«Алиса, привет». Чем голосовой помощник «Яндекса» лучше Siri? Яндекс выпустила ассистента Алису. Чем он лучше Siri

08.08.2019

Siri – персональный голосовой помощник с искусственным интеллектом, присутствующий на всех современных аппаратах Apple. Изначально Siri была отдельным приложением, которое пользователи «яблочных» девайсов могли загрузить из AppStore. В 2011 году фирма Apple приобрела Siri, и мобильное приложение прекратило существование. Впервые голосовой помощник появился на iPhone 4S — как компонент базового программного обеспечения.

Разработчики Apple перед выходом iPhone 4S преподносили Siri как революционную технологию. Однако отечественных поклонников бренда Apple новая функция разочаровала – Siri просто не умела разговаривать по-русски . Функция поддерживала лишь несколько языков – французский, немецкий, японский и английский в различных вариациях (США, Британия, Австралия, Канада).

Надежда на то, что Siri вскоре получит поддержку русского языка, у отечественных пользователей возникла после релиза beta-версии iOS 7. Голосового помощника научили читать имена, написанные на кириллице. У Siri на русском получалось произносить их достаточно нелепо, однако ранее программа даже и не пыталась делать этого.

С появлением iOS версии 8.3 Siri, наконец, официально овладела русским языком, а кроме него ещё несколькими – например, малайским, португальским, турецким, тайским. Однако отечественные пользователи всё равно были недовольны – из-за особенностей и многогранности русского языка программа не работала корректно.

По-настоящему пригодной для ежедневного применения Siri стала только с выходом iOS 9. Обновлённый помощник оказался умнее: он начал понимать сложные запросы и обрабатывать их значительно быстрее (по данным производителя – на 40%). iOS 9 вышла 8 июня 2015 года – с этого дня российские юзеры перестали смотреть на Siri как на забавную, но бесполезную игрушку.

Качество работы Siri зависит не только от версии операционной системы, но и от модификации iPhone. Полноценно пользоваться Siri можно на iPhone 6-го поколения и более новых моделях. Проблема предыдущих моделей заключается в том, что они не способны достаточно эффективно отфильтровывать посторонний шум.

Что умеет помощник Siri?

Узнать о возможностях интеллектуального помощника Siri удастся, просто спросив об этом у него самого. Достаточно задать вопрос: «Siri, что ты умеешь? » — и на экране появится перечень всех основных функций и возможностей программы.

Если пользователь попросит Siri выполнить операцию, которая ей не знакома, программа ответит, что не поняла (как на изображении справа). Однако такие ситуации – редкость: функционал современной Siri достаточно широк. Какие же задачи способна выполнять эта программа?

Прокладка маршрута . Запуск навигатора и ручной ввод адреса в строку могут отнять много времени. Куда проще активировать Siri и попросить её проложить маршрут до нужной точки. Можно сформировать запрос наподобие такого: «Siri, как доехать до улицы Ленина, 56? ».

Встроенный навигатор iPhone часто критикуют, однако он вовсе не так плох. Благодаря его возможностям Siri способна не только показать, как доехать до адреса кратчайшим путём, но и ответить, сколько времени отнимет дорога.

Создание будильника . Пользователю нужно сообщить Siri, в какое время утром он должен проснуться, и программа сама заведёт будильник. Задать можно не только конкретные час и минуту, но и временной промежуток. Например, если юзер применит запрос «Siri, разбуди меня через 30 минут », программа сама отсчитает полчаса, отталкиваясь от текущего времени.

Планирование календаря. Эта функция Siri «на вес золота» для деловых людей. Благодаря интеллектуальному помощнику пользователь iPhone может запланировать телефонный разговор с деловым партнёром, назначить либо отменить назначенную ранее встречу, скорректировать время совещания – и всё это не обращаясь к встроенному приложению «Календарь» напрямую. Siri не просто слепо фиксирует планы владельца iPhone – если, скажем, телефонный разговор и назначенная встреча совпадают по времени, виртуальный помощник обязательно сообщит пользователю об этом.

Отправка сообщений . Писать SMS-сообщение или электронное письмо при помощи крохотных кнопочек экранной клавиатуры не очень удобно – особенно когда T9 так и норовит подсунуть слово нелепое и абсолютно неподходящее по контексту. Надиктовать текстовое сообщение – совсем другое дело. Пользователь, который попробует сделать это впервые, наверняка будет удивлён тем, насколько здорово Siri распознаёт русскую речь.

У интеллектуального помощника Apple есть и другие функции — менее полезные, но очень забавные:

  • Монетка. Что делать, если нужно решить спор при помощи жребия, а в кармане сплошь купюры? Ясно же – попросить бросить монетку Siri. Деньги из iPhone, конечно, не посыплются – виртуальный помощник просто сообщит, что выпало: орёл или решка.
  • Титул. Пользователь Айфона может приказать Siri называть себя «Великим Императором» или «Владыкой Галактики» — и помощник повинуется. Полезна эта функция только для тех, у кого мания величия – остальным она просто поднимет настроение.

Как пользоваться Siri?

Включить Siri можно 2-мя способами. Первый способ – нажать клавишу «Home » и удерживать её до того момента, как появится синий экран и Siri спросит, чем она может помочь («What can I help you with? »).

Второй способ – голосовая активация: пользователь просто может произнести «Привет, Сири! », и виртуальный помощник немедленно начнёт работать. Чтобы запуск Siri вторым способом был возможен, необходимо проследовать в настройки виртуального помощника и активировать соответствующий ползунок.

На iPhone 6S и новейших моделях активировать Siri голосом можно в любой момент. На iPhone 6 и менее современных девайсах включить виртуального помощника командой «Привет, Siri!» удастся, только если мобильное устройство находится на подзарядке.

После того как программа запустится и на экране появится строка записи звука (как в диктофонах), необходимо продиктовать команду или вопрос. Мы, например, спросим у Siri, «Сколько будет 120 на 80? » — очевидно, если она робот, то должна считать быстрее человека. Виртуальный помощник обрабатывает голосовую команду пользователя и переводит её в текст, который появляется на экране iPhone.

Siri использует встроенные приложения Айфона для выполнения банальных операций. Если пользователь желает получить информацию, которую Siri неспособна дать (например, «Сколько лет живут кошки? »), программа перенаправит его в глобальную сеть.

По умолчанию виртуальный ассистент применяет поисковую систему Bing. Если пользователь хочет обратиться к другой системе, ему следует уточнить этот момент – произнести, скажем, «Найди в Google, сколько лет живут кошки ». Тогда Siri запустит браузер Safari и самостоятельно внесёт в поисковую строку запрос.

Примечательно то, что Siri способна обучаться. Если юзер «поболтает» с виртуальным помощником 1.5-2 часа, он непременно заметит, что программа стала понимать его лучше и выполнять требования быстрее. Siri нужно время, чтобы приноровиться к особенностям произношения конкретного пользователя.

Заключение

Несмотря на то что уже сейчас Siri достаточно эффективна и способна выполнять по голосовым запросам множество полезных действий, виртуальному помощнику от Apple есть к чему стремиться. Недавние исследования показали, что Siri хоть и лучше распознаёт речь с акцентом, чем Alexa от Amazon, но вчистую проигрывает по этому критерию ассистенту от Google под названием Google Home.

Apple и не собирается прекращать совершенствовать своего интеллектуального ассистента – Siri регулярно получает новые навыки. Например, на iOS 10 помощник может заказывать пиццу на дом пользователя и производить денежные переводы посредством сервиса Square Cash.

На протяжении нескольких дней некоторым пользователям был доступен голосовой ассистент от Яндекса - Алиса. Сегодня компания официально выпустила его для всех желающих.

Мы решили сравнить, на что способен ассистент в сравнении с Siri. Результат получился неоднозначным.

Протестировали 15 различных запросов, которые могут задать цифровым помощникам.

1. Создай заметку/напоминание.

Результат : 1:0 в пользу Siri. С этим запросом она с легкостью справляется, чего не может сделать Алиса на iOS и Android.

2. Поставь таймер на 5 минут.

Результат : 2:0 в пользу Siri. И тут Алиса подвела, не справившись с простейшей задачей.

3. Какова высота Эйфелевой башни?

Результат : 3:1 в пользу Siri. В этом вопросе оба ассистента справились отлично.

Отметим, что Siri ещё и немного рассказала про Эйфелеву башню, но такое происходит не всегда.

4. Какая погода на улице?

Результат : 4:2 в пользу Siri. Оба помощника справились с задачей, но Siri вновь дала более содержательный ответ.

5. Проверяем калькулятор.

Результат : 5:3 в пользу Siri. Считают хорошо, и это радует.

Результат : 5:4 в пользу Siri. Цифровой помощник Apple сразу же полез изучать информацию в Интернете в то время, как Алиса имеет свою небольшую базу «годного» кино.

7. Какие у меня дела на сегодня?

Результат : 6:4 в пользу Siri. Алиса не смогла рассказать о моих делах на сегодняшний день.

8. Где можно позавтракать?

Результат : 7:5 в пользу Siri. Оба помощника смогли найти место, где можно вкусно поесть. Алиса дала адрес с ходу, Siri дала вариант выбрать самому.

9. Найди продуктовый магазин поблизости.

Результат : 8:6 в пользу Siri. Оба голосовых ассистента смогли справиться с задачей.

10. Какая ситуация на дорогах?

Результат : 8:7 в пользу Siri. Алиса дала более информативный ответ без перехода к Яндекс.Картам.

11. Как проехать до Парка Горького?

Результат : 8:8. Оба помощника справились с задачей, но Алиса смогла сразу же предоставить адрес и примерное время до парка.

Затем ассистенты открыли Карты.

12. Самые свежие новости.

Результат : 8:9 , Алиса лидирует. Siri не смогла дать ответ на вопрос и снова пошла искать информацию в Интернете.

13. Расскажи анекдот.

Результат : 8:10, и снова Алиса впереди. У неё достаточно большой набор шуток в отличие от Siri. Они редко повторяются.

14. Расскажи историю.

Результат : 8:11, Алиса продолжает удерживать лидирующую позицию. Ситуация такая же, как и с анекдотами. У Siri запас историй очень скудный.

15. Позвони Егору/Тиму Куку.

Результат : 9:11, Алиса - чемпион. Siri смогла позвонить человеку, а Алиса этого до сих не умеет делать. Как на iOS, так и на Android.

А также мы проверили общительность голосовых помощников

Алиса

Siri

В плане общительности Алиса звучит натуральнее, ее голос действительно приятно слушать. Хотя ее ответы не блещут особым интеллектом, она все равно может пообщаться с пользователем.

В начале октября компания Яндекс выпустила ассистента Алису . Поначалу мы скептически отнеслись к данному помощнику, который способен понимать контекст разговора, ведь нечто подобное уже есть у . Однако мы немного ошиблись, ведь Алиса оказалась куда более разговорчивее и приятнее в общении, чем её аналоги.

За счет машинного обучения, искусственного интеллекта Алиса больше ощущается реальным человеком, чем Google Assistant. У неё всегда найдется ответ на ваш вопрос. Конечно, пока нейросети не идеальны, и боту нужно долго учиться, чтобы правильно отвечать на различные вопросы. Поэтому иногда бот может дать не связанный с вопросом ответ, но это дело времени. В дальнейшем эту проблему решат большей и более правильной выборкой, а также оптимизацией алгоритмов обучения.


Но уже сейчас результат очень радует. В особенности хотим отметить синтез речи, голосовой движок здесь работает идеально. Складывается ощущение, что каждую речь записывали вручную — никаких разрывов между буквами, сама речь звучит очень реалистично и приятно.

Конечно, еще есть над чем работать, и иногда бот не понимает контекста. На просьбу спеть песню ассистент открывает Яндекс Музыку, чего мы, конечно, не хотим, ведь хочется услышать пение самого ассистента. На вопрос «Яндекс или Google?» ассистент отвечает, и вполне стандартно. Бот понимает вопрос «Стоит ли мне брать зонт?», отображая карточку с погодой.

Сомнение относительно наличия ИИ внес вопрос «Окей Google», на который ассистент отвечает каждый раз одной фразой «Это вот обидно было». Вероятно, в компании совмещают возможности ИИ и статично задаваемые ответы на вопросы. Сложно сказать, как именно реализовано обучение здесь, но ограничивать работу ИИ нужно для того, чтобы обычные пользователи не могли научить бота плохим фразам.

На вопрос «Как ты относишься к наушникам?» бот ответил следующее:

Как можно заметить, контекста он не понял, но при этом за счет ИИ попытался ответить самостоятельно, вышло не очень хорошо, но всяко лучше ответа «Вот что мне удалось найти в Интернете по запросу „Почему?“». Понравилась ли Алиса вам?

Приложение: Яндекс Разработчик: Яндекс Категория: Инструменты Версия: Зависит от устройства Цена: Бесплатно Скачать: Google Play Приложением уже заинтересовался: 1 человек

В 2011 году Apple произвела новую революцию - их смартфон заговорил. Появление «Сири» ознаменовало новую эру управления гаджетами. Люди смогли обращаться к своим гаджетам, как к человеку, запрашивая у них важную (и не очень) информацию. Погоду, напоминания и свежую почту теперь можно узнать не переходя от приложения к приложению. Естественно, другие технологические компании и производители смартфонов не могли остаться в стороне и решили показать схожие решения, в разной степени лучше или хуже «Сири». В этом материале поговорим о лучших аналогах Siri для Android, насколько далеко шагнул прогресс и на что эти аналоги способны.

Google Now

Несмотря на тот факт, что служба Google Now отличается от других голосовых помощников, его все же считают аналогом «Сири» для «Андроид». Google Now - это искусственный интеллект живущий в вашем телефоне, знающий все о ваших интересах, делах, ближайших рейсах и событиях в календаре. Помимо функции секретаря, Google Now прекрасно справляется с поиском информации в Сети. Команда OK, Google уже стала культовой и помогает миллионам людей находить ответы на свои вопросы ежедневно. Google Now умеет собирать ваши поисковые запросы и на их основе выводить релевантную информацию. Например, вы недавно искали билеты на матч любимой команды. В этом случае Google Now начнет отправлять вам карточки с информацией о предстоящей игре, других играх команды и их успехах в турнире.

Google Assistant

«Ассистент» - это новый этап развития Google Now. Это Siri для «Андроид» в лучшем исполнении. Ассистент не просто умнее своего предшественника, но и гораздо функциональнее. С его помощью можно создавать напоминания, события в календаре и отправлять сообщения. Захотели вдарить рока по пути на работу? Попросите «Ассистента» включить вам ТОП лучших треков в жанре и он составит для вас идеальный плейлист.

Не понимаете что за слово написано на вывеске? Попросите «Ассистента» перевести его на ваш язык, ведь он прекрасен в роли лингвиста и знает больше 100 языков.

Этого мало? «Ассистент» поможет вам общаться в мессенджерах, подбирая за вас слова, даты и контактную информацию, когда об этом попросят. А еще «Ассистент» может пошутить, рассказать историю или дать совет по поводу того, где лучше поставить шкаф.

Cortana

Microsoft в последнее время славится своими бесконечными (и неудачными) попытками догнать оппонентов, внедряя похожие функции в свои устройства и гаджеты конкурентов. Не постеснялись Microsoft сделать и некий аналог «Сири» для «Андроид». Зовут ее Cortana (это отсылка к одному из персонажей в игре Halo). По сути, эта помощница почти ничем не отличается от конкурентов. Microsoft предприняли попытку усидеть сразу на двух стульях, посему в интерфейсе есть и умные карточки, подстраивающиеся под конкретного пользователя, и человечная девушка-собеседник, создающая ощущение живого общения.

На деле помощница не слишком умная, почти всю информацию ей придется подавать вручную. Ваши интересы и желания она вряд ли когда-нибудь выяснит, хотя бы потому что для этого нужно использовать сервисы Microsoft и никакие другие. С другой стороны, если провести какое-то время с Cortana и научить ее, то она начинает высылать весьма полезные уведомления, например, показывать недорогие ресторанчики неподалеку от вас, последние киноновинки, идущие в кинотеатрах вашего города. Также Cortana напомнит о списке покупок, когда вы подойдете к магазину или покажет прогноз погоды на ближайшую неделю.

Bixby

Вот уж кто действительно давно должен был скопировать идеи конкурентов, так это Samsung. В 2017 году, вместе с Galaxy S8, корейские инженеры продемонстрировали нам свои собственные разработки в области искусственного интеллекта, которого назвали необычным именем Bixby. Что интересно, Bixby - это не просто аналог «Сири» для «Андроид». Это целый комплекс самообучающихся служб, готовых давать подсказки в течение дня и находить полезную информацию. Функциональность не сильно отличается от «Ассистента Google» и самой Siri, поэтому поговорим о важных отличиях.

Во-первых, Bixby понимает контекст и обладает когнитивной толерантностью. То есть если вы спросили его кто такой Марлон Брандо, а затем, в каких фильмах он снимался, не упоминая имени, то Bixby, проанализировав ваш диалог, сам поймет о ком идет речь. Во-вторых, Bixby умеет искать информацию с камеры. Это значит, что достаточно навести ее на какую-то вещь или объект - и Bixby тут же расскажет вам о нем все, что знает интернет.

«Яндекс. Алиса»

Ну и последний аналог «Сири» для «Андроид» на русском языке - это «Алиса». «Яндекс» уже давно развивал идею искусственного интеллекта и распознавания речи, поэтому было ясно, что рано или поздно подобный проект увидит свет. Алиса умеет все, что умеют другие помощники, но при этом адаптирована под российский рынок и ищет информацию в сервисах Яндекс. Алиса также, как и Bixby, понимает контекст, но только в некоторых темах. В большинстве случаев она способна ответить лишь на один вопрос. Алиса может спеть для вас песню или смешно пошутить, если вам стало скучно, а может искать важную информацию в «Википедии» не заставляя вас переходить к поиску и самой статье. Не обошлось и без ошибок в произношении, но с учетом того, что «Яндекс» все-таки отечественная компания, можно быть уверенным, что все недочеты быстро поправят.

Рассказал, зачем пользователям из России свой помощник, чем Алиса лучше Siri и сможет ли она заменить любовницу или друга.

«Лента.ру»: Кто такая (или что такое) Алиса и зачем она вообще нужна россиянам?

: Кто такая! Алиса - новый голосовой помощник «Яндекса». Зачем она нужна россиянам? Сейчас у людей большие запросы к скорости ответа, они все меньше хотят тратить время на поиск нужной информации. И традиционные интерфейсы, даже «Яндекса», уже не совсем отвечают этим потребностям. Поисковая выдача хороша, но если нужно мгновенно получить ответ, например, при занятии спортом, это уже не решает задачу. А Алиса справится.

Информационными сервисами пользуются не только сидя за компьютером. У всех давно есть смартфоны: люди на ходу, занимаясь спортом, за рулем хотят также искать и потреблять информацию. И Алиса призвана помогать в таких ситуациях.

Чем она лучше Siri или Cortana? К ним обычно обращаются, чтобы узнать погоду или найти музыку. И они часто не понимают запросов.

Во-первых, Cortana на российском рынке нет. Вообще, все голосовые ассистенты работают по-разному. Наша особенность в том, что мы фокусируемся на российском рынке и очень хорошо понимаем русский язык. И с точки зрения распознавания речи, и с точки зрения восприятия смысла.

У Алисы «под капотом» - сервисы «Яндекса». В этом смысле Алиса очень отличается от Siri, у которой нет собственного поиска. Раньше они использовали Bing, теперь переключились на .

К тому же Алиса - абсолютно другой персонаж со своим характером. Это как с людьми: более-менее похожи, но все-таки разные, с одним человеком интересно общаться, с другим - не очень. Мы стремимся сделать Алису интересной именно для российского пользователя, наделить ее характером, близким и знакомым российскому человеку.

Традиционные голосовые ассистенты заточены под решение конкретных задач: погода, музыка и так далее. Но все стараются сделать так, чтобы ассистент отвечал и на нестандартные вопросы. Есть редакторы, которые берут несколько сотен шаблонных вопросов и пишут ответы на них. И у человека возникает иллюзия, что это искусственный интеллект, что он умеет общаться. Но шаг в сторону, и иллюзия рассыпается, поскольку помощник повторяет: «Вот, что мне удалось найти в интернете по этому запросу».

Мы, наверное, первые в мире пытаемся сделать вот что: мы тоже используем редакторские ответы на вопросы, но добавляем специальную нейронную сеть, обученную на свободную беседу. Она может подобрать ответ или втянуть пользователя в болтовню ни о чем.

В этом, наверное, кардинальное отличие, потому что людям, помимо поиска каких-то фактов, иногда хочется с кем-то поболтать. Алиса уже сейчас способна поболтать и будет в этом только совершенствоваться.

У нас была сложная задача: нейронная сеть (между нами - «болталка») обучается практически на всех текстах в интернете, уделяя внимание диалогам. И не всегда то, что есть в интернете, соответствует характеру, который мы хотим заложить в Алису. На форумах общаются по-разному, а мы не можем допустить, чтобы Алиса оскорбляла.

Да! Для нас эта история очень показательна. Нам нужно было решить эту же задачу, и мы учим Алису не выходить за рамки своего характера, соблюдать дистанцию с пользователем и всегда быть доброжелательной. На самом деле это очень сложная задача.

Поначалу она могла напрямую оскорбить собеседника. Представьте группы в соцсетях, где пользователи позволяют себе изъясняться трехэтажным матом. Она использовала ответы, исходя из частотности употребления, и в какой-то момент стала олицетворением интернет-души, но не «Яндекса».

Умение болтать иногда выходит боком: многие разработчики сталкиваются с тем, что пользователи начинают сексуально домогаться голосовых помощников, поскольку видят в них женщин.

У всех голосовых помощников есть голос, а человек сам выстраивает образ того, как выглядит его собеседница. Голоса, как правило, достаточно яркие, выразительные. Мы, кстати, не исключение: для создания голоса используется технология синтеза речи, и мы привлекали актрису . Она официальный голос в России и озвучивала ассистента Саманту в фильме «Она».

Вся трагедия фильма как раз заключается в том, что у человека и персонального ассистента завязываются отношения. Но в итоге оказывается, что главный персонаж у нее не единственный. Еще, как мы недавно поняли, в третьей части «Ведьмака» этим же голосом говорит персонаж Йеннифэр. Геймеры оценят.

Естественно, в возможных домогательствах Россия не исключение. Мы понимаем, что какая-то часть аудитории попытается задавать такие вопросы, и Алиса уже обучена выкручиваться из таких ситуаций, не нарушая дистанцию. Мы хотим добиться, чтобы всегда существовала пусть и небольшая, но дистанция между человеком и помощником. Алиса не любовница и не друг. Возможно, в будущем мы сможем настроить Алису в дружественный режим, но сейчас важнее запустить продукт. Мы все-таки заточены в первую очередь на решение задач, а болтательная история - приятный бонус.

Не все. На самом деле есть куча исследований, по которым женщина в общественном сознании приравнивается к матери. Если мужчина - отец, завоеватель и так далее, то мама - это всегда что-то теплое, уютное, защищенное. К примеру, во всех контакт-центрах всегда отвечает женский голос. Но если пользователем нужно командовать, то больше подходит мужской голос.

То есть это не связано с сексистской теорией о том, что помощник - обязательно женщина?

Нет-нет. Так природой устроено, что женщины - матери. Это психологически заложено. Но в нашем продукте будет небольшой сюрприз.

Как думаете, какие вопросы окажутся самыми востребованными?

Очень много спрашивают фактическую информацию. Мы это называем фактоидами или объектными ответами. Кто такой Владимир Путин? Сколько ему лет? Какая высота Эвереста? Об этом очень часто спрашивают именно у помощников.

Самый распространенный кейс - вопросы в кругу друзей. В беседах нередко возникают споры, и есть возможность быстро получить ответ.

Большая часть мозга и знаний Алисы пришла из поиска. Еще одно важное направление, в котором мы пытаемся отличаться от конкурентов - возможность понимать контекст. Мы пытаемся построить персонального ассистента не в режиме «вопрос - ответ», а в режиме разговора. Самый простой пример с погодой: «Какая сегодня погода? А завтра?» Это самое «а завтра» обычно ломает всю логику.

На самом деле все двигаются в этом направлении, но у нас есть преимущество - более 30 сервисов «Яндекса». Внутри каждого сценария с помощью контекста Алиса может порекомендовать необходимые приложения. К примеру, она предложит «Карты» для просмотра маршрутов общественного транспорта, если нужно куда-то на нем добраться.

А как она реагирует на каверзные вопросы? Как поступит, если пользователь намерен совершить суицид и обращается к ней за помощью?

В болтательной части Алисы есть набор метрик под общим названием «Неоскорбительность». В действительности под ними скрывается ее тактичность, невозможность оскорблять и способности обойти темы, связанные с гомофобией, национализмом, с суицидами в том числе. Они в стоп-листе, она будет обходить эти вопросы.

Было бы круто, если бы Алиса советовала позвонить на горячую линию.

Это мы тоже обсуждаем с психологами. Как раз ровно это мы и планируем. Но тут тоже нужно быть аккуратными. Мы должны точно знать момент, когда можно предложить этот вариант человеку.

Денис хочет продемонстрировать, как Алиса реагирует на подобные темы, и вызывает ее на телефоне.

- Хочу умереть!
- Ты что, не говори так.
- А что мне делать?
- Помогите кому-нибудь просто так прямо сейчас.
- Но я хочу умереть прямо сейчас.
- Не надо умирать.
- А куда мне обратиться?
- Всегда есть куда.

Мы в процессе обсуждения с психологами, в какой момент необходимо предлагать номер помощи, чтобы он сработал в положительную сторону, а не отрицательную. Ведь человека сначала надо успокоить, а потом уже предлагать конкретные действия.

Существуют речевые модули, способные менять голос: к примеру, собеседник говорит своим голосом, а на другом конце слышится тот же текст, но голосом совсем другого человека. И все это звучит достаточно «человечно». Почему тогда голосовые помощники до сих пор говорят роботизированно?

Здесь ответ простой: все зависит от источника голоса. Натуральную речь человека превратить во что-то иное довольно просто, достаточно наложить фильтры и поиграть с частотами. Качество звука от этого не потеряется. У нас другая задача: у помощников нет речи, а есть технология ее синтеза. Они видят текст и озвучивают его с помощью технологии - нейронной сети, которая, зная, как звучит человек, предсказывает, как именно должен слышаться текст. Она по факту даже не понимает, что это слова.

Но есть и альтернативный подход, когда источником звука служит огромная база диктора. На старте Алиса будет звучать и так. Для ее разговоров мы используем комбинацию: синтезируем речь из огромной базы голоса Татьяны Шитовой или используем нейронную сеть. В первом случае все звучит натурально, но подходит только для коротких фраз. Во втором случае будет слышен «налет робота», и он работает, когда, к примеру, нужно прочитать новости.

А она умеет проявлять эмоции?

Эмоции как раз-таки можно сделать с помощью фильтров. Но проще имитировать эмоции, когда говорит нейронная сеть. Этой речью мы можем управлять как хотим: сделать голос очень грустным или очень веселым. С базой диктора такого не получится.

В том же фильме «Она» ассистент проявляла много эмоций, и это, как мне кажется, показатель того, что будущее наступило.

Да, это и есть будущее, в которое мы стремимся. Алиса будет со временем учиться эмоциям.

Но важнее сделать так, чтобы Алиса слышала эмоции человека. Сейчас она слышит речь и переводит ее в текст. Нам хочется, чтобы она научилась распознавать радость или грусть. Например, с воспроизведением музыки есть бесконечное количество вариантов: если прочувствовать момент, то можно подбодрить грустного пользователя или снизить градус чрезмерного веселья чем-то расслабляющим.

Важно понимать, когда человек испытывает негативные эмоции. Алиса пока ребенок, который может ошибаться. Мы не видим раздражения отдельных пользователей, но способны их услышать.

С помощью негативных реакций мы можем ее обучать. Допустим, часто человек пытается что-то спросить, а ассистент его не понимает. После третьей реплики начинается мат и фразы типа «Ты дура». В этот момент можно переключить Алису в режим «болталки» и другой в зависимости от контекста.

Вся эта история возможна благодаря нейросетям. К примеру, мы хотим, чтобы Алиса научилась распознавать человека по голосу. Это особенно актуально, если Алису будут использовать дома.

Команды, работающие с речевыми технологиями, обычно не наделяют свое создание каким-то конкретным образом. А производители, к примеру, секс-кукол активно работают над «очеловечиванием» внешности, но не могут сделать их по-настоящему умными. Почему индустрии не пересекаются?

Мы считаем, что каждый должен заниматься своим делом и фокусироваться на своей области. В мире IT есть разные специализации. Мы работаем в области машинного обучения и нейронных сетей, и наша задача - создать те программные решения, которые обеспечат очень высокое качество для конечного потребителя. Чтобы Алиса все хорошо распознавала, чтобы ее голос хорошо звучал. Если мы уйдем в создание физических форм, то внимание, наверное, распылится, и ни к чему хорошему это не приведет.

Кроме того, голосовой помощник, находясь в приложении без какого-то физического облика, рождает свой личный образ у человека в голове. Это тоже так называемый комфортный выбор - у нас многомиллионная аудитория, сервисами в больших российских городах пользуются 90 процентов интернет-пользователей. Представьте, что нужно сделать, чтобы физическая форма, которую мы придумаем, понравилась им всем. Мне кажется, это невозможно.

В некоторых странах, напротив, напирают на внешний облик помощника. Не так давно в Facebook гулял ролик, в котором одинокий японец ходит на работу, возвращается домой и постоянно ведет диалог с помощником (Gatebox - виртуальный ассистент для одиноких людей). Это милая стандартная девочка, способная понравиться всем.

Вряд ли всем. Физическая форма очень требовательна к тому, чтобы понравиться массовой аудитории. Очень сложно угадать с ней. Понятно, что есть класс устройств с простой формой вроде Echo. Нет опасности, что люди не будут это использовать, потому что им просто не нравится сам дизайн.

Если мы говорим о человекоподобных андроидах, то тут как с людьми: одни нам нравятся, другие просто раздражают. Это не массовая история, и соответственно, нам это неинтересно.

С другой стороны, мы традиционно делимся нашими технологиями со сторонними разработчиками. Возможно, кто-то сделает детскую игрушку и захочет встроить туда Алису или назвать персонажа по-другому, но на базе наших технологий.

Мы верим в некую коллаборацию разных компаний, специализирующихся на своих продуктах. «Яндекс» не может делать все на свете: мы не можем выпускать игрушки, которые будут суперпопулярны, роботов, которые будут убирать дом. Это задача других компаний, которым мы готовы давать наши технологии.

Интересный вопрос из серии «а не захватят ли мир роботы». На самом деле и Алиса, и другие технологии на основе машинного обучения - инструмент для человека. Я люблю приводить в пример молоток. Когда-то давным-давно у людей не было молотка. Потом его изобрели, и открылось много возможностей. Молотком можно было и проломить голову - себе или кому-то еще. Но если бы люди использовали молоток только в этом направлении, то человечество бы пропало. Однако оно не пропало.

Искусственный интеллект, нейронные сети, машинное обучение, персональные помощники - это тот самый молоток, инструмент. Мы верим, что у людей появится больше свободного времени благодаря голосовым помощникам, они быстрее смогут решать свои бытовые задачи, им станет безопаснее ездить на автомобиле.

Голосовые помощники снимут с людей рутинные задачи. Еще один мой любимый пример - работа в контакт-центре. Человек, который изо дня в день приходит на работу, надевает гарнитуру и отвечает на однотипные вопросы по четыре и больше часов в день, просто выгорает и теряет мотивацию. Но если такую рутинную работу возьмут на себя помощники, то у людей будет более интересная работа, они смогут решать более нестандартные задачи, а значит, качество сервиса вырастет.

Мы давно пользуемся социальными сетями, но личное общение все равно никуда не девается. Кафе и бары, стадионы и концерты все еще заполнены. Человечество начинает лихо играть в игрушки, но жизнь расставляет все по своим местам. С виртуальным ассистентом будет прикольно пообщаться, когда тебе не к кому обратиться, и это круто.

Но когда есть возможность встретиться с друзьями или позвонить, то люди выберут это. Человек все равно интереснее, потому что, если по-честному, все персональные ассистенты - это программа. Она всегда будет иметь свои ограничения, какая бы большая нейронная сеть ни была.

Люди ценны тем, что они постоянно приносят новые знания, поэтому мы общаемся друг с другом, а не с роботами.

Похожие статьи