Главная
Советы начинающим
Алиса поисковая система. «Алиса» — новый голосовой помощник для Android от «Яндекс. Что(кто) такое Яндекс Алиса

Алиса поисковая система. «Алиса» — новый голосовой помощник для Android от «Яндекс. Что(кто) такое Яндекс Алиса

27.05.2019

- Вы пользовались Siri или Google Now, помощниками, у которых есть русскоязычный голосовой интерфейс?

Нет, не пользовалась.

- А успели уже поговорить с «Алисой»?

Успела поговорить, только когда мне включали пробные записи в течение рабочего процесса. И дома показала. Но никто не оценил: мой папа вообще не понял, в чем прикол, а дочка сказала: «О, здорово, теперь я тоже могу сама с собой разговаривать?» Она подумала, что теперь каждый может взять телефон и сам с собой поговорить. После этого еще ни разу не включала.

- Как проходила запись для голосового помощника? Вы сидели перед микрофоном домаАктриса Сьюзан Беннет, озвучившая первую версию Siri, рассказывала, что записывала реплики для помощницы в домашней студии. или приходили в студию? Что происходило потом?

Все как всегда: я приходила в студию, сидела перед микрофоном, зачитывала много текста. А за стеклом сидели несколько человек: звукорежиссер, представитель «Яндекса», редактор, и периодически собирался такой консилиум. Я не знаю, что они слушали и на что смотрели. Они корректировали меня и показывали промежуточный результат работы.

- Вы что-то надиктовали, и тут приходит этот консилиум и говорит: «Нужно исправить». Что, например?

- Например, попадались отрывки из художественной литературы. Я их начинала читать от себя, как меня в школе актерского мастерства учили (смеется) , как от лица автора, не ровно и безжизненно, а сразу прилипала к тексту и вживалась в роль. На что меня деликатно поправляли: «Нет-нет, так делать не надо». Как раз нужно наоборот: с душой, но поровнее.

Я говорю: «А кто такой дурацкий текст дал?! Вот абракадабра!»

- Какие тексты зачитывали? Только художественные?

Текст был разный: были отрывки из художественных произведений, были звуки, были правильные слова, были слова с ошибками, с неправильной падежностью. Я говорила: «Тут же грамматическая ошибка, так нельзя». «Нет, вот нужно именно вот так, чтобы получилось что-то». А я как диктор волновалась - как скажу с ошибкой, а мне потом скажут: «Тань, ты говоришь неправильно».

- Помните, какие произведения были?

- Разные отрывки были, я всех не упомню. И Лев Толстой был, что-то из «Войны и мира», и русская классика, и нужно было разговаривать как автоответчик, и с настроением, и о погоде.

- Актриса, которая озвучивала Siri, говорила, что ей приходилось зачитывать бессмысленные фразыВот пример текста, который зачитывали для Siri: «Malitia oi hallucinate, buckry ockra ooze, cathexis fefatelly sexual ease stump, say the shrodding again, say the shroding again, say the shreeding again, say the shriding again, say the shrading again, say the shrudding again». .

Были какие-то абракадабровские предложения, непонятные или несвязанные слова, предложения, которые не имеют ни начала, ни конца. Ты даже не поймешь, как их читать! Как бы ты хорошо ни читал, все равно не сможешь эту абракадабру прочитать нейтрально. Я-то не искусственный интеллект, не машина, поэтому подсознательно искала какой-то смысл, где паузу поставить, где, может быть, есть запятая. Я говорю: «А кто такой дурацкий текст дал?! Вот абракадабра!» Мне говорят: «Это программа выдает такой текст». Они все, что я начитала, забрасывали в программу, а она этот текст обрабатывала, резала и выдавала следующий фрагмент. Мне очень трудно было это в голове поместить и понять: «Какая программа? Почему она так режет? Почему такой текст выдает?»

- То есть отрывки из книг и абракадабра?

Попадались очень профессиональные слова, какая-нибудь врачебная терминология. Думаешь: «Господи, ну я-то этих слов не знаю!» Это не просто «переливание крови», «пробирка», «шприц», а названия заболеваний, что-то на латыни. Очень редко попадались матерные слова. Но по поводу мата мне было дано на откуп: «Хочешь, Таня, произноси, хочешь - не произноси». Я их не произносила, но программа, думаю, все равно порежет так, как ей надо (смеется) .

Реакция «Алисы» на мат будет примерно такой же

Алиса довольно сдержанно реагирует на мат: она делает замечание и спрашивает: «А вы с родителями тоже так разговариваете?»

Видите, а мне программа выплевывала мат, она сама его откуда-то набирала. Но эти слова были не к тому, что я матом буду отвечать. Рассчитано, что «Алиса» будет помощницей для любого человека, что ее может слушать ребенок. Порой нельзя было сделать какой-нибудь интонационный закидон, потому что не знаешь, с кем беседуешь: с мужчиной, с женщиной или с ребенком. В том-то и сложность. Это не как компьютерная играТатьяна озвучила Нейроматрицу из Destiny 2, Phantom Assassin из Dota 2, Роковую вдову из Overwatch, Йеннифер из игры «Ведьмак 3: Дикая охота» и других персонажей. , где примерно знаю, какой я персонаж.

- Сколько это длилось? Полгода-год?

Долго. Начинали где-то зимой. Это шло периодами: собираемся и пишем, потом перерыв - и через время меня зовут на другой этап, например, писать только звуки. Были простые тексты. Мы их писали раза четыре в неделю по несколько часов. Сначала пробовали записать быстрее, а потом - нет, слышно, что голос уставший, слышно, что голос больной, что не отдыхала. А ведь нужно придерживаться одной тональности. Поэтому много материала машина выбросила в помойное ведро, он не соответствовал уровню. Были разные сроки: февраль–март, потом решили, что это где-то сентябрь–октябрь.

В первый день работы «Алисы» люди заметили, что она понимает жаргон. Приходилось зачитывать жаргонные фразы?

Да, что-то такое было, что-то такое резало слух. Мы тоже удивлялись, но читали. Не знаю, в каком они остались варианте: в первозданном виде или в порезанном.

«Алиса» узнает сленг и отвечает жаргонизмами

Актриса, которая озвучивала Siri, рассказывала, что ей даже не сообщили, зачем нужна ее запись, поэтому было тяжело работать и иногда кажется, что у Siri уставший голос.

Мне кажется, в моем голосе не должна слышаться усталость. Я люблю свою работу, и меня не утомляет большой объем. Любая работа диктора - озвучивание фильма, компьютерной игры, документальная программа - это много текста. А на работе я отдыхаю. Это я дома устаю от воспитания ребенка и оттого, что нужно успеть то-то, пятое, двадцатое.

- Она говорила, что диктовала текст для Siri.

Да? Интересно. Мне сразу сказали, кто я, что мы делаем и для чего.

- Было какое-то прослушивание?

Не знаю, наверное, что-то было, но меня не кастинговали. Мне позвонили и сказали: «Таня, вы озвучивали фильм «Она». У нас есть к вам предложение…» У них есть другие наработки, были другие исполнители, часы, наработанные другими актерами и актрисами. Мне было очень лестно, что меня утвердили на этот проект. Все тестовые записи были в самом начале, если бы я не подошла, то они бы сразу сказали и позвали другую.

- Вот у помощницы Cortana есть аватар - персонаж из игр серии Halo. С кем мы можем ассоциировать «Алису»?

- [Сначала была ассоциация с фильмом «Она»], а потом появилась Алиса Селезнева Кира Булычева, миелофонУстройство для чтения чужих мыслей в фантастических романах Кира Булычева. , «Алиса в Стране чудес», «Алиса в Зазеркалье», что-то потустороннее. Это должен быть доброжелательный помощник, друг. Но не просто друг-няшка, а где-то и с чувством юмора. Что-то должно быть живое.

Машинное обучение ,

Поисковые технологии ,

Разработка мобильных приложений

В будущем, как нам кажется, люди будут взаимодействовать с устройствами с помощью голоса. Уже сейчас приложения распознают точные голосовые команды, заложенные в них разработчиками, но с развитием технологий искусственного интеллекта они научатся понимать смысл произвольных фраз и даже поддерживать разговор на любые темы. Сегодня мы расскажем читателям Хабра о том, как мы приближаем это будущее на примере Алисы – первого голосового помощника, который не ограничивается набором заранее заданных ответов и использует для общения нейронные сети.

Несмотря на кажущуюся простоту, голосовой помощник – один из самых масштабных технологических проектов Яндекса. Из этого поста вы узнаете, с какими сложностями сталкиваются разработчики голосовых интерфейсов, кто на самом деле пишет ответы для виртуальных помощников, и что общего у Алисы с искусственным интеллектом из фильма «Она».

На заре своего существования компьютеры в основном применялись на крупных научных или оборонных предприятиях. Про голосовое управление тогда размышляли лишь фантасты, а в реальности операторы загружали программы и данные с помощью куска картона. Не самый удобный способ: одна ошибка, и все нужно начинать сначала.

С годами компьютеры становятся доступнее и начинают применяться в компаниях поменьше. Специалисты управляют ими с помощью текстовых команд, вводимых в терминале. Хороший, надежный способ – он применяется в профессиональной среде и по сей день, но требует подготовки. Поэтому когда компьютеры стали появляться в домах обычных пользователей, инженеры принялись искать более простые способы взаимодействия машины и человека.

В лаборатории компании Xerox зарождается концепция графического интерфейса WIMP (Windows, Icons, Menus, Point-n-Click) – массовое применение она нашла в продуктах уже других компаний. Заучивать текстовые команды для управления домашним компьютером больше не требовалось - им на смену пришли жесты и клики мышью. Для своего времени это было настоящей революцией. И теперь мир приближается к следующей.

Теперь почти у каждого в кармане лежит смартфон, вычислительных мощностей которого достаточно, чтобы посадить корабль на Луну. Мышь и клавиатуру заменили пальцы, но ими мы совершаем все те же жесты и клики. Это удобно делать, сидя на диване, но не в дороге или на ходу. В прошлом для взаимодействия с компьютерными интерфейсами человеку приходилось осваивать язык машин. Мы верим, что сейчас пришло время научить устройства и приложения общаться на языке людей. Именно эта идея легла в основу голосового помощника Алиса.

У Алисы можно спросить [Где поблизости выпить кофе?], а не диктовать что-то вроде [кофейня улица космонавтов]. Алиса заглянет в Яндекс и предложит подходящее место, а на вопрос [Отлично, а как туда пройти?] - даст ссылку на уже построенный маршрут в Яндекс.Картах. Она умеет отличать точные фактовые вопросы от желания увидеть классическую поисковую выдачу, хамство – от вежливой просьбы, команду открыть сайт – от желания просто поболтать.

Может даже показаться, что где-то в облаке работает нейронная чудо-сеть, которая в одиночку решает любые задачи. Но в реальности за любым ответом Алисы скрывается целая цепочка технологических задач, решать которые мы учимся уже 5 лет. И начнем мы свой экскурс с самого первого звена – со способности слушать.

Привет, Алиса

Искусственный интеллект из научной фантастики умеет слушать – людям не приходится нажимать на специальные кнопки, чтобы включить «режим записи». А для этого нужна голосовая активация – приложение должно понимать, что человек к нему обращается. Сделать это не так легко, как может показаться.

Если вы просто начнете записывать и обрабатывать на сервере весь входящий звуковой поток, то очень быстро разрядите батарейку устройства и потратите весь мобильный трафик. В нашем случае это решается с помощью специальной нейронной сети, которая обучена исключительно на распознавание ключевых фраз («Привет, Алиса», «Слушай, Яндекс» и некоторых других). Поддержка ограниченного числа таких фраз позволяет выполнять эту работу локально и без обращения к серверу.

Если сеть обучается понимать лишь несколько фраз, вы могли бы подумать, что сделать это достаточно просто и быстро. Но нет. Люди произносят фразы далеко не в идеальных условиях, а в окружении совершенно непредсказуемого шума. Да и голоса у всех разные. Поэтому для понимания лишь одной фразы необходимы тысячи обучающих записей.

Даже небольшая локальная нейронная сеть потребляет ресурсы: нельзя просто взять и начать обрабатывать весь поток с микрофона. Поэтому на передовой применяется менее тяжеловесный алгоритм, который дешево и быстро распознает событие «началась речь». Именно он включает нейросетевой движок распознавания ключевых фраз, который в свою очередь запускает самую тяжелую часть – распознавание речи.

Если для обучения лишь одной фразе необходимы тысячи примеров, то вы можете себе представить, насколько трудоемко обучить нейросеть распознаванию любых слов и фраз. По этой же причине распознавание выполняется в облаке, куда передается звуковой поток, и откуда возвращаются уже готовые ответы. Точность ответов напрямую зависит от качества распознавания. Именно поэтому главный вызов – научиться распознавать речь настолько же качественно, насколько это делает человек. Кстати, люди тоже совершают ошибки. Считается, что человек распознает 96-98% речи (метрика WER). Нам удалось добиться точности в 89-95%, что уже не только сопоставимо с уровнем живого собеседника, но и уникально для русского языка.

Но даже идеально преобразованная в текст речь ничего не будет значить, если мы не сможем понять смысл сказанного.

Какая погода завтра в Питере?

Если вы хотите, чтобы ваше приложение выводило прогноз погоды в ответ на голосовой запрос [погода], то здесь все просто – сравниваете распознанный текст со словом «погода» и если получаете совпадение, выводите ответ. И это очень примитивный способ взаимодействия, потому что в реальной жизни люди задают вопросы иначе. Человек может спросить у помощника [Какая погода завтра в Питере?], и тот не должен растеряться.

Первое, что делает Алиса при получении вопроса, это распознает сценарий. Отправить запрос в поиск и показать классическую выдачу с 10 результатами? Поискать один точный ответ и сразу выдать его пользователю? Совершить действие, например открыть сайт? А, может, просто поговорить? Невероятно сложно научить машину безошибочно распознавать сценарии поведения. И любая ошибка здесь малоприятна. К счастью, у нас есть вся мощь поисковой машины Яндекса, которая каждый день сталкивается с миллионами запросов, ищет миллионы ответов и учится понимать, какие из них хорошие, а какие – нет. Это огромная база знаний, на основе которых можно обучить еще одну нейронную сеть – такую, которая бы с высокой вероятностью «понимала», чего именно хочет человек. Ошибки, конечно же, неизбежны, но их совершают и люди.

С помощью машинного обучения Алиса «понимает», что фраза [Какая погода завтра в Питере?] – это запрос погоды (кстати, это заведомо простой пример для наглядности). Но о каком городе идет речь? На какую дату? Здесь начинается этап извлечения из пользовательских реплик именованных объектов (Named Entity Recognition). В нашем случае важную информацию несут два таких объекта: «Питер» и «завтра». И Алиса, у которой за плечами стоят поисковые технологии, «понимает», что «Питер» – синоним «Санкт-Петербурга», а «завтра» – «текущая дата + 1».

Естественный язык – не только внешняя форма наших реплик, но и их связность. В жизни мы не обмениваемся короткими фразами, а ведем диалог – он невозможен, если не помнить контекст. Алиса его помнит – это помогает ей разбираться со сложными лингвистическими явлениями: например, справляться с эллипсисом (восстанавливать пропущенные слова) или разрешать кореференции (определять объект по местоимению). Так, если спросить [Где находится Эльбрус?], а потом уточнить [А какая у него высота?], то помощник в обоих случаях найдет верные ответы. А если после запроса [Какая погода сегодня?] спросить [А завтра?], Алиса поймет, что это продолжение диалога про погоду.

И кое-что еще. Помощник должен не только понимать естественный язык, но и уметь говорить на нем – как человек, а не как робот. Для Алисы мы синтезируем голос, в оригинале принадлежащий актрисе дубляжа Татьяне Шитовой (официальный голос Скарлетт Йоханссон в России). Она озвучивала искусственный интеллект в фильме «Она» , хотя вы могли запомнить ее и по озвучке чародейки Йеннифэр в «Ведьмаке». Причем речь идет о достаточно глубоком синтезе с применением нейронных сетей, а не о нарезке готовых фраз – записать все их многообразие заранее невозможно.

Выше мы описали особенности естественного общения (непредсказуемая форма реплик, отсутствующие слова, местоимения, ошибки, шум, голос), с которыми нужно уметь работать. Но у живого общения есть еще одно свойство – мы далеко не всегда требуем от собеседника конкретного ответа или действия, иногда нам просто хочется поговорить. Если приложение будет отправлять такие запросы в поиск, то вся магия разрушится. Именно поэтому популярные голосовые ассистенты используют базу редакторских ответов на популярные фразы и вопросы. Но мы пошли еще дальше.

А поболтать?

Мы научили машину отвечать на наши вопросы, вести диалог в контексте определённых сценариев и решать задачи пользователя. Это хорошо, но можно ли сделать ее менее бездушной и наделить человеческими свойствами: дать ей имя, научить рассказывать о себе, поддерживать разговор на свободные темы?

В индустрии голосовых помощников эта задача решается с помощью редакторских ответов. Специальная команда авторов берет сотни наиболее популярных у пользователей вопросов и пишет по несколько вариантов ответов на каждый. В идеале это нужно делать в едином стиле, чтобы из всех ответов складывалась цельная личность помощника. Для Алисы мы тоже пишем ответы – но у нас есть кое-что еще. Кое-что особенное.

Помимо топа популярных вопросов существует длинный хвост из низкочастотных или даже уникальных фраз, на которые заранее подготовить ответ невозможно. Вы уже догадались, с помощью чего мы решаем эту проблему, не так ли? С помощью еще одной нейросетевой модели. Для ответов на неизвестные ей вопросы и реплики Алиса использует нейросеть, обученную на огромной базе текстов из интернета, книг и фильмов. Знатоков машинного обучения, возможно, заинтересует то, что начинали мы с 3-слойной нейронной сети, а теперь экспериментируем с огромной 120-слойной. Детали прибережем для специализированных постов, а здесь скажем, что уже текущая версия Алисы старается отвечать на произвольные фразы с помощью «нейросетевой болталки» – так мы ее называем внутри.

Алиса учится на огромном количестве самых разных текстов, в которых люди и персонажи далеко не всегда ведут себя вежливо. Нейросеть может научиться совсем не тому, чему мы хотим ее научить.

– Закажи мне сэндвич.
– Обойдетесь.

Как и любого ребенка, Алису нельзя научить не хамить, ограждая ее от всех проявлений хамства и агрессии – то есть обучая нейросеть на «чистой» базе, где нет грубостей, провокаций и прочих неприятных вещей, часто встречающихся в реальном мире. Если Алиса не будет знать о существовании подобных выражений, она будет отвечать на них бездумно, случайными фразами – для неё они останутся неизвестными словами. Пусть лучше она знает, что это такое – и выработает определённую позицию по этим вопросам. Если ты знаешь, что такое мат, ты можешь либо ругнуться в ответ, либо сказать, что не станешь разговаривать с ругающимся. И мы моделируем поведение Алисы так, чтобы она выбирала второй вариант.

Бывает так, что сама по себе реплика Алисы вполне нейтральна, но вот в контексте, заданном пользователем, ответ перестаёт быть безобидным. Однажды, еще во время закрытого тестирования, мы попросили пользователя найти какие-то заведения – кафе или что-то подобное. Он сказал: «Найди другое такое же». И в этот момент в Алисе случился баг, и она вместо запуска сценария поиска организации дала довольно дерзкий ответ – что-то вроде «на карте поищи». И не стала ничего искать. Пользователь сначала удивился, а потом удивил и нас, похвалив поведение Алисы.

Когда Алиса использует «нейросетевую болталку», в ней может проявиться миллион разных личностей, так как нейросеть вобрала в себя немного от автора каждой реплики из обучающей выборки. В зависимости от контекста Алиса может быть вежливой или грубой, жизнерадостной или депрессивной. Мы же хотим, чтобы персональный помощник представлял собой целостную личность со вполне определенным набором качеств. Здесь на помощь приходят наши редакторские тексты. Их особенность в том, что они изначально написаны от лица той личности, которую мы хотим воссоздать в Алисе. Получается, что можно продолжать обучать Алису на миллионах строк случайных текстов, но отвечать она будет с оглядкой на эталон поведения, заложенный в редакторских ответах. И это то, над чем мы уже работаем.

Алиса стала первым известным нам голосовым помощником, который старается поддерживать общение не только с помощью редакторских ответов, но и используя обученную нейронную сеть. Конечно же, мы еще очень далеки от того, что изображают в современной фантастике. Алиса не всегда точно распознает суть реплики, что влияет на точность ответа. Поэтому работы у нас еще много.

Мы планируем сделать Алису самым человекоподобным помощником в мире. Привить ей эмпатию и любознательность. Сделать её проактивной – научить ставить цели в диалоге, проявлять инициативу и вовлекать собеседника в разговор. Сейчас мы одновременно и в самом начале пути, и на переднем крае наук, изучающих эту область. Чтобы двигаться дальше, придется этот край подвинуть.

С середины мая ленты порталов, посвящённых мобильной электронике, запестрели новостями о том, что «Яндекс» проводит испытания собственного голосового помощника — аналога «яблочного» ассистента Siri . Голосовому помощнику от «Яндекс» дали имя «Алиса» — разработчики утверждают, что в честь Алисы Селезнёвой, героини советских фильмов. Сейчас «Алиса» уже доступна всем обладателям мобильного приложения «Яндекс».

Существует весьма красноречивая статистика (собранная порталом SEO-Auditor), утверждающая, что свыше 90% отечественных юзеров ищут информацию в одной из 2-х поисковых систем – Google или «Яндекс». Системам Mail.ru и Рамблер остаются жалкие крохи внимания пользователей, а о существовании Bing и Yahoo многие российские юзеры и вовсе не подозревают.

При этом по рейтингу SEO-Auditor можно понять, что «Яндекс», существенно опережавший Google в середине 2016-го года, в 2017-ом близок к тому, что отдать «пальму первенства». Почему «Яндекс» становится слабее? Ответ прост: потому что всё больше людей лезут в интернет с мобильных устройств, и всё меньше – с ПК. На многих ли гаджетах браузер по умолчанию работает с «Яндекс»? Нет — любой Android-смартфон сразу заходит в Google.

Дабы не допустить монополии на российском рынке поисковых систем и не проиграть Google конкуренцию вчистую, «Яндекс» пытается предложить пользователям нечто, чего не дал им ещё «заморский гигант». Этим «нечто» и должен стать толковый голосовой помощник, понимающий русский язык. Google Assistant хорош, но с русским у него пока туго; Google Now весьма примитивен по сравнению, скажем, c Siri и Alexa от Amazon. «Алиса» нужна «Яндексу», чтобы поддержать популярность.

Российской компании удалось выпустить своего голосового помощника на массовый рынок раньше, чем Google Assistant заговорил на русском — а это значимая победа.

Когда вышел голосовой помощник «Алиса»?

Компания «Яндекс» официально представила «Алису» 10 октября 2017 года . Прибегнуть к услугам «Алисы» могут владельцы всех устройств с iOS и Android. На ПК с «операционкой» Windows помощник продолжает работать в бета-версии. На других ОС поисковой гигант запускать интеллектуального ассистента не спешит.

«Алиса» хорошо распознаёт речь — более того, она понимает пользователя с полуслова. Как сообщает «Яндекс», ассистентка обучена на огромном массиве текстов, а потому является настоящим эрудитом — она способна распознавать даже незавершённые вопросы, учитывая контекст сказанного ранее. В отличие от бета-версии официальная «Алиса» не имеет проблем с интонацией – говорит она голосом Татьяны Шитовой, актрисы, озвучивающей Скарлетт Йоханссон. В «Яндекс» любят привлекать к озвучке сервисов звёзд — навигатор этой компании, например, способен говорить голосом рэпера Басты.

Что умеет ассистент «Алиса» от «Яндекс»?

Прокладывает маршруты, находит адреса. Также программа сообщает о пробках.
Производит традиционный поиск в системе «Яндекс».
Даёт прогнозы погоды.
Сообщает адреса заведений – кафе, бизнес-центров, хостелов.
Выполняет математические действия, конвертирует валюты.
Запускает сторонние приложения — например, Instagram и «ВКонтакте».
Поддерживает диалог, а иногда даже демонстрирует музыкальную эрудицию, цитируя песни различных исполнителей – от группы «Аквариум» до Oxxxymiron.

Ожидается, что со временем многие другие крупные компании тоже дадут «Алисе» доступ к своим приложениям.

Разработчики здорово постарались, чтобы максимально «очеловечить» «Алису» — поэтому голосовой ассистент от «Яндекс» способен юморить не хуже Siri, некоторые из перлов которой стали популярными мемами. Вот как «Алиса» объясняет, почему её так зовут:

Ответы «Алисы» действительно до крайности забавны, и голос помощника звучит вполне себе естественно (куда лучше, чем в бета-версии) — благодаря технологиям машинного обучения склейки почти незаметны. Те же, кого раздражают небольшие «дефекты речи», могут отключить голос и ответы «Алисы» читать.

Как установить «Алису» на смартфон?

Загрузить «Алису» на смартфон можно, скачав и установив официальное приложение «Яндекс» из Google Play или AppStore. Следует запустить приложение и нажать на синюю клавишу с изображением микрофона, расположенную точно посреди экрана.

Появится окно переписки, где будут отображаться старые запросы и ответы, данные на них «Алисой». Снова кликнув на кнопку с иконкой микрофона, юзер сможет сделать новый голосовой запрос.

Заключение

Согласно статистике, в 2016 году в мире использовались 3.5 млрд различных устройств с голосовыми помощниками. По оценкам специалистов, к 2021 году число таких устройств может увеличиться двукратно. Статистика убеждает, что мы находимся на стадии становления мощного общемирового бренда – уже в скором времени компания, которая не подарила миру интеллектуального помощника, созданного собственноручно, будет считаться аутсайдером.

Все крупные разработчики ПО уже обзавелись голосовыми ассистентами, которые работают в разной степени эффективно: например, Apple радует своих поклонников «умницей» Siri, а Samsung , напротив, огорчает пользователей бестолковым (пока) Bixby . Компания «Яндекс» тоже не осталась в стороне – её помощник «Алиса» с точки зрения функциональности сопоставим с нынешним хитом Google Assistant.

Всем доброго дня или вечера. Сегодня решил рассказать вам об одних реальных сутках, проведенных с голосовым помощником Яндекс Алиса. Эта история будет о том, как вначале с ней совсем ничего не получалось, но потом вдруг все стало у нас хорошо. Для пущего эффекту, я еще и голосового помощника Гугл установил и все вопросы ему тоже задал. Читайте дальше, кто оказался умнее - я, Алиса или Гугл.

Как скачать голосовой помощник «Яндекс Алиса» и почему в первый день сделать это было не просто

Как только на моем любимом новостном сайте появилось сообщение о выпуске Алисы, я решил, что хочу ее установить. Google на тот момент еще даже не представлял что это за чудо, а Яндексом я не пользуюсь. Потому озадачился поиском в Google Play Market, где нашел по запросу «Алиса Яндекс » только приложение «Яндекс Бета». Его и установил.

Уже потом, разобравшись, я понял, что надо было ставить приложение «Яндекс» без «беты», куда и была помещена голосовая помощница Алиса. Впрочем, не суть важно. Чтобы вы не путались, вот вам ссылки на приложение для смартфонов.

Как установить, рассказывать не буду. Сами догадаетесь. Если все получится, то открыв приложение вы увидите сиреневый значок микрофона, на него тыкайте и начинайте спрашивать.

А если вы захотите установить Алису на свой компьютер Windows, то придется довольствоваться “бетой” программы.

Как Алиса меня куда подальше послала, но извинилась

Сам я живу под Минском в небольшом городке. Все мы понимаем, что разработчики в первую очередь делают приложения для жителей мегаполисов. А потому было вдвойне интересно, как справится Алиса с моими провинциальными запросами. Тут еще и Яндекс подзадорил пресс-релизом, где пообещал, что голосовой помощник будет понимать живую речь.

Первый вопрос был такой: «где ближайшее СТО». Алиса ответила, что в городе Липецке есть некая Stella, которая работает с 10 утра до 9 вечера (потом оказалось, что это магазин одежды). Посмотрев на карте, что до нее переть около 1000 км, заподозрил неладное. Проверил местоположение, задав вопрос «где я» – и получил ответ «Гвинейский залив». Тут возникло сразу два вопроса. Неужели от Гвинейского залива ближайшее СТО только в Липецке? А как же Того или Буркина-Фасо, там-то точно хоть одна ремонтная мастерская на две страны, но должна быть. И почему Алиса думает, что я в море?

Разобраться с вторым вопросом было легче, с него и начал. Полез в настройки своего , который только недавно хвалил в обзоре за точность и скорость работы GPS. Все было включено. Тогда открыл браузер Google Chrome и вбил прямо в поиск «ближайшее СТО», получив варианты в Минске. Уже неплохо. Значит местоположение работает. Хотя есть и поближе, конечно, автомастерские.

Спросил у Алисы какая сейчас погода. И та – о чудо – рассказал погоду для моего города, а не африканских просторов. «Вроде заработало!» – подумал я и давай сыпать самыми актуальными на тот момент вопросами:

Где купить вкусное пиво? – в первый раз Алиса магазин пива не предложила, а показала ссылку на Вики, с ответом, что такое пиво. Во второй – дала адрес в Минске неплохого магазина (бывали – знаем).
Когда наступит Новый год? – почему-то начала рассказывать про китайский. Xiaomi ей мой что-то навеял?
Сколько миллиметров в парсеке? – ответ отправила искать в Яндекс поиск.
Ты знаешь белорусский язык? – уклончиво отправила в список, что она умеет. Естественно белорусского языка там не оказалось.
Кто такой Якуб Колос? – Белорусского классика она не нашла совсем! Даже в поиск не отправила.
Чем ты занимаешься в свободное время и т. п. – Оказалось, бродит по интернету.

К слову сказать, все ответы, что меня не устраивали я помечал как неудовлетворительные. И Алиса исправно извинялась в стиле «не ошибается тот бот, который ничего не делает». И то приятно.

С географией у Алисы было все совсем плохо, а с юмором даже наоборот

На вопрос «Хорошо ли жить в Беларуси?» – ответила, что НЕ ЗНАЕТ такой страны. Тут я совсем загрустил и высказал ей все, что о ней думаю. Подробно пересказывать эту часть беседы не буду, но там присутствовали слова «тупая», «падла» и «плохо учишься».

Обстановку разрядила сама Алиса, когда я, устав ее нравоучить, попросил рассказать анекдот. Вот реально смешной! Попробуйте сами попросить Алису рассказать шутку…

Только, казалось, жизнь наладилась и Алиса стала понимать, где мы с ней находимся. Как снова все пошло не так.

На вопрос «где купить хлеб» она послала меня в город Новокузнецк, ул. Вокзальную, 65. С одной стороны, расстояние в 4 500 километров меня не устраивало, так как жена просила принести его побыстрее. С другой, подумал, чем черт не шутит, - доверюсь искусственному интеллекту. Не гулять же еду, а по делу!

Дальняя дорога требовала большого запаса топлива. На вопрос «Где заправить машину?» получил от Алисы ответ: «Форсаж», г. Канаш, Канашская улица, 65, сейчас закрыто. Доля логики в этом была - посмотрев на карту я убедился, что это по дороге, всего в 1500 километров от меня. «Пока доеду, откроется!» – решил я и стал собираться в дорогу за хлебом за 4,5 тыс. километров.

Яндекс Алиса нашла заправку по дороге

Жена, узнав, что я собираюсь в новокузнецкий магазин, не отпустила. Я расстроился и снова наговорил Алисе много всего лишнего. На этот раз вот читайте, там все цензурно:

Чтобы как-то разрядить нервозное настроение из-за несостоявшегося шопинга, поговорил с Алисой про котиков. Тут мы сошлись:

Самый главный вопрос Алисе и счастливый для кого-то конец

Устав от неопределённости Алисиных ответов, я решил продолжить эксперимент и задавать вопросы более точные, так сказать, геопривязанные. «Макдональдс» Яндекс Алиса не захотела показывать ни в Минске, ни в Москве (после Новокузнецка, съездить за гамбургером в Москву казалось плёвым делом).

А вот кофейню в моем городке на вопрос «где попить кофе» подсказала! Я понял, что искусственный интеллект работает! И задал самый главный вопрос:

Когда ты завоюешь мир? – Алиса долго уклонялась, отвечала невпопад. Но я чувствовал, что истина где-то рядом и настаивал. И вот вам ответ:

Задав еще один провокационный вопрос, хороший ли Путин? Алиса ответила, что не умеет на такие темы разговаривать. Гм, возможно завоевание мира она планирует без него? Вот сюрприз ему будет!..

Дальше было много вопросов и странных ответов. Напомню, что я находился под Минском. Меня посылали в «ближайшую» школу в Израиле, в поликлинику в республике Северная Осетия. Я устал от предложений Яндекс Алисы путешествовать по миру и пошел спать.

Гугл ассистент - почти близко, а Алиса вдруг исправилась!

На следующий день я установил приложение Allo. В нем встроен голосовой ассистент на основе искусственного интеллекта корпорации Google. Задал все те же вопросы и получил вполне достойные ответы. Все предложения школ, магазинов и поликлиник были в районе 1-70 км от меня. Никакой Африки и бескрайних просторов России. Для провинции точность неплохая!

На вопрос, хороший ли Путин, Гугл был более категоричен - предложив посмотреть видео.

И чтобы уже окончательно убедиться в недееспособности Алисы, я снова с ней пообщался на те же темы и задав все те же вопросы.

И о чудо! Yandex Алиса перестала посылать меня куда подальше, а все маршруты ограничивались моим районным центром.

Можно ли ужиться с Алисой?

Не буду больше вас томить долгими россказнями. Алиса исправилась! Если бы не моя жена, я об этом узнал бы на подъезде к городу Канаш, улице Канашской за 1,5 тыс. километров от дома в поисках хлеба.

Цель этого рассказа не в том, чтобы раскритиковать Яндекс Алису. Хотя и есть за что! Интерфейс голосового помощника Яндекс, по всей видимости, «позаимствовал» у Гугла. Имя Алиса - о-o-o-очень напоминает название голосового помощника Alexa от Amazon. У сервиса явно какие-то проблемы с работой на мобильных устройствах. При включенной , когда остальные приложения спокойно пользуются данными о местоположении, Алиса нестабильна и беспомощна. Да и ещё постоянное открывание результатов поиска в отдельной вкладке браузера. Вот в приложении Гугл “Алло” эта функция реализована удобнее. Но сам опыт общения с голосовым помощником, который понимает фразы, а не ключевые слова - это очень интересно.

Буду ли я пользоваться Алисой для поиска информации и прокладки нужных мне маршрутов? Ни за что! Может через годик-два, или раньше, когда Алиса завоюет мир. Но так же я не буду пользоваться и помощником Google. Технологии искусственного самообучающегося интеллекта только-только нащупывают свое место среди людей. Им еще многому предстоит научиться, а пока - это неплохие игрушки. Устанавливайте их, включайте и задавайте вопросы. Но не доверяйте им!

Чтобы начать разговор, запустите приложение и скажите: «Привет, Алиса» (или нажмите на кнопку с микрофоном).

Когда вы нажимаете 👎, Алиса предлагает сообщить о проблеме разработчикам. Если вы нажали 👎 по ошибке или передумали жаловаться, выберите Да нет, все хорошо .

Алиса меня не понимает

Если Алиса неправильно распознаёт ваши слова (на экране появляется не тот текст, который вы произнесли), попробуйте приблизить микрофон и сказать фразу четче. Если Алиса все равно показывает неправильный текст, нажмите 👎 и выберите вариант Моя речь не распозналась . В мобильных приложениях текст можно набрать вручную - для этого нажмите значок клавиатуры на экране Алисы.

Если же ваша речь распознаётся правильно, но Алиса отвечает невпопад или явно не понимает вопрос, нажмите 👎 и выберите вариант Ответ не соответствует вопросу .

Алиса неправильно произносит слова

Чтобы рассказать разработчикам об ошибке в произношении, нажмите 👎 под ответом Алисы и выберите вариант Неверно озвучен текст .

Алиса грубит

Алиса пытается ответить на каждый вопрос индивидуально - строгого соответствия между вопросом и ответом нет. Не подходящий по контексту ответ может обидеть или показаться неудачной шуткой. Пожалуйста, сообщите нам об этом: нажмите 👎 под ответом Алисы и выберите нужный вариант (например, Ответ обидный или оскорбительный ).