Чат-бот – это программа-собеседник, которая выясняет потребности пользователей, а затем помогает удовлетворить их.
Введение
В начале 2018-го года «Яндекс» выпустил в свет «умного» ассистента по имени «Алиса», который стал помощником бизнесу. Клиенты получили возможность обращения к компаниям через «Алису» со своего смартфона или «Яндекс.Станции». А уже в июле того же года появился «Google Ассистент», который освоил и русский язык. Российские фирмы получили возможность создавать собственные приложения для общения с клиентами через помощника от Google.
По сути, родился новый рынок, на котором бренды могут сражаться за внимание клиентов. Организации, которые первыми интегрировались с голосовыми ассистентами, получили шанс стать новыми основными помощниками клиентов. К примеру, «Алиса» стала помогать клиентам компаний «Утконос», «Папа Джонс», McDonald’s, S7 Airlines отыскать требуемую информацию и заказать услуги.
Для того чтобы научить голосового ассистента ориентироваться в услугах бизнеса, необходимы специальные разговорные навыки, которые формируются разработчиками. Все навыки являются «умными» разговорными ботами, которых можно использовать как службу поддержки, отдел бронирования или интерактивный магазин.
Автоматизация деловых процессов при помощи разговорного интерфейса и чат-ботов
Рынок чат-ботов прошел стадию пиара и экспериментов и вошел в стадию гонки технологий и повышения эффективности инструмента. Понятие «чат-бота» стало заменяться более масштабным и полноценным, и превратилось в разговорный искусственный интеллект, Conversational AI. Организации используют его для организации общения с клиентами на сайтах, в мессенджерах, мобильных приложениях и умных устройствах.
За «разговорностью» скрываются современные технологии распознавания и синтеза речи, технологии восприятия естественных языков, алгоритмы машинного обучения. Фирма Just AI разработала конструктор разговорных ботов Aimylogic. В нем можно сформировать «умного» ассистента, понимающего живой язык и использующего совокупность алгоритмов машинного обучения.
Для того чтобы «понимать» речь, чат-бот должен сопоставить услышанное с фразами большого количества других людей, на которых бот проходил обучение. Он должен найти сходство с образцами фраз, определить тему вопроса и выполнить запрограммированное на данный вопрос действие.
У людей появляется иллюзия того, что бот его понимает, то есть, он действует логично, реагирует подобно людям и способен поддержать беседу. На этой иллюзии базируется известный тест Тьюринга, а именно, если эксперт не может определить, бот с ним общался или человек, то значит технология прошла испытание.
Понимание является субъективной «величиной», которая не просто поддается измерению. Корпорация Microsoft провела исследование эффективности системы распознавания речи и системы ответов на вопросы по определенной тестовой совокупности, и обе системы показали эффективность больше, чем у людей. Тесты были пройдены с минимальным количеством ошибок, что стало отличной новостью для разработчиков интеллектуальных систем.
Передовые разговорные ассистенты способны продемонстрировать высокую степень понимания людей и точности ответов, особенно, если им поставлена достаточно тривиальная задача и задана тематика беседы, такая как, бронирование билетов, поиск вакансии, заказ пиццы.
Обучение чат-ботов, в принципе, аналогично обучению людей. Человек с детства умеет отделить важное от шума, учитывать контекстное содержание разговора, понять различное произношение одних и тех же фраз. К примеру, родители могут понять, что фраза «мама, молись и кайся» на самом деле означает «Мама, Малыш и Карлсон». А продавец в магазине способен быстро понять, что фраза «такое же, но с перламутровыми пуговицами» подразумевает желание поменять товар. Однако чат-бот является машиной, поэтому его прежде всего следует обучить такому восприятию при помощи специальных технологий.
«Умный» ассистент обязан правильно осуществлять преобразование звуков в слова, обладать пониманием смысла вопроса, учитывать контекст беседы и давать ответы адекватные контексту. Все это является комплексом речевых технологий и технологий понимания естественного языка (NLU). Процесс обучение состоит из следующих этапов:
- Этап обучения пониманию речи и текста.
- Этап работы со смыслом.
- Этап работы с контекстом.
На первом этапе бот учится распознавать признаки звука или его цифровые параметры. Следует осуществить определение и интерпретацию этих параметров так, чтобы на выходе получить сказанную человеком фразу. Здесь имеется немало проблем, и главной является проблема отделения запроса от шумов, а также надо уметь распознавать различные по значению, но одинаковые по звучанию слова, например, «мыла» и «мыло». Из набора возможных вариантов следует выбрать самый подходящий. Чат-бот применяет языковую и акустическую модели, на которых он предварительно обучается на очень большом объеме данных, накапливая опыт.
В работе со смыслом используется технология Natural Language Understanding. Фраза пользователя уже представлена в виде текста, однако ее смысл и желание клиента еще не являются определенными. «Умный» ассистент должен начать действовать подобно человеку, то есть, соотнести фразу с образцами, на которых он проходил обучение, и найти самую подходящую по смыслу. Он должен мыслить классами, соотнося новый запрос с одним из них. А классы должны формироваться в зависимости от области использования бота, то есть, например, банковских услуг, оформления заказов, консультаций по грузоперевозкам.
При работе с контекстом технология внутри чат-бота обязана учитывать контекст беседы. Например, вопрос «Как будет “забронировать номер” по-английски?» может быть воспринят и как бронирование номера, и как запрос к переводчику.