ПроCall-центр. Распознавание речи. Применение

Давайте подумаем где можно применить технологии распознавания речи. Мы не знаем ни одного сервиса, который было бы удобно управлять голосом. И задачу по построению сервиса, управляемого голосом мы тоже не решали. Но задача, на наш взгляд, весьма и весьма интересная.

Call-центры будущего

Ричард Кенни, менеджер по сегменту Контакт-центры компании Plantronics считает, что:

«Автоматизация перестанет быть одной из опцией выбора в 2020-м году, она станет нормой. Роскошь держать команду специалистов по обслуживанию, работающих на полную ставку для ведения разговоров с клиентами, станет тем, от чего компании откажутся».

«Возможность поговорить со специалистом по сервисным вопросам, всё же, сохраниться, но компании будут взимать за это плату»

Наш местный оператор связи порадовал. Но пока не понятно как позвонить на этот сервис:

Осенью прошлого года ОАО «Таттелеком» анонсировал работу сервиса с распознаванием речи. Это авто-информатор  по кодам городов и правилам набора номера. При наборе номера предлагается назвать регион, после чего система предлагает назвать город, в который требуется позвонить. Если город был распознан системой, абоненту сообщается код и правила набора номера. По мнению руководителя call-центра, этот сервис позволил существенно на 40-50% снизить нагрузку на операторов.

На наш взгляд, успешное внедрение распознавания речи было бы в «службе 09» для квартирных телефонов:

– Назовите фамилию; Клиент произносит фамилию, система распознает ее, в случае однозначного распознавания происходит переход к следующему шагу.

Аналогичным образом происходит идентификация других  параметров запроса. Назовите:

– имя;
– отчество;
– улицу;
– дом;
– квартиру.

После получения данных система производит поиск данных в базе данных и зачитывает клиенту номер телефона абонента.

Интересно было бы объединить распознавание и синтез речи для поисковых запросов номеров телефонов организаций и предприятий:

– магазин мебель Серова;
– купить обои центр;
– садик лейтенанта шмидта Казань;
– кафе вечернее;

После чего система озвучивает результаты поиска, проговаривает номера телефонов и предлагает запомнить номер или сразу переключить вызов.

Самое простое было бы обрабатывать запросы:

– такси в аэропорт;
– заказать суши;
– заказать пиццу;
– заказать суши;
– купить IP АТС;

с автоматическим переключением вызова на службу, оказывающую такую услугу.

Конечно, система распознавания должна пройти какой-то курс «обучения» прежде, чем ее можно будет запускать в боевую эксплуатацию. Вместе с тем, «обучение» невозможно без набора статистических данных на основе реальных запросов клиентов.

Айрат

11 комментариев для “ПроCall-центр. Распознавание речи. Применение

  • А подскажите как организовать подобное сравнение
    если человек сказал Александр Супов или наоборот Супов Александр
    как организовать перевод именно на этого человека? Не только же по одной фамилии ориентироватся… вдруг есть Супов Владимир

    • Хороший вопрос, Сергей. На самом деле тут все просто. Система распознавания и вернет строку «Александр Супов», «Супов Александр» или «Супов Владимир» именно в той последовательности слов, которую произнес говоривший. В зависимости от этого и будет произведен выбор направления маршрутизации вызова. Собственно, для поиска яндекса или гугла, например, нет ведь разницы между поисковым запросом «Александр Супов» или «Супов Александр». Результирующая выдача результатов будет одинакова. Так реализовать можно и в этой системе.

    • Совершенно верно. Только я рекомендовал бы делать это не в самом IVR, а на основе хранимой процедуры в СУБД в которую как параметр передается распознанная строка, а выходным параметром является либо номер телефона на который надо переводить вызов, либо датасет определенного вида. Кроме того, что придется предусмотреть разницу в порядке произнесения слов («Александр Супов», «Супов Александр). придется еще предусмотреть различные варианты часто встречающегося ошибочного распознавания некоторых слов. Например, «Супов», «Супоф», «Сувов», «Сутов», «Сутоф» и пр. Сопоставление тех или иных ошибочно распознанных слов с необходимыми ключевыми производится на основе частоты таких случаев.

    • Ну на самом деле это не так уж и сложно, если владеть определенными технологиями обработки данных. Кроме того, мы готовы Вам оказать помощь в этом.

  • попробовал длинный текст обычным темпом надиктовать, поржал)
    продиктовал
    Наш дом находится по адресу Петропавловская 70, построен в 1963 году, ему уже 48 лет. Около дома износился асфальт, его ни разу не ремонтировали. Образовались две ямы и люди падают, хотя бы ямы бы заделали! Я обращался к главному инженеру, он сказал что это домовая территория и нужно обратиться к своему депутату. Нужно отремонтировать дорогу или хотя бы провести частичный ремонт и устранить дыры в асфальте.
    распознало как
    наш дом находится по адресу петропаловской 70мм 1904 году лимона 48 лет какого дома лечусь асфальт его ни разу не монтировать умер, люди падает хотя бы я мог, я бросился главным инженером он сказал что ты домой територия и нужно обратится фанатка тату нужно отремонтировать дорогу или хотя бы провести частичный ремонт устранить выросла

    • Речь ведь не идет о секретаре, который будет за вами формировать машинописный текст. Речь идет о распознавании голосовых фрагментов небольшой длины, по которым идет дальнейшая маршрутизация вызова или выдача определенного контента на основе вычленения из фразы ключевых слов. Такое — работает.

  • Перебор подходящих вариантов имени можно сократить? чтобы он искал в тексте *александр*…*супов*
    а то гугл распознает по всякому ясупов усупова…

Добавить комментарий

Ваш e-mail не будет опубликован.

*