Сегодня мы с вами поговорим о том, как устроена технология классификации диалогов и зачем она бизнесу.
В B2C-отраслях — таких как авто, недвижимость, банки, медицина — компании выделяют огромные средства на привлечение лидов, которые чаще всего выражаются в звонках или заявках на перезвон менеджера. Маркетинговые расходы достигают нескольких процентов годового бюджета, и эффективность трат зависит от двух основных факторов: качество поставляемых маркетинговым агентством лидов и работы колл-центра.

Как анализировать качество звонков?
Самый простой и эффективный способ — прослушать записи разговоров. Однако такой вариант не подходит, если количество звонков в день составляет сотни и тысячи.
В данном случае на помощь приходят технологии, способные обрабатывать любые объемы информации.
Так, например, на нашей платформе входящий звонок маршрутизируется на оператора, затем разговор записывается и делится на два канала (отдельно голос клиента, отдельно — оператора), далее диалог транскрибируется и в текстовом виде передается модели для аналитики.
Как происходит обработка диалогов?
Если кратко, то на основе полученного массива текстов выделяются отдельные термины и их сочетания, с опорой на которые машина должна научиться делать выводы о тематиках разговора. Разметка происходит в несколько этапов:
- Составление словаря терминов и сочетаний слов — выделение битермов (пар слов, употребленных в одном сообщении, но не обязательно стоящих рядом) и триграмм (последовательности слов);
- Разрешение многозначности — выявление всех возможных значений слова в контексте;
- Поиск совместных слов — анализ текста в окне, где определенные слова традиционно располагаются рядом и могут быть проанализированы вместе безотносительно порядка их расположения.

Пример нативного словаря для автобизнеса.
Готовый словарь загружается в модель, которая выстраивает закономерности и начинает выявлять смыслы разговора самостоятельно.
Особенность процесса заключается в том, что словарь составляется под определенную тематику, и, например, создав модель для финансового сектора, ее можно доработать для любого банка с учетом особенностей его предложений, вместо того чтобы делать проект с нуля.
Как применять классификатор на практике?
Разберем на примере сферы недвижимости. Дорогой товар обуславливает крайне высокую стоимость привлечения одного лида — от нескольких тысяч до нескольких десятков тысяч рублей. Основываясь на данных одного из застройщиков, можно назвать сумму в 60 млн рублей, которые ежемесячно уходят маркетинговому агентству за генерацию звонков и заявок.

Пример классификатора для недвижимости.
В данном случае принципиально понимать, насколько эффективно расходуется бюджет как с точки зрения качества лидов, так и с точки зрения профессионализма операторов колл-центра, обрабатывающих звонки.
Кейс #1: качество лидов
Чтобы отработать KPI, агентства нередко инициируют фейковые звонки: одни и те же люди звонят с разных номеров, по разным объектам недвижимости, иногда даже записываются на просмотр квартиры и приезжают, но никогда не заключают сделку.
Задача состоит не только в том, чтобы сравнить номера, с которых приходят звонки, но и проверить голос звонящего — сколько раз он звонил, какими объектами интересовался. Если эти объекты относятся к одной категории (совпадают район, количество комнат и т.д.), запрос считается релевантным. Если же вопросы касаются разных по характеристикам квартир, и, кроме того, статусы в CRM-системе говорят, что общение с этими клиентами никогда не приводило к продаже, звонящий определяется как спамер.
С помощью голосовой биометрии были проанализированы несколько тысяч разговоров. Затем те записи, что машина определила как похожие, были повторно проверены экспертами. В результате 4,5% звонков оказались подозрительными, что в денежном выражении составляет 2 700 000 рублей в месяц.
Кейс #2: профессионализм операторов
Не только маркетинговые агентства находят способы упрощения своей работы. Менеджеры колл-центров предпочитают сотрудничать с клиентами, готовыми купить квартиру здесь и сейчас, остальные же звонки помечают в CRM-системе как нецелевые и забывают про эти заявки в дальнейшем. В результате компания теряет сотни потенциальных сделок.
В рамках второго кейса задача состояла в том, чтобы проанализировать звонки со статусом «нерелевантный» и найти среди них целевые. Таковым считается разговор, в котором упоминается вопрос приобретения квартиры: маркерами в данном случае выступали упоминания названий объекта, бюджета, количества комнат и метража. Отдельно также выявлялась готовность к дальнейшим действиям (приехать на просмотр, перезвонить) и готовность к ипотеке.
В результате 72% записей из не взятых в работу были определены как целевые, из них:
- 47% клиентов готовы к дальнейшим действиям;
- 29% рассматривают возможность ипотеки;
- 25% клиентов озвучивают бюджет;
- 73% клиентов озвучивают желаемое количество комнат.
Таким образом, классификатор диалогов дает возможность контролировать и совершенствовать процесс лидогенерации, оценивая звонки по заданным критериям. Кроме того, технология позволяет находить звонки в CRM-системе по ключевым словам и задавать выполнение определенных действий при срабатывании триггера.
