Может ли робот опознать проблемного клиента?

25 окт 2020 19:40 #97320 от ICT
Публикуем очередное интервью, имеющее в общем и целом связь с темой диверсификации (предыдущие интервью смотрите здесь и здесь). На этот раз состоялся разговор с с командой стартапа speechWORKS. Редакция Nag.Ru уже традиционно предлагает вам:видеозапись интервью,аудиоверсию разговора для скачивания (например, чтобы послушать в машине и в общественном транспорте),печатную версию для чтения, включая возможность скачать файл в формате pdf для "читалки".
Помимо штатных комментариев к статье, которые могут стать основой для длительного обсуждения темы на форуме, есть возможность пообщаться более оперативно в нашей группе telegram, созданной как раз для этого разговора. Что это: Машинный анализ эмоций и интонаций в аудиозаписях. Для чего это: Выявление звонков от недовольных клиентов, контроль качества, машинный анализ интонаций для повышения эффективности продаж. Почему важно: Уже сейчас можно на лету выявлять конфликтные звонки и на базе этой информации выявлять типовые сбои в бизнес-процессах. В перспективе технология позволит на лету давать подсказки начинающим продажникам, и их эффективность приблизится к эффективности специалистов с огромным опытом. Обычно я пиарю проекты, где есть готовый продукт. Сегодня у нас стартап в ранней фазе - анализ эмоций в голосе. Технология в целом работает, уже сейчас можно выявлять конфликтные звонки. Ребята ищут тех, кто готов пилотироваться, делать у себя тестовые внедрения и участвовать в обучении нейросетки. Я энтузиаст речевой аналитики и верю, что ее применение в коммерции открывает огромные перспективы. Наш разговор с командой speechWORKS состоял из двух частей - короткая, где парни объявляют, что ищут заинтересованных во внедрении. И длинная - разговор о перспективах применения машинного анализа интонаций в коммерции. Потенциальные направления применения:анализ температуры лида (отличать людей, которые готовы и хотят купить, от людей, которые просто прицениваются);сопоставление голоса клиента с поведенческим типом по модели DISC. Диспетчеризация входящих обращений (попытка собрать комплементарные пары из клиента и продажника), формирование в реальном времени рекомендаций по переговорной тактике (для носителей разных поведенческих типов важны разные свойства продукта);детектор лжи в голосовом канале. Оценка вероятности того, что клиент вводит нас в заблуждение. Можно применить для выявления опасности в длинных сделках, когда клиент кормит нашего сейла "завтраками", а сам ориентируется на конкурентов. Система предоставит сигнал о том, что сделка под угрозой и надо менять сейла на более опытного или задействовать инсайдеров;HR-экспертиза. Выявление кандидатов, которые будут более успешны в продажах и допродажах, потому что им будут охотнее отвечать на вопросы.
К команде speechWORKS имеет смысл обращаться в двух случаях:Если у вас есть потребность в выявлении конфликтных звонков (критически важная задача для совершенствования сервиса, ее можно решать уже сейчас).Если вам интересно вести исследования в продвинутых коммерческих функциях (анализ интонаций), у вас есть большой объем данных (звонки и CRM) и есть ресурсы на разметку (люди, которые уже сейчас занимаются контролем и анализом качества переговоров).
Держите меня в курсе переговоров - я с удовольствием буду освещать пилотные проекты ! Команда speechWORKS:
Зюзин Антон, почта Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript., телеграм @aztechnologiyes
Александр Смирнов, почта Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript., телеграм @alessander_smirnov
Темы разговора на шкале времени: 00:00 Представление стартапа speechWORKS. Стартап в ранней фазе, есть технология, но нет продукта. Команда занимается аудиоаналитикой: анализом эмоций, анализом интонаций. Ищет заинтересованных в применении технологии. Обсуждение подхода, на основании каких параметров делается анализ и чем это перспективней чем перевод речи в текст и анализ в тексте.
Задача поиска конфликтов.
06:00 Поиск конфликтов в коммуникациях сотрудников. Выявление сбоев в бизнес-процессах через анализ внутренних коммуникаций. Важность статистически достоверной раскладки по типам конфликтов, чтобы определить приоритеты в отладке бизнес-процессов.
08:40 Приглашение к пилотированию. speechWORKS ищет людей, у которых есть реальные бизнес-задачи и данные, чтобы дообучать нейросетку. Те, кто будет сотрудничать с технологией в ранней фазе, получат обученную систему на партнерских началах. Коллцентры с большим трафиком, CRM, и людьми которые уже сейчас занимаются прослушиванием звонков, контролем качества, которые могут поучаствовать в разметке. Система работает уже сейчас, по крайней мере может искать конфликтные звонки, анализируя файлы.
Дальнейший разговор - обсуждаем перспективы, что можно выжать из технологии в будущем.
12:00 Поведенческая модель DISC. Возможность свести клиента с тем продажником, с которым клиенту будет комфортней. Задача диспетчеризации клиентов во входящих обращениях.
15:10 Корреляция поведенческой модели DISC и темпа речи.
18:00 Экспертиза по температуре лида - клиент звонит, потому что он уже готов покупать, или он хочет просто узнать подробности?
21:00 Участие команды speechWORKS в хакатоне "Цифровой прорыв", сотрудничество с детским технопарком Кванториум по профориентации подростков.
24:00 Возможность давать сотруднику коллцентра в реальном времени подсказки для подстройки под клиента. Можно выявлять моменты, когда клиент "поплыл" и не воспринимает продажника, можно давать ему сигнал, что нужно замедлить темп разговора.
27:00 Важность интонаций. 10% информации в общении человек воспринимает из слов, 90% из интонаций. Почему в России плохо работает техника продаж СПИН - клиенты неохотно отвечают на наши вопросы. В итоге, продажники обжигаются, стесняются задавать вопросы клиентам и работают в режиме автоответчика. Существует потенциальная возможность на этапе собеседования выявлять людей, которым клиенты будут отвечать на вопросы с большей готовностью (HR-экспертиза).
30:00 Перемываем косточки проекту F2Fgroup - лицевая и аудио биометрия, психологические профили по аудиоканалу, дешевый полиграф (детектор лжи) - возможность понять, что человек что-то скрывает по интонациям в голосе.
33:04 Важность искренности и экспертности. Формирование доверия и эмоциональной связи.
33:50 Датасет для получения детектора лжи можно собрать на биллинговых событиях. Когда человек обещает оплатить и не платит, когда человек обещает оплатить и платеж приходит.
38:40 Обсуждаем перспективу решения задачи поиска проблемных сделок. В b2b норма жизни - бесконечные переносы сроков принятия решения. Можно ли научиться отличать ситуацию, когда клиент переносит сроки по объективным причинам, от ситуации, когда по факту мы выпали из приоритета и клиент уже ориентируется на другого поставщика (детектор заинтересованности)? Это важно для того, чтобы РОП мог понять, что сделка под угрозой, и пора ввести усиление (задействовать инсайдеров, задействовать лучшего специалиста). Можно собрать датасет, ориентируясь на CRM-события.
51:26 HR-задача. Очень низкая доходимость до собеседований. Из десяти тех, кто пообещал прийти на собеседование, приходят трое. Непонятно, куда деваются семь из десяти. Возможность обучить детектор лжи на репликах людей, которые обещали прийти и не пришли.
56:54 Еще раз команда speechWORKS открыта для сотрудничества, готова рассматривать организации желающих копать эти темы.
Сокращения:
ТЧ – Тимур Чудутов (ДК АйТишник, ex-RiNet).
АЗ – Антон Зюзин (speechWORKS​).
АС - Александр Смирнов (speechWORKS​).
ТЧ> Здравствуйте, дорогие друзья! У нас сегодня новая рубрика "Дорогу молодым!" Обычно я работаю с продуктами, которые можно взять и купить, а сейчас у меня редкая ситуация стартапа в совсем ранней фазе. Но ребята занимаются речевой аналитикой, анализом эмоций, а это для меня самая любимая тема, я ей горю. Я энтузиаст и патриот, поэтому как раз с этими ребятами решил зарелизить интервью. Тем более, что им как раз сейчас нужны люди, готовые окунуться в мир пилотирования, изготовления МВП, желающие поучаствовать в цифровой революции, которая у нас сейчас происходит. Представьтесь, пожалуйста.
Александр Смирнов и Антон Зюзин АЗ> Добрый день, дорогие друзья! Я Зюзин Антон и Александр Смирнов. Мы команда "speechWORKS", и мы занимаемся как раз технологией, которая позволит в ближайшем будущем любому желающему через телефон или другие устройства узнать о собеседнике какую-то полезную информацию: мужчина, женщина, психотип, эмоции и так далее. Более подробно сейчас Александр как раз расскажет об этом вопросе, поэтому всех приглашаем к тому, чтобы подружиться, начать диалог и попробовать в действии данное интересное современное решение. Александр? АС> Всем привет! Как сказал Антон, мы сделали такой движок, который может распознавать по голосу как возраст и пол человека, так и более важные для анализа эмоций характеристики - такие как настроение, темп речи, разборчивость речи, перепады его интонаций и другие факторы, которые влияют на то, какой у человека, например, темперамент, насколько эффективно он может продавать продукт или оказывать техническую поддержку и прочие другие моменты. ТЧ> Звучит очень интересно и вкусно. У меня как человека, который потратил, можно сказать, годы жизни на контроль качества, рвется вопрос. Давайте, буду задавать блиц. Первый вопрос. Анализ эмоций – тема очень старая. И всё предыдущее время я разговаривал со всеми, кто занимается поставщиками речевой аналитики, лидерами рынка – Яндексом, "Fonemica", "Speech Analytics" и людьми, которые проводили исследования, и все говорили, что на английском языке анализ эмоций есть, а на русском языке анализа эмоций нет. И раньше все решения были через Speech To Text. То есть, все решения базировались на Speech To Text, а не на анализе тембров. Что сейчас произошло? В чем революция? В чем изменения? АС> Мысли по поводу того, чтобы сделать такой движок, появлялись давно. Я считаю, что в России в принципе такие технологические решения появляются позже, но в данном случае, мне кажется, что скорее всего, это связано с тем, что распознавание речи – задача более понятная, чем анализ эмоций. И научные наработки, опубликованые в открытом доступе, могут подсказать, как это делается. Плюс, опять же, опыт других компаний. То есть, сейчас мы видим, что действительно появляется очень много новых компаний, которые занимаются анализом текста, речи. А мы решили пойти в эту сферу, потому что увидели в этом дополнительные возможности - что-то, чего действительно на российском рынке не так много. Поэтому будем пробовать. ТЧ> Я видел вашу демку, на демо-звонках действительно удается определить эмоции. То есть ключевая задача – это по крайней мере выявление конфликтного клиента. Уже хорошо. То есть без всякого DISCа, конфликтные эмоции – уже хорошо (DISC - популярная модель описания типов личности). Я общался с экспертами на эту тему. Что говорят люди? Что в данный момент по анализу эмоций эксперименты есть, но низкая достоверность. Эксперты говорят: эмоции можно определить, но не с удовлетворительной точностью (как будто, блин, Speech To Text у нас с удовлетворительной точностью, видел я этот Speech To Text), там очень много ошибок. Но мы же запускаем не огнемет по срабатыванию эмоций, всё равно идет репорт сотруднику на дослушивание - человеку, который будет дослушивать эти звонки и понимать, действительно ли это конфликтный клиент, или просто человек темпераментно говорит? Если будет какое-то количество ложных срабатываний – 20-30%, я считаю, что нормально. Для задач отдела контроля качества это очень хороший, очень важный показатель – мониторить конфликтных клиентов и разбираться – почему люди были недовольны нашим сервисом, почему они расстраиваются? Еще есть момент, который обычно упускается. Я говорю, как специалист по вопросу корпоративной отладки бизнес-процессов: очень важная информация – переговоры внутри коллектива. Обычно, когда разговаривают сотрудники с клиентами, всё вежливо и аккуратно. Когда сотрудники разговаривают друг с другом, если реально был операционный сбой и что-то пошло не так, то там эмоции никто не фильтрует. Поэтому, если движком анализа эмоций обработать внутренние голосовые коммуникации, то можно очень многое узнать о состоянии своего бизнеса. Для руководителя это будет важная-преважная информация, потому что вы получите информацию, что происходит у сотрудников на самом деле. Какой-нибудь монтажник на складе получил не тот роутер, курьер пришел не по тому адресу и так далее. Обычно организационная система изолирует от руководства такие косяки. То есть, оно заметается под ковер, менеджментом операционным урегулируется и всё хорошо у нас. А тут, если сделать такую штуку, можно получить прям правильное понимание работы бизнес-процессов. АС> Интересный кейс, да. ТЧ> Да. Я просто энтузиаст этой вещи – что называется "TQM", неправильное совершенствование бизнес-процессов. Извините, парни, что я за вас говорю. Зачем эта штука нужна вообще? В чем суть? Реально в любом сервисе есть проблемы. И на самом деле, руководитель никогда не знает, что именно является приоритетным, чем надо заниматься в первую очередь. И организационно очень сложная задача – собрать статистически достоверную раскладку о проблемах сервиса. Потому что, повторяюсь, всегда все проблемы разруливаются на уровне сотрудников. Сотрудники всё разруливают, и руководство получает картину "Всё хорошо, прекрасная маркиза" - это фундаментальное свойство организаций. Но нельзя одновременно совершенствовать всё, надо выбирать приоритетные места, узкие, критичные. Как их понять? Только статистика, которая позволяет оценивать массив обращений, и по массивам обращений выявлять то, чем реально недовольны пользователи нашего сервиса или сотрудники с точки зрения бизнес-процесса. Вот поэтому я топлю за анализ эмоций. Парни, очень хорошо, что вы есть. Извините, что опять же за вас скажу. В чем суть нашего эфира? Дорогие друзья! У меня много френдов, которые занимаются колл-центрами, занимаются налаживанием бизнес-процессов. Это золотые товарищи: "speechWORKS" - Александр, Антон. Если вам эта тема так же близка, как мне, то можете обратиться к ним напрямую, я повешу контакты. Они сейчас ищут места, где им можно попилотироваться, потренировать свою зловещую нейросетку. АЗ> Очень добрую нейросетку. Не надо, она не зловещая. ТЧ> Добрую, понятно. Эта добрая нейросетка уже дает какие-то показатели, но понятно, что как только мы начнем ее внедрять, сразу надо ее дообучать. И после цикла дообучения она станет очень полезной и, как я понял ребят, те, кто поучаствует в обучении нейросети, получит потом льготные лицензии на использование движка, и будет возможность этот очень ценный инструментарий использовать в своих целях. Не на рыночных условиях, а на партнерских. Я правильно понимаю, подтвердите, пожалуйста? АЗ> Да. АС> Да, и я на самом деле полностью согласен с тем, почему бы нам хотелось поучаствовать в этих пилотах, то есть найти партнеров? Потому что они наверняка располагают огромными мощностями, ресурсами и данными, что в наше время является очень важным фактором успеха. А у нас в свою очередь, есть выстроенный пайплайн обучения от того, что мы берем данные и выставляем готовое решение. То есть готовое решение в виде сервиса, которому можно отправлять файлы и получать ответы. А дальше мы можем направляться в любую ветку на пути развития того, что мы увидим, что заходит. Если мы поймем, например, что наибольшим профитом обладает определение конфликтных диалогов, мы будем улучшать в эту сторону. Если мы увидим, что это подстройка менеджера под клиента в режиме реального времени – это крутая-крутая тема на практике, мы будем работать в эту сторону. ТЧ> Деловая часть нашего разговора закончилась. Вот ребята, я повешу их контакты, можно будет с ними выйти напрямую, поговорить. Меня как журналиста, гиену пера держите в курсе, я очень хочу сопровождать пилоты на уровне "было – стало". Мне просто интересно, как всё это дело происходит, эта революция на практике. С анализом конфликта мне вообще всё понятно. Там хайтек исключительно в том, чтобы его найти и дальше отправить на супервайзера, который или примет, что это проблема, или отвергнет, скажет: "Здесь у нас ошибка распознания". Дальше анализы конфликта нужны для того, чтобы сделать статистически достоверную картину сервиса или какие-то операционные выводы, что такой-то сотрудник вызывает у клиентов негатив (лично мой опыт - бывали случаи, что кто-то "агрит" клиентов). Вот так. То есть, это уже ближайшая перспектива. А что касается DISСа – давайте на эту тему поговорим. Это уже у нас пошел коммерческий high end. Я сейчас вводную дам. Я смотрел эту тему. Первое – я в нее верю. То есть я знаю, что есть люди, которые в нее не верят и считают, что там темы нет. Давайте озвучим постановку: анализируя какие-то интонации, тембры голоса можно решать коммерческие задачи какого характера? Первое – давать экспертизу по клиенту. Например, отвечать на вопрос – этот клиент хочет купить или он только интересуется? Это очень важный вопрос. Практический кейс я вижу так: в колл-центр идет входящее обращение. Мы каким-то образом понимаем, что этот клиент горячий и его надо тащить по воронке продаж. Если мы понимаем, что клиент на самом деле просто осматривается, приценивается, что ему рано продавать, его надо тащить на контентную воронку. То есть, по сути, его надо отправлять другим специалистам, не менеджерам по продаже, а менеджерам, которые будут выяснять и сначала продавать идею. Такая история. Может быть этого человека надо пихать просто в автоворонку и греть рассылками, контентом, он еще не готов купить. Есть такой кейс. Есть еще более изощренная вещь - комплиментарность. Известная история, что клиентам определенного типа нужно давать продавцов определенного типа. Я проводил митапы по машинному зрению, и там люди, которые занимаются лицевой биометрией, копали именно это направление. BestFitMe конкретно. В моем канале есть митап на эту тему. Они решали как раз эту задачу – комплиментарность сотрудников (HR-задача) и комплиментарность клиентов (коммерческая задача - подбирать клиенту правильного сейлза и давать переговорную стратегию). Но основная проблема с лицевой биометрией. Почему я считаю эту историю тупиковой - лицевую биометрию очень тяжело снять. То есть очень тяжело снять лицевую биометрию, просто чтобы получить нужное количество кадров, в ритейле ты ее не получишь, очень во многих ситуациях не получишь. А аудиобиометрия действительно так устроена, что снять ее гораздо проще. Например: входящее в колл-центр обращение, и мы понимаем, что для клиентов этого типа нужно давать продавца этого типа. Если мы можем простраивать такие коммуникации, то это прямо огонь! У кого крупные колл-центры, кто занимается коммерцией, думаю, с вами с удовольствием поговорят, если вам есть, что на эту тему сказать. Простите, что я так много говорю. Я закончил. Расскажите про DISC. Я рассказал про рыночный запрос и рыночную надежду. А что у вас есть из того, что можно пощупать? АС> Антон? АЗ> Тимур, ты опять всё рассказал за нас. ТЧ> Прости. АЗ> Как раз то, к чему мы идем. Я хотел немножко рассказать про историю и становление нашего стартапа, но давай расскажу чуть позже, чтобы не было вырвано из контекста. А про DISC тогда передам слово Саше. Саша? АС> Хорошо. Действительно, пообщавшись с некоторыми людьми, которые занимаются консалтингом, в том числе в колл-центрах, мы заметили такую штуку. Опять же из нашего опыта участия во всяких программерских соревнованиях, мы поняли, что в принципе, можно на основе каких-то голосовых характеристик получать класс по этой модели DISC. Эта модель используется очень широко для профориентации, для оценки клиентов. И мы заметили, что такие голосовые характеристики, как темп речи, экспрессия в голосе, наличие банальных пауз, перепадов интонации – всё это может нам сказать о психотипе человека. То есть, например, если это доминантный тип, то у него громкая речь, короткие паузы, экспрессивная речь. Если это тип зависимость, более слабый, у него более тихий голос, он не так ярко выражен. Мы всё это можем отследить и да, действительно, мы можем направить человека к нужному менеджеру, который найдет для него правильный подход, создаст теплую атмосферу доверия, в которой он поймет, что этому человеку можно доверять, и "я куплю у того, кому я могу доверять". А другой поймет, что тут ребята говорят действительно конкретно четко, точно: "О, мне это нужно! Я люблю работать с такими людьми, я куплю у него". А наоборот если перепутать, то тут будут проблемы. ТЧ> Доминанты будут биться друг об друга рогами, да? АС> Да. То есть я вижу это так, но это гипотеза, ее надо тестировать. У нас для этого всё есть, welcome, давайте работать! ТЧ> Вообще огонь! У меня сейчас среди моих френдов куча бизнес-тренеров, которые с этим DISCом работают. Я знаю людей, которые считают DISC шарлатанством, что эта модель научно не обоснована и носит описательный характер. Это именно модель, которая позволяет информацию в голове устаканить. То есть она не обладает научной точностью, она для того, чтобы упростить жизнь. Но, с другой стороны, есть тренеры, которые в DISC верят и на DISC затачивают сотрудников. То есть, если достаточно крупный колл-центр, то действительно можно сводить клиентов и продажников - могут быть очень интересные истории. Я какую историю считаю перспективной? Это классическая битва между маркетингом и продажами за температуру лида, потому что на нее часто и мотивацию завязывают. Я вот что подумал именно с точки зрения данных и обучения нейронки. Преамбула: когда я еще руководил RiNetом, у меня был сотрудник - очень опытный телеком-сейл, он рассказывал такую историю: "Снимаю трубку, говорю с клиентом 30 секунд. Еще ничего не прозвучало, никакой существенной информации, просто поздоровались, но мне уже понятна в целом картина, я знаю ответы на два вопроса. Первый: человеку надо срочно купить или он приценивается, ему всё равно, покупать или не покупать, временного фактора нет? А второй вопрос – это лицо, принимающее решение, или, грубо говоря, секретарь, который собирает информацию?". По двум этим векторам он раскладывает стратегию, что надо с этим клиентом делать, о чем с ним говорить и как. Понятно, человек 20 лет отработал телеком-сейлом и, если действительно можно давать на входящем звонке некую экспертизу по предположениям по температуре лида – это, конечно, огонь! По крайней мере не надо сразу бросаться со скидкой, если человек спешит. И я к чему? Там с точки зрения обучения данных, есть очень простая метка – это CRM. То есть мы можем из "Битрикса" выгребать сделки, отрубать первые 30 секунд разговора в канале клиента и смотреть – была быстрая покупка или не была? Если была быстрая сделка – значит, мы понимаем, что люди с этими интонациями покупают быстро, по крайней мере не надо к ним бросаться делать скидки. Такая история. Опять же, если у людей есть развернутый процесс, то есть датасайнтисты, которые могут дообучить и в этом вопросе поэкспериментировать. Извините, что я опять за вас говорю. АЗ> Да. Но фактически, если брать в данном случае продукт как решение, которое позволяет обогатить информацию о клиенте и дальше ее дополнительно обработать. Вот то, о чем ты сейчас начал говорить в плане CRM-системы, накоплении данных о транзакциях и прочих вещах. Я хотел откатиться немного назад, когда вообще мы с Сашей встретились и начали всю историю прорабатывать. Сначала упор был на опять же Speech To Text – классическую модель и уже анализ текста туда, на те моменты, о которых мы думали, что они могут все-таки являться важной ценностью. Мы потом пришли к такому интересному выводу, когда вместе с Сашей участвовали на "Цифровом прорыве" и даже заняли там одно из победных мест, и вот сейчас вышли в финал с решением, которое позволяет дополнительному образованию (а конкретно "Кванториумам") делать геймификацию процесса обучения, выстраивать образовательную траекторию для детей, где мы как раз применили эту технологию для того, чтобы показать, как эта штука может определять психотип ребенка и его базовые мотиваторы. Причем, как сейчас используется? Есть профориентатор, который единоразово говорит: "Твой ребенок пойдет туда или туда, или туда", а эта история меняется. Может каждый месяц, может целый год. Если выдавать эти порции данных, постоянно анализируемые автоматически системой, для родителей, для образовательных организаций, для самого ребенка в некой игровой форме, то это позволяет ему быстрее подстроиться - чем ему лучше в принципе по жизни заниматься. Это немного истории не про колл-центры, а именно про детей. ТЧ> Да. Ребята, которые занимались лицевой биометрией (я буду оппонировать) говорят, что с молодежью бесполезно и непрогнозируемо заниматься профилированием психотипов, потому что человек меняется. То есть, по их данным, психопрофили ребенка всё время меняются, и после 20 лет уже можно говорить о сформированной личности и работать с профилированием полноценно. Я сейчас пересказываю позицию (BestFitMe). АЗ> Не буду спорить. Мы это использовали с точки зрения формирования модели геймификации, которая опять же помогает обогащать данные о интервьюируемом персонаже и дальше помогает ему сформировать некий дальнейший профиль. Но именно на тот момент эта работа и привела нас к тому, что можно копать в сторону эмоций. Не только Speech To Text. И дальше случилось то, что случилось – мы с Сашей стали прорабатывать вопрос: а что, если это сделать? А как это будет работать? А какой эффект даст? А вообще какие кейсы возможны? И то, о чем вы в принципе говорите, но пока не озвучили – есть целое направление НЛП, то есть нейролингвистического программирования. И один из важных элементов там – это подстройка. Подстройка под клиента – то, что делает менеджер. И вот одна из галлюциногенных или прикольных идей, которые у нас есть, на мой взгляд, которая потенциально может повысить конверсию в продажи – это мгновенная подстройка или набор рекомендаций данным алгоритмом менеджеру о том, как лучше сейчас разговаривать с клиентом: замедлиться, ускориться, говорить громче, говорить ярче, говорить более точные вещи. А дальше эту историю можно развивать с точки зрения как раз формирования базовых мотиваторов этого человека для того, чтобы понимать: о чем лучше с ним разговаривать? Но это уже следующий этап нашей разработки. ТЧ> Да, это такая история. Я думаю, не в этом году. Хотя... АС> На самом деле хотел рассказать интересный кейс. Буквально недавно, когда была первая волна коронавируса в России, и в Москве ввели пропускной режим, появилась дополнительная "горячая линия", на которой отвечали на вопросы "Как мне получить пропуск?", "Как мне выйти из дома?". Я эти звонки слышал. И там наблюдается такая проблема. Звонит бабуля, например, и говорит: "Не могу, сынок, смску непонятно отправлять и на сайте непонятно, как вообще куда заходить? Мне 80 лет". И он начинает ей тараторить информацию по листу. То есть, именно темп. То, о чем Антон говорил: "Замедлись!". А он ей тараторит, тараторит. Она вообще не воспринимает, что он говорит. И проблема в том, что Speech To Text не покажет, что потом: "Речь распознана, окей, всё говорил нормально. Чего бабуля не поняла?" А то, что бабуля потом сидела дома, умерла от голода, потому что из дома выйти не смогла, например. Я такое вижу. ТЧ> У тебя ситуация маргинальная. В смысле, что она краевая. Те, кто занимается продажами, как говорят? Говорят, что то, как человек говорит – это 10% текст, а 90% - интонация. И поэтому надо звонки слушать. РОПы слушают звонки, потому что формально одни и те же правильно сказанные слова могут привести к диаметрально разным последствиям в зависимости от интонаций, с которыми человек говорит. Есть хорошая фраза: "Почему в России не работает СПИН? Потому что у нас люди просто не отвечают на вопросы". То есть, если американская, англосаксонская культура, где он разработан, открытая, и людям задают вопрос по бизнесу, они отвечают. А у нас человек начинает думать: "Как ты меня будешь сейчас разводить?" и запирается. И отличие сейла от несейла заключается в том, что сейл задает вопрос, ему на вопрос отвечают. А несейл задает вопрос, а ему говорят: "Мальчик, идинафиг". Или девочка. Серьезно, в этом же суть. И, кстати, поэтому, например, люди боятся всяких продаж, потому что боятся, что их пошлют, боятся задавать вопросы. Классическое. Я спрашивал ребят - РОПы и обучение, тренинг продаж: "Какая главная ошибка у коммерсантов?". Человек-автоответчик. Его спросили – он ответил. Он сам не переходит в наступление, не задает вопросы. А почему? Потому, что человек не хочет оказаться дураком. Боится, не хочет, чтобы его посылали. И поэтому не задает вопросов. Просто выученная беспомощность, что называется. Я всё к чему? К тому, что если, например, можно на уровне анализа интонаций получать вероятность того, что этому человеку буду отвечать (есть какие-то такие интонации в голосе), то это очень важная HR-экспертиза. Вы можете делать входной контроль на потенциальных менеджерах по продажам и выделять тех людей, которые могут задавать вопросы. Соответственно, это выход на апсейл, на продажи, на доппродажи – в основе своей, это умение задать вопрос. Экспертиза важнейшая. Опять же, обращаюсь к слушателям этого эфира – если у вас есть какое-то понимание, где взять датасет, что человек задал вопрос и ему ответили – опять же это на РОП-контроль, на контрольных чек-листах, исходящие обзвоны, обзвоны по теплой базе. Не холодные звонки, а по теплой базе, где человек задал ванильный вопрос и понять – когда ему ответили, и когда не ответили. Если мы можем вырезать такие реплики и получать подкрепление в виде: "ответили или проигнорировали", то ценнейшая hr-экспертиза. Есть ребята, которые занимались аудиоаналитикой ( я их видел в Сколково в прошлом году), они называются F2Fgroup. Вначале они занимались лицевой биометрией, но потом перешли на аудиобиометрию. Уних было такое интересное решение – детектор лжи. Аудио. И решение такое, что робот звонит человеку и задает вопросы. Во-первых, там психологическое профилирование делается на базе как раз голосовых паттернов. И вероятность того, что человек врет. Мой любимый кейс – контролировать раз в квартал закупщика насчет откатов. "А в последнем месяце к тебе подкатывали в предложением откатов? А ты взял что-то? А подарки получал?". Я к тому, что шутки шутками, но я знаю, что есть организации, в которых тех, кто занимается закупками, тестят на детекторах лжи. И, возвращаясь к нашему разговору: дорогие друзья! Если у вас есть понимание, где взять датасет на тему человек врет или говорит правду – массовый большой объем данных, то возможно как раз это может стать решением. Дешевый полиграф, дешевый детектор лжи. Есть опять же много отраслей, где это применимо. У нас время заканчивается до перерыва. 7 минут. Давайте вы все-таки поговорите и что-то еще расскажете, что хотелось бы поведать миру. АЗ> Тут важные два момента определить с точки зрения организации. Где вообще технология даст конкретный технико-экономический или практико-экономический эффект? С точки зрения продаж – исходящие звонки, входящие звонки. С точки зрения сервиса - входящие звонки. И что мы здесь можем получить? Я буквально сегодня разговаривал с одной компанией, которая занимается внедрением IT-продуктов. Я говорю: - А как у вас выстроен процесс продаж?
- Ну, у нас РОП слушает звонки каждый день по 3-5 часов.
Я говорю:
- А он все звонки успевает послушать, всех 10-ти продавцов?
Он говорит:
- Да нет, конечно.
- Бывают осечки?
- Да, бывают. И поэтому технология в данном случае сокращает время за счет подсветки аномальных зон. То есть там, где алгоритм выявил какие-то неадекватные поведения, эмоциональные всплески, либо еще какие-то вещи, потому что так или иначе эта история сопровождается. Это может быть и на входящих звонках, и на исходящих. Это может быть не только на звонках, это может быть взаимодействие с инфоматом, который стоит в ритейле, когда человек подходит, и общаясь с ним может наорать на него, может спокойно сказать. И так далее. Тут еще важный момент какой? У нас, в отличие от Европы, Запада, ценится не следование алгоритму, скрипту продаж – жесткому, по которому человек протараторил и всё – галочку поставил, выполнил и система работает. Ценится некая искренность. Искренность и следование понятным блокам. То есть, когда человек разбирается, когда у него есть экспертиза, когда ты с ним установил эмоциональную связь, уже после этого возникает этап, на котором переходят и к продаже, и к более нормальному диалогу. ТЧ> Давайте сейчас я одну вещь выскажу, пока не забыл. У меня мозговой штурм, уже мысль пошла. Я понял, где взять экспертизу на детектор лжи, и она реальна важна. Это контроль дебиторки. Классическая ситуация, где вопрос – доверяем мы клиенту или нет? И мы говорим голосом клиенту: "Ты сегодня платить будешь?" Он скажет: "Да, я сегодня оплачу". Если у нас оплаты нет в течение этого времени, то человек врал. То есть массив аудио, где клиент говорит: "Да, я оплачу" и не оплатил, может выработать цифровой детектор лжи. Это в качестве шальной идеи. А давайте сейчас маленький перерыв сделаем и продолжим по поводу как раз работы РОПа. Повторяюсь, у меня среди моего нетворкинга много специалистов по обучению продажам, контролю коммерсантов. Давайте на эту тему поговорим: какие возможности, связанные с речевой аналитикой, есть сейчас и в некой перспективе открываются. Давайте как раз поговорим именно по поводу работы РОПа. Какие здесь есть перспективы? То есть, что реально с вашей точки зрения с этой системой можно сделать? И на эту тему подискутируем. АС> Во-первых, ты говорил про интонации, что важно не то, что сказал, а то, как сказал. Ведь по сути мы же все - b2b этот или b2c - продажа идет человеку. И важно, когда мы обращаемся правильно к человеку, не зная, что он чувствует – доверие или полный спектр необходимых эмоций. Я думаю, что проработка этих вещей очень может быть, в ней очень сильно может помочь как раз анализ эмоций. ТЧ> Хорошо, давай с точки зрения технологий. Первый вопрос: какие интонации мы ловим? И второй вопрос: как мы это будем измерять? АС> Что касается самого простого варианта: допустим, бинарный критерий, или три – хорошее, нейтральное и плохое настроение у человека. Опять же, с технической точки зрения нам нейросеть дает на это не только само значение, но еще и вероятность, которая считает, что это действительно оно. И у нас есть значение от нуля до единицы, которое измеряет плохость настроения человека или его хорошесть, допустим. ТЧ> Что нам это дает? АС> В кейсе конфликтных и неконфликтных диалогов мы их можем так фильтрануть. Например, мы поставим, что все звонки, у которых сеть уверена больше, чем на 80% процентов, что диалог конфликтный, мы... ТЧ> Извините, просто конфликты мы разобрали в первой части. Можно было бы совсем остановить эфир, я специально продолжил именно по вопросу коммерция, b2b-продажи. Есть работа РОПа, РОП слушает звонки. Вопрос – как РОПы слушают звонки? Если грамотные РОПы, они работают в CRM – отслеживают сделки, смотрят, как идет общение. Причем, там есть несколько стратегий. В некоторых случаях работают с крупными сделками, мониторят некоторых новых сотрудников. Есть разные задачи, которые нужно решать. Но, допустим, у нас есть задача – отслеживание крупной сделки. Вопрос – что мы ловим в терминах эмоций? Что является индикатором того, что РОПу нужно обратить внимание на разговор? АЗ> Важно сначала определить – какой алгоритм у РОПа с точки зрения прослушивания звонков, а уже после этого система может именно сэкономить ему время и искать, и слушать именно те диалоги, которые она подсвечивает как аномальные или с выбросами определенными. Саш? АС> Я согласен. ТЧ> Давайте я поиграю в РОПа. Первая модель: РОП хочет понять, что есть сделки, которые под угрозой. То есть b2b-продажи, обычно там есть серия переговоров – там на одного клиента идет 10 звонков – созвонов по разным поводам. И мы хотим понять – мы еще в воронке продаж или вылетаем? То есть, по каким-то причинам клиент, о котором сначала мы думали, что он будет покупать, перестал хотеть. И мы хотим вмешаться, опытного коммерсанта туда ввести на добивание. Допустим, такой кейс. Что может здесь наука предложить простому РОПу? АЗ> Это понятная легенда всех диалогов, разбитая автоматически и проставленная флагами эмоций, например. И дальше это уже привязка переходов в CRM-системе с того или другого в зависимости еще и от того, какая была эмоция в том или ином этапе диалоге. ТЧ> Ты же слышал эти разговоры. Они на самом деле все очень спокойные, если мы говорим про b2b-продажи. Там же всё довольно скучно. Там бесконечное "я подумаю", "сейчас согласовывается", "вопрос решается" и так далее. То есть, если мы говорим о задаче, надо отличить ситуацию, когда реально люди тормозят по объективным причинам или они трахают мозг. Мы можем это сделать или нет? АЗ> Тут весь вопрос – кто будет выходить на эмоцию? Сам отдел продаж (то есть продажник, который будет заниматься этим вопросом), либо это будет клиент или партнер? ТЧ> Давайте слово "эмоции" в этом куске разговора не использовать. Почему? Потому что эмоции все здесь спокойные. Давайте "интонации". АЗ> Интонации? ТЧ> Да. Давайте говорить об интонациях. То есть, есть ли какие-то индикаторы интонаций, которые система может распознать, свидетельствующие о том, что мы перестали быть у этого клиента приоритетным? Я приведу пример. Ты идешь продавать в какой-нибудь банк свою систему контроля эмоций. У тебя там всё хорошо начиналось – вы что-то пилотировали и так далее. И вдруг в какой-то момент сделка тянется-тянется, а потом – бабах! И выясняется, что люди уже купили решение от "Манго-телеком". К примеру. И вас вывели из игры. То есть, если бы ты это вовремя понял, мог бы дернуть инсайдеров, понять, что надо падать по цене – какие-то такие характерные вещи, покамест в игру вошел конкурент. Но у тебя с точки зрения интонаций всё очень спокойно. С тобой всё так же вежливо говорят, тебе же никто не грубит, не хамит. Тебе вообще ничего не говорят на самом деле. Просто идет динамо. А ты не отличишь динамо, которое происходит по внутренним причинам: "Это должен решить Сергей Петрович, а он сейчас в отпуске. Вернется из Канады на следующей неделе". А потом: "Да-да, но у нас как раз сейчас пройдет совещание, где мы это рассмотрим". То есть, динамо может быть полгода. Но, повторяюсь, динамо может быть нормальным полгода, когда тормозная организация, у которой цикл внутренних согласований длинный. И вот ситуация, когда тебя выносят конкуренты. Мы можем это отличить по интонациям, как вы считаете? АС> Я сейчас подумал немножко над этой задачей. Как бы я стал решать? Я не могу сказать, поскольку я не профессиональный b2b-сейл и не знаю всех деталей. ТЧ> Подожди, ты как датасайнтист. Тебе дают нарезки разговоров, много нарезок разговоров, где люди отвечают на вопрос: "Я-динамо". И "я-динамо" кончилось хорошо, и "я-динамо" кончилось развалом сделки. АС> Здесь позитивный момент в том, что нейросети (это же по сути черный ящик) нет разницы, какие конкретно нюансы в звонке привели к срыву сделки. Нам важен факт, нам важно, что есть запись разговора и информация о том, свалилась сделка или не свалилась. Чем больше информации, тем лучше. То есть какие-то итоговые значения. И дальше мы просто создаем модель, ее обучаем и начинаем тестировать. И какие-то контрольные выборки нам дадут понять, насколько это действительно совпадает с интересами компании. ТЧ> Мне ребята-нейросетевики говорили, что чтобы понять, задача в принципе сходится или не сходится – есть корреляция или нет корреляции, датасет нужен довольно небольшой – условно говоря, 500 единиц достаточно для того, чтобы понять – у нас продвижение или нет. Если на 500-1000 экземпляров мы получили сходимость, то систему можно дообучать. Она будет дообучаться и дальше выйдет на плато, где ее будет бесполезно кормить новыми данными. Я так понял то, что ребята объясняли. То есть подтвердите, опровергните. Начиная с какого количества этих экземпляров можно понять, что задачи сходятся? АС> Во-первых, это число разное для разных критериев. Например, если мы распознаем что-нибудь типа пола человека, то вообще достаточно еще меньшего количества экземпляров и меньшей длительности, что немаловажно. А в этом случае возможно нужны более длинные куски и их нужно больше. То есть это на самом деле экспериментальный параметр, я не думаю, что кто-то сможет точно сказать. ТЧ> Это качественно. АС> Да. А в принципе, с чем это может коррелировать из параметров? Это может коррелировать, во-первых, с формулировкой задачи. Здесь у нас интонация. Это всегда коррелирует с мнением людей, которые это размечают. ТЧ> Ну да. АС> Например, параллель можно провести: когда-то была идея стартапа - сделать сервис, который мог бы по фотографии человека поставить оценку от 1 до 100. Например, насколько у него фотография получилась хорошая, чтобы аватарку выбрать. У тебя есть 10 фотографий. Какую лучше всего поставить, чтобы, например, девчонкам всем понравиться? И чтобы решить эту задачу, нам нужно взять, например, чтобы условно пять девчонок размечали фотографии пацанов и мы бы усредняли их мнения. Нейросеть и учится усредненному мнению, что три девочки посчитали, что он красивый на 100%, а две, что на 60. И 70-80% будет давать нейросеть. ТЧ> А я, кстати, сообразил, что нам нужно на самом деле. Очень простая история. И она имеет серьезную коммерческую значимость. Мы звоним человеку, и он говорит: "Сейчас я не могу говорить, позвоните тогда-то". То есть вот эта ванильная реплика, вырезаем эти 20 секунд с точки зрения движка интонаций, а дальше смотрим – это "позвоните когда-то" кончилось тем, что, когда ты им перезвонил, он начал разговаривать? Или он опять сказал: "Позвоните еще раз тогда-то". Тебя могут полтора года мурыжить: "Позвоните через месяц", потому что люди на самом деле не хотят покупать. С точки зрения сейла это печальная история и в его жизни – вылавливать, когда клиент готов. Как отличить ситуацию "человек готов разговаривать" от человека, которому неприоритетно? И, если у тебя клиент холодный, то его надо вывести из воронки или перевести в контентную воронку и о нем пока забыть? Или еще что-то. А если система может дать экспертизу, что человек все-таки хочет, то есть смысл как минимум не просрать звонок, через месяц реально позвонить. И это CRM-событие. Ты сейчас говорил, что это оценка разметчика, но я говорю, что у нас есть CRM-события, которые не зависят от мнения человека. То есть конфликтный звонок или нет – да, надо усреднять мнение, позицию разметчика. А CRM-событие – там же не надо ничего. То есть биллинговое событие – например, клиент обещал заплатить и не заплатил. Момент, что экспертиза – клиент нам врет или говорит правду, на самом деле а-ля детектор лжи, но в очень коммерческих разрезах. Она имеет серьезные практические применения. АС> Здесь ведь тоже не стопроцентная корреляция, даже при лучшей нейросети будет, потому что мы не учитываем другие факторы, что у человека банально может быть плохое настроение, какая-то жена рога наставила или конкуренты предложили тупо дешевле и просили не говорить об этом. Это я придумываю, но. ТЧ> Подожди, надо отличать ситуацию, что у человека плохое настроение и конкуренты предложили дешевле. Это правда разные вещи, извините. Есть задача, где нам нужна стопроцентная точность - какой-нибудь датчик аварийности металлоконструкций. Например, если он будет давать неправильную экспертизу, какой-нибудь мост может рухнуть. А если мы говорим про эти вещи, то это просто всего лишь экспертиза, но какая-то подсказка человеку – жать надо дальше или надо отстать от клиента? Или надо поменять бойца – тоже вариант часто работает, что у этого сейла с этим клиентом отношения зашли в тупик и сейл не может в этом признаться, потому что надеется, что дожмет сделку и получит бонус, а в общем-то РОПу надо принять решение. Этому сказать: "Мальчик заболел, я руководитель отдела продаж, давайте я с вами поговорю, в чем там у нас затык?" Нормальная классическая смена бойца на поле, смена в составе. И если мы можем такие задачи решать именно анализом интонаций, это было бы интересная перспективная история. АС> Кстати, если есть возможность в какой-то компании, где очень много сейлзов и они действительно практикуют смену бойца, то мы, в принципе, можем опять же по той же CRMке отследить, например, какие сделки закончились в итоге продажей при смене бойца. И таким образом мы можем протестировать корреляцию нашей системы с правильным вычислением его психотипа по диску. То есть, если, например, мы сказали: "Этот психотип больше подходит, давай, поставь его". Его ставят и он продает. И если да, то круто. ТЧ> Может быть. Интересная история, надо ее погонять. Знаешь, какая еще мне пришла в голову история тоже прикольная, где мы можем быстро получить датасет – врет человек или не врет? HR. Все HRы вешаются от того, что люди не приходят на собеседования. Там доходимость чудовищная: 10 человек сказали: "Я приду", и пришло три. Блин! У меня даже такая конспирологическая версия, что у HeadHuntera стоит колл-центр, который эмулирует кандидатов-зомби, потому что ну не может быть! Человек ищет работу, как он на собеседование не придет, если он сказал: "Я завтра приду"? Что может пойти не так? Какого хрена он не пришел?! Один, два, один из десяти – нормально: заболел, нашел работу, еще что-то. Но их 7 из 10 не приходят! И у меня была такая теория, что HeadHunter набит фейками по каким-то своим причинам. Я серьезно. Это же не продажи! Человек работу ищет, ты ему предложил оффер. Он говорит: "Да, всё понятно". Цены озвучил, зарплату, работа понятна. Он говорит: "Да, я приду" и не приходит. Причем не приходит с вероятностью 70%. И HRы говорят: "Это нормально, нормальная история". Но я к тому, что если опять же вырезать в датасете эти куски, где говорят: "Да, я приду завтра" и дальше вероятность "пришел/не пришел", если можем посмотреть вероятность "пришел", можно HR-у говорить: "Ладно, на это время можно еще ставить кандидата. Не ссыте, ничего страшного, этот, наверное, не придет". Шуточный, может, пример, но. АС> Но здесь какая ситуация? Это уже конечная трата времени на него перед тем, что "Окей, давай приходи на собеседование". Вот если он после этого узнает, что он не придет, он сильно-то выиграет что? Только какое-то время, которое его не будет? 5 минут? ТЧ> Там выигрыш в чем? Как это происходит в организациях? Задача – набрать состав. Чтобы набрать состав нужно нагнать кандидатов. Чтобы нагнать кандидатов, их кто-то должен посмотреть. Если ты нагоняешь кандидатов мало, то получается ситуация, что не из чего выбирать. Поэтому надо нагонять побольше. Но люди уже договорились, что завтра в 12. Кто-то переговоры не ставит – руководитель, который должен собеседовать. Но я сейчас не про это. Я про врет-не врет. То есть вероятность того, что человек необязателен – это интересная перспектива для коммерции. Для HR-то хрен с ними, кому жалко HRа, скажите мне? АС> Как разработчикам очень жалко. ТЧ> Но с точки зрения коммерции это обещание "Я оплачу счет" - и не оплатил. С человеком ты договорился, и он тебя опрокинул. У Морейниса в рассылке, по-моему, сегодня была история (у него есть классная рассылка "Fast Founder", где разные актуальные западные стартапы, которые можно клонить): заполненные корзины в интернет-магазине – 70% брошены. То есть человек зашел, набрал товаров и передумал. 70% брошенных корзин. Блин! Это е-коммерц, но в коммерции аудиальной, где люди говорят голосом, такая же ситуация. Люди, которые уже вроде бы купили-купили, куда-то делись. И если система может показывать "опасных" клиентов с вероятностью того, что они будут срываться, может быть там просто нужно усиление? Идея такая: у тебя колл-центр, какая-то группа продаж из 10 бойцов. Один сильный, хороший, крутой спец и 10 обычных, которые работают первые шесть месяцев и не очень ориентируются. И если какая-то ситуация, что сделка под угрозой, клиент, например, обещает купить и куда-то динамит, в этой ситуации можно (и мы уже говорили об этом сегодня) делать замену. То есть выводить человека более профессионального, если мы понимаем, что сделка под угрозой, но клиент перспективный. Вот такие могут быть применения. Вроде бы уже все понятно, мы обсудили перспективы использования в коммерции. АС> Прикольные идеи, на самом деле. ТЧ> У меня идей, как у дурака фантиков, обращайтесь. Завершая наш разговор, хочу сказать, что те, кто услышит этот эфир или прочтут его в расшифровке, обратите внимание: ребята выиграли какие-то олимпиады, то есть сейчас, если вы очень быстро не примете решение о пилотах, скорее всего, вы уйдете в дальний конец очереди, потому что их отхватит кто-нибудь, кто примет решение быстрее. Не тормозите с этим вопросом, потому что задача на острие коммерческой мысли – то, что мы обсуждали сегодня, это коммерческий high end. И задача, имеющая высочайшую важность. Так что ими надо заниматься. Спасибо за разговор, Александр, Антон! До свидания! Пример работы системы SpeechWorks Ссылка на источник


  • Сообщений: 75474

  • Пол: Не указан
  • Дата рождения: Неизвестно
  • Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

    Мы в соц. сетях