Yandex B2B Tech запустила первый в России сервис для быстрого синтеза речи Brand Voice Lite
Теперь организациям требуется всего лишь предоставить от 20 до 40 минут аудиозаписи голоса диктора для создания уникального фирменного голоса. Этот голос может быть интегрирован в голосовых ботов для колл-центров, использоваться в процессе озвучивания подкастов, обучающих материалов и других коммерческих инициатив. Данная услуга уже доступна в Yandex Cloud.
Для осуществления синтеза необходимо загрузить имеющуюся запись или начитать текст непосредственно в интерфейсе системы. В качестве диктора может выступать профессиональный актер, владелец компании или представитель бренда. Для добавления дополнительных эмоциональных оттенков, таких как печаль или агрессия, потребуется дополнительно 20 минут записи. Процесс создания модели занимает до семи дней.
Brand Voice Lite функционирует на основе ML-моделей Yandex SpeechKit, которые проходят дополнительное обучение с учетом потребностей клиента. Информация надежно хранится в защищенных центрах обработки данных Яндекса. Компаниям необходимо получить разрешение диктора на использование его голоса, а доступ к сгенерированному голосу будет предоставлен исключительно заказчику.
По данным Fortune Business Insights, мировой рынок разговорного ИИ в 2024 году достиг $12,2 млрд, а к 2025 году вырастет до $14,8 млрд. В России, по прогнозам Naumen, объем рынка диалогового ИИ в 2024 году составил бы 7,45 млрд руб.
