Последние новости
15.01.2026, 20:45 «Рождественский кубок» увековечил вклад Юрия Лужкова в развитие спорта
13.01.2026, 21:26 Henley & Partners — растущий разрыв в паспортах меняет глобальную мобильность в 2026 году
13.01.2026, 21:27 ITE Hong Kong 2026: ведущая международная ярмарка поставщиков для азиатской туристической индустрии и независимых путешественников
13.01.2026, 20:22 Yaber расширили ассортимент своей продукции на сегмент умных устройств для уборки
13.01.2026, 16:09 Alamar Biosciences объявила о закрытии финансирования за счет конвертируемых облигаций с превышением лимита подписки и о расширении руководства
13.01.2026, 15:15 Oriental Culture Holding LTD объяила о плане специальных денежных дивидендов для вознаграждения акционеров
13.01.2026, 15:42 Компания Astronergy выпускает модуль ASTRO N7 Pro для обеспечения профессиональной производительности
13.01.2026, 15:58 CATL открыла крупнейший на Ближнем Востоке объект по послепродажному обслуживанию новых энергоресурсов в Эр-Рияде
13.01.2026, 11:02 Почему рост складов в Казахстане не решает проблему мультитемпературных хабов
12.01.2026, 13:22 Возможностями платформы «Город идей» воспользовались более 650 тысяч жителей столицы
ИИ «VK Видео» достиг 25% улучшения в распознавании речи
Общество
Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.
Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.
В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.
Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.
Источник: CNews
