Последние новости
31.12.2025, 19:26 Мошенничество и системные кризисы предсказуемы: вышла книга Феникса Фламма
31.12.2025, 17:47 Уриэль предвидит светлое будущее
31.12.2025, 17:51 Внутри Китая | Кишоре Махбубани: совещание АТЭС в Шэньчжэне может воодушевить глобальное развитие
30.12.2025, 18:39 Ледовое шоу «Белоснежка» Евгения Плющенко и Яны Рудковской стало громким культурным событием, объединив фигурное катание, балет, музыку и высокие технологии
30.12.2025, 14:20 Лауреат премии ОК! «Больше, чем звёзды» и основательница Академии брокеров Нина Суворова о бизнесе, балансе и трендах на рынке элитной недвижимости
30.12.2025, 12:16 17-е собрание IFSB Summit: определение перспективы влияния и стабильности
27.12.2025, 18:31 Цвет Pantone 2026: профессиональный взгляд на Cloud Dancer
27.12.2025, 10:45 CGTN: почему борьба с коррупцией в Китае не прекращается
26.12.2025, 18:48 CGTN: самая жаркая зимняя вечеринка в Китае
25.12.2025, 18:43 В Торгово-промышленной палате России прошел международный круглый стол по итогам 2025 года, организованный «Мнениями» и «Пиар Групп»
ИИ «VK Видео» достиг 25% улучшения в распознавании речи
Общество
Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.
Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.
В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.
Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.
Источник: CNews
