Последние новости
05.05.2026, 09:10 Десятилетие обучения без границ: Институт сотрудничества и развития Юг-Юг Пекинского университета отмечает свое 10-летие
05.05.2026, 09:39 Brookfield и The Nuclear Company объединились для создания новой компании с целью ускорения развития атомной энергетики в США
04.05.2026, 23:55 Bitget отмечает 3-летие Blockchain4Youth запуском кампании Boxed for Opportunity ко Дню Bitcoin Pizza Day
04.05.2026, 19:24 Объем торгов CFD на Bitget вырос до $8 млрд на фоне ускоренного роста торговли золотом
03.05.2026, 12:44 Фильмы о текстильных отходах и циркулярности в текстильной промышленности в сериале «Fashion Redressed»
03.05.2026, 12:13 День открытых дверей в кампусе университета CityUHK (Dongguan) 2026 привлекает более 50 000 посетителей
01.05.2026, 15:51 «Русское море» возглавило топ самой продаваемой рыбной продукции в России
01.05.2026, 14:10 Принт в главной роли: 4 бренда Московской недели моды, где рисунок ткани становится высказыванием
30.04.2026, 19:23 Инфраструктура и долговой рынок как точки роста: итоги конференции «Перспектива с Цифрой»
30.04.2026, 18:56 Hisense поднимает моду и культуру с культовой кампанией в честь «Дьявол носит Prada 2» в кинотеатрах 1 мая
ИИ «VK Видео» достиг 25% улучшения в распознавании речи
Общество
Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.
Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.
В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.
Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.
Источник: CNews
