Последние новости
18.10.2025, 20:10 Военно-исторический фестиваль «Москва за нами!»
18.10.2025, 10:40 CGTN: Китай возглавляет глобальный импульс по достижению новой вехи в развитии женщин
17.10.2025, 21:36 Югра получила стратегическую связь с федеральными трассами через новый мост
17.10.2025, 18:33 Спецприз Фонд Юрия Лужкова получит студентка Елецкого университета
17.10.2025, 16:43 Почему нужен запрет изъятия за долги единственного жилья в ипотеке: рассказывает адвокат Владимир Постанюк
17.10.2025, 10:59 Его Королевское Высочество наследный принц объявил о проекте King Salman Gate в Мекке
17.10.2025, 09:17 Potique Hotel Nha Trang впервые удостоен титула «Vietnam’s Leading Lifestyle Hotel 2025» на премии World Travel Awards
17.10.2025, 09:15 Волонтеры из Vantage Foundation проявляют сострадание и заботятся о спасенных собаках в Laws for Paws Vietnam
17.10.2025, 09:26 Комментарий NABR к решению МСОП
17.10.2025, 09:56 Tech4Nature расширяет рамки на Всемирном конгрессе по охране природы МСОП
ИИ «VK Видео» достиг 25% улучшения в распознавании речи
Общество

Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.
Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.
В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.
Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.
Источник: CNews