Последние новости
21.12.2025, 11:18 Фонд Miral Impact создан в партнерстве с Управлением социального вклада — Ma’an для защиты окружающей среды и социального воздействия
21.12.2025, 09:45 В Дубае прошла международная выставка с участием представителей шинной промышленности
20.12.2025, 15:15 Прогулочные маршруты и аудиогиды с ИИ: на портале «Узнай Москву» появилась новогодняя страница
19.12.2025, 23:40 Инфраструктура и экология Крылатского определяют спрос на новое жильё
19.12.2025, 21:50 Holand Automotive Group объявляет о продаже Ferrari Rancho Mirage группе Lapis Automotive Group
19.12.2025, 18:40 Vantage получает награду «Лучшее мобильное приложение для трейдинга — Азиатско-Тихоокеанский регион» на церемонии UF Awards APAC 2025
19.12.2025, 13:10 С Московскими видеоиграми познакомятся пользователи из Китая, Индии, Египта и ОАЭ
18.12.2025, 17:49 Компания TCL представит будущее в рамках портфеля передовых визуальных инноваций и продуктов с поддержкой ИИ на выставке CES 2026
18.12.2025, 17:09 ИИ для поиска истины создает крупнейший в мире портал энциклопедических знаний — в 6000 раз больше Википедии
18.12.2025, 17:02 Компания Hisense возглавит ориентированную на человека эволюцию дисплеев на выставке CES 2026
ИИ «VK Видео» достиг 25% улучшения в распознавании речи
Общество
Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.
Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.
В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.
Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.
Источник: CNews
