$76.81 €89.43

Последние новости

09.12.2025, 16:10 Открылся современный медицинский центр для сотрудников АО «Роствертол»

08.12.2025, 18:28 Группа «Уралхим» и индийские компании Rashtriya Chemicals and Fertilizers Limited, National Fertilizers Limited и Indian Potash Limited подписали меморандум о создании совместного предприятия по производству карбамида в России

08.12.2025, 09:26 Фонд Yidan Prize Foundation объединяет глобальные идеи и местный опыт на ежегодном крупнейшем съезде 

06.12.2025, 17:00 Лилиана — восходящее имя на сцене мелодик-хауса и вокального дэнс-попа

02.12.2025, 17:21 «Уралкалий» — генеральный партнер X Пермского инженерно-промышленного форума

02.12.2025, 08:27 Владимир Плякин предупредил о возможном повышении исполнительского сбора в России

01.12.2025, 17:04 Тормозные колодки, маркетинг и реальность авторынка

01.12.2025, 11:07 В Москве состоялся крупнейший форум об инвестициях Private Money 2025

01.12.2025, 09:59 Фонд Vantage Foundation пожертвовал 1 миллион гонконгских долларов на поддержку жителей, пострадавших от пожара в Гонконге

01.12.2025, 09:45 Чэнду становится глобальным инновационным центром в 14-й пятилетке

ВСЕ НОВОСТИ

ИИ «VK Видео» достиг 25% улучшения в распознавании речи

Общество

Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.

Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.

В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.

Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.

Источник: CNews