Последние новости
17.07.2025, 22:45 Отчет Bitget Wallet: игры и путешествия — главные сферы интересов при использовании криптовалютных платежей
17.07.2025, 21:31 Всемирный день навыков молодежи 2025: Shanghai Electric продвигает развитие ИИ и цифровых навыков в рамках Глобального инновационного турнира
17.07.2025, 15:27 Приз имени Юрия Лужкова получат спортсмены на фестивале The BOWL
17.07.2025, 13:42 Предпоказ уникальных янтарных лотов организован для гостей AmberForum и журналистов
17.07.2025, 10:35 Rwazi собирает 12 млн долларов, чтобы заменить каждое интуитивное решение советом цифрового помощника на основе ИИ
17.07.2025, 10:31 Инициатива по развитию человеческого потенциала (HCI) публикует аналитический отчет за 2025 год
16.07.2025, 08:34 Vantage блистает на выставке Money Expo Colombia 2025
12.07.2025, 21:16 Алтай ждёт гостей-единомышленников на фестивале «ВОТЭТНО!»
12.07.2025, 14:17 От Музея Фаберже в Петербурге запустили новые водные маршруты
11.07.2025, 12:38 CGTN: Почему Китай чтит дух сопротивления агрессии?
ИИ «VK Видео» достиг 25% улучшения в распознавании речи
Общество

Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.
Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.
В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.
Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.
Источник: CNews