Последние новости
08.07.2025, 18:49 Эффективные механизмы поддержки семей: опыт сотрудничества науки и бизнеса
08.07.2025, 14:53 В Парк-отеле Орловский торжественно открыли скульптуру и фонтан Графа Орлова
07.07.2025, 21:53 Fix Price провел экопоход по природному памятнику — Царёву Кургану
04.07.2025, 16:28 Планета Лайка расширила линейку продукции для ухода за домашними животными
04.07.2025, 16:03 Доверие как фундамент: как построить прибыльный бьюти-бизнес, основанный на честности
04.07.2025, 15:26 Майнинг в 2025: стабильность и устойчивость важнее мощностей
04.07.2025, 14:50 Благодаря BlackLine компания Creditsafe добивается окупаемости инвестиций (ROI) на уровне 234 % и побеждает в конкурсе Nucleus Research ROI Awards 2025
04.07.2025, 13:12 Новая версия Р7 команда для iOS: обмен контентом и поиск
04.07.2025, 13:49 Древний китайский центр по изготовлению изделий из бронзы — город Баоцзи — способствует культурному обмену в Казахстане
04.07.2025, 13:56 Bitget Wallet сокращает комиссии за ончейн-переводы TRON USDT на 50% благодаря обновлению GetGas
ИИ «VK Видео» достиг 25% улучшения в распознавании речи
Общество

Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.
Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.
В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.
Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.
Источник: CNews