$78.96 €90.97

Последние новости

25.11.2025, 19:22 Контрафактный табак: эксперты определили ключевые точки для роста эффективности борьбы в 2026 году

25.11.2025, 18:38 «Пластмассовые» помидоры: что скрывают горы немаркированных овощей 

22.11.2025, 17:36  NABR — Постоянный комитет СИТЕС выпустил Оценочный доклад практики разведения длиннохвостых макак

22.11.2025, 17:12  Xinhua Silk Road — Интервью: возобновление связей Шелкового пути, когда китайский фарфор Blanc de Chine встречается с итальянской майоликой

22.11.2025, 16:30 Озеленение учебных пространств в условиях кризиса

19.11.2025, 14:53 V Международный форум «СМИ и цифровые технологии перед вызовом информационного и исторического фальсификата» завершил работу в Москве

18.11.2025, 12:39 CGTN: Безрассудные слова, реальные последствия: г-жа Такаити переходит черту

18.11.2025, 12:12 BPIC отмечает пятую годовщину: развивая сотрудничество в рамках БРИКС

17.11.2025, 11:18 Дмитрий Гавдур, СЕО Lerna: как ИИ меняет EdTech и помогает масштабировать бизнес на международном уровне

15.11.2025, 13:30 Университет Косыгина представил авторские костюмы на выставке «Традиционная Россия» в Государственной Думе

ВСЕ НОВОСТИ

ИИ «VK Видео» достиг 25% улучшения в распознавании речи

Общество

Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.

Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.

В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.

Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.

Источник: CNews