Последние новости
29.12.2024, 00:51 Бритье лица — новый секрет молодости кожи?
28.12.2024, 20:45 Проект мирового уровня: зарубежные партнеры оценили будущий кластер видеоигр и анимации в Москве
28.12.2024, 16:37 Sanya Marriott Yalong Bay Resort & Spa готовится к празднованию Нового года
28.12.2024, 15:57 Shanghai Electric завершает восьмидневную программу повышения квалификации для сотрудников проекта Thar в Пакистане
27.12.2024, 20:37 Особенности эксплуатации коммерческого транспорта во многом связаны с тем, что он подвергается более интенсивной нагрузке
27.12.2024, 20:29 Yutong Bus поставила 500 новых автомобилей V6 в Латинскую Америку
27.12.2024, 20:44 Написать сценарий и снять ролик: в «Кинокампусе Горького» подготовили мастер-классы для детей и подростков
27.12.2024, 20:18 Miral анонсирует амбициозную стратегию устойчивого развития для продвижения досуга, развлечений и туризма
27.12.2024, 20:46 Компания KT&G обсудила укрепление сотрудничества в области технического регулирования с Узбекским агентством по техническому регулированию
27.12.2024, 16:40 АО «Транснефть – Сибирь»: Эффективные подходы к транспортировке нефти в Сибири
ИИ «VK Видео» достиг 25% улучшения в распознавании речи
Общество
Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.
Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.
В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.
Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.
Источник: CNews