$79.15 €91.84

Последние новости

07.03.2026, 16:48 Huawei представляет решение для образовательных центров искусственного интеллекта (AIEC)

07.03.2026, 15:57 LiuGong на выставке CONEXPO 2026  |  Электрические и интегрированные решения

07.03.2026, 15:08 LiuGong представила электрические и интегрированные решения на выставке CONEXPO 2026   

07.03.2026, 15:24 Константин Брянка назвал пять технических ошибок, которые могут сорвать корпоративное мероприятие

07.03.2026, 13:26 Huawei получила восемь наград GLOMO на MWC Barcelona 2026

07.03.2026, 13:58 Генеральный директор HONOR становится центром внимания на MWC 2026, а Robot Phone получает восторженные отзывы за инновации и интеграцию ИИ

07.03.2026, 12:23 Huawei представляет обновленное решение Xinghe AI Fabric 2.0 для эпохи ИИ

07.03.2026, 12:28 HM Hospitals и Huawei совместно представляют глобальную демонстрационную площадку «умного» здравоохранения

07.03.2026, 11:25 CGTN — Как путь развития Китая становится моделью для глобального роста

06.03.2026, 22:30 Huawei запускает решения для конкретных сценариев для офиса, здравоохранения и образования

ВСЕ НОВОСТИ

ИИ «VK Видео» достиг 25% улучшения в распознавании речи

Общество

Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.

Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.

В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.

Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.

Источник: CNews