 На Нижнекамском заводе отметили вклад работников в развитие шинной промышленности
	30.10, 00:08
	На Нижнекамском заводе отметили вклад работников в развитие шинной промышленности
	30.10, 00:08
     Ночные квесты и иммерсивные спектакли: как музеи борются за внимание молодежи и новые доходы
	28.10, 00:13
	Ночные квесты и иммерсивные спектакли: как музеи борются за внимание молодежи и новые доходы
	28.10, 00:13
     Форум «Мой бизнес. Время побед»: от финансовой стабильности к человеческой устойчивости
	27.10, 19:48
	Форум «Мой бизнес. Время побед»: от финансовой стабильности к человеческой устойчивости
	27.10, 19:48
     Инновационный прорыв в мире спорта!
	21.10, 16:50
	Инновационный прорыв в мире спорта!
	21.10, 16:50
     Документалистика об усадьбах С.В. Рахманинова представлена в Московской консерватории
	20.10, 19:41
	Документалистика об усадьбах С.В. Рахманинова представлена в Московской консерватории
	20.10, 19:41
     «Звёздное дежавю»: шоу-ностальгия о легендах, которых мы любим
	20.10, 18:26
	 «Звёздное дежавю»: шоу-ностальгия о легендах, которых мы любим
	20.10, 18:26
				
Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.
Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.
В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.
Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.
Источник: CNews