SFU Logo
  • Все новости
  • Объявления
  • Медиакит
  • Анонсы
  • Наши медиа
  • Фото
  • Для СМИ
  • Прислать новость
  • Реклама
  • Медиа
SFU Logo
SFU Logo
Сведения о вузе
SFU Logo
Сведения о вузе
ГлавнаяМедиаВсе новостиМагистрант ИКИТ создал алгоритм для распознавания речи по видео

Магистрант ИКИТ создал алгоритм для распознавания речи по видео

4 октября 2021 г. | наука

Магистрант Института космических и информационных технологий Сибирского федерального университета Антон Дзюба научил нейронные сети распознавать речь по артикуляции губ на видео. Экспериментальные исследования проведены с использованием самостоятельно полученных видеороликов с русскоговорящими спикерами.

Магистрант Института космических и информационных технологий Сибирского федерального университета Антон Дзюба научил нейронные сети распознавать речь по артикуляции губ на видео. Экспериментальные исследования проведены с использованием самостоятельно полученных видеороликов с русскоговорящими спикерами.

Распознавание речи выполняется в два этапа. Сначала осуществляется поиск лица и выделение области губ в отдельном кадре видеопоследовательности с использованием признаков Хаара. Далее последовательность кадров поступает на вход свёрточной и рекуррентной нейронных сетей глубокого обучения для распознавания виземы речи.

При проведении экспериментальных исследований использован набор данных, содержащий 768 различных высказываний, произнесённых различными спикерами. Видеоролики получены самостоятельно, так как требовался набор данных русскоязычных спикеров. Высказывания помечены теми же метками, что и набор данных для обучения. Тестовыми словами были: «бегу», «пила», «милый», «усы», «вулкан», «банан», «тонуть». Лучшая точность распознавания речи по артикуляции составила 93,7 % для слова «банан», а средняя точность — 68 %.

«Визуальное распознавание речи является важнейшей задачей при общении людей с нарушениями слуха. Распознавание речи по артикуляции применяется также в областях, не связанных с медициной, например, в правоохранительной деятельности. Виземы и фонемы не имеют однозначного соответствия. В русском языке насчитывается 42 фонемы. Из них 6 гласных и 36 согласных. Часто несколько фонем соответствуют одной виземе и выглядят одинаково на лице говорящего человека. В дальнейшем мы планируем усовершенствовать алгоритм, повысить точность его работы и расширить количество распознаваемых слов», — рассказал Антон Дзюба.

Добавим, научным руководителем магистранта является доцент кафедры систем искусственного интеллекта ИКИТ СФУ Анна Пятаева. Результаты работы были представлены на VIII Международной научной конференции «Региональные проблемы дистанционного зондирования Земли».

Пресс-служба СФУ, 4 октября 2021 г.

  • Версия для печати
  • PDF
  • написать ВКонтакте

Похожие новости

  • Лекция «Строительство на вечномёрзлых грунтах» 18 окт 2024 г.
  • СФУ объявляет о наборе в докторантуру 30 сен 2024 г.
  • В СФУ будут обучать автоматизации логистики 6 сен 2024 г.
  • Ко Дню космонавтики первокурсники СФУ презентовали игру про космос 11 апр 2024 г.
  • СФУ презентовал концепцию дисциплины «Психология» для непсихологических направлений профессиональной подготовки 18 мар 2024 г.
  • Учёные СФУ представили коллективную монографию о цифровых гуманитарных исследованиях 30 ноя 2023 г.
  • В СФУ прошли I Хасановские чтения 23 мая 2023 г.
АбитуриентуШкольникуСтудентуАспирантуСотрудникуПартнёруПрессе
АбитуриентуШкольникуСтудентуАспирантуСотрудникуПартнёруПрессе
  • Общая информация
  • Структура
  • Все документы
  • Карьера в СФУ
  • Закупки
  • Общественная приёмная
  • Кампус
  • Позиции СФУ в рейтингах
  • Символика
  • Партнёры
  • СФУ в федеральных проектах
  • Выпускники
  • Политика конфиденциальности
  • Все сайты СФУ
  • Общая информация
  • Бакалавриат, специалитет
  • Экскурсии по СФУ
  • Магистратура
  • Аспирантура
  • Докторантура
  • Полезные материалы
  • Контакты
  • Иностранным абитуриентам
  • Общая информация
  • Расписание
  • Образовательные программы
  • Графики учебного процесса
  • Платное обучение
  • Электронное обучение СФУ
  • Возможности для студентов
  • Дополнительное образование
  • Документирование учебной деятельности
  • Физико-математическая школа-интернат
  • Онлайн-формы
  • Общая информация
  • Исследования
  • Трансфер технологий
  • Гранты, конкурсы
  • Конференции, мероприятия
  • Инфраструктура
  • Аспирантура
  • Докторантура
  • Научная аттестация
  • Научные журналы СФУ
  • Общая информация
  • Документы
  • Бронирование пространств
  • Студенческие объединения
  • Мероприятия и проекты
  • Архив воспоминаний
  • Направление в поездки обучающихся
  • Спорт
  • Общая информация
  • Международное сотрудничество
  • Для выезда за рубеж
  • Для иностранных граждан
  • Документы
  • Общая информация
  • Все новости
  • Объявления
  • Медиакит
  • Анонсы
  • Наши медиа
  • Фото
  • Для СМИ
  • Прислать новость
  • Реклама
Сведения об образовательной организацииПротиводействие коррупцииБанковские реквизитыАрхивФорма обратной связи

© Сибирский федеральный университет, 2006-2026

Сделано