Diversity tech: як штучний інтелект допомагає людям з поганим слухом

Diversity tech: як штучний інтелект допомагає людям з поганим слухом

Вівторок, 19 лютого 2019, 16:30 -
azertag.az
Як розвиток технологій створює інклюзивне середовище, і чому автоматичні субтитри — не найефективніше рішення. (рос)

По данным Всемирной организации здравоохранения, в мире 466 млн людей с "инвалидизирующей потерей слуха", причем цифра постоянно растет. В Украине, по неофициальным данным, около 2 млн неслышащих и слабослышащих людей.

Люди с нарушением слуха должны иметь доступ к информации: смотреть новости и фильмы, проходить онлайн-курсы, учиться в университетах.

В таких случаях помогают сурдоперевод или субтитры. Однако языком жестов владеют не все слабослышащие, а субтитры, генерируемые автоматически, часто содержат ошибки. Чтобы их избежать, приходится транскрибировать тексты вручную, а это дорого и долго.

Как быть? На помощь приходят технологии.

Реклама:

Технологические решения для слабослышащих

Развитие технологий помогает слабослышащим лучше адаптироваться в обществе. Например, исследователи Калифорнийского университета в Сан-Диего разработали умные перчатки, которые переводят американский жестовый язык в текст, появляющийся на экране смартфона или ноутбука.

Камера при этом не требуется, достаточно надеть перчатку на руку. Стоимость компонентов не превышает 100 долл. Проект находится в стадии разработки.

Созданный датчанами слуховой аппарат Oticon Opn использует систему шумоподавления: пользователь может слышать одновременно несколько говорящих. С помощью веб-платформы If This Than That аппарат может отправлять текстовые сообщения о том, что ему необходима зарядка. Oticon Opn также можно подключить к дверным звонкам или камерам наблюдения.

В 2018 году Oticon сообщили о выпуске приложения Kaizn, работающего на основе искусственного интеллекта. Как утверждают создатели, приложение способно фиксировать изменения звуковой среды пользователя, узнавать о его планах с помощью пуш-уведомлений и регулировать настройки.

В 2017 году австралийский производитель кохлеарных — заменяющих часть внутреннего уха — имплантов Cochlear объявил о партнерстве с Apple для трансляции звука в импланты Nucleus 7 Sound Processor прямо с устройств Apple.

В 2018 году компания создала приложение Nucleus Smart для Android, с помощью которого обладатели имплантов Nucleus 7 могут регулировать их настройки.

Автоматическое транскрибирование против ручного

Индустрия транскрибирования меняется медленно. Еще несколько лет назад расшифровка аудиозаписей и создание субтитров производились только вручную. Сейчас появились программы, которые делают это за людей.

Иллюстрация работы технологии — автоматические субтитры на YouTube. В основе технологии — "глубокое обучение", которое является классом алгоритмов машинного обучения. Нейросеть получает запись, а затем разбивает ее на маленькие кусочки, пытаясь сопоставить звуки и буквы.

Таких соответствий может быть много, поэтому машина выбирает наиболее вероятные комбинации букв. Если она слышит слово "не…росеть", там может оказаться и "нейросеть", и "нефросеть", и еще какое-либо слово. Первое из них более вероятно, поэтому искусственный интеллект предпочтет его.

Плюс программ — скорость, но полностью автоматизированные решения могут предоставить только 85-90% точности. Искусственному интеллекту пока не хватает словарного запаса, в том числе знания сленга и региональных языковых особенностей. Кроме этого, он не всегда способен отделять посторонние шумы. Однако постоянное обучение позволяет получать все более высокую точность.

У ручного транскрибирования тоже есть минус: цена. Учебному заведению или команде образовательной платформы регулярно нужны субтитры для новых лекций и программ. Для этого им требуется отдел транскрибирования. Решением может быть комбинация автоматического и ручного транскрибирования.

Равный доступ к образованию

Потребность в обучении — часть знаменитой пирамиды Маслоу. В ее основе — физическая безопасность, затем — базовый комфорт, принадлежность и любовь. Выше идут компетентность, успех и признание, познание и понимание.

Чтобы каждый человек имел шанс реализоваться на этом уровне, необходим равный доступ к образованию и возможности для продуктивной работы.

Читайте також
"Ми можемо визначити, про яку літеру ви думаєте": навіщо штучний інтелект навчився читати думки
Окей, Google. Як незабаром зміниться пошуковик
Sapiens, але не Homo. На що ще здатний штучний інтелект

В Украине инклюзивное образование только формируется, поэтому опыт других стран трудно переоценить.

Так, в США закон о правах людей с инвалидностью предусматривает, что аудиовизуальный контент должен быть расшифрован с точностью не менее 99%.

Это позволяет создать равные условия для студентов.

Как объяснили в киевском офисе компании Verbit.ai, которая сочетает интеллект машины и человека для транскрибирования и создания субтитров, добиться такой точности с помощью автоматизированной системы пока невозможно.

Чтобы достичь 99%, к проверке текстов привлекают людей.

Научить систему распознавать речь можно, говорят в компании. Для этого нужны тысячи часов записей, а образование может их предоставить. Провайдеры онлайн-курсов создают сотни часов лекций каждый год. Их файлы позволяют обучать нейросеть, которая потом расшифровывает самые разные записи.

Субтитрами на лекциях онлайн-курсов пользуются не только слабослышащие студенты, но и те, кому проще воспринимать текстовую информацию.

Так улучшается распознавание речи и в других отраслях: юриспруденции, маркетинге, медицине. Это тот случай, когда технология направлена на поддержку слабослышащих, но в конечном итоге от нее выигрывают все. Впрочем, это можно сказать о многих достижениях инклюзивного общества.

Реклама: