Модель розпізнавання мовлення для вирішення задачі керування елементами веб-сайту

Юлія Олександрівна Литвин, Оксана Вікторівна Строкань

Анотація


В статті розглядається метод розпізнавання мовлення, а саме можливість використання цієї технології для мовного керування елементами веб-сайтів. У зв’язку з широким впровадження таких технологій у життя людини, постає задача створити голосовий додаток, який би покращив зручність їх використання. Особливістю запропонованої моделі є виконання розпізнавання мовлення не на сервісі або за допомогою будь-яких програмних модулів (Запрягаев, & Коновалов, 2009), як це відбувається у більшості випадків, а на самому пристрої із застосуванням лише мікрофону. У вже існуючу конструкцію можна легко додавати будь-які команди. Розпізнання мови реалізовано на сторінці веб-сайту за допомогою мови програмування Javascript. Робота скрипта базується на використані інтерфейсів SpeechRecognition Web Speech API та SpeechGrammarList API Web Speech (Черный, 2014).

Ключові слова


розпізнавання; веб-сайт; SpeechGrammarList API Web Speech; скрипт; інтерфейс

Повний текст:

PDF

Посилання


Запрягаев, С. А., & Коновалов, А. Ю. (2009). Распознавание речевых сигналов. Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии, 2, 39-48.

Макаров, В. (2017). Как устроен искусственный интеллект: распознавание речи. Взято с https://www.popmech.ru/technologies/392382-kak-ustroen-iskusstvennyy-intellekt-raspoznavanie-rechi/.

Сорокин, В. Н. (2008). Синтез речи. Москва: Наука.

Черный, Д. В. (2014). Сверхбыстрое распознавание речи без серверов на реальном примере. Взято с https://habrahabr.ru/post/237589.

Як працює команда «Ok Google» на пристрої Android – Пристрій Android – Пошук Google Довідка. (2018). Support.google.com. Взято з https://support.google.com/websearch/answer/6031948?hl=uk&co=GENIE.Platform%3DAndroid.

Davies, K. H., Biddulph, R., & Balashek, S. (1952). Automatic Speech Recognition of Spoken Digits. Journal of the Acoustical Society of America, 24 (6), 637-642.

Jurafsky, D. & Martin, J. H. (2009). Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice-Hall.

Klass, P. J. (1962). Fiber Optic Device Recognizes Signals. Aviation Week & Space Technology, 77 (20), 94-101. N.Y.: McGraw-Hill. Retrieved from https://archive.org/stream/Aviation_Week_1962-11-12#page/n46/mode/1up.


Метрики статей

Завантаження метрик ...

Metrics powered by PLOS ALM

Посилання

  • Поки немає зовнішніх посилань.




##submission.copyrightStatement##

Лицензия Creative Commons
This work is licensed under a Creative Commons Attribution 4.0 International License.

eISSN 2521-1234