Igler, C. (2018). Modularer Treiber zur Sprachsteuerung eines Terminals für ältere Anwender und Anwenderinnen [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2018.38157
E187 - Institut für Gestaltungs- und Wirkungsforschung
Date (published):
Number of Pages:
Durch die großen Fortschritte im Bereich der Spracherkennung befindet sich diese Techno-logie als Eingabemethode auf dem Vormarsch und findet in einer zunehmenden Anzahl an Geräten und Bereichen Einsatz. Speziell im Bereich Smart Home und Active and Assisted Living (AAL; ehemals Ambient Assisted Living) bietet sich eine Steuerung mittels Sprachein-gabe an und öffnet unter anderem die Möglichkeit einer barrierefreien Bedienung. Solch ein AAL-System ist an der Technischen Universität Wien bereits in Arbeit und besitzt als zentrale Steuereinheit ein Local User Interface (LUI), das bislang primär über Touchscreen bedient wird. In dieser Arbeit wird die Möglichkeit einer Implementierung der Bedienung des LUI mittels eines Treibers zur Spracherkennung untersucht und mit einem Prototyp verwirklicht. Der Prototyp besteht aus einer Kernkomponente und einer Komponente zur Spracherkennung. Die Kernkomponente wurde mittels des Node.js-Frameworks umgesetzt und übernimmt die Kommunikation mit dem LUI und der Komponente zur Spracherkennung, sowie die Verarbei-tung und Verteilung der Daten. Diese Komponente bietet außerdem ein klar definiertes und dokumentiertes Interface, welches es ermöglicht, die unterschiedlichsten Anwendungen zur Spracherkennung anzubinden und für die Steuerung des LUI zu nutzen. Für die endgültige Umsetzung des Treibers wurde die Microsoft Speech Platform eingesetzt, für die Evaluie-rung der Spracherkennung wurde aber auch die neuere Microsoft Technologie – Windows Speech API – herangezogen. Die Steuerung des LUI mittels Spracherkennung erwies sich als zufriedenstellend, wobei sich die Windows Speech API als alltagstauglicher herausstellte. Im Weiteren wurden durch die Evaluierung wichtige Ansatzpunkte für die Weiterentwicklung der Steuerung des LUI mit-tels Spracherkennung sowohl seitens der Spracherkennungstechnologie, als auch des LUI identifiziert.
Owing to the big advances in the field of speech recognition, this technology is on the rise as a new input method and is used in an increasing number of fields and devices. Particularly, the field of Smart Home and Active and Assisted Living (AAL, former Ambient Assisted Liv-ing) lends itself to control by means of speech recognition and provides, among other possi-bilities, a barrier-free operation. Such a system is already under construction at the University of Technoloy in Vienna and currently uses as a central control unit a Local User Interface (LUI) that is mainly controlled through a touchscreen. In this study the possibility of implementing a control via a speech recognition driver for the LUI is evaluated and realized in a prototype. The prototype consists of a core component and a component for speech recognition. The core component was implemented using the node.js-framework and carries out the communication with the LUI and with the component for speech recognition, as well as it processes and distributes the data. Moreover, this com-ponent offers a clearly defined and well-documented interface, which provides the possibility to integrate different speech recognition technologies to control the LUI. The Microsoft Speech Platform was chosen for the final driver implementation but for the evaluation of the speech recognition control the newer Microsoft technology called Windows Speech API was employed as well. Using speech recognition to control the LUI proved to be satisfactory with the Windows Speech API showing a higher suitability for daily use. Furthermore, the evaluation identified important starting points for further development of a speech recognition control for the LUI regarding the speech recognition technology as well as the LUI itself.