Název: Real-time large vocabulary spontaneous speech recognition for spoken dialog systems
Další názvy: Rozpoznání spojité spontánní řeči s velkým slovníkem a v reálném čase pro dialogové systémy
Autoři: Švec, Jan
Šmídl, Luboš
Citace zdrojového dokumentu: ŠVEC, JAN; ŠMÍDL, Luboš. Real-time large vocabulary spontaneous speech recognition for spoken dialog systems. In: Proceeding of the 4th International congres on Image and signal processing (CISP), 15th-17th October 2011, Shanghai. Beijing: IEEE Press, 2011, p. 2458-2463. (Volume 5).ISBN 978-1-4244-9304-3.
Datum vydání: 2011
Nakladatel: IEEE Press
Typ dokumentu: článek
article
URI: http://www.kky.zcu.cz/cs/publications/JanSvec_2011_Real-timeLarge
http://hdl.handle.net/11025/17164
ISBN: 978-1-4244-9304-3
Klíčová slova: rozpoznávání řeči;jazykové modelování;hlasové dialogové systémy
Klíčová slova v dalším jazyce: speech recognition;language modelling;spoken dialog system
Abstrakt: Článek popisuje modifikaci výchozího systému pro rozpoznávání řeči. Výsledný systém je vhodný pro použití v hlasovém dialogovém systému se smíšenou iniciativou a přirozeným vstupem. Jsou prezentovány tři přístupy pro rozšiření rozpoznávacího slovníku za účelem zajištění schopnosti rozpoznat všechny entity z dané domény. Dále je navržena metoda normalizace nespisovného textu. Experimenty provedené na korpusu spontánní řeči ukazují, že navržená metoda je velmi významná pro jazyky, kde se podstatně liší psaná formální podoba jazyka a obecná nespisnovná řeč. Celková chybovost slov (Word Error Rate) byla redukována o 16.7%.
Abstrakt v dalším jazyce: This paper describes the method for modifying the baseline speech recognition system to be suitable for a use in spoken dialog system with mixed initiative and natural user’s input. We present three approaches for extending the recognition vocabulary to ensure the spoken dialog system is able to recognize all entities in the given domain. The colloquial text normalization method is proposed. The experiments performed on spontaneous speech corpus suggested that the proposed method is very important for languages where the formal written language and a common colloquial speech are very different. The overall word error rate was reduced by 16.7%.
Práva: © Jan Švec - Luboš Šmídl
Vyskytuje se v kolekcích:Články / Articles (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
JanSvec_2011_Real-timeLarge.pdfPlný text237,78 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/17164

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.