Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados

Fabricio Lira Figueiredo

Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados

Fabricio Lira Figueiredo

Material

DISSERTAÇÃO

Idioma

Português

ISBN

(Broch.)

Número de chamada

T/UNICAMP F469s

Publicação

Campinas, SP : [s.n.], 1999.

Descrição física

150p. : il.

Nota geral

Orientador: Fabio Violaro

Nota de dissertação ou tese

Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação

Resumo Resumo: Os Modelos Ocultos de Markov constituem, atualmente, a principal abordagem para o problema de Reconhecimento de Fala, pois proporcionam bom desempenho e alto grau de flexibilidade. Infelizmente, este modelo acústico não é ideal e alguns problemas afetam sua robustez e desempenho em condições... Ver mais Resumo: Os Modelos Ocultos de Markov constituem, atualmente, a principal abordagem para o problema de Reconhecimento de Fala, pois proporcionam bom desempenho e alto grau de flexibilidade. Infelizmente, este modelo acústico não é ideal e alguns problemas afetam sua robustez e desempenho em condições adversas. A inconsistência do modelamento temporal implícito nos HMM's é um exemplo de um sério problema sem soluções bem definidas. De fato, o Modelo de Duração de Estados com distribuição exponencial é incompatível com o comportamento estatístico das unidades lingüísticas reais. A hipótese de independência entre observações representa outra limitação dos HMM's, já que não se verifica nos experimentos práticos. De fato, existe forte dependência contextual no caso de quadros pertencentes a regiões de transição entre unidades acústicas de uma elocução. Alguns modelos e algoritmos têm sido propostos para tentar transpor estes obstáculos, tais como Modelos Segmentais e Duração Explícita de Estados. Nesta tese, uma estratégia alternativa é proposta para atenuar estes problemas, sem acréscimos significativos no custo computacional. A informação relativa às transições entre fones, ao longo de uma elocução, é obtida através de métodos de segmentação automática. Realiza-se uma ponderação no algoritmo de Viterbi, a fim de penalizar os modelos que gerarem segmentações inconsistentes. Bons resultados são obtidos, para várias condições relacionadas a uma aplicação de Dígitos Conectados. O objetivo atual é aplicar esta técnica para o caso de vocabulários extensos Ver menos

Abstract: Hidden Markov Model is actually the main approach to Speech Recognition problem, because of the good performance and high degree of flexibility that can be achieved. Unfortunately, this acoustical modeling is not optimum and some problems still affect it's robustness and performance in a... Ver mais Abstract: Hidden Markov Model is actually the main approach to Speech Recognition problem, because of the good performance and high degree of flexibility that can be achieved. Unfortunately, this acoustical modeling is not optimum and some problems still affect it's robustness and performance in a more realistic condition. The weakness of the temporal modeling embedded in HMM is an example of a serious problem without well defined solutions. In fact, the implicit state duration model with exponential distribution may not describe the real linguistic units distributions. The hypothesis of independence between observations is other difficult problem to solve and it is incompatible with practical experiments because there is strong correlation between frames in the same acoustic segment. Some models and algorithms have been proposed to overcome or, at lest, attenuate those problems, such as Stochastic Segment Models and Explicit State Duration. This thesis presents an alternative approach to alleviate these problems, with relatively low computational cost. The information on phoneme boundaries in time is obtained through an Automatic segmentation algorithm and it is used in a Weighted Viterbi Algorithm in order to penalize the, models that generates inconsistent segmentations. Good results were achieved for various conditions related to connected digits application. The actual objective is to expand it to continuous speech recognition Ver menos

Assuntos

Reconhecimento automático da voz

Redes neurais (Computação)

Processos de Markov

Processamento de palavras

Algoritmos

Reconhecimento automatico da fala

Autoria

Figueiredo, Fabricio Lira

Violaro, Fábio, 1950- Orientador

Meloni, Luís Geraldo Pedroso, 1958- Avaliador

Alcaim, Abraham Avaliador

Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação. Programa de Pós-Graduação em Engenharia Elétrica

Sites

DOI: https://doi.org/10.47749/T/UNICAMP.1999.183837

Arquivos

Texto completo pdf

Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados

Fabricio Lira Figueiredo

Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados

Fabricio Lira Figueiredo

Exemplares

Nº de exemplares: 2
Não existem reservas para esta obra

Informações do exemplar	Informações do exemplar	Nº de chamada	Biblioteca	Localização	Situação	QR Code
Tombo: 1150041607 Ano: 1999 Suporte: Impresso Nº de chamada: T/UNICAMP F469s Biblioteca : BAE Situação: Retido (Aguardando baixa patrimonial) Visualizar QR Code	Tombo: 1150041607 Ano: 1999 Suporte: Impresso	T/UNICAMP F469s	BAE		Retido (Aguardando baixa patrimonial)
Tombo: 1150041595 Ano: 1999 Suporte: Impresso Nº de chamada: T/UNICAMP F469s Biblioteca : BCCL Situação: Não circula Visualizar QR Code	Tombo: 1150041595 Ano: 1999 Suporte: Impresso	T/UNICAMP F469s	BCCL		Não circula

Terminal de consulta web

Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados

Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados

Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados

Exemplares