Un análisis comparativo de estrategias para la categorización semántica de textos cortos

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/13917
Información del item - Informació de l'item - Item information
Título: Un análisis comparativo de estrategias para la categorización semántica de textos cortos
Título alternativo: A comparative analysis of strategies for semantic short-text categorization
Autor/es: Rosas, María Verónica | Errecalde, Marcelo Luis | Rosso, Paolo
Palabras clave: Categorización de textos | Desambiguación | Ontología | Colecciones de textos cortos | Text categorization | Word sense disambiguation | Ontology | Short-text corpora
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: abr-2010
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: ROSAS, María V.; ERRECALDE, Marcelo L.; ROSSO, Paolo. “Un análisis comparativo de estrategias para la categorización semántica de textos cortos”. Procesamiento del Lenguaje Natural. N. 44 (abr. 2010). ISSN 1135-5948, pp. 11-18
Resumen: La categorización de textos cortos es, hoy en día un área importante de investigación debido a que gran parte de la información que recibimos y con la cual trabajamos habitualmente tiene esta característica (e-mails, mensajes de texto, resúmenes de noticias, entre otros). Distintos trabajos han reportado resultados interesantes en la categorización de textos incorporando información semántica a la representación de los documentos. Sin embargo, estos trabajos no se han concentrado en general en las particularidades que presentan los textos cortos. Por otra parte, los métodos de desambiguación más difundidos (basados en corpus) no siempre son adecuados en los dominios que se intentan abordar. En estos casos, la desambiguación basada en conocimiento se convierte en una alternativa interesante a considerar. En este trabajo, estudiamos la efectividad de la categorización de textos cortos, cuando se utiliza información semántica obtenida con métodos basados en conocimiento. Los resultados obtenidos con este enfoque muestran mejoras interesantes que incentivan a continuar con esta línea de investigación. | Nowadays, short-texts categorization is an important research area because most of the information we usually receive and work with have this characteristic (e-mails, text messages, news, etc.). Different studies have reported interesting results in text categorization by adding semantic information to documents’ representation. However, these studies have not focused on the particularities that short texts introduce. Furthermore, the most popular disambiguation methods (corpus-based methods) not always are feasible to use in these domains. Thus, knowledge-based disambiguation methods become interesting alternatives in these cases. In this article, we study the effectiveness of short text categorization, when semantic information, obtained by knowledge-based methods, is used. The results obtained with this approach show interesting improvements that encourage to continue this line of research.
Patrocinador/es: Proyecto TEXT-ENTERPRISE 2.0 (TIN2009-13391-C04-03).
URI: http://hdl.handle.net/10045/13917
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 44 (abril 2010)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_44_01.pdf669,8 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.