Aproximación a la categorización textual en español basada en la semántica de marcos

  1. Crespo Miguel, Mario
  2. Frías Delgado, Antonio
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2008

Número: 41

Páginas: 65-71

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

FrameNet es un recurso basado en la Semántica de Marcos que trata de representar el modo por el que diferentes lenguas dan cuenta lingüísticamente de situaciones cotidianas. Los marcos funcionan al modo de paquetes de información sobre cómo hablar de una determinada situación. Este trabajo presenta un procedimiento para categorizar documentos a partir del análisis de las situaciones de FrameNet que concurren en un texto determinado. El conjunto de marcos situacionales es usado como un vector de rasgos en el que la presencia o ausencia de determinados marcos situacionales en un texto sirve para establecer su categoría. Los resultados muestran cómo nuestro sistema fue capaz de categorizar textos en español con gran precisión.