Corpus ForenUCAdiseño, objetivos y estado actual en el marco del instituto de investigación en lingüística aplicada
-
1
Universidad de Cádiz
info
ISSN: 2444-197X
Año de publicación: 2018
Número: 4
Páginas: 363-374
Tipo: Artículo
Otras publicaciones en: E-Aesla
Resumen
Una de las disciplinas lingüísticas más recientes en el ámbito hispánico es la Lingüística forense, caracterizada por el uso de técnicas lingüísticas para investigar delitos. Entre sus principales focos de investigación se encuentra la determinación del emisor de textos electrónicos como emails, redes sociales o mensajería móvil. El estudio de los componentes dialectales y sociolectales del habla es esencial para una caracterización del género, edad o nivel educativo del emisor de un texto determinado. En el ámbito hispánico existe escasez de corpus de textos electrónicos asociados a diferentes variables sociolingüísticas, y que sirva como soporte científico en el ámbito de la Lingüística forense. Este trabajo presenta el Corpus ForenUCA de actual desarrollo en el Instituto de Investigación en Lingüística Aplicada de la Universidad de Cádiz, que recopila textos procedentes de nuevos medios de comunicación social — mensajería corta, email y redes sociales —. Este trabajo presenta las directrices, diseño y objetivos finales de este corpus que actualmente cuenta con más de 200 mil palabras