Corpus ForenUCAdiseño, objetivos y estado actual en el marco del instituto de investigación en lingüística aplicada

  1. Mario Crespo Miguel 1
  1. 1 Universidad de Cádiz
    info

    Universidad de Cádiz

    Cádiz, España

    ROR https://ror.org/04mxxkb11

Revista:
E-Aesla

ISSN: 2444-197X

Año de publicación: 2018

Número: 4

Páginas: 363-374

Tipo: Artículo

Otras publicaciones en: E-Aesla

Resumen

Una de las disciplinas lingüísticas más recientes en el ámbito hispánico es la Lingüística forense, caracterizada por el uso de técnicas lingüísticas para investigar delitos. Entre sus principales focos de investigación se encuentra la determinación del emisor de textos electrónicos como emails, redes sociales o mensajería móvil. El estudio de los componentes dialectales y sociolectales del habla es esencial para una caracterización del género, edad o nivel educativo del emisor de un texto determinado. En el ámbito hispánico existe escasez de corpus de textos electrónicos asociados a diferentes variables sociolingüísticas, y que sirva como soporte científico en el ámbito de la Lingüística forense. Este trabajo presenta el Corpus ForenUCA de actual desarrollo en el Instituto de Investigación en Lingüística Aplicada de la Universidad de Cádiz, que recopila textos procedentes de nuevos medios de comunicación social — mensajería corta, email y redes sociales —. Este trabajo presenta las directrices, diseño y objetivos finales de este corpus que actualmente cuenta con más de 200 mil palabras