El análisis de autoría en Lingüística forensehistoria, concepción y revisión metodológica. Aplicación de la razón de verosimilitud a textos cortos en español.

  1. Mario Crespo Miguel
Revista:
Revista signos: estudios de lingüística

ISSN: 0035-0451 0718-0934

Año de publicación: 2023

Volumen: 56

Número: 111

Páginas: 35-58

Tipo: Artículo

DOI: 10.4067/S0718-09342023000100035 DIALNET GOOGLE SCHOLAR lock_openAcceso abierto editor

Otras publicaciones en: Revista signos: estudios de lingüística

Resumen

El análisis de la autoría refiere a un conjunto de técnicas cuyo objetivo principal es determinar quién es el autor de un texto. En los últimos años se está produciendo un desarrollo considerable de este tipo de trabajos, lo que está llevando a un rápido desarrollo de la disciplina. Este estudio recorre los orígenes del análisis de autoría, identifica sus campos de actuación y define sus fundamentos metodológicos actuales. Entre ellos se destaca el uso de la razón de verosimilitud como marco que permite mostrar la fuerza de la evidencia en el ámbito forense. A partir de un corpus de textos cortos electrónicos, se muestran los principales aspectos que deben resolverse para su correcta aplicación: la selección de rasgos, la adecuada caracterización del estilo de un autor a partir de ellos, y el cálculo de probabilidades y su interpretación.

Referencias bibliográficas

  • Altamimi, A., Alotaibi, A. & Alruban, A. (2019). Surveying the Development of Authorship Identification of Text Messages. International Journal of Intelligent Computing Research(IJICR), 10(1), 953-966.
  • Amuchi, F., Al-Nemrat, A., Alazab, M. & Layto, R. (2013). Identifying Cyber Predators through Forensic Authorship Analysis of Chat Logs. Proceedings of Third Cybercrime and Trustworthy Computing Workshop (pp. 27-38). Los Alamitos, CA: IEEE.
  • Aitken, C. & Taroni, F. (2010). Estadística y evaluación de la evidencia para expertos forenses. Madrid: Dykinson, SL.
  • Boenninghoff, B., Nickel, R., Zeiler, D. & Kolossa, D. (2019). Similarity Learning for Authorship Verification in Social Media. Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (pp. 2457-2461). Brighton, United Kingdom: IEEE.
  • Castillo Velásquez, F. A, Martínez Godoy, J. L., Torres Falcón, M. C. P., Zavala de Paz, J. P., Becerra Chávez, A. & Rizzo Sierra, J. A. (2020). Atribución de autoría de mensajes de Twitter a través del análisis sintáctico automático. Research in Computing Science, 149, 91-101.
  • Corpas, G. & Seghiri, M. (2007). Determinación del umbral de representatividad de un corpus mediante el algoritmo N-Cor. Procesamiento del Lenguaje Natural, 39, 165-172.
  • Coulthard, M. & Johnson, A. (2007). An Introduction to Forensic Linguistics: Language in Evidence. Londres & Nueva York: Routledge.
  • Crespo, M. (2016). Analysis of Parameters on Author Attribution of Spanish Electronic Short Texts. RiCL, 4, 25-32.
  • Crystal, D. (1997). The Cambridge Encyclopedia of Language. Cambridge: Cambridge University Press.
  • Delgado, C. (2002). La identificación de locutores en el ámbito forense. Tesis doctoral, Universidad Complutense de Madrid, Madrid, España.
  • Ebrahimpour, M., Putniņš, T. J., Berryman, M. J., Andrew, A., Ng, B. W.-H. & Abbott, D. (2015). Automated Authorship Attribution Using Advanced Signal Classification Techniques. PLOS ONE, 8(2), 1-12.
  • Elmanarelbouanani, S. & Kassou, I. (2014). Authorship Analysis Studies: A Survey. International Journal of Computer Applications, 86(12), 22-29.
  • Evans, J. D. (1996). Straightforward Statistics for the Behavioral Sciences. Calif.: Brooks/Cole Publishing: Pacific Grove.
  • Fernández Trillo, J. J. (2015). La problemática autoría de Carlos Castaneda. Un estudio estilométrico de candidato único. Tesis Doctoral, Universidad Autónoma de Madrid, Madrid, España.
  • Garayzábal Heinze, E., Jiménez Bernal, M. & Reigosa Riveiros, M. (2014). Glosario básico para entender la Lingüística Forense. Lingüística forense: La lingüística en el ámbito legal y policial (pp. 411-417). Madrid: Euphonia Ediciones.
  • Garayzábal Heinze, E., Queralt Estévez, S. & Reigosa Riveiros, M. (2019). Fundamentos de la lingüística forense. Madrid: Síntesis.
  • Gollub, T., Potthast, M., Beyer, A., Busse, M., Rangel, F., Rosso, P., Stamatatos, E. & Stein, B. (2013). Recent Trends in Digital Text Forensics and Its Evaluation. En P. Forner, H. Müller, R. Paredes, P. Rosso & B. Stein (Eds.), Information Access Evaluation. Multilinguality, Multimodality, and Visualization. CLEF 2013. Lecture Notes in Computer Science(pp. 282-302). Berlin, Heidelberg: Springer.
  • Goodman, R., Hahn, M., Marella, M., Ojar, C. & Westcott, S. (2007). The Use of Stylometry for Email Author Identification: A Feasibility Study. Proceedings of Student/Faculty Research Day, CSIS (pp. 1-7). Nueva York: Pace University.
  • Göhring, A. (2009). Spanish Expansion of a Parallel Treebank (Lizentiatsarbeit). Zurich: University of Zurich.
  • Halvani, O., Winter, C. & Pflug, A. (2016). Authorship Verification for Different Languages, Genres and Topics. Digital Investigation, 16, 33-43.
  • Holmes, D. I. (1998). The Evolution of Stylometry in Humanities Scholarship. Literary and Linguistic Computing, 13(3), 111-117.
  • Ishihara, S. (2014). A Likelihood Ratio-Based Evaluation of Strength of Authorship Attribution Evidence in SMS Messages using N-grams.International Journal of Speech, Language & the Law, 21(1), 23-50.
  • Jamak, A., Savatić, A.& Can, M. (2012). Principal component analysis for authorship attribution. Southeast Europe Journal of Soft Computing,1(1), 49-56.
  • Jiménez, M. (2014). La Lingüística forense: Licencia para investigar la lengua. Lingüística forense: La lingüística en el ámbito legal y policial (pp. 79-94). Madrid: Euphonia Ediciones.
  • Juola, P. (2008). Authorship Attribution. Foundations and Trends in Information Retrieval, 1(3), 233-334.
  • Koehler, J. J. (2013). Linguistic Confusion in Court: Evidence from the Forensic Sciences. Journal of Law & Policy, 21(2), 515-539.
  • Lagutina, K., Lagutina, N., Boychuk, E., Vorontsova, I., Shliakhtina, E., Belyaeva, O., Paramonov, I. & Demidov, P.G. (2019). A Survey on Stylometric Text Features. 25th Conference of Open Innovations Association. Helsinki: IEEE.
  • Lalla, H. (2010). E-mail Forensic Authorship Attribution. Tesis de Magíster, Universidad de Fort Hare, Bhisho, Sudáfrica.
  • Li, C. (2010).Handbook of Research on Computational Forensics, Digital Crime, and Investigation: Methods and Solutions. Information Science Reference. Hershey PA: IGI Global.
  • McMenamin, G. R. (2002). Forensic Linguistics: Advances in Forensic Stylistics. Washington: CRC Press.
  • Mosteller, F. & Wallace, D. L. (1964). Inference and Disputed Authorship: The Federalist. Londres: Addison-Wesley.
  • Neal, T., Sundararajan, K., Fatima, A., Yan, Y., Xiang, Y. & Woodard, D. (2017). Surveying Stylometry Techniques and Applications. ACM Computing Surveys, 50(6), 1-36.
  • Nini, A. (2020). Corpus Analysis in Forensic Linguistics. En C. A. Chapelle (Ed.), The Concise Encyclopedia of Applied Linguistics(pp. 313-320). Hoboken: Wiley-Blackwell.
  • Olsson, J. (2004). Forensic Linguistics. An Introduction to Language, Crime and the Law. Londres: Continuum.
  • Picornell, I. (2014). La aplicación de la atribución de autoría en la investigación e inteligencia: La aplicación práctica (y su problemática). Lingüística forense: La lingüística en el ámbito legal y policial (pp. 79-94). Madrid: Euphonia Ediciones.
  • Queralt Estévez, S. (2014). Acerca de la prueba lingüística en atribución de autoría hoy. Revista de Llengua i Dret, 62, 35-48.
  • Queralt Estévez, S. (2019). The Creation of Base Rate Knowledge of Linguistic Variables and the Implementation of Likelihood Ratios to Authorship Attribution in Forensic Text Comparison.Language and Law= Linguagem e Direito, 5(2), 59-76.
  • Ramírez Salado, M. (2017). Antecedentes de la lingüística forense: ¿Desde cuándo se estudia el lenguaje como evidencia?Pragmalingüística, 25, 525-539.
  • Ramírez Salado, M. (2019).Terminología y lingüística forense: Usos terminológicos relacionados con los ámbitos de actuación de la lingüística forense y su interfaz con otras disciplinas. Tesis doctoral, Universidad de Cádiz, Cádiz, España.
  • Reddy, T. R., Vardhan, B. V. & Reddy, P. V. (2016). A Survey on Authorship Profiling Techniques. International Journal of Applied Engineering Research, 11(5), 3092-3102.
  • Rico Sulayes, A. (2012). Quantitative Authorship Attribution of Users of Mexican Drug Dealing Related Online Forums. Tesis doctoral, Universidad de Georgetown, Georgetown, Estados Unidos.
  • Rocha, A., Scheirer, W. J., Forstall, C. W., Cavalcante, T., Theophilo, A., Shen, B., Carvalho, A. & Stamatatos, E. (2017). Authorship Attribution for Social Media Forensics. IEEE Transactions on Information Forensics and Security, 12(1), 5-33.
  • Rose, P. (2002). Forensic Speaker Identification. Nueva York: Taylor& Francis.
  • Salih, R., Balci, K. & Salah, A. (2016). Authorship Recognition in a Multiparty Chat Scenario. Proceedings of4th International Conference on Biometrics and Forensics(IWBF) (pp. 1-6). Cyprus: IEEE.
  • Sapkota, U., Bethard, S., Montes, M. & Solorio, T. (2015). Not all Character N-grams are Created Equal: A Study in Authorship Attribution. En Proceedings of the 2015 conference of the North American chapter of the association for computational linguistics:Human language technologies,93-102. Berkeley, CA: ACL.
  • Savoy, J. (2016). Estimating the Probability of an Authorship Attribution. Journal of the Association for Information Science and Technology, 67(6), 1462-1472.
  • Schmid, H. (1994) Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of International Conference on New Methods in Language Processing, Vol. 12, Manchester, United Kingdom.
  • Sousa-Silva, R. (2019). Computational Forensic Linguistics: An Overview of Computational Applications in Forensic Contexts. Language and Law= Linguagem e Direito, 5(2), 118-143.
  • Stamatatos, E. (2009). A Survey of Modern Authorship Attribution Methods. Journal of the American Society for information Science and Technology, 60(3), 538-556.
  • Stańczyk, U. & Cyran, K. A. (2007). Machine Learning Approach to Authorship Attribution of Literary Texts. International Journal of Applied Mathematics and Informatics, 1(4), 151-158.
  • Stefanova Spassova, M. (2009). El potencial discriminatorio de las secuencias de categorías gramaticales en la atribución forense de autoría de textos en españolTesis doctoral, Universitat Pompeu Fabra, Barcelona, España.
  • Swain, S., Mishra, G. & Sindhu, C. (2017). Recent Approaches on Authorship Attribution Techniques —An Overview. International Conference on Electronics, Communication and Aerospace Technology, 557-566.
  • Triola, M. (2013). Estadística(11ª ed.). Naucalpan de Juárez: Pearson Educación de México.
  • Turell, M. T. (2008). Plagiarism. En J. Gibbons & M. T. Turell (Eds.), Dimensions of Forensic Linguistics (pp. 265-299). Ámsterdam & Filadelfia: John Benjamins.
  • Tweedie, F. J., Singh, S. & Holmes, D. I. (1996). Neural Network Applications in Stylometry: The Federalist Papers. Computers and the Humanities, 30(1), 1-10.
  • Villayandre Llamazares, M. (2008). Lingüística con corpus (I). Estudios Humanísticos. Filología, 30, 329-349.