Más allá del corpusbig data en la investigación lingüística. Evolución, analisis y predicción del uso de la lengua a través de twitter
- González Fernández, Adela
- María Luisa Calero Vaquera Directeur/trice
- Gloria Guerrero Ramos Directeur/trice
Université de défendre: Universidad de Córdoba (ESP)
Fecha de defensa: 03 juin 2016
- Ricard Morant Marco President
- Alfonso Zamorano Aguilar Secrétaire
- María Tadea Díaz Hormigo Rapporteur
Type: Thèses
Résumé
RESUMEN DE LA TESIS DOCTORAL DE D./Dª Adela González Fernández El resumen de la tesis para la base de datos Teseo debe ser una presentación de la tesis y tener la extensión suficiente para que quede explicado el argumento de la tesis doctoral. El formato debe facilitar la lectura y comprensión del texto a los usuarios que accedan a Teseo, debiendo diferenciarse las siguientes partes de la tesis: 1. Introducción o motivación de la tesis Esta tesis doctoral se inscribe en una línea de investigación relacionada con las nuevas tecnologías aplicadas a la Lingüística de Corpus y Big Data. Se pretende utilizar la información representada conceptualmente como Big Data (el producto tangible y no estructurado de las interrelaciones humanas a través de las nuevas tecnologías y de las redes sociales) para analizar el uso y la evolución del lenguaje. La hipótesis de partida de esta investigación es la utilidad de la información disponible en las redes sociales y, en concreto, en Twitter, como vehículo principal, para estudiar la evolución histórica y el estado inmediato del lenguaje, así como para realizar predicciones futuras sobre el comportamiento del mismo y las aplicaciones que esto pueda tener en cualquier ámbito de estudio de la Lingüística. Dado que toda esta información se encuentra en soporte digital, diseñaremos una herramienta basada en la idea anterior para demostrar la veracidad de la hipótesis. 2. Contenido de la investigación El contenido de la presente investigación, por tanto, se centra en una revisión teórica enmarcada en el ámbito de la Lingüística de Corpus y en su relación con big data y con Twitter. Al mismo tiempo, puesto que partimos de la hipótesis de que la investigación lingüística a través de big data supone una mejora con respecto a las metodologías tradicionales, se ha diseñado una herramienta web que nos permita la obtención, el almacenamiento y el análisis de aquella información de Twitter relevante para los estudios sobre el lenguaje y la lengua. Para demostrar la conveniencia de trabajar con big data en Lingüística y la utilidad de la herramienta, presentamos, en la segunda parte del trabajo, diversos estudios que den cuenta de algunas de las utilidades que esta nos ofrece. 3. Conclusión Las conclusiones obtenidas tras la realización de esta investigación presentan, por un lado, un carácter teórico y disciplinar, puesto que podemos afirmar que la relación entre las dos disciplinas aquí trabajamos, la Lingüística y la Informática, es necesaria y deseable para un mayor avance del conocimiento y de la ciencia. Por otro lado, desde una perspectiva metodológica, constatamos la utilidad, la pertinencia y las ventajas de utilizar big data y Twitter en la investigación lingüística, y la necesidad de disponer de las herramientas y soportes informáticos adecuados para que los análisis se puedan efectuar.