Bases teóricas para el estudio de los centros de interés del léxico disponible: Disponibilidad léxica de informantes extranjeros en las universidades andaluzas

Sánchez-Saus Laserna, Marta

Bases teóricas para el estudio de los centros de interés del léxico disponibleDisponibilidad léxica de informantes extranjeros en las universidades andaluzas

Sánchez-Saus Laserna, Marta

Dirigida por:

Miguel Casas Gómez Director

Universidad de defensa: Universidad de Cádiz

Fecha de defensa: 22 de octubre de 2011

Tribunal:

Francisco Moreno Fernández Presidente/a
Luis Escoriza Morera Secretario
Juan Andrés Villena Ponsoda Vocal
Óscar Loureda Lamas Vocal
Martin Hummel Vocal

Departamento:

Filología

Tipo: Tesis

Teseo: 314259 DIALNET RODIN editor

Resumen

Los estudios de disponibilidad léxica cuentan ya con una cierta trayectoria tras de sí desde su nacimiento en Francia a mediados del siglo pasado, cuando los autores del Français Fondamental idearon una nueva metodología que perfeccionaba la selección del léxico básico de una lengua mediante la unión del vocabulario frecuente con su complementario: el léxico disponible, aquel que primero se viene a la mente de un hablante ante un tema de conversación determinado. El éxito de esta metodología de investigación del léxico lo demuestran las numerosas publicaciones sobre disponibilidad léxica que, a nivel internacional y sobre diferentes lenguas, han ido apareciendo desde entonces. No obstante, es el español la lengua que mejor ha sabido aprovechar las ventajas de estos estudios, gracias, fundamentalmente, a la existencia de un proyecto común a España e Hispanoamérica para la confección de un diccionario del léxico disponible de la gran mayoría de hablantes de nuestra lengua, el Proyecto Panhispánico de Disponibilidad Léxica, al cual se han adherido numerosos investigadores. Sin embargo, para entender esta difusión es necesario tener en cuenta el amplio abanico de posibilidades de aplicación de los resultados obtenidos en estos estudios a un gran número de disciplinas lingüísticas. Estas abarcan el objetivo primordial que se plantearon los trabajos pioneros, que es también la finalidad última del trabajo que aquí presentamos: el perfeccionamiento de la selección del léxico que han de estudiar los estudiantes no nativos de una lengua, a partir de la determinación de las unidades que pertenecen al léxico básico y que, por tanto, deben ser enseñadas en los niveles inferiores. Esta finalidad, por otra parte, puede extenderse a la enseñanza de la lengua materna, por las mismas razones: las palabras más básicas de un estado de lengua determinado deberían ser aquellas que primero se enseñaran a los niños. Además, la difusión de estos estudios se ha visto favorecida por el hecho de que no solo la didáctica de lenguas puede aprovecharse de la disponibilidad léxica, sino que su capacidad de descripción del uso del léxico más primario en una zona determinada dota al investigador interesado en la dialectología y la etnolingüística de una base de datos muy valiosa, así como al sociolingüista variacionista que quiera estudiar la influencia de factores sociales. Además, el carácter asociativo de las pruebas que dan lugar a la base de datos de disponibilidad ha sido empleado en ocasiones para estudios de corte psicolingüístico sobre los mecanismos de producción léxica y el lexicón mental. Dentro de este vasto campo de posibilidades de enfoque y con una historia de la disciplina, aunque relativamente reciente, poblada de numerosos estudios, creemos que aún es posible presentar trabajos novedosos, que abran puertas a aspectos todavía no tratados con profundidad. En este sentido, la investigación que aquí presentamos estuvo planteada, desde el primer momento, hacia la finalidad primitiva de la disponibilidad léxica, la que tuvieron en mente los primeros investigadores franceses: el perfeccionamiento de la enseñanza del vocabulario a aquellos estudiantes que quieren aprender una lengua extranjera. La línea de estudio de la disponibilidad léxica, además, tiene ya tradición en el grupo de investigación Semaínein de la Universidad de Cádiz, al que pertenezco. En su seno, en los últimos años se ha seguido una línea de trabajo de gran relevancia, Disponibilidad léxica, contacto de lenguas y variación lingüística, financiada mediante un proyecto de investigación, Lenguas en contacto y disponibilidad léxica, concedido tanto por el Ministerio de Educación como por la Universidad de Cádiz, que ha afrontado el estudio del léxico disponible de zonas con características lingüísticas y sociales tan peculiares como Ceuta, Melilla y Gibraltar. Los dos primeros ya han sido publicados: el de Ceuta, llevado a cabo por la profesora Ayora Esteban, publicado en 2006, y el de Melilla, dirigido por el profesor Fernández Smith, con la colaboración de la Universidad de Granada, y que vio la luz el año 2008. Respecto a Gibraltar, el proyecto contempló tanto el léxico disponible en español como en inglés y sus resultados pronto serán publicados. Se trata, en todos los casos, de estudios de disponibilidad léxica muy novedosos, a causa de las circunstancias particulares de las zonas escogidas, que los convierte en investigaciones enfocadas directamente hacia el contacto de lenguas en comunidades bilingües y la influencia de esta circunstancia en el vocabulario más básico. En este sentido, la tesis doctoral que aquí presentamos comparte con este proyecto la particularidad de contar con una población multilingüe, que se ve afectada por hechos de variación provocados por factores distintos a los que influyen en las poblaciones monolingües y para la que es necesario, por tanto, adaptar la metodología de investigación, cuestión esta muy novedosa en nuestro trabajo. Dentro de este ámbito, la presente tesis se presenta por un lado, como un estudio de la disponibilidad léxica de estudiantes de español como lengua extranjera, los cuales son, en el momento de la recogida de datos, alumnos de alguna universidad andaluza. Desde el comienzo de nuestro trabajo hemos tenido muy en cuenta la existencia de otros, excelentes aunque ciertamente escasos, trabajos dedicados al léxico disponible de estudiantes de español como lengua extranjera (Carcedo 2000a y Samper Hernández 2002, fundamentalmente), pero no existía ninguno que combinara una muestra lo suficientemente amplia para extraer conclusiones relevantes con el hecho de contar con informantes de lenguas maternas diferentes, nivelados según los estándares del Marco común europeo de referencia para las lenguas (MCER). Además, creemos que era necesario adaptar algunos aspectos de la metodología que emplea el Proyecto Panhispánico al tipo de informantes con los que tratamos, sobre todo en lo relacionado con la selección de los centros de interés. Por ello, en esta investigación hemos trabajado con una lista propia, que, por un lado, recoge la mayor parte de los contenidos semánticos que recomienda el MCER para los niveles iniciales de español como lengua extranjera y que, por otro, guarda las semejanzas suficientes como para poder realizar futuras comparaciones entre los datos aquí presente y los de otros trabajos (cf. capítulo 3). Así pues, nuestro objetivo principal ha sido proporcionar un estudio con una base de datos amplia y diversa, de manera que sea posible alcanzar el objetivo, al que tantas veces se ha hecho referencia, de aplicar la disponibilidad léxica al perfeccionamiento de los métodos de enseñanza del léxico a alumnos extranjeros y de los materiales de aprendizaje que estos emplean. Por otro lado, desde el punto de vista teórico, nos parecía de gran importancia el estudio semántico de las agrupaciones de palabras que constituyen los pilares del léxico disponible: los centros de interés. En este sentido, nos planteamos que este trabajo sirviera, igualmente, para completar un aspecto de la disponibilidad que ha sido introducido en otros trabajos centrados en este mismo aspecto, aunque partiendo desde puntos de vista diferentes, como el gran trabajo de Hernández Muñoz (2006), en el que analizaba los centros de interés desde el punto de vista de las categorías cognitivas. Nuestro objetivo, en este sentido, ha sido, por un lado, más historiográfico. Partiendo del fundamento de la disponibilidad léxica, la capacidad asociativa de las palabras en la mente de los hablantes, rastreamos la importancia que esta facultad ha tenido en los estudios del significado desde que la semántica surgió como disciplina lingüística científica en el siglo XIX. La diversidad de planteamientos, corrientes y teorías con los que nos enfrentamos al hacer este recorrido facilitan el desentrañamiento de los rasgos propios de los centros y de las posibles diferencias que hay entre ellos. Esta caracterización se completa, además, con el análisis interno de estas configuraciones léxicas a partir de las relaciones más frecuentes que se establecen en su interior y la descripción de su naturaleza semántica, ya esté basada en el significado, en otros elementos del signo lingüístico o, por el contrario, tengan una base extralingüística y se trate de relaciones designativas. Con este planteamiento general, de carácter aplicado en su fondo pero basado en un estudio teórico amplio e inédito, el presente trabajo se organiza en cinco partes. La primera de ellas, el capítulo 1, sirve de marco para la investigación, pues presenta la historia de los estudios de disponibilidad léxica. A mediados del siglo XX, cuando desde hacía algunas décadas existía interés, a nivel internacional e incluso impulsado desde las instituciones educativas, por determinar los vocabularios básicos de las lenguas, se da comienzo en Francia al proyecto que debía dar lugar al Français Fondamental, que reuniría los conocimientos básicos de gramática y vocabulario para un estudiante no nativo de francés en sus primeas etapas. Los encargados del proyecto Gougenheim, Michéa, Rivenc y Sauvageot pronto percibieron que la metodología empleada en los vocabularios reducidos que se habían confeccionado hasta el momento sufría de limitaciones graves. La frecuencia como único método para determinar el léxico básico dependía en gran manera de la selección del corpus, los cuales solían estar basados únicamente en textos escritos, y, por otro lado, proporcionaba un número muy bajo de nombres concretos, que, en definitiva, son los que conforman el vocabulario de mayor importancia en los primeros niveles de una lengua extranjera. Por ello, determinaron completar el método de la frecuencia con el que acabó convirtiéndose en su complementario, la disponibilidad léxica, capaz de extraer casi exclusivamente nombres concretos y a partir de datos extraídos directamente de hablantes que servían de informantes. Esta nueva metodología estaba fundamentada en pruebas asociativas que se basaban de estímulos temáticos sobre realidades muy cercanas al hablante: la casa, el cuerpo humano, la ciudad, el campo, etc., y permitían extraer aquellas palabras que primero se vienen a la mente del hablante cuando se enfrenta ante un tema determinado. A pesar de las críticas que recibió, se llevaron a cabo algunos trabajos con esta misma metodología en las décadas de 1970 y 1980, pero fue a partir de la década de los 90 y de los primeros años de este nuevo siglo, y fundamentalmente sobre el español, cuando los estudios sobre léxicos disponibles alcanzaron su mayor difusión. La razón de ello está en el Proyecto Panhispánico de Disponibilidad Léxica, aglutinador de la gran mayoría de los trabajos aparecidos sobre este tema en los últimos años, cuyos criterios, además, se han adaptado incluso en trabajos que no pertenecen a él, como los que se han publicado hasta el momento relacionados con el español como lengua extranjera. Este primer capítulo se cierra con la descripción de las aplicaciones de los estudios de disponibilidad, muy variadas, en tanto que abarcan desde la enseñanza de lenguas materna y extranjeras, hasta la sociolingüística variacionista que emplee la estratificación de la muestra para estudiar la influencia de factores sociales sobre el conocimiento del léxico; la etnolingüística que quiera llevar a cabo comparaciones entre diversos estudios para determinar la variación debida a cuestiones culturales; la dialectología, para aprovechar las posibles comparaciones entre léxicos disponibles de diferentes zonas en busca de rasgos dialectales, y la psicolingüística, para la que resultan de gran interés los procesos de producción léxica en los que se fundamenta la disponibilidad, así como el estudio de los vínculos asociativos que se producen durante estos procesos. El capítulo 2 se centra en el análisis historiográfico del fundamento de la disponibilidad: la capacidad asociativa de las unidades léxicas, que da lugar a los denominados centros de interés que organizan el léxico disponible. Se ha discutido mucho sobre si la selección de centros que se hizo en los trabajos pioneros, y que luego se ha retomado en los estudios del Proyecto Panhispánico, era la adecuada, es decir, si realmente podía considerarse universal o si era la apropiada para, como en el trabajo presente, adaptar estos estudios a informantes a los que no se les pregunta sobre su lengua materna. Sin embargo, la atención prestada a la descripción semántica de los centros de interés ha sido menor, por lo que nuestro objetivo es el de subsanar esas carencias teóricas e historiográficas. En primer lugar, prestamos atención al origen del término, que los primeros investigadores franceses tomaron de la pedagogía donde existe toda una corriente basada en los centros de interés, en tanto que núcleos temáticos a partir de los cuales el niño se desarrolla cognitivamente, pero ignoraron la tradición que tenía el término en la lexicografía como modo de clasificación interno de las nomenclaturas. Estas nomenclaturas, por otro lado, son obras lexicográficas de características muy semejantes a las de los léxicos disponibles, fundamentalmente por su organización onomasiológica y su intención didáctica. A continuación llevamos a cabo un repaso histórico sobre la importancia que la capacidad asociativa de las palabras ha tenido en la semántica desde que esta surgió como disciplina lingüística científica, efectuando tres calas. En primer lugar, profundizamos en las etapas historiográficas específicas de la semántica, comenzando por la semántica histórica y tradicional de corte psicologicista, que es heredera de Reisig en su interés por los cambios semánticos pero afronta su estudio desde el punto de vista de la influencia de los contenidos semánticos de la palabra que se originan por su conexión con otras unidades léxicas en la mente de los hablantes, así como por la experiencia que estos tienen del mundo. Esta tendencia hacia lo psicológico, que reúne en la Alemania de principios del siglo XX a autores como Hey, Rosenstein, Erdmann, Marty, Wellader y, sobre todo, Sperber, se descubre, años después, en Francia y en propuestas como los campos asociativos de Bally, los campos nocionales de Matoré y los campos morfosemánticos de Guiraud, así como en los campos lingüísticos del checo Duchácek, aunque estos últimos ya apuntan hacia las teorías estructuralistas. Por último, la semántica neohumbolditiana y las teorías preestructuralistas del campo léxico nos vuelven a situar en Alemania y apuntan muchas de las características de las estructuras paradigmáticas que analizará la semántica estructural en el léxico. La segunda gran etapa que consideramos es, precisamente, la semántica estructural, la cual es, probablemente, la menos explicativa cuando nos proponemos describir configuraciones asociativas como los centros de interés. Ciertamente, los límites que impone a las parcelas de la lengua que pueden ser estructuradas deja fuera a los centros de interés, que están basados en relaciones asociativas que implican otros elementos del signo lingüístico más allá del significado, además de elementos externos a la lengua y pertenecientes a la realidad de las cosas, pero la separación entre los niveles del significar que impone esta corriente semántica va a ser de gran importancia para comprender el funcionamiento interno de los centros, así como la relación entre los elementos que los componen y sus denominaciones. Por otro lado, dentro de la semántica estructural también se han contemplado otros tipos de agrupaciones léxicas, derivadas de las perspectivas semasiológica y onomasiológica, en tanto que estudio de las significaciones partiendo del significante y estudio de los signos partiendo del concepto o la cosa, respectivamente. Estas dos perspectivas dan lugar a los campos semasiológicos y onomasiológicos, de los cuales los onomasiológicos se configuran con características muy parecidas a las que presentan los centros de interés. Por último, la tercera perspectiva que adoptamos es la de la semántica cognitiva, la cual, pese a las críticas que se han dirigido hacia sus bases teóricas y hacia su inconsistencia terminológica, presenta una caracterización de las categorías léxicas que se adapta con gran facilidad a los tipos de centros, debido, fundamentalmente, a la concepción que esta corriente tiene de la lingüística como un acercamiento al lenguaje a partir de su uso y de la comunicación real y actualizada. Tras describir el nacimiento de esta corriente y sus aspectos teóricos básicos, fundamentalmente en relación con la teoría de prototipos y los procesos de categorización, así como aquellas clasificaciones de corte cognitivo que se han hecho en otras investigaciones sobre disponibilidad léxica (Hernández Muñoz 2006 y Tomé 2011) de los centros de interés empleados por el Proyecto Panhispánico, proponemos una tipología propia, adaptada a los centros que hemos empleado en nuestra investigación y basada en tres conceptos: las categorías naturales, las categorías radiales y los esquemas. El tercer capítulo está dedicado a los aspectos metodológicos de la investigación en disponibilidad léxica, concretamente a la elección de la muestra, las variables empleadas para su estratificación, la selección de los centros de interés que es distinta de la que se ha empleado en otros trabajos y los criterios de edición de los datos. La población estudiada es la de los estudiantes de español como lengua extranjera de las universidades andaluzas, de la cual se ha extraído una muestra de 322 individuos, estratificados en función de cinco variables: el sexo, el nivel de español (A, B y C, a partir de los niveles del MCER, aunque reduciendo los seis que el Marco propone A1, A2, B1, B2, C1 y C2 a tres), las lenguas maternas (hemos trabajado con seis: alemán, finés, francés, inglés, italiano y polaco), la frecuencia con que hacen uso del español (alta, media y baja) y el conocimiento que tienen de otras lenguas extranjeras románicas, variable esta que solo es aplicable a los informantes que no tengan ya una lengua románica como lengua materna (contemplamos tres posibilidades: que no conozcan ninguna otra lengua extranjera; que conozcan otra u otras, pero ninguna sea románica, y que conozcan otras lenguas románicas). La selección de los centros de interés es diferente de la que se emplea en el Proyecto Panhispánico, el cual parte de los dieciséis que propusieron los autores del Français Fondamental, aunque luego cada trabajo particular haya podido añadir otros. Conscientes de lo inadecuado de alguno de esos centros para una investigación sobre informantes no nativos, hemos preferido crear una lista propia, basada en los temas de vocabulario que el MCER considera más básicos y que introduce en el nivel A1. No obstante, hemos procurado mantener todos los paralelismos que fuera posible conservar, de manera que se puedan llevar a cabo comparaciones entre los resultados que aquí aportamos y los de otros trabajos. La lista, finalmente, se compone de dieciocho centros: 1) el cuerpo humano, 2) la ropa, 3) la casa, 4) alimentos y bebidas, 5) la cocina y sus utensilios, 6) escuela y universidad, 7) la ciudad, 8) el campo, 9) medios de transporte, 10) los animales, 11) ocio y tiempo libre, 12) profesiones y trabajos, 13) tiempo meteorológico y clima, 14) ocio y tiempo libre, 15) aspecto físico y carácter, 16) la familia, 17) viajes y vacaciones y 18) el dinero. Por último, en la edición de los datos seguimos las recomendaciones para los trabajos del Proyecto y las que se propusieron en los otros trabajos realizados sobre el español como lengua extranjera. No obstante, debemos señalar que la edición de nuestros datos ha procurado ser lo más abarcadora posible, en el sentido de que se incluyen en las listas de disponibilidad todas aquellas palabras que tengan relación con el centro de interés que corresponda, aunque sea indirecta, pues el objetivo de nuestra investigación es observar cuál es el vocabulario que conocen estos estudiantes y no la determinación de las unidades que pueden formar parte de los centros en un sentido estricto. Estas singulares características hacen del análisis cuantitativo de los resultados, que se desarrolla en el capítulo 4, un estudio también particular. La primera parte de este análisis se refiere a datos generales de toda la muestra y es semejante a las descripciones que se llevan a cabo en cualquier trabajo de disponibilidad léxica: número total de palabras recogidas en el estudio, número de palabras diferentes o vocablos, media de palabras por persona y centro de interés e índice de cohesión de cada centro, el cual mide el grado de coincidencia de las respuestas de los informantes en un mismo centro. La segunda parte está dedicada al estudio de los resultados cuantitativos por variables, pero, en este caso, no nos encontramos ante un análisis de estratificación tradicional, como suele hacerse en los estudios variacionistas, sino que las variables empleadas codifican factores que pueden influir en el nivel de conocimiento del español, como el nivel que tienen los informantes en esta lengua, el uso que hacen de ella, el conocimiento que tengan de otras lenguas románicas y su propia lengua materna, así como el sexo. Estos factores son los que pueden, además, influir de manera más práctica en la adaptación efectiva de los materiales de enseñanza de vocabulario a alumnos extranjeros, por lo que el análisis de su significatividad resulta de gran interés a la hora de aplicar los resultados de este análisis a la mejora de la enseñanza del español. Finalmente, el último capítulo está dedicado al análisis cualitativo de las listas de léxico disponible. El estudio se divide en dos partes. La primera de ellas se centra en el estudio de las conexiones más frecuentes que se dan entre palabras en el interior de los centros de interés, a partir de la propuesta de Casas (2005b y 2011) sobre la diferenciación entre relaciones léxicas y relaciones significativas. Con la ayuda del programa DispoGrafo extraemos las relaciones entre pares de palabras más frecuentes, de manera que podemos analizar la naturaleza de aquellos vínculos que sustentan la organización de los centros. Para ello, será de gran importancia no perder de vista el límite entre lo intralingüístico y lo extralingüístico y, más aún, distinguir claramente los vínculos que se establecen entre significados de aquellos en los que intervienen otros componentes del signo lingüístico o los signos completos y, más allá, de las relaciones que se establecen entre las cosas, que pertenecen al mundo de la designación. Creemos que estas distinciones, propias de la semántica estructural, no deben perderse de vista si realmente se quiere conocer cómo se organizan internamente los centros de interés, incluso a pesar de que otras corrientes, como la cognitiva, partan de puntos de vista que permitan descripciones más ajustadas de estos centros. A continuación, la segunda parte del capítulo consiste en un estudio descriptivo de las unidades léxicas pertenecientes a cada centro de interés. Este análisis se centra en varios aspectos. El primero de ellos tiene que ver con los distintos núcleos temáticos que se reúnen dentro de los centros más o menos diversos en función de los tipos de categorías que estudiamos en el capítulo 2, seguido de la cuantificación de las categorías lingüísticas mayoritarias, que en todos los trabajos sobre disponibilidad suelen ser los sustantivos. Por ello incluimos en esta investigación dos centros diseñados específicamente para la extracción de unidades de otras categorías: acciones y actividades habituales, para verbos, y aspecto físico y carácter, para adjetivos. Por otro lado, analizamos los fenómenos lingüísticos de mayor relevancia que afectan a este léxico, centrándonos en cuatro ámbitos: la variación (diatópica, diafásica y especializada), los cambios semánticos (por el empleo de eufemismos y disfemismos, por metáforas y metonimias y por elipsis originada en combinatoria léxica), la importación léxica (extranjerismos, préstamos y calcos) y la formación y creación léxicas (derivación, composición y creación a partir de acortamientos). Finalmente, dedicamos las últimas páginas a las conclusiones centrándonos, sobre todo, en los aspectos más novedosos de esta investigación, que son la descripción historiográfica llevada a cabo sobre la capacidad asociativa de las palabras, así como en la naturaleza semántica de las relaciones más frecuentes dentro de los centros de interés. Asimismo, el detallado análisis de variación cuantitativa llevado a cabo sobre las variables detendrá gran parte de nuestra atención. A esto sigue la bibliografía citada y los anexos, en los que recogemos el modelo de encuesta empleado y el diccionario de léxico disponible. Esperamos que el trabajo aquí presente, aun desde sus limitaciones, cumpla los objetivos que nos marcamos en un principio y que nos han acompañado durante estos años de trabajo: en primer lugar, la profundización en los aspectos teóricos que sustentan la disponibilidad léxica, que no han sido estudiados aún, así como en la tradición semántica que ha estudiado la capacidad asociativa de las palabras, fundamento de la disponibilidad. Y, desde el punto de vista aplicado, el análisis estadístico de las variables que realmente influyen en el conocimiento léxico de los estudiantes de español como lengua extranjera, así como de las relaciones entre palabras que sostienen los procesos de producción léxica a partir de estímulos asociativos. Así pues, la presente tesis doctoral ha estado enfocada hacia una doble perspectiva, ambas con la característica de abrir camino en aspectos de la disponibilidad léxica no tratados en profundidad, o no tratados en absoluto, en otros estudios. Por un lado, hemos realizado el análisis del léxico disponible de una amplia muestra de estudiantes de español como lengua extranjera con lenguas maternas diversas, residentes en todas las capitales andaluzas y alumnos de sus universidades. No es el primer trabajo dedicado a esta aplicación de la disponibilidad léxica, pero cuenta con una muestra mayor que la de otros estudios de las mismas características. Por otro, nos hemos adentrado en un aspecto totalmente novedoso en este tipo de investigaciones, como es la caracterización semántica de los centros de interés, con dos vertientes: en primer lugar, en tanto organizaciones léxicas de tipo asociativo, con ciertas semejanzas con estructuras y sistemas estudiados en la semántica, en sus corrientes más sobresalientes desde su inicio como disciplina científica; en segundo lugar, y de nuevo con un enfoque muy original, fijándonos en su funcionamiento interno, hemos extraído aquellas relaciones que se establecen con más frecuencia entre las unidades léxicas que componen los centros y determinado su naturaleza en función de los niveles del significar en los que se sitúan, distinguiendo las relaciones estrictamente léxicas, entre significados, de las significativas, de tipo designativo y establecidas entre las cosas a las que se refieren las palabras disponibles. Además de estas cuestiones teóricas, el primer capítulo lo hemos dedicado a los orígenes de los estudios de disponibilidad léxica, partiendo de sus antecedentes, los vocabularios reducidos, de los que el método del léxico disponible parte como un perfeccionamiento de su metodología. Aquellos vocabularios estaban basados únicamente en la frecuencia con que las palabras aparecían en corpus realizados, normalmente, a partir de textos escritos sobre diversos temas. Los autores del Français Fondamental, a quienes se les había encargado la elaboración de un material básico de aprendizaje del vocabulario y la gramática del francés para estudiantes no nativos, percibieron los dos grandes problemas de este método, esto es, la frecuente inadecuación de la selección de los textos para el corpus, del que se excluía la lengua hablada, lo cual podía conllevar la exclusión de palabras fundamentales para la comunicación cotidiana, y, desde el punto de vista de las categorías lingüísticas, la exigua presencia de sustantivos concretos, aquellos que, precisamente, designan los objetos que nos rodean. Por esta razón, Michéa, Gougenheim y sus compañeros decidieron completar este método, basado en la frecuencia y empleado tradicionalmente para la confección de diccionarios básicos, incluyendo, por un lado, encuestas orales dentro del corpus y, por otro, completando las listas de vocabulario frecuente con el que denominaron léxico disponible, extraído mediante encuestas de tipo asociativo a partir de unos estímulos o centros de interés. El vocabulario extraído de este modo se componía fundamentalmente de sustantivos, los cuales se jerarquizaban no solo teniendo en cuenta su frecuencia, sino también el rango, es decir, el lugar de aparición del término en cuestión dentro de cada encuesta. Esta nueva metodología no estuvo exenta de críticas, como hemos podido comprobar, las cuales se centraron, por un lado, en la subjetividad de la selección de los centros de interés critica que aún se mantiene y que sigue siendo uno de los puntos más conflictivos de los estudios de léxico disponible, aunque en nuestro caso procuramos acercarnos lo más posible a una selección de centros objetivamente adecuada a la muestra con la que trabajamos, como luego explicamos y, por otro, en la falta de contexto de las palabras recogidas y, por tanto, en la ausencia de descripción de su sintagmática, tan importante a la hora de enseñar una lengua extranjera. A pesar de ello, las ventajas de contar con un método de extracción de fundamentalmente los sustantivos más básicos de una lengua y las numerosas posibilidades de aplicación que supone el disponer una base de datos de este tipo, tanto para la simple descripción de un estado de lengua concreto, como para su comparación con otros sincrónicamente y desde la variación, sobre todo diatópica , para el estudio de los procesos de producción léxica y, retomando el objetivo originario, el perfeccionamiento de los métodos de enseñanza del vocabulario tanto de la lengua materna como una lengua extranjera, hicieron que los estudios de disponibilidad léxica tuvieran un gran seguimiento. En este aspecto, la figura de Humberto López Morales es fundamental, pues fue él quien promovió, con la creación del Proyecto Panhispánico de Disponibilidad Léxica, la elaboración de una gran base de datos de léxico disponible del español de España y de Hispanoamérica, proyecto al que se acoge la gran mayoría de estudios que han aparecido hasta el momento. El objetivo del segundo capítulo ha sido, en primera instancia, el de estudiar el origen del término centro de interés. Los trabajos pioneros lo tomaron de la pedagogía, donde se había fundado toda una corriente en torno a este concepto, el cual se entendía como el conjunto de estímulos fundamentales que hacen madurar al niño tanto física como intelectual y socialmente y cuyos contenidos pueden agruparse en torno a diferentes temas, que funcionan como palabras-clave que concentran los intereses del niño. Estos agrupamientos son los que tuvieron en mente los autores de Français Fondamental a la hora de encontrar una solución al problema de la insuficiencia de las listas de vocabulario frecuente a partir del nuevo método de la disponibilidad léxica. Sin embargo, el término no era exclusivo de la pedagogía, sino que también había servido para clasificar cierto tipo de obras lexicográficas estructuradas con una organización onomasiológica: las nomenclaturas. Estas, cuyo origen se remonta a los Vocabularia medievales, se habían difundido por Europa desde el Renacimiento y consistían en conjuntos de vocablos organizados por temas, normalmente pensados con un objetivo didáctico, fundamentalmente enfocado hacia la enseñanza de una lengua extranjera. Las semejanzas que guardan las nomenclaturas con los léxicos disponibles son evidentes, en tanto que en ambos casos se trata de listas abiertas de sustantivos reunidos bajo un concepto superior, sin un criterio claro para su delimitación y con finalidad didáctica, por mucho que los trabajos pioneros sobre disponibilidad léxica no prestaran atención a la tradición lexicográfica de la que eran herederos. El grueso de este segundo capítulo, no obstante, está enfocado hacia la descripción semántica del concepto centro de interés tal y como lo entendemos en los estudios de disponibilidad, es decir, como configuraciones asociativas que, a partir de un enunciado que sirve como estímulo una o varias palabras-clave, reúne toda una serie de vocablos asociados. El estudio se ha realizado a partir de dos vías. En primer lugar, analizamos desde el punto de vista historiográfico el tratamiento que la capacidad asociativa de las palabras tuvo en las primeras etapas de la semántica en cuanto disciplina científica. Dentro de las períodos que son específicos de los estudios del significado, en la semántica histórica, caracterizada por su interés por los cambios semánticos, el hecho de que las unidades léxicas puedan vincularse a otras, bien por contextos compartidos, bien porque la mente del hablante las asocia, a través de las vivencias que ha tenido y del mundo que le rodea, pueden llegar a ser determinantes para que se produzcan cambios en su contenido semántico. Esta línea psicologicista, que puede rastrearse hasta Bréal y sus leyes intelectuales del lenguaje a las que también denomina psicológicas, tiene, sin embargo, su mayor desarrollo en algunos autores alemanes de finales del siglo XIX y principios del XX, herederos de Reisig en su preocupación por los cambios semánticos y de Wundt en la justificación psicológica de los mismos, como fueron Rosenstein, Hey, Marty, Erdmann y Wellander, entre otros. El planteamiento más completo y abarcador de muchas de las ideas de sus compañeros será, no obstante, el de Sperber, quien, en su Einführung in die Bedeutungslehre, desarrolla toda una seria de teorías y conceptos acerca de los tipos de contenido léxico (contenido conceptual, sentidos accesorios y valor emocional), el fenómeno de la consociación o transferencia de significados por cercanía contextual y las esferas conceptuales, conformadas por un concepto y todos aquellos sentidos secundarios que se le relacionan. Estas esferas conceptuales son, por tanto, agrupaciones de palabras con una organización interna muy semejante a la de los centros de interés, puesto que esos sentidos secundarios son las relaciones asociativas debidas a la experiencia que el hablante tiene de la cosa designada y de lo que, en la realidad, está conectado con ella, lo cual explica que en centros como los animales, además de vocablos pertenecientes a la categoría como perro, gato, león, etc., aparecerán otros como compañía, veterinario, dependencia, alergia o amistad, o Navidad, cumpleaños, pelea, broma, sonrisa y jardín en la familia. Más adelante, esta preponderancia, no solo de lo psicológico, sino también de lo sociológico en los estudios semánticos se observará en algunas de las propuestas de configuraciones de tipo asociativo que se desarrollan en Francia hacia mediados del siglo XX, con representantes como Bally y sus campos asociativos, los campos nocionales de Matoré y los campos morfosemánticos de Guiraud. Todos ellos, aunque cada uno con características particulares, se basan en la misma capacidad asociativa que hace que en los centros de interés no solo aparezcan vocablos vinculados directamente por el significado, sino también otros muchos cuyos vínculos los establece el significante, la cosa designada, la experiencia individual y las convenciones sociales en torno a un determinado tema. Asimismo, es de gran interés la propuesta que hace Duchácek con sus campos lingüísticos, más cercana al estructuralismo, aunque todavía con una gran carga asociativa. En una primera clasificación de estos campos incluye, como campos lingüísticos de ideas, los campos conceptuales y los campos semánticos, los primeros constituidos en torno a un concepto común a los contenidos semánticos de todas las palabras que forman el campo y los segundos, más complejos y extensos, reúnen y clasifican las palabras emparentadas desde el punto de vista del contenido, aunque no necesariamente por la dominante semántica o núcleo del contenido. Esta división, aunque desaparecería en clasificaciones posteriores de los campos lingüísticos, puede aplicarse a los centros de interés empleados en la disponibilidad léxica y, de hecho, nos ayuda a comprender las diferencias que existen entre ellos. Campos conceptuales, en los que, el concepto que aglutina el campo es la dominante semántica, son centros como el cuerpo humano o los animales, en los que la dominante es formar parte del cuerpo o pertenecer a una especie considerada del reino animal. Por el contrario, otros como ocio y tiempo libre o el dinero reúnen un número mayor de unidades, sin un núcleo conceptual tan claro como centro y a través de vínculos asociativos más complejos y difusos, por lo que se trataría de campos semánticos. Por otro lado, veremos que el gran aporte de la semántica estructural al análisis de los sistemas léxicos es su teoría sobre los campos léxicos, que sostiene, de hecho, el carácter estructural de los mismos. Ahora bien, esta teoría tiene su antecedente en la llamada semántica neohumboldtiana o Sprachinhaltsforschung, que se sitúa en Alemania a principios del siglo XX y que sienta las bases de los campos léxicos estructurales. Con una metodología que se ha criticado por ser excesivamente impresionista, sus grandes exponentes, Trier y Weisgerber, establecen que el léxico está estructurado en parcelas yuxtapuestas cuyos elementos están íntimamente ligados, por su significado, a sus vecinos y cubren sin huecos una sección del contenido semántico. La semántica estructural, posteriormente, corregirá los desajustes de esta primera propuesta, pero no se separará radicalmente de ella. En este sentido, los campos léxicos, tal y como los propone el estructuralismo no explican, ciertamente, toda la configuración interna de los centros de interés, aunque en algunos de ellos sí puedan detectarse estructuras parciales que funcionen como campos léxicos de objetos concretos, como los formados por las prendas de la ropa en la ropa, las relaciones de parentesco en la familia, los nombres de animales en los animales y los de vehículos en medios de transporte. Además, la propuesta que, dentro de esta misma corriente, hace Baldinger con sus conceptos de campo semasiológico y campo onomasiológico, que recubren las relaciones que se establecen entre un significante y los significados a él asociados, en el campo semasiológico, y entre un concepto y sus significantes, en el campo de designaciones u onomasiológico, es asimismo de gran utilidad para explicar el comportamiento de los centros de interés, fundamentalmente el segundo de ellos. Y es que el camino que se sigue en la disponibilidad léxica es el onomasiológico: desde un concepto determinado se llega a toda una serie de significantes, de designaciones de ese concepto, así como a otros vinculados con él. Sin duda, estas posibles aplicaciones de la semántica estructural a la descripción de los centros de interés se restringen a aquellas propuestas que describen organizaciones del léxico más allá de la lexemática coseriana, la cual impone limitaciones muy estrictas a las parcelas de la lengua que pueden ser estructuradas. Sin embargo, estos mismos límites nos ayudan a situar con mayor precisión en qué nivel del significar se constituyen las relaciones que se producen en el léxico disponible, tanto entre los elementos pertenecientes a los centros de interés y los enunciados de estos centros como entre los propios elementos del léxico disponible. Los componentes de los centros no se vinculan solo por su significado, sino que se asocian a un concepto, esto es, a la imagen mental que los individuos nos hacemos de los objetos de la realidad, primera abstracción del proceso semiótico, a la que debe seguir una segunda, ya intralingüística, para poder llegar al significado. Las relaciones entre estos elementos se producen, pues, fuera de la lengua y, de hecho, como observamos en el capítulo dedicado al análisis cualitativo y a las relaciones léxicas y significativas dentro del léxico disponible, se deberán en ocasiones a la manera en que el mundo real está organizado. Es debido a esta vinculación de los centros de interés con lo extralingüístico por lo que la semántica cognitiva puede explicar de manera más precisa en qué consisten, ya que esta perspectiva de los estudios semánticos parte, precisamente, de las relaciones entre el concepto y el significado enciclopédico, esto es, entre las palabras y su uso y el conocimiento del mundo. La atención que dedican a los procesos cognitivos de categorización, a cómo se traducen en el lenguaje y a las propiedades de las categorías semánticas permiten clasificar de manera muy ajustada ante qué nos encontramos cuando nos preguntamos qué es un centro de interés. De esta manera, siguiendo algunos trabajos que, desde esta perspectiva, ya han llevado a cabo tipologías de centros de interés, clasificamos los empleados en esta investigación en: 1) categorías naturales: aquellas que se corresponden con las características clásicas de una categoría semántica, con límites más o menos definidos y cuyos miembros son fácilmente identificables. Son categorías naturales el cuerpo humano, la ropa, alimentos y bebidas, medios de transporte, los animales, profesiones y trabajos y aspecto físico y carácter; 2) categorías radiales: basadas en las nociones de red conceptual y de semejanza de familia, las palabras no se restringen a un solo dominio cognitivo, sino que los distintos elementos son capaces de activar otros dominios y vincularse, por tanto, a conceptos diferentes, aunque conectados con el enunciado de la categoría. Se trata de la configuración que presentan los centros ocio y tiempo libre, tiempo meteorológico y clima, la familia y viajes y vacaciones, y 3) esquemas: vinculados a espacios del mundo real, los informantes evocan, para la actualización del léxico disponible, escenas y lugares físicos y, a partir de ellos, objetos relacionados. Se trata del caso de los centros la casa, la cocina y sus utensilios, escuela y universidad. la ciudad, el campo y acciones y actividades habituales, aunque en este último no es el espacio el que determina los procesos cognitivos que dan lugar al léxico disponible vinculado a él, sino el tiempo, por lo que lo hemos clasificado como un tipo especial de esquema, el denominado guión. A esta clasificación, sin embargo, hay que hacerle algunas puntualizaciones, sobre todo en la consideración de algunos centros como categorías naturales. Los criterios de edición de los materiales que hemos seguido en esta investigación, muy poco restrictivos, así como la elección de las denominaciones de los centros, pensadas precisamente para que los informantes actualizaran el mayor número de unidades vinculadas al tema propuesto, hacen que todos los centros clasificados como categorías naturales sean, en esta investigación y con los resultados obtenidos, más propiamente categorías radiales. Ahora bien, creemos que es interesante mantener la distinción entre unas y otras, con la puntualización anterior, ya que, aunque finalmente en ambas se incluyan elementos que traspasan los límites de una categoría natural, en los centros clasificados como tales la cohesión en torno al núcleo conceptual es mucho mayor. Después de dos capítulos estrictamente teóricos, los tres restantes se centran en el estudio que hemos llevado a cabo sobre la disponibilidad léxica de los estudiantes de español como lengua extranjera de las universidades andaluzas. De ellos, el capítulo 3 se ha dedicado a la metodología de la investigación. En primer lugar hemos descrito la muestra empleada compuesta por 322 informantes y su estratificación según las variables lengua materna (alemán, francés, finés, inglés, italiano y polaco), nivel de español (A, B y C del MCER), sexo (hombre y mujer), uso del español (bajo, medio y alto) y conocimiento de otras lenguas (conocimiento de otra lengua románica como lengua extranjera; conocimiento de otra lengua extranjera, no románica, y conocimiento únicamente del español como lengua extranjera). A continuación, nos centramos en la encuesta, que está basada en las que se han empleado en los trabajos del Proyecto Panhispánico, aunque se ha adaptado a las variables que nosotros empleamos (cf. Anexo I). Como ellas, está dividida en dos partes, la primera dedicada a la recolección de datos acerca de la procedencia y edad de los informantes, el nivel económico y cultural de su familia, las lenguas que conocen, el uso que hacen del español y los materiales de enseñanza que han empleado en los cursos de español que hayan recibido informaciones todas estas de las que únicamente codificamos los datos sobre las variables antes reseñadas. En la segunda parte se lleva a cabo la prueba asociativa en la que consiste el test de disponibilidad. La selección de los centros de interés ha sido, al igual que la de las variables empleadas, diferente a la propuesta por el Proyecto Panhispánico. Basándonos en los contenidos de tipo léxico que propone el MCER para el nivel A1 de español, hemos empleado una lista de centros que recoge muchos de estos contenidos, al tiempo que mantenemos un margen de semejanza con los trabajos del Proyecto Panhispánico, de manera que podamos, en próximos estudios, llevar a cabo comparaciones entre unos y otros léxicos. Por último, en lo que respecta a la edición de los datos recogidos, con el mismo objetivo de poder comparar resultados con otros estudios, hemos seguido los propuestos por el Proyecto, además de los criterios que se han empleado en otras investigaciones realizadas sobre muestras de informantes no nativos, por las características particulares de este trabajo. Debemos señalar, no obstante, que un estudio del léxico disponible de hablantes de español como lengua materna, que tiene el objetivo de analizar cuál es el léxico más básico que conocen los estudiantes, ha de partir de unos criterios de edición abarcadores, que no limiten en exceso las palabras asociadas a los centros de interés, pues creemos que, en este caso, la finalidad de conocer qué palabras y cuántas actualizan estos informantes está por encima de la determinación de qué elementos pertenecen estrictamente a cada una de las categorías. Por ello, salvo en casos extremos donde la unidad léxica registrada no tenía conexión alguna con el centro de interés, se han incluido en las listas de léxico disponible todas aquellas registradas en las encuestas. En el capítulo cuarto hemos llevado a cabo un exhaustivo análisis estadístico sobre los resultados cuantitativos que han proporcionado las encuestas de disponibilidad léxica realizadas sobre la muestra. En primer lugar, hemos expuesto los resultados cuantitativos generales: en las 322 encuestas realizadas se han recogido 83.805 palabras en total, lo que supone una media de 260,26 palabras por informante en el total de la encuesta y de 14,46 palabras por centro de interés. Si tenemos en cuenta el número de palabras diferentes, o como se denominan tradicionalmente en los estudios de disponibilidad, de vocablos, estos han sido 8.604 . Los centros de interés más productivos aquellos en los que se ha actualizado un mayor número de palabras en total han sido, por orden, el 4. Alimentos y bebidas, el 7. La ciudad y el 3. La casa; resultaron los menos productivos, por su parte, el 5. La cocina y sus utensilios, el 13. Tiempo meteorológico y clima y el 2. La ropa. Por otro lado, los centros 17. Viajes y vacaciones, 6. Escuela y universidad y 7. La ciudad han registrado la mayor cantidad de palabras diferentes, por lo que se configuran como los más ricos desde el punto de vista léxico; por el contrario, en el 2. La ropa, el 16. La familia y el 5. La cocina y sus utensilios el número de vocablos diferentes ha sido el más bajo. Un último dato cuantitativo de gran interés es el que aporta el índice de cohesión, complementado con la densidad: los centros de interés más cohesionados, aquellos en los que la coincidencia en las respuestas de los informantes ha sido mayor, son el 1. El cuerpo humano, el 2. La ropa y el 4. Alimentos y bebidas; en el extremo opuesto se encuentran el 12. Profesiones y trabajos, el 8. El campo y el 18. El dinero. Para esta investigación se han tenido en cuenta cinco variables, nivel de español, lengua materna, sexo, uso del español y conocimiento de otras lenguas, cuya descripción se hizo en el capítulo anterior. Uno de los objetivos fundamentales que nos planteábamos en este trabajo era el de analizar la influencia de estos factores sobre el número de palabras que actualizan los estudiantes de español como lengua extranjera en las encuestas de disponibilidad léxica. Para ello, el primer paso fue estudiar la correlación existente entre las variables, es decir, cómo unas pueden influir sobre otras a la hora de que se produzca variación en el número de palabras. Dado que ha resultado imposible seleccionar una muestra representativa de la población objeto de estudio, a causa de la inestabilidad y enorme heterogeneidad de la misma, hemos llevado a cabo todas las pruebas estadísticas controlando, al menos, la influencia de una de las dos variables que se han revelado como más influyentes: el nivel de español y la lengua materna. Una vez realizadas las pruebas estadísticas de contraste de hipótesis sobre las diferencias que se revelaron en los análisis descriptivos de cada variable, podemos afirmar que la variable que provoca la mayor variación en los resultados cuantitativos es el nivel de español. La variable de control empleada fue la lengua materna, con el resultado de que el nivel es significativo para todas ellas. Las diferencias entre niveles son de un aumento en el número de palabras del 42,59% entre los niveles A y B, un 49,04% entre A y C y un 4,43% entre B y C. Las diferencias entre B y C, sin embargo, no son significativas y, de hecho, los análisis post-hoc que se han llevado a cabo a partir de las pruebas Anova revelan que los dos niveles superiores se comportan como un solo subgrupo. Esto corrobora la hipótesis que nos formulamos al observar la poca diferencia que existe entre los resultados de los informantes de B y C: el avance en el conocimiento del léxico es fundamental para profundizar en el conocimiento del español como lengua extranjera entre los niveles iniciales y los intermedios, pero este aumento se estanca cuando se avanza hacia niveles superiores. Al estudiar la influencia de la lengua materna, para lo cual controlamos su interdependencia con el nivel de español, observamos que, a pesar de que en la descripción cuantitativa de las diferencias el número de palabras registradas crecía entre un 12% y un 15% al pasar de lengua a lengua, en el orden ascendente de polaco, finés, italiano, francés, inglés y alemán, la significatividad se concentra en las diferencias entre algunos pares de lenguas y, sobre todo, en el nivel A. Así, en el nivel inferior los informantes de lengua alemana conocen significativamente más palabras que los de francés, finés y polaco; los de lengua inglesa e italiana, más que los de finés y polaco, y los hablantes de francés, más que los de finés. En el nivel B son los hablantes de alemán y de inglés quienes se diferencian significativamente por encima de los de italiano y en el C, los de alemán sobre los de inglés, francés e italiano. El sexo resulta ser una variable muy poco discriminatoria entre los estudiantes de español como lengua extranjera. Los resultados levemente superiores obtenidos por las mujeres en el análisis descriptivo (un 9,87% más de respuestas) se deben a la distribución de los sexos por niveles, pues las mujeres se concentran en los superiores. Controlando la influencia tanto del nivel de español como de la lengua materna sobre la variación debida al sexo, tan solo en el subgrupo de informantes de nivel A y de lengua polaca las mujeres conocen significativamente más palabras que los hombres, concretamente un 21,27% más. Se trata, además, de la única variable en la que se puede deducir un patrón en la significatividad por centros de interés: en general, las diferencias entre sexos son significativas en los centros menos productivos y con menor riqueza léxica: el 2. La ropa, el 5. La cocina y sus utensilios, el 13. Tiempo meteorológico y clima y el 16. La familia. El uso del español se ha revelado como otra variable de cierta importancia para determinar la productividad léxica. Las diferencias entre los resultados de los informantes que afirman hacer un uso poco frecuente del español y los que lo usan con una frecuencia media es de un 24,88% más de palabras en estos últimos; el aumento entre los que hacen un uso bajo y los que emplean el español con frecuencia alta es del 40,89% y entre el uso medio y el alto el incremento de las palabras actualizadas es de un 12,82%. Al comprobar la significatividad de estas diferencias, para lo cual se ha controlado el nivel, resulta que están debidas en su mayoría a la distribución de los informantes, ya que los que emplean el español con poca frecuencia son más abundantes en el nivel A y los que usan el español de manera frecuente o medianamente frecuente, en los niveles B y C. Así, el uso del español solo explica variación de manera significativa en el nivel inferior y únicamente al comparar los subgrupos extremos: el de uso bajo y el de uso alto. Por último, la variable conocimiento de otras lenguas, a pesar de haberla analizado controlando cuidadosamente los otros factores que le afectan, no influye para nada en la variación entre resultados cuantitativos. Tan solo en algunos centros de interés resulta significativa su influencia, aunque sin una tendencia clara. Así pues, y en resumen, los factores analizados influyen fundamentalmente en el nivel A, diluyéndose su capacidad para establecer diferencias conforme crece el nivel de los informantes. Un hablante de lengua alemana o inglesa, con un uso alto del español y situado en el nivel A, conoce significativamente más palabras que sus compañeros de clase; por el contrario, un hablante de este mismo nivel que tiene como lengua materna el polaco o el finés y que no emplea el español con frecuencia está por detrás en su conocimiento cuantitativo del léxico, más aún si se trata de un hombre de lengua polaca. Sin embargo, una vez que pasen al nivel intermedio estas características dejarán de tener influencia, comportándose todas de manera muy semejante. Por último, el capítulo quinto se ha centrado en el análisis cualitativo del léxico disponible extraído en el estudio. Dividido en dos partes, en la primera de ellas el objetivo ha sido la descripción de las relaciones léxicas y las relaciones significativas más frecuentes dentro de cada uno de los centros de interés. Con la ayuda del programa DispoGrafo, hemos extraído aquellos pares de palabras que más frecuentemente han aparecido directamente unidos en las encuestas, es decir, aquellas palabras que el informante ha actualizado de manera seguida, lo cual nos ha permitido observar la naturaleza de las relaciones que sostienen la organización de los centros. Hemos distinguido, siguiendo a Casas (2005b y 2011), entre relaciones basadas en los significados de las palabras relaciones léxicas en sentido estricto, como la hiperonimia-hiponimia, la antonimia y la parasinonimia, y relaciones significativas. Estas últimas pueden ser lingüísticas, en las que los miembros de la relación forman parte del signo lingüístico, pero no se restringen al significado, como las relaciones entre significantes (paronimia), las relaciones bidireccionales entre significantes y significados, las relaciones entre signos completos y las que se constituyen entre un signo y el significado de otro signo. Pero también se detectan relaciones significativas de tipo designativo, en las que los vínculos se establecen entre las cosas designadas, debido a asociaciones provocadas por la experiencia personal del mundo; a la similitud (relaciones de tipo metafórico), contigüidad (metonimia) o inclusión (meronimia) entre los elementos designados; a contraposiciones de tipo cultural (antonimia del hablar), o a relaciones lógico-designativas de carácter terminológico. La preponderancia de las relaciones léxicas o de las relaciones significativas en los distintos centros de interés está directamente relacionada con la cohesión de los centros y, además, con el hecho de que podamos clasificarlos, desde el punto de vista cognitivo, como categorías naturales o, por el contrario, como categorías radiales y esquemas. En los primeros, con índices de cohesión más altos, la relación entre los componentes del centro y su enunciado, o una restricción de este (del tipo la ropa-prendas de ropa) es de hiperonimia-hiponimia, ya sea directa o indirecta, y muchos de los elementos se configuran como cohipónimos entre sí. Sin embargo, en los centros con una cohesión menor, el número de relaciones que detecta DispoGrafo es más reducido y su naturaleza tiende a ser significativa, con una presencia importante de las relaciones metonímicas o por contigüidad, muy reseñables, fundamentalmente, en los esquemas. Así pues, aunque al contemplar la totalidad de elementos que componen los centros el único vínculo que explica la presencia de todos los elementos presentes en ellos sea la de la asociación mental en sentido laxo pues, en definitiva, cualquier tipo de relación entre palabras es una relación asociativa en la mente del hablante, es posible establecer sistemas e incluso estructuras parciales entre algunos de los elementos más disponibles, los cuales, además, ayudan al esclarecimiento de la naturaleza interna de los centros. Por otro lado, el análisis descriptivo de los centros examina, en primer lugar, los núcleos temáticos presentes en cada uno de los centros cuya diversidad va a estar muy vinculada, de nuevo, al índice de cohesión de los mismos, así como la abrumadora presencia, en la gran mayoría de los centros de interés, de la categoría lingüística de los sustantivos. Únicamente los centros 14. Acciones y actividades habituales y 15. Aspecto físico y carácter, pensados expresamente para la extracción de verbos y adjetivos, respectivamente, quedan al margen de esta tendencia. Entre los demás, aquellos en los que los verbos suponen al menos el 20% de los elementos recogidos son los centros 11. Ocio y tiempo libre, 16. La familia y 18. El dinero; el 9. Medios de transporte y el 17. Viajes y vacaciones cuentan con una presencia de verbos de entre el 15 y el 17%. Los adjetivos, por su parte, tienen una presencia notable en el centro 13. Tiempo meteorológico y clima y el 16. La familia, con el 20%, y en el 1. El cuerpo humano y el 2. La ropa, con porcentajes entre el 13 y el 15%. En los centros restantes, no pasan de la décima parte del total los elementos léxicos pertenecientes a alguna de estas dos categorías lingüísticas. Por otro lado, nos hemos detenido en el análisis de aquellos fenómenos lingüísticos que caracterizan cualitativamente el léxico disponible de los estudiantes de español como lengua extranjera. En primer lugar, hemos llevado a cabo una breve introducción teórica, dividiendo estos fenómenos en cuatro ámbitos: 1) los que están relacionados con la variación, sea esta diatópica, diafásica o de especialidad; 2) los que hacen referencia a tipos de cambios semánticos: eufemismos y disfemismos, casos de metáforas y metonimias y elipsis originadas en combinatoria léxica; 3) casos de importación léxica, distinguiendo entre extranjerismos, préstamos y calcos (estructurales y semánticos), y 4) mecanismos de formación y creación léxica, fundamentalmente la derivación, la composición tanto ortográfica como sintagmática y los acortamientos, entendiendo bajo este concepto tanto acortamientos simples como abreviaturas, siglas y acrónimos. El conjunto del léxico recogido en los dieciocho centros de interés muestra un predominio del léxico español estándar, sin un número relevante de casos de variación. Se han detectado algunos americanismos, como pollera, remera o chancho, aunque, sorprendentemente, ningún dialectalismo propio de las hablas andaluzas. La presencia de voces que se relacionan con niveles de lengua informales es algo mayor, aunque no es tampoco reseñable, como, por ejemplo, guay, chulo, michelín y barrigón. Por último, la presencia de elementos que se consideren propios del lenguaje de especialidad se concentra en el centro el cuerpo humano y se trata de términos propios de la fisiología y la medicina. Dentro de los cambios semánticos, el fenómeno más frecuente es el de la elipsis originada en combinatoria léxica, dado que se trata de un mecanismo muy productivo dentro de la lengua española, que afecta a numerosas áreas temáticas, aunque especialmente a campos como las denominaciones de los vinos (jerez, manzanilla, tinto, fino), las prendas de ropa (media, deportiva, tenis, pashmina, palestino, americana, tejano, playera), las partes de la casa (lavadero, ropero, trastero) y los electrodomésticos (vitrocerámica, microondas). Los cambios por metáfora y metonimia son testimoniales, como el de diésel. Los eufemismos y disfemismos, aunque también escasos, tienen una presencia algo mayor, sobre todo en el centro el cuerpo humano y referidos a los órganos sexuales. Los extranjerismos y préstamos que aparecen son, por lo general, de uso común en español y procedentes en su mayoría del inglés. Se concentran en los centros alimentos y bebidas, medios de transporte, ocio y tiempo libre y viajes y vacaciones (como pizza, tortellini, gin, baguette, parking, ferry, roller entre los extranjerismos, paté, puré, gratín, bistec, béisbol, fútbol, gol, cóctel, entre los préstamos adaptados). Los ejemplos de calcos estructurales son más escasos, aunque se encuentra ejemplos como perrito caliente, hombre de negocios y rascacielos. Dentro de los mecanismos de formación y creación léxica, las siglas tampoco tienen una presencia muy reseñable, salvo en el dinero (PIB, IVA, PIN). Los abreviamientos simples, por su parte, tienen cierta presencia, aunque son de uso muy común, y se concentran en medios de transporte (bici, moto, bus). La presencia de derivados es muy notable en el centro profesiones y trabajos, mientras que la composición se observa en la totalidad de los centros, fundamentalmente de tipo sintagmático. Por tanto, el análisis cualitativo descriptivo nos lleva a la conclusión de que el léxico disponible de los estudiantes de español como lengua extranjera es, fundamentalmente, de carácter neutro, formado mayoritariamente por unidades simples que pertenecen a la categoría léxica de los sustantivos. Es el español estándar más básico que se enseña en los centros de idiomas, con muy poca presencia de elementos que procedan de su uso del español con las personas de su edad, de la zona en la que residen en el momento en que se realizaron las encuestas o de innovaciones léxicas aún no asimiladas por la norma, ni de unidades excesivamente complejas en su formación. En conclusión, este trabajo ha pretendido ser un aporte original a la nómina de estudios sobre disponibilidad léxica, y esto en dos sentidos. El primero de ellos, de carácter teórico, se refiere al análisis semántico de los centros de interés, tanto desde el punto de vista de la importancia que ha tenido, en la historia de esta disciplina, la capacidad asociativa de las palabras, fundamento de la disponibilidad léxica, como del análisis interno de los centros de interés y de las relaciones entre palabras que conforman su organización interna. El segundo, con una intención aplicada, ha sido el de proporcionar un amplio estudio sobre el léxico disponible de los hablantes de español como lengua extranjera, a partir de una muestra multilingüe, que, además del interés que tiene en sí mismo como descripción de un estado de lengua muy particular, nos sirva, en próximos trabajos, para realizar análisis y comparaciones más directamente enfocadas al perfeccionamiento de la enseñanza del vocabulario y de la selección del léxico en los materiales de aprendizaje.