Julio Loras Zaera

fortanete

Profesor Francho de Fortanete A la luz de la ciencia. Biología y asuntos humanos

Glottobank construye cinco bases de datos lingüísticos comparables a los de otras ciencias

Ciencias como la biología, la etnología o la antropología disponen de ingentes bases de datos que permiten investigaciones importantes, imposibles sin ellas. La lingüística, hasta hace poco, solo disponía de bases muy limitadas con unos pocos miles de datos, y ceñidas a ciertos aspectos de las lenguas, pese a que la investigación en ese ámbito viene de lejos y está muy viva desde el siglo XVIII.

Existen entre 6.000 y 10.000 idiomas que se estudian desde muy diversos puntos de vista, tanto lingüísticos, como psicológicos, sociolingüísticos o antropológicos. Un consorcio internacional, Glottobank, en el que participan los más prestigiosos institutos y universidades, así como un nutrido grupo de lingüistas que han colaborado de forma independiente ha construido cinco bases de datos de unos 2.500 idiomas (naturalmente, la base de datos está en construcción permanente) y unas decenas de dialectos (no me convence en absoluto la distinción entre idiomas y dialectos, ya que me parece confusa y los propios lingüistas no se ponen de acuerdo a la hora de distinguirlos, ni siquiera a la de definirlosi). Estos idiomas se agrupan en 215 familias, distribuidas en todas las regiones geográficas y continentes habitados.

Estas cinco bases son: una que documenta la variación lexicográfica (Lexibank), otra que documenta la variación en la estructura (Grambank), la de los sistemas de paradigmasii (Parabank), la de los numerales (Numeralbank) y la de los cambios fonéticos (Fonobank). No tengo información sobre las otras cuatro, pero leí la presentación de Grambank que se publicó en Science Advances por parte de un nutrido grupo de profesionales de los que la han recopilado.

Nos explican que las lenguas varían mucho en sus propiedades estructurales, desde el orden de las palabras, pasando por la combinación de los segmentos fónicos en unidades de orden superior, la presencia variable de categorías como género, número, caso o tiempo, el que en unas lenguas se traduzcan tiras fónicas de muchas palabras de otras a una sola palabra, etc. Se trata de documentar todo eso de forma sistemática lo más completa posible. Según los autores de la presentación, esta diversidad lingüística no es aleatoria, sino que podría explicarse por las características de nuestra cognición, la proximidad geográfica y la ascendencia genealógica de los idiomas. Hasta ahora, para los promotores de Grambank, los esfuerzos por dilucidar estas cuestiones adolecían de asistematicidad y de alcance muy limitado (por ejemplo, limitados a una familia lingüística y realizados de manera puramente cualitativa). Con esta base de datos, los lingüistas y todos los científicos relacionados con el lenguaje podrán estudiarlo con mayor rigor (incluso cuantitativo) y amplitud.

Grambank está diseñado para investigar la distribución global de características estructurales de las lenguas, la posibilidad de lenguajes universales, las dependencias funcionales, la prehistoria del lenguaje y las relaciones del lenguaje con la cognición, la cultura y el ambiente. Recoge una amplia gama de fenómenos gramaticales.

La presentación es muy interesante, entra en y propone conclusiones a debates lingüísticos de larga data, como el del papel de la ascendencia frente a la difusión geográfica, o el número de ejes de variación necesario para explicar la variación de las estructuras gramaticales reales, o el estudio de los idiomas inusuales, que da pistas sobre las restricciones del lenguaje, etc.

Quien esté interesado en la lingüística disfrutará, creo, leyendo el artículo original. No lo resumo porque resumiéndolo no le haría justicia. Solo quiero comentar un aspecto con el que solo estoy parcialmente de acuerdo. Me refiero a lo que dicen de la extinción de idiomas. Consideran la variedad de idiomas como una riqueza, al modo en que lo es la biodiversidad y, en consecuencia ven la desaparición de idiomas como un empobrecimiento. La biodiversidad es una riqueza que tiene varios aspectos: para el funcionamiento de unos ecosistemas favorables a nuestra vida, de recursos de todo tipo (desde alimentarios y materiales hasta medicinales) o científica. Solo esta última resulta empobrecida con la extinción de un idioma. Y no se diga que supone sufrimiento para sus últimos hablantes, en la medida que la generación siguiente no la echa en falta. Ese sufrimiento solo es importante si la extinción del idioma es resultado de la coacción y de la opresión.

Diciembre de 2023

i Por poner un ejemplo de esa confusión, a veces se concluye que dos personas con dialectos distintos hablan la misma lengua si pueden tener una conversación normal entendiéndose perfectamente. Parece razonable, pero noruegos, suecos y daneses se entienden perfectamente, a pesar de que se suele considerar que hablan tres lenguas distintas.

ii En lingüística un paradigma es una estructura en la cual pueden situarse unas palabras en lugar de otras del mismo valor (incluso con diferentes significados) sin que la estructura se altere. Son paradigmas, por ejemplo, los sistemas de flexiones, como las tres conjugaciones del español o las declinaciones del latín, o también los tipos de oraciones.

QR Code