Soy un científico de datos de 25 años: así uso la IA para preservar el griego que hablaban en la antigua Esparta

Jaime García Chaparro posa en el pueblo de Leonidio, en Grecia, ante un cartel que dice en griego moderno y en tsakonio: "Nuestra lengua es el tsakonio. Pregúntanos y te contaremos".
Jaime García Chaparro posa en el pueblo de Leonidio, en Grecia, ante un cartel que dice en griego moderno y en tsakonio: "Nuestra lengua es el tsakonio. Pregúntanos y te contaremos".

Jaime García Chaparro

  • Jaime García Chaparro es un científico de datos que con 25 años trabaja en Havas Group e investiga en la Universidad Alfonso X el Sabio.
  • Tras aprender griego moderno, ruso, bielorruso y chino, su amor por los idiomas y su conocimiento tecnológico le han llevado a intentar rescatar el tsakonio, la evolución moderna del griego que se hablaba en la polis de Esparta.

(Este artículo parte de una entrevista entre Jaime García Chaparro y David Vázquez, redactor de Business Insider España. La transcripción ha sido editada solo por motivos de extensión y claridad).

Mi historia no es solo mi historia. Tampoco empieza simplemente cuando lo hace la mía, sino mucho antes. Comienza en Esparta, una de las polis más importantes de la antigua Grecia, una potencia militar ubicada en la península del Peloponeso.

Pero nada dura para siempre, ni siquiera el recio ejército de los espartanos. La antigua Esparta acaba siendo derrotada por el ejército macedonio y saqueada a finales del siglo IV de nuestra era.

Mientras, con el paso de los años surge el tsakonio, una variedad dialectal que no proviene de la unificación de lenguas (koiné) que ha dado lugar al griego moderno, sino del antiguo griego dórico que se hablaba en el Peloponeso, es decir, la zona en la que se ubicaba Esparta.

La sucesión de guerras da lugar a que los hablantes del tsakonio acaben trasladándose y ocupando una pequeña zona montañosa en el Golfo Argólico, concretamente alrededor de las ciudades Leonidio y Tyros, que quedan bastante aisladas hasta el siglo XIX.

En mi familia siempre han gustado los idiomas y la historia. Mi tío es arqueólogo, y mi padre es un abogado que siempre se ha sentido muy atraído por la cultura grecolatina. Inspirado por ellos, con apenas 10 años mis padres me apunté a una escuela de idiomas de Málaga para que aprendiera griego moderno.

Aquello llamó mi atención desde el principio, no tanto por el lado estrictamente cultural como por el propio aprendizaje del idioma. Todos aquellos sonidos, aquellas estructuras gramaticales a las que yo no estaba acostumbrado… Tanto me gustó que, con el tiempo, quise aprender también otros idiomas como el ruso, el bielorruso y el chino.

Fue precisamente mi intento de aprender bielorruso y la falta de diccionarios específicos para ese idioma lo que me convenció de la importancia de esta herramienta para preservar idiomas que no habla mucha gente y que corren cierto peligro de extinción. 

Pero eso llegó más tarde. Antes, empecé en la universidad una carrera de Relaciones Internacionales con ADE en la Universidad Alfonso X El Sabio en la que, poco a poco, me fui escorando hacia el lado más técnico y económico, concretamente hacia todo lo que tenía que ver con el manejo de datos.

Ilustración centro de datos

Fue en esa época cuando aprendí a programar con Python por mi cuenta, convencido como estaba de que la tecnología podía convertirse en mi aliada a la hora de aprender idiomas. Empecé a desarrollar mis primeros proyectos, que tenían que ver con el bielorruso, el chino y el griego.

Acabé la carrera y, tras descartar opositar a economista del Estado, me seguí formando en el mundo de la tecnología y los datos en Ironhack, un centro de formación especializado, entre otras cosas, en tecnología.

Hoy, soy científico de datos júnior en Havas Group, donde trabajo tratando de usar la estadísitica y la programación para tratar de adelantarme o hacer más fáciles determinados procesos. En todo este tiempo, los idiomas han seguido siendo mi pasión. Últimamente, uno en concreto ocupa buena parte de mi tiempo: el griego tsakonio.

Jaime García Chaparro posa en la pueblo de Leonidio, Grecia, con un cartel que dice en griego moderno y en tsakonio: "Que te vaya bien. Que tu camino sea aceite". La expresión se utiiza para desear a alguien buen viaje.
Jaime García Chaparro posa en la pueblo de Leonidio, Grecia, con un cartel que dice en griego moderno y en tsakonio: "Que te vaya bien. Que tu camino sea aceite". La expresión se utiiza para desear a alguien buen viaje.

Jaime García

Al rescate del tsakonio

Si te digo la verdad, no sé muy bien cuándo empezó. Simplemente, en algún momento, dándole vueltas a algunas de las ideas que tenía, me dio por pensar que yo no puedo aprender todos los idiomas que hay en el mundo, pero que tal vez las máquinas sí que pueden. 

En esas estaba cuando, guiado por mi gusto por todo lo que se sale de la norma, llamó mi atención el tsakonio, una evolución del griego que se hablaba en zonas como la antigua Esparta. Hoy, apenas lo hablan, como mucho, un millar de personas. Que aún se conserve una derivación de una lengua tan antigua es casi un milagro.

Para que te hagas una idea, lo que siente un hablante de griego moderno cuando escucha el tsakonio es algo parecido a lo que podemos sentir los castellanoparlantes cuando escuchamos a alguien hablar en ladino, la evolución moderna del español que hablaban los judíos expulsados de la península en 1492.

Esto, contando con que el tsakonio viene de un idioma todavía mucho más antiguo, con lo que, a diferencia de lo que nos ocurre a los españoles con el ladino, que más o menos somos capaces de entenderlo, a los griegos les resulta muy difícil pillar una sola palabra en tsakonio. Saben que es griego, pero no saben qué dice quien lo habla.

Este fue uno de mis primeros descubrimientos cuando, en 2023, en uno de los viajes que mi familia suele hacer por Grecia, les pedí que por favor fuésemos a la zona de Leonidio, uno de los pocos pueblos donde se habla tsakonio. 

Para ese momento, yo ya había buscado por internet en mis ratos libres todo lo que había podido sobre el tsakonio, pero no había encontrado prácticamente ningún texto con el que alimentar una máquina para tratar de preservarlo.

Lo segundo que descubrí en mi viaje es que el tsakonio es una especie de secreto guardado a buen recaudo por sus hablantes. De alguna manera, la vergüenza de creer que se trata de algo demasiado local hace que nadie en estas zonas hable en tsakonio ni mencione el idioma a los turistas. Muchos visitantes, de hecho, abandonan la zona sin conocer siquiera la existencia de este milagro lingüístico.

Sin embargo, a poco que uno pregunte o se fije, encuentra cosas. Muchos de los carteles que hay en la calle, por ejemplo, están en griedo moderno y en tsakonio, y quienes tienen negocios y son de la zona procuran siempre hacer algún guiño. En el hotel en el que nos hospedábamos, por ejemplo, cada habitación tenía el nombre de una fruta cuyo nombre estaba escrito en tsakonio.

Pero todo esto lo descubrí más tarde. Primero, tuve que dar mis primeros pasos como investigador de campo.

Lo que necesitas saber para estar informado

Lo que necesitas saber para estar informado

¿Te gusta lo que lees? Comienza tu día sabiendo qué piensan y qué les preocupa a los ejecutivos de las principales empresas del mundo con una selección de historias enviada por Business Insider España a primera hora cada mañana.

Recibe la newsletter

Empecé en una farmacia. Una mujer se metió de inmediato en la trastienda de su negocio cuando, con el griego que había aprendido de niño, le pregunté por el tsakonio. Al rato, apareció con un libro que era en realidad el manual de tsakonio que estaba utilizando en clase para aprenderlo.

La suerte se puso de mi lado. Al rato, mientras esperábamos para poder hablar con una panadera que era hablante de verdad de tsakonio y que me mostró la distancia tan grande que hay entre este y el griego moderno, en un mercadillo de libros antiguos di con otro hallazgo que ha sido fundamental. 

Preguntando por volúmenes en tsakonio o personas que lo hablaran, me terminaron poniendo en contacto con Eleni Poutsela, la secretaria del Archivo Tsakonio en Grecia. Le hablé de mi idea de tratar de usar la tecnología para conservarlo y le entusiasmó. Aún hoy está emocionada con el proyecto.

Pero mi buena fortuna no acabó ahí. Justo antes de irme, conocí a Maxim Kisilier, un investigador y lingüista ruso que es el único hablante extranjero de tsakonio y que es una verdadera eminencia en la enseñanza del idioma. También quedó encantado con lo que tenía en mente.

Así fue como, junto con uno de sus alumnos, Marcel Nowakowski, ni cortos ni perezosos nos lanzamos los tres a la preservación digital del tsakonio a través de un grupo de investigación llamado Tsakonian Digital (el nombre es provisional). Este tiene tres patas: diccionario, conservación de textos y el uso para todo ello de la inteligencia artificial. 

Funcionamos desde el pasado mes de septiembre, y cada dos o tres semanas nos reunimos para ver nuestros avances. Por ahora, gracias a la tecnología, hemos conseguido sacar adelante el primer diccionario online de tsakonio. Tiene unas mil palabras, y es clave para mantener la lengua viva.

Lo es, entre otras muchas cosas, porque permite traducir del griego al tsakonio, lo que nos ofrece, por otra parte, la posibilidad de generar textos en este idioma. Estos textos son el material principal con el que estamos entrenando una IA para que aprenda el tsakonio. 

Lady Gaga luciendo joyas de Tiffany en el 2019.

La base de esta IA es Llama 2, un modelo lingüístico de código abierto de Meta al que tenemos previsto hacerle algunas modificaciones para que se ajuste mejor a nuestras necesidades.

Más allá de esto, ahora lo que más tiempo nos ocupa es tratar de regularizar la ortografía. Al ser una lengua conservada sobre todo oralmente, cada hablante la escribe un poco a su manera. Marcel está haciendo un gran trabajo tratando de hacer una propuesta de normalización que guste a los hablantes.

Por mi parte, yo estoy trabajando en un TFM para la Universidad Alfonso X El Sabio para tratar de establecer una metodología que sirva para salvar el tsakonio. Esta se basa en tratar de averiguar qué información se necesita para preservarlo, con lo que estoy trabajando con datos sintéticos y una ortografía muy particular que está inspirada en el dialecto andaluz del español.

La idea es que, si descubrimos un método para salvar el tsakonio, tal vez podamos aplicarlo a otras lenguas en peligro de extinción, como el griego que se habla en el sur de Italia, por ejemplo. ¿Es este el comienzo de una era en la que las máquinas saldrán al rescate de los idiomas minoritarios? 

Bueno, quién sabe. Por ahora, lo que he aprendido de todo esto es que para llevar a cabo un proyecto de estas características es necesario el conocimiento técnico, es decir, aprender cómo montar una base de datos, cómo hacerla escalable y cómo hacer una página web accesible para la gente, por ejemplo.

Sin embargo, la parte social también es fundamental. Yo podría ponerme a hacer esto solo, perder horas y horas, pero es mucho más eficiente coordinar un equipo, ver cómo podemos trabajar juntos, enganchar a la comunidad, incluso implicar a la universidad para ver si lo podemos replicar con otros idiomas. Salir de la caja implica salirse de lo estrictamente técnico.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Business Insider.