Extracto de “La forja genética de Europa”, de Carles Lalueza-Fox (Edicions de la Universitat de Barcelona, 2018)

Selección a cargo de Michele Catanzaro

Actualmente cerca de la mitad de la población mundial —incluyendo territorios colonizados por europeos en los últimos centenares de años como América y Australia— habla lenguas indoeuropeas. Se trata de una gran familia lingüística que engloba más de cuatrocientos lenguajes y dialectos que tienen un origen común; entre ellos se encuentran prácticamente todos los que se hablan en Europa, con la notable excepción del euskera —un auténtico fósil lingüístico preindoeuropeo— y algunos otros como el húngaro, el estonio y el finlandés, que son debidos a influencias asiáticas mucho más recientes. Las diferentes ramas indoeuropeas incluyen subfamilias como la itálica, la céltica, la germánica, la helénica, la albanesa, la báltica, la eslava y la indoiraniana (que con el sánscrito llega hasta India y Sri Lanka). Se conocen también lenguajes indoeuropeos extintos, como el hitita (que se hablaba durante el imperio hitita, en la actual Anatolia, hasta su destrucción por los asirios en 1180 antes de Cristo) o el misterioso tocario (que se hablaba en la cuenca del Tarim, en el oeste de China, y que desapareció hacia el siglo ix de nuestra era). Desde el siglo xvi, diversos viajeros y eruditos constataron algunas semejanzas en palabras de lenguas muy diversas, como el sánscrito, el griego y el latín, que sugerían un origen común para todas ellas. Thomas Young —un estudioso que intervino también en el descifrado de los jeroglíficos egipcios compitiendo con Champollion— fue el primero en usar, en 1813, el término «indoeuropeo» para referirse a dicha genealogía lingüística. Desde entonces, un problema que ha fascinado por igual a lingüistas, arqueólogos e incluso genetistas, es: ¿cuándo tuvo lugar la expansión de los lenguajes indoeuropeos y qué pudo catalizarla?

Parece evidente que este proceso, por su magnitud, tiene que estar asociado a una migración humana a gran escala. La posterior fragmentación en numerosas lenguas no representa un problema conceptual, pero la existencia de un núcleo original, denominado protoindoeuropeo, es difícil de localizar en la actualidad y se ha convertido por lo tanto en un tema muy controvertido. En esencia existen dos teorías sobre la expansión indoeuropea que difieren tanto en la ruta de entrada en Europa como en el período en que esta se produce. La primera, formulada por la arqueóloga de origen lituano Marija Gimbutas (1921-1994) y conocida como la hipótesis de los kurganes, sostiene que las lenguas indoeuropeas entran en Europa en el neolítico final, asociadas al movimiento de grupos pastoralistas nómadas procedentes de las estepas pónticas (la gran región póntica se extiende desde el norte del mar Negro hasta el mar Caspio). Estas poblaciones tienen su núcleo original en la denominada cultura Yamnaya, que data de hacia el año 3000 antes de Cristo y que se caracteriza desde un punto de vista arqueológico por la construcción de grandes túmulos funerarios conocidos como kurganes, donde normalmente se entierra a un personaje de relevancia. La gran extensión de las estepas y la economía pastoralista dominada por el caballo conllevan que una sucesión de años climáticos favorables con pasto abundante generen un gran excedente demográfico, tanto de humanos como de animales. Lo mismo ocurrió en tiempos históricos con las hordas mongolas y anteriormente con los hunos.

Estos pastoralistas Yamnaya se moverían hacia el oeste y entrarían en contacto con los agricultores europeos en el neolítico final, generando una nueva cultura centroeuropea, llamada Ware (o cerámica cordada), que reemplaza a la LBK. La cultura Corded Ware se caracteriza por cerámicas con decoraciones hechas con cuerdas anudadas sobre las vasijas recién hechas (de ahí su nombre). Estas cerámicas acompañan enterramientos individuales donde con frecuencia se deposita también un hacha de combate hecha con piedra pulida. Por las dificultades que entraña su construcción, se cree que se trata de personajes de cierta importancia social para la comunidad que lo lleva a cabo. La distribución de los kurganes es muy amplia y engloba una gran extensión del centro y este de Europa, desde Ucrania hasta Polonia y Dinamarca. Según diversos investigadores, el hecho de que las lenguas indoeuropeas compartan términos referidos al pastoreo, a la metalurgia y a los carros tirados por caballos apoyaría también su origen común en ese período y no en el neolítico inicial, donde dichas tecnologías no existían todavía.

Precisamente la hipótesis alternativa sobre el origen de las lenguas indoeuropeas las sitúa mucho más atrás en el tiempo, unos 6.500 años antes de Cristo, en la llegada misma del neolítico y de emigrantes de Oriente Próximo (por eso se la conoce como la hipótesis del «neolítico de Anatolia»). Su mayor defensor durante años ha sido Colin Renfrew (técnicamente, Lord Renfrew), un arqueólogo británico y miembro de la Cámara de los Lores que fue profesor en Cambridge. Aparte de hacer coincidir el evento con un fenómeno migratorio indiscutido y masivo (la llegada de la agricultura), su hipótesis encontró un apoyo inesperado entre los propios lingüistas, donde en principio no era muy popular. En 2012, unos lingüistas emplearon métodos filogenéticos para intentar datar la antigüedad común de las lenguas indoeuropeas; las fechas obtenidas (con lógicos márgenes de error) eran más coincidentes con el neolítico antiguo que con el final. Sin embargo, otros lingüistas criticaron rápidamente las asunciones hechas en los modelos matemáticos (suele pasar que con los modelos estadísticos hay que aplicar tantos supuestos teóricos que al final la incertidumbre planea siempre sobre los resultados).

Quizá un punto en contra de la hipótesis de Gimbutas es que los kurganes son típicos de las estepas centroasiáticas, pero escasean en la Europa central y no llegan hasta el oeste del continente. ¿Se habría reformulado esta cultura y habría seguido expansionándose a pesar de haberse transformado en otra cosa? Las lenguas que triunfan suelen estar asociadas a elementos de prestigio y sin duda los enterramientos en túmulos lo eran (de hecho, la fastuosa tumba macedonia de Anfípolis no deja de ser heredera de dicha tradición), pero quizá su distribución no eran tan extensa como sería deseable para la hipótesis indoeuropea. Por otra parte, los análisis genéticos hechos con los europeos actuales no parecían detectar una señal global que apuntara hacia el este. Los estudios clásicos realizados con marcadores como los grupos sanguíneos sí que detectaban una distribución clinal de la diversidad genética actual coherente con la entrada del neolítico por el sudeste de Europa. Debido a esto, durante años, la mayoría de los genetistas —y yo entre ellos— se alinearon con Renfrew para defender un origen en el neolítico inicial de las lenguas indoeuropeas.

Conocí a Renfrew, con setenta y cuatro años y ya jubilado, durante una visita suya a la Universidad Pompeu Fabra en marzo de 2012; le expliqué nuestros resultados preliminares sobre La Braña —que eran todavía inéditos— y se mostró encantado. Era todo un caballero, con ese punto de excentricidad que tanto gusta a los ingleses. Para él, el hecho de que los cazadores y los neolíticos fueran tan distintos apoyaba la gran migración que su hipótesis requería: cambiaba la gente, cambiaba la lengua.

Todo esto sería coherente con la consideración del euskera como una lengua preneolítica europea —en rigor, la única conservada de aquel período— y, por lo tanto, con los vascos como una población con un fuerte componente mesolítico que habría conservado su lengua original contra viento y marea. Pero cuando analizamos el genoma completo de La Braña, ya me di cuenta de que algo fallaba: el cazador mesolítico no estaba especialmente relacionado con los vascos actuales, como habría sido de esperar. En cambio, los análisis hechos con los primeros agricultores como Stuttgart sí daban cierta afinidad con los vascos (después de con los sardos); este hecho, que sugería una llegada tardía de los indoeuropeos, pasó desapercibido en la mayoría de las publicaciones posteriores.

En este estado de cosas, la paleogenómica vino a dar una vuelta de tuerca al debate, al corroborar la existencia de un influjo genético masivo en la Europa continental, procedente de las estepas rusas, en el neolítico final. El trabajo estuvo liderado otra vez por el grupo de David Reich y empezó a sonar en diversos congresos hacia finales de 2014 (algunos blogueros van a los congresos y tuitean novedades que se les escapan a los conferenciantes). El trabajo salió publicado en Nature el 2 de marzo de 2015 y su primer firmante era Wolfgang Haak. Un medio norteamericano encontró el titular perfecto: «A steppe forward» (un juego de palabras con la típica frase «A step forward»).

Esta vez representaba también un cambio de enfoque técnico: ya no se buscaba generar genomas completos. Durante nuestra competición con La Braña, Reich se dio cuenta de lo difícil que era encontrar muestras lo suficientemente bien conservadas para secuenciar todo el genoma. Para él, que trabajaba con los principios de genética de poblaciones, los genomas completos no eran necesarios; le interesaban algunos centenares de miles de posiciones variables a lo largo del genoma (conocidos como SNP, o single nucleotide polymorphisms) para caracterizar individuos y poblaciones con suficiente poder estadístico. Descubrió también que estas posiciones se podían capturar y secuenciar mediante un array con miles de sondas de ADN en muestras que, por otra parte, no eran lo bastante buenas para ser secuenciadas. Diseñó un sistema de captura genómica con 390.000 posiciones informativas y se dedicó a genotipar muestras prehistóricas de diversos períodos y procedencias. Al final, terminó con datos de nada menos que 65 genomas prehistóricos. Cuando comparaba con todos los genomas anteriores que al menos tuvieran un 5% del genoma secuenciado y publicados desde 2010, solo sumaban 40.

Es decir, en un solo trabajo multiplicaba por 1,5 todos los genomas anteriores. Como es obvio, hay cosas que no pueden hacerse con datos de SNP únicamente. Por ejemplo, diversos análisis de selección o estudios demográficos requieren de secuencias cromosómicas más extensas y no solo de posiciones variables de un único nucleótido de ADN. O a lo mejor se encuentra en el futuro una variante interesante que no estaba incluida en el array original y esto solo podría investigarse en un genoma completo. Pero Reich tenía como objetivo reconstruir los procesos migratorios del pasado en Europa y para este fin sus datos eran más que suficientes. Tenían individuos que iban desde el mesolítico hasta la Edad del Bronce; la gran mayoría procedían de Alemania y de Rusia. Entre estos últimos destacaban seis muestras de la cultura de las estepas, los Yamnaya, que databan del Bronce inicial (hace entre 3.500 y 2.700 años antes de la era cristiana).

Dada la amplitud de muestras, los resultados de Reich tocaban diversos frentes en una escala sin precedentes. Para empezar, los investigadores describían un resurgir del componente cazador-recolector unos 1.000 o 2.000 años después de la llegada de las primeras poblaciones de agricultores. Este incremento del sustrato mesolítico se detectaba desde Centroeuropa hasta la península ibérica; podía deberse simplemente al colapso demográfico que experimentaron los primeros neolíticos, asociado al deterioro del clima y al agotamiento de los recursos iniciales. O quizá a que quedaron grupos de cazadores en algunas zonas —presumiblemente del norte de Europa— que se fueron mezclando de forma progresiva con los agricultores ya asentados en el continente. Por otra parte, los cazadores del este de Europa parecían ser distintos de los del oeste (representados por La Braña y Loschbour) y también de los de Escandinavia; los primeros mostraban un componente poblacional más afín al genoma de Mal’ta —y por tanto al sustrato poblacional basal en el norte de Eurasia, el ANE—. Reich los denominaba EHG (Eastern huntergatherers).

Pero los resultados más interesantes procedían de las muestras de la Edad del Cobre y Bronce. Los Yamnaya mostraban un componente genómico con afinidades en la zona del Cáucaso y el oeste de Asia (en proporciones cercanas al 60% y 40%, respectivamente), que entraba con fuerza en la Europa central a partir del final del neolítico. Claramente el grupo de Reich había detectado, en tiempo real, la llegada de un gran influjo genético procedente de las estepas centroasiáticas, que había cambiado la configuración genética de la Europa del momento. En este sentido, el horizonte arqueológico conocido como Corded Ware parecía estar formado por cerca de un 70% de componente procedente de los Yamnaya. Y se trataba de un cambio brusco, no de aportes genéticos progresivos durante un período de tiempo largo; las poblaciones alemanas previas a los Corded Ware no presentaban dicho componente y, como todos los genomas neolíticos, se agrupaban tranquilamente con los sardos (y con los LBK y los cardiales). Los Corded Ware, en cambio, se agrupaban ya con las poblaciones actuales del norte de Europa, como Inglaterra y Alemania. Aunque las poblaciones actuales tienen menos componente Yamnaya que los Corded Ware, esta agrupación indica cierta continuidad desde entonces hasta el presente.

La transformación del cromosoma Y europeo proporcionaba una evidencia adicional: los linajes masculinos más frecuentes entre los europeos actuales son los R1b y R1a y ambos se encuentran en frecuencias residuales entre los primeros agricultores. En cambio, todos los hombres Yamnaya y otros individuos de Rusia muestran estos linajes; entre los posteriores Corded Ware aumentan hasta el 50%. Su presencia ancestral en la estepa quedaba probada por el hecho de aparecer también en dos mesolíticos de Rusia. En concordancia con su antigüedad, algunos de ellos presentaban, dentro de ambos linajes, combinaciones ancestrales de marcadores genéticos que prefiguraban los posteriores R1b y R1a típicamente europeos. El hecho de que todos los Yamnaya tuvieran el mismo linaje apuntaba además a una organización patrilineal de estos grupos, unidos por fuertes vínculos de ascendencia masculina. Esto podría relacionarse con el hecho de que su equipamiento cultural, basado en los carros, los caballos y las armas de bronce, apunta hacia una esfera de expansión violenta entre las comunidades agrícolas del oeste de Europa, que hasta ese momento muestran pocos indicadores arqueológicos de jerarquización social.

Por otra parte, linajes mitocondriales como el N1a y linajes del cromosoma Y como el G2a o el T1a, que son muy frecuentes entre los primeros agricultores, prácticamente desaparecen en períodos posteriores. Lo mismo ocurre con el raro cromosoma Y de La Braña y de Kostenki 14: en este caso no aparecía en ninguna de las muestras analizadas.

Con estos resultados, los investigadores habían localizado también la entrada del antiguo componente poblacional ANE en Europa, cuya llegada hasta entonces era un misterio, ya que a pesar de su antigüedad en Eurasia, su presencia en los europeos actuales no estaba asociada ni a los cazadores mesolíticos ni a los primeros agricultores. La inferencia más llamativa del trabajo es que habían encontrado el rastro genético de los primeros indoeuropeos. Esta gran transformación del bagaje genético europeo coincidía en el tiempo con la cultura de los kurganes y por lo tanto los datos paleogenómicos reforzaban, después de más de medio siglo de debates, la hipótesis de Gimbutas. Cambiaban las personas, sí, pero en el neolítico final. El bagaje genómico que veíamos en los cardiales y en los otros agricultores antiguos quedaba restringido a Cerdeña, una población actual sin apenas el componente ANE.

Unas semanas después, el grupo de Willerslev (encabezado por el investigador posdoctoral Morten Allentoft, quien había participado en el trabajo de La Braña) publicó un nuevo trabajo con genomas de la Edad del Bronce con unas conclusiones parecidas. Aunque los daneses hacían bandera del hecho de haber incluido más de cien genomas antiguos, en realidad la mayoría correspondían a fracciones muy limitadas (cercanas al 1% del genoma completo) y tan solo 19 de ellos tenían coberturas superiores a 1x. Sin embargo, sí era cierto que cubrían grandes áreas del Asia central y detallaban la expansión del componente de las estepas no solo hacia el oeste, hacia Europa, sino también hacia el este. Entre ellas incluían la cultura neolítica más antigua de Siberia, la llamada Afanásievo, que apareció entre 3.500 y 2.500 años antes de Cristo.

El grupo de Eske también asociaba las migraciones centroasiáticas hacia Europa con las lenguas indoeuropeas. El trabajo de Allentoft tuvo un colofón extraordinario: normalmente los genetistas analizan las secuencias humanas que generan, pero nadie presta atención a las que se descartan, aquellas que no mapean en el genoma humano. Alguien en el grupo de Eske tuvo la ocurrencia de mirar qué había en estos billones de secuencias no-humanas y descubrió que en al menos siete individuos había un número significativo de secuencias de la bacteria Yersinia pestis, la causante de la peste.

Se conocen tres grandes pandemias europeas causadas por la peste: la primera, conocida como la plaga de Justiniano (entre los años 541 y 544) llevó a la decadencia a un imperio bizantino que acababa de inaugurar la majestuosa Santa Sofía; la segunda, conocida como la peste negra, asoló Europa en una primera oleada entre 1347 y 1351 y causó la muerte de entre un tercio y la mitad de su población (tuvo además rebrotes subsiguientes de forma intermitente, como la gran plaga de Londres de 1665); la tercera emergió en China hacia la mitad del siglo xix y se extendió por todo el mundo durante casi un siglo. Hay documentados episodios anteriores, como la plaga de Atenas (430 427 antes de Cristo) o la plaga Antonina (165-180 después de Cristo), que causaron la decadencia de la Grecia clásica y el inicio de la gran crisis del imperio romano, respectivamente, pero se desconoce si fueron causados por el mismo patógeno. Es evidente, sin embargo, que los humanos habían podido estar expuestos a la epidemia desde mucho antes de que existieran fuentes escritas sobre esta. Los investigadores daneses decidieron secuenciar a fondo los siete individuos descubiertos y terminaron generando genomas completos del patógeno en cada uno de ellos, con coberturas que iban de 0,12x hasta 50x. Los portadores de la bacteria —y que quizá murieron a causa de ella— incluían dos individuos de la cultura Afanásievo, datados cerca del año 2.800 antes de Cristo, así como un Corded Ware de Estonia y un individuo de la Edad del Hierro de Armenia, entre otros. Con los genomas de Yersinia pestis, pudieron construir árboles filogenéticos que situaban los linajes prehistóricos en posición basal, lo que era congruente con su mayor antigüedad. Los datos permitieron calcular un origen de unos 5.800 años para la cepa actual de la bacteria. Sin embargo, también descubrieron que a las formas prehistóricas les faltaban algunos genes relacionados con la virulencia, lo que sugería que no podría causar peste bubónica —es decir, el tipo de peste que se transmite por picaduras de pulgas de roedores— como ocurrió con las tres pandemias antes mencionadas. Una idea fascinante que se derivaba de dicho estudio, publicado en la revista Cell en 2015, es que el impacto genético de la migración de las estepas, que tenía lugar sobre un continente ya poblado, podía haber sido mayor al haber estado acompañado de una epidemia mortal. El declive poblacional y la crisis de las comunidades del neolítico final entre las postrimerías del cuarto milenio y el principio del tercero antes de Cristo podía deberse a la introducción de una enfermedad de origen asiático que era hasta entonces desconocida por los agricultores europeos.

Para los autores de ambos estudios, Renfrew estaría equivocado. Pero algunos comentaristas no se apresuraron a liquidar todavía la hipótesis del origen indoeuropeo en Anatolia. Al fin y al cabo, argumentaban, no hay forma de saber qué lenguajes hablaban estos emigrantes Yamnaya. La mayoría de los lingüistas están de acuerdo en que las ramas más basales de la familia indoeuropea son las que incluyen el griego micénico y el hitita. Las ramas con el sánscrito y el tocario también estarían cerca de estas ramas basales y después seguirían las otras ramas que incluirían todo el resto de los lenguajes europeos. Un origen anatolio de los indoeuropeos no tendría problemas para explicar esta filogenia basándose en expansiones de los primeros agricultores hacia el este (India y Asia central) y hacia el oeste (Europa). En cambio, un origen posterior en Asia central o en la zona del Cáucaso con entrada en Europa por la estepa tenía dificultades para explicar la existencia de las ramas más basales mucho más abajo, en el sudeste de Europa. Obviamente, ni el grupo de Reich ni el de Willerslev disponían de muestras antiguas procedentes de la zona crítica de Anatolia y los Balcanes y no sabían cómo podría haber cambiado el sustrato poblacional allí, pero sin duda era un inconveniente que cualquiera podía entrever. Los primeros lo reconocían en una frase: «Nuestros datos no resuelven la cuestión final de la zona de origen de los protoindoeuropeos». Los autores sugerían incluso una solución intermedia; quizá los invasores de las estepas introdujeron solo algunos de los lenguajes indoeuropeos (como los báltico-eslávicos y los germánicos) y quizá los primeros agricultores desarrollaron in situ las ramas más basales de la familia. Asimismo, el origen genético de las poblaciones Yamnaya originales no estaba claro y, hacia principios de 2015, tanto el grupo de Reich como el de Willerslev se lanzaron a buscar más muestras por toda Asia central.