Mil
Nature Communications volumen 14, Número de artículo: 1059 (2023) Citar este artículo
7093 Accesos
81 Altmetric
Detalles de métricas
La actividad humana afecta las trayectorias evolutivas de muchas especies en todo el mundo. El comercio mundial de productos agrícolas contribuye a la dispersión de patógenos remodelando su composición genética y brindando oportunidades para aumentar la virulencia. Comprender cómo los patógenos superan las estrategias de control y hacen frente a los nuevos climas es crucial para predecir el impacto futuro de los patógenos de los cultivos. Aquí, abordamos esto mediante el ensamblaje de un panel global de mil genomas de Zymoseptoria tritici, un importante patógeno fúngico del trigo reportado en todas las áreas de producción en todo el mundo. Identificamos las rutas de invasión global y el intercambio genético en curso del patógeno entre las regiones productoras de trigo. Encontramos que la expansión global estuvo acompañada por una mayor actividad de elementos transponibles y defensas genómicas debilitadas. Finalmente, encontramos una variación de pie significativa para la adaptación a los nuevos climas encontrados durante la expansión global. Nuestro trabajo muestra cómo los paneles genómicos de grandes poblaciones permiten una visión profunda de la trayectoria evolutiva de un importante patógeno de cultivos.
La actividad humana ha derribado las barreras naturales al flujo de genes para muchas especies a través del comercio y los viajes. Las distribuciones de especies remodeladas ayudaron a propagar plantas invasoras y patógenos1. Un factor importante que contribuye a la expansión del rango de patógenos es la distribución de especies hospedantes adecuadas. Los patógenos y sus anfitriones a menudo comparten una historia evolutiva común, ya sea a través de la coevolución o mediante restricciones compartidas de su entorno común2,3. Las discrepancias en la historia evolutiva de los huéspedes y sus patógenos pueden deberse a saltos de huéspedes, diferencias significativas en el flujo de genes o adaptación local. Los patógenos agrícolas a menudo han surgido durante la domesticación de sus especies hospedantes4 y han causado amenazas significativas a la producción de alimentos. El aumento del comercio mundial de productos agrícolas ha precipitado brotes de enfermedades graves en las últimas décadas5. Los patógenos de los cultivos están expuestos a condiciones globalmente homogéneas del huésped creadas por la plantación de cultivares de cultivos genéticamente similares y la aplicación de compuestos plaguicidas similares para controlar enfermedades6,7. Además, el cambio climático modifica la distribución geográfica de las especies patógenas, y desde la década de 1960 se sospecha de expansiones hacia los polos8. Las expansiones de rango pueden conducir a cambios significativos en la composición genética de las especies de patógenos por efectos fundadores y barreras cambiantes al flujo de genes9. Comprender cómo los patógenos emergentes superan las estrategias de control y hacen frente a la adaptación climática es crucial para predecir el impacto futuro de los patógenos de cultivos en un mundo cambiante.
Los brotes de enfermedades fúngicas en los cultivos se informan periódicamente en todos los continentes5. Además del daño episódico, la mayoría de los patógenos de cultivos son endémicos y reducen continuamente los rendimientos. El ascomiceto Zymoseptoria tritici es un patógeno importante del trigo harinero y duro, que causa la enfermedad Septoria tritici blotch, que ahora se reporta en la mayoría de las regiones productoras de trigo y causa daños significativos10. El centro de origen de Z. tritici se encuentra en el Medio Oriente, donde se encuentran especies hermanas que infectan pastos silvestres11. La emergencia de Z. tritici fue concomitante con la domesticación del trigo11. El momento y el origen geográfico compartido del patógeno y el trigo domesticado sugieren fuertemente la coevolución entre las dos especies. El patógeno alberga una amplia variación permanente desde hojas individuales infectadas hasta grandes regiones agrícolas12,13. Como consecuencia, el patógeno mostró respuestas rápidas en todas las principales áreas productoras de trigo para superar la resistencia del huésped y ganar tolerancia a los fungicidas en menos de una década10. Los análisis genómicos de población mostraron que la evolución paralela entre regiones geográficas facilitó la rápida adaptación del patógeno14,15. Sin embargo, falta una imagen completa de la dispersión y adaptación de patógenos en todo el rango de distribución global.
Aquí, reunimos más de mil genomas del hongo patógeno de cultivos Z. tritici para rastrear las rutas de invasión en todo el mundo desde su origen en el Medio Oriente e identificar el intercambio genético en curso entre las principales regiones productoras de trigo. Mostramos que la expansión global estuvo acompañada por una mayor actividad de elementos transponibles y defensas genómicas debilitadas. Finalmente, identificamos la variación genética permanente para la adaptación a los nuevos climas encontrados durante la expansión global.
Evaluamos la trayectoria evolutiva del patógeno junto con la historia del cultivo mundial de trigo (Fig. 1a). Para esto, reunimos una colección mundial de aislamientos de Z. tritici de campos naturalmente infectados (Fig. 1b). Seleccionamos aislamientos que cubrían la mayoría de las áreas de producción de trigo, tanto en el centro de origen del cultivo (es decir, el Creciente Fértil en el Medio Oriente) como en áreas donde se introdujo el trigo durante los últimos milenios (es decir, Europa y África del Norte), o últimos siglos (es decir, las Américas y Oceanía; Fig. 1c). Llamamos variantes en un conjunto de 1109 conjuntos de datos de resecuenciación de lectura corta de alta calidad (Datos complementarios 1, 2) que cubren 42 países y una amplia gama de climas. Usando un enfoque de genotipado conjunto, producimos llamadas variantes sin procesar asignadas al genoma de referencia IPO323 ensamblado de telómero a telómero. Para evaluar la precisión del genotipado, utilizamos ocho aislamientos con datos de secuenciación replicados para analizar las discrepancias. Ajustamos los umbrales de calidad apuntando específicamente al tipo de errores de genotipado observados en nuestro conjunto de datos (Fig. S1). El filtrado mejorado produjo 8 406 818 variantes cortas de alta confianza (indeles cortos y SNP). El conjunto de variantes final incluía 5.578.488 SNP bialélicos correspondientes al 14,1 % del genoma.
a Representación esquemática de la introducción del trigo en los continentes. b Síntomas de mancha de Septoria tritici causados por Z. tritici en hojas de trigo. Imágenes tomadas por BA McDonald, ETH Zurich. c Mapa del esquema de muestreo para la colección global de 1109 aislamientos para la secuenciación del genoma completo.
Probamos si los patrones de diversidad global de las poblaciones de patógenos son probablemente una consecuencia de la historia del cultivo de trigo. Primero realizamos un agrupamiento no supervisado de genotipos e identificamos once grupos bien respaldados (Fig. 2a, Figs. S2, 3). Más del 90% de los genotipos se asignaron claramente a un solo grupo (Fig. 2a, Datos complementarios 3). Se identificaron dos grupos entre los genotipos que se originaron en el centro de origen del patógeno, distinguiendo las colecciones de las regiones de Irán y Medio Oriente. Los genotipos de África y Europa se dividieron en dos grupos genéticos distintos sin ninguna estructura secundaria aparente dentro de los grupos. Esta falta de una estructura a escala fina es notable dado el extenso muestreo geográfico de genotipos europeos y sugiere un extenso flujo de genes dentro del continente. Los genotipos de Oceanía se agruparon en tres grupos distintos marcados por colecciones de Tasmania, Australia continental y Nueva Zelanda. Los genotipos de América del Norte formaron dos grupos a lo largo de una separación Norte-Sur. Finalmente, los genotipos sudamericanos formaron dos grupos divididos a lo largo de los Andes (Chile versus Argentina y Uruguay). Existe cierta incertidumbre en la evaluación de la estructura de la población regional por la baja cobertura de los principales países productores de trigo, como Rusia y Ucrania. La mancha de Septoria tritici solo se informa esporádicamente en China. En análisis complementarios, encontramos que una red filogenética que explica la alta frecuencia de recombinación reflejaba consistentemente la estructura de la población global (Fig. S4). Un análisis de componentes principales de todos los genotipos confirmó la estructura genética anidada con diferenciación a nivel de continente, subdivisiones dentro de algunos continentes y la existencia de genotipos mezclados (Fig. 2b, Fig. S5).
un mapa del agrupamiento genético basado en un conjunto de datos SNP de todo el genoma reducido utilizando sNMF. Cada color representa un grupo genético diferente, y los tamaños de los cortes representan la atribución promedio al grupo entre los aislamientos de cada ubicación. Las fracciones que representan menos del 10 % de todos los genotipos de una ubicación se colorearon en gris para mejorar la claridad. El gráfico circular grande fuera del mapa representa la proporción de aislados asignados claramente (≥75 %) a un solo grupo genético (puro; en verde azulado) y aislados identificados como híbridos (mezclados) entre grupos (en amarillo). Los nombres de los grupos incluyen una abreviatura de continentes y una ubicación geográfica más precisa (MEA: Medio Oriente y África; NA: América del Norte; SA: América del Sur; OC: Oceanía). b Análisis de componentes principales, que muestra el primer y segundo componente (PC) en función de un subconjunto de variantes. Los colores y las formas indican los grupos genómicos identificados con el método sNMF (con híbridos en gris). Las distribuciones marginales representan la distribución para cada PC. Las PC 1 a 8 se muestran en la Fig. S4. c Árbol de población basado en Treemix, enraizado usando dos genomas de las especies hermanas Z. passerinii y Z. ardabiliae. Los colores son los mismos que en los paneles anteriores y solo se utilizaron muestras que se asignaron por completo a un grupo. d Diversidad estimada usando pi por grupo genético. Los diagramas de caja están ordenados de acuerdo con el árbol de panel. C. Las bisagras inferior y superior corresponden al primer y tercer cuartil, los bigotes al valor más grande están dentro de 1,5 veces el rango intercuartílico y la línea horizontal central define la mediana. e Desequilibrio de ligamiento (r2) entre variantes por grupo genético. Los colores son idénticos entre los paneles.
Analizamos la historia de las divisiones de población y la mezcla utilizando información de frecuencia de alelos (Fig. 2c). Los análisis respaldaron en gran medida una estructura genética moldeada por la introducción del trigo en todos los continentes. Las relaciones históricas entre los clústeres muestran una divergencia temprana de los clústeres de Medio Oriente y África del Norte que coinciden con la introducción temprana de la agricultura en estas regiones. Las poblaciones de Europa y las Américas comparten un punto de divergencia similar en el tiempo, en consonancia con las amplias contribuciones de los genotipos europeos al hemisferio occidental. Los grupos de Oceanía se han separado como una sola rama de los genotipos más estrechamente relacionados con las poblaciones europeas existentes. Coincidiendo con la introducción del trigo en Oceanía desde el continente europeo, las poblaciones de patógenos de Australia y Nueva Zelanda comparten un origen común arraigado en la diversidad genética europea. Las poblaciones de Australia también muestran una sorprendente pérdida de diversidad y un mayor desequilibrio de vinculación en comparación con la diversidad europea, lo que es consistente con un efecto fundador significativo (Fig. 2d, e). De manera similar, las poblaciones de América del Sur y del Norte tienen una diversidad genética reducida en comparación con las poblaciones europeas existentes, como se sugirió anteriormente en base a la secuenciación de Sanger16. La mayor diversidad se encontró en las poblaciones de África y Medio Oriente más cercanas al centro de origen. En general, la estructura genética global del patógeno revela múltiples eventos fundadores asociados con la introducción del trigo en nuevos continentes.
El flujo de genes en curso entre las regiones debería conducir a genotipos mezclados. Encontramos que casi el 10% de todos los genotipos analizados mostraron contribuciones de al menos dos grupos. El flujo de genes reciente más significativo se detectó entre grupos de Oriente Medio/África del Norte y grupos europeos en el norte de África (es decir, Argelia y Túnez), así como en el sur y el este de Europa (es decir, Francia, Italia, Hungría, Ucrania, Portugal y España). ; Datos complementarios 3). Encontramos una incidencia particularmente alta de inmigración reciente en una población de trigo duro en el sur de Francia. La población consistía únicamente en híbridos o genotipos atípicos que sugerían una migración reciente desde el norte de África o una especialización del hospedante en variedades de trigo duro. Además, encontramos genotipos híbridos con ascendencia europea tanto en América del Norte como en Oceanía. Las proporciones de ascendencia relativamente equilibradas en estos híbridos sugieren un flujo de genes muy reciente que se remonta a unas pocas generaciones. Investigamos más a fondo el flujo de genes pasado entre grupos al permitir que Treemix infiriera eventos de migración, creando así una red de población (Fig. S6a-d). Tres eventos de migración recientes distintos explicaban mejor los datos con rutas de migración específicas desde los grupos de Medio Oriente/África a América del Norte, desde un grupo de Australia a América del Sur y entre dos grupos de Oceanía (Fig. S6d). Sin embargo, los eventos de migración no afectaron la forma general del árbol de población inferido (Fig. 2c, Fig. S6b-d). Para comprender mejor los efectos del flujo de genes a larga distancia, investigamos la relación entre la relación entre los genotipos (es decir, la identidad por estado) y la distancia geográfica. A nivel de continente, observamos una relación negativa entre la identidad por estado y la distancia geográfica (Fig. S7). La amplia distribución de los valores de identidad por estado muestra que, aunque los aislamientos estrechamente relacionados tienden a encontrarse a una distancia geográfica más cercana, los aislamientos relacionados de forma lejana se pueden encontrar tanto en distancias geográficas lejanas como cercanas. Lo más probable es que los eventos de migración de larga distancia sean causados por el comercio internacional, de manera similar a otros patógenos de cultivos17,18,19. En combinación, nuestros hallazgos muestran un papel importante de la dispersión a larga distancia que afecta la composición genética de las poblaciones desde campos individuales hasta la diversidad genética a escala continental.
Los elementos transponibles (TE) son impulsores de la evolución del genoma. En Z. tritici, la actividad de TE creó mutaciones beneficiosas para la resistencia a fungicidas y la virulencia en el huésped de trigo20,21. La rápida adaptación reciente del patógeno se ha beneficiado de la actividad de los TE con consecuencias para el tamaño del genoma22. La transposición no controlada de TE puede ser perjudicial y se ha desarrollado una serie de mecanismos de defensa para contrarrestar su actividad tanto a nivel genómico como epigenético, incluidas las mutaciones específicas y el silenciamiento23. Para analizar la efectividad de las defensas genómicas contra los TE activos, examinamos todos los genomas en busca de evidencia de inserciones de TE. Asignamos datos de secuenciación de lectura corta en el genoma de referencia y una biblioteca de secuencias de TE específica de especie. Clasificamos la evidencia de TE en cada uno de los aislamientos analizados como TE de referencia (es decir, también presente en el genoma de referencia) y TE de no referencia (es decir, ausente). Los TE detectados entre los aislamientos se agruparon en loci (ancho de 100 pb) para tener en cuenta las incertidumbres sobre el mapeo preciso del punto de inserción. Descubrimos que el espectro de frecuencia de las inserciones de TE está fuertemente sesgado hacia las bajas frecuencias, con el 77 % de las inserciones de TE en aislamientos únicos (~0,1 % de frecuencia) y el 96 % de las inserciones en diez o menos aislamientos (<1 %; Fig. S8a) consistente con una fuerte selección purificadora. El genoma de Z. tritici contiene cromosomas centrales y accesorios (es decir, cromosomas que no comparten todos los aislados de la especie; Fig. 3a)24. Los cromosomas accesorios tienen densidades de TE más altas (15–33 % frente a 5,5–19 %24; fig. 3b), lo que refleja una menor presión de selección en los cromosomas accesorios25. Más allá de esto, las regiones cromosómicas accesorias se diferencian ampliamente de las regiones centrales según la secuencia, la transcripción y los conjuntos de características epigenéticas (Fig. 3c). El diferenciador primario (es decir, el primer componente principal) separaba los segmentos cromosómicos eucromáticos y heterocromáticos (H3K9me2). Estas diferencias en las marcas epigenéticas coincidían con la variación de densidad de TE, las consecuencias de las defensas genómicas (es decir, mutaciones puntuales inducidas por repetición) y el contenido de GC. El número de inserciones de TE no se correlacionó con el contenido de GC, pero se correlacionó positivamente con la presencia de heterocromatina facultativa (H3K27me3) y se correlacionó negativamente con las marcas de eucromatina. H3K27me3 también es un sello distintivo de los segmentos de cromosomas accesorios en consonancia con hallazgos anteriores26,27,28. El polimorfismo de inserción/deleción corta (indel) se correlacionó positivamente con las regiones accesorias heterocromáticas, de acuerdo con la selección purificadora que actúa contra indels principalmente en regiones densas en genes.
a Presencia de cada cromosoma en los 1109 aislamientos evaluados por profundidad de cobertura. Los colores amarillos en los paneles a–c representan los cromosomas accesorios conocidos, mientras que los cromosomas centrales se muestran en verde azulado. b Número medio de polimorfismos de inserción de elementos transponibles (TIP) por ventana de 10 kb para cada cromosoma. La línea punteada representa la media de todo el genoma. c Análisis de componentes principales utilizando información genómica, epigenómica y transcriptómica por ventana de 10 kb, así como número de variantes (variantes cortas y TIP). d Diagrama de puntos que muestra el número de TIP y la profundidad de cobertura de todo el genoma para cada aislado secuenciado. El color y la forma diferencian los grupos genéticos identificados en función de las variantes cortas de todo el genoma. Los nombres de los grupos incluyen una abreviatura de continentes y una ubicación geográfica más precisa (MEA: Medio Oriente y África; NA: América del Norte; SA: América del Sur; OC: Oceanía). e Gráficos de violín del número de TIP por transposón de ADN (clase II) familia TE y por grupo. Los números de TIP se normalizaron por la mediana de los tres grupos encontrados en el centro de origen. Solo están representadas las familias de TE con una mediana de inserciones por encima de ocho. f Gráficos de violín del número de TIP por retrotransposón (clase I) familia de TE y por aislamiento con normalización idéntica a la del panel e. g Número de TIP por aislamiento para dos TE que muestran un aumento fuera del centro de origen.
El genoma del patógeno muestra variación en el contenido de TE entre poblaciones de diferentes continentes, lo que sugiere que el contenido de TE estuvo influenciado por la historia de colonización de la especie22,29. Por lo tanto, probamos si las poblaciones establecidas recientemente se diferenciaron de las poblaciones del centro de origen. Descubrimos que los polimorfismos de inserción de TE (TIP) son más específicos de un grupo genético con solo el 31% de las inserciones compartidas por dos o más poblaciones (Fig. S8b). Utilizamos TIP como marcador genético y descubrimos que la diferenciación de la población coincidía con la diferenciación evaluada mediante variantes cortas (Fig. S8c). Por lo tanto, la historia de la población del patógeno fue un factor importante que dio forma al contenido de TE. También encontramos que el contenido de TE por individuo ha aumentado en la mayoría de las áreas fuera del centro de origen. La detección de TE utilizando datos de secuenciación de lectura corta está limitada por la profundidad de secuenciación, por lo tanto, tomamos en cuenta la profundidad en nuestros análisis comparativos del contenido de TE (Fig. 3d). El contenido de TE de los genomas de Oriente Medio y África fue más bajo que en cualquier otra región, con un rango de 164 a 394 (mediana = 302) y de 184 a 429 TIP (mediana = 300), respectivamente, incluidas solo muestras con una cobertura inferior a 35. En contraste , los genomas de Oceanía, América del Norte y América del Sur se encuentran entre los números de TE más altos (258–513, mediana = 373; 283–513, mediana = 462; 237–476, mediana = 375 TIP, respectivamente) y genomas europeos que muestran TE intermedio recuentos (209–669, mediana = 334 TIP, incluidas solo muestras con una cobertura inferior a 35).
El aumento en el contenido de TE se extendió ampliamente entre las superfamilias e incluyó transposones y retrotransposones de ADN (Fig. S9, 10). Algunas superfamilias mostraron firmas particularmente fuertes de expansión fuera de Medio Oriente y África, incluidos los retrotransposones Copia (RLC) y otros retrotransposones LTR (RLX) (Fig. 3e, f). La expansión de RLC está impulsada principalmente por el elemento Deimos con un aumento de 11,3 copias en promedio en genomas de Medio Oriente y África a un promedio de 50,8 copias por genoma fuera del centro de origen (Fig. 3g y S9, 10). La expansión de la superfamilia RLX está impulsada por el elemento Styx, generalmente más presente fuera del centro de origen (Fig. 3g y S9,10). Se demostró que la actividad de Styx afecta la reproducción asexual en el huésped30. También observamos expansiones específicas de la población, como el elemento LINE (RIX) Juno presente principalmente en las poblaciones de América del Norte y Australia, el Helitron (DHH) Fátima se expandió principalmente en la población australiana y el DTX miniatura TE de repetición invertida (MITE) Unicornio más extendido en las poblaciones de América del Norte y Nueva Zelanda (Fig. S9,10). El amplio aumento en el contenido de TE fuera del centro de origen sugiere una relajación de las defensas genómicas sobre la historia evolutiva del patógeno en el trigo.
Muchos ascomicetos comparten un mecanismo de defensa del genoma contra los TE que pueden introducir rápidamente mutaciones específicas en secuencias recién duplicadas, lo que se denomina mutación puntual inducida por repetición (RIP)31,32. La maquinaria RIP está activa en genomas de Z. tritici, con altos niveles de mutaciones similares a RIP identificadas en genomas del centro de origen y especies hermanas que infectan pastos silvestres29,33. Analizamos el panel global en busca de evidencia de mutaciones similares a RIP informando el índice compuesto de RIP. El índice mediano está por encima de 1 en secuencias TE en todos los grupos genéticos. Sin embargo, descubrimos que la fuerza de RIP varía considerablemente entre los grupos genéticos con las firmas más fuertes que se encuentran en los genomas de los aislados africanos y de Medio Oriente (Fig. 4a). Los grupos de Oriente Medio y África tienden a incluir genomas con bajo contenido de TE y fuertes firmas RIP (Fig. 4b, S8a, b). En regiones colonizadas más recientemente, los genomas mostraron una correlación negativa entre la fuerza de las firmas RIP y la cantidad de TE por genoma (valor de p <2.2e-16; pendiente de 6.7 × 10-4 en todas las poblaciones fuera de Medio Oriente y pendiente de 4,6 × 10−4 solo en la población europea, Fig. 4b y S11a, b). La asociación entre el contenido de TE y la fuerza de la firma RIP es consistente con que las defensas genómicas son menos capaces de prevenir nuevas inserciones de TE después de la migración fuera del centro de origen.
un índice compuesto RIP en los TE para cada aislado (pequeño punto transparente) y como un promedio por grupo genético (gran punto opaco). Los nombres de los grupos incluyen una abreviatura de continentes y una ubicación geográfica más precisa (MEA: Medio Oriente y África; NA: América del Norte; SA: América del Sur; OC: Oceanía). La línea vertical gris representa el promedio general. b Diagrama de puntos que representa el número de TIP por genoma en comparación con la mediana del compuesto RIP en el mapeo de lecturas en las secuencias de consenso TE. Los colores/formas son los mismos que en el panel d. c Distribución del índice compuesto RIP por copia de TE en 20 ensamblajes de genoma de alta calidad para la especie. La línea de puntos en el valor 0 corresponde a señal RIP no detectada. d Mediana del índice compuesto RIP de las lecturas alineadas con un consenso de TE específico en función de la longitud del consenso de TE.
Aún se desconoce en gran medida cómo se modulan las defensas genómicas contra los TE en los hongos. La maquinaria RIP se activa durante la recombinación sexual en Neurospora34, lo que sugiere que la reproducción sexual reducida podría disminuir la eficacia de RIP. En Z. tritici, la reproducción sexual puede ocurrir durante la temporada de crecimiento del trigo, pero se cree que la mayor parte de la reproducción ocurre al final de la temporada35. La tasa de reproducción sexual es alta en todas las poblaciones, ya que encontramos que la proporción de tipos de apareamiento fue consistentemente cercana a 50:50 (Fig. S11c). Alternativamente, la maquinaria RIP podría haber perdido su función en algunas poblaciones. En este caso, los TE deben mostrar firmas bimodales de RIP con TE antiguos que lleven firmas de actividad histórica de RIP e inserciones recientes sin firmas de RIP o débiles. De hecho, un alto porcentaje de TE muestra solo evidencia débil de RIP (índice compuesto <0.5) en grupos genéticos fuera de Medio Oriente y África (media = 20.1%, rango de 11.3–34.6%; Fig. S11d). Por el contrario, en el centro de origen todos los genomas tenían menos del 10 % de TE que mostraban evidencia débil de RIP (media = 7,48 %, min = 5,18 %). Confirmamos las firmas RIP bimodales mediante el análisis de TE individuales en 20 genomas ensamblados a nivel de cromosoma (Fig. 4c). Todos los genomas compartieron un pico de índice compuesto RIP importante de ~ 2. Se encontró un pico secundario indicativo de TE sin RIP en genomas de las Américas, Oceanía y Europa. A pesar de la mayor actividad de TE, no encontramos evidencia de que la pérdida de la funcionalidad RIP también condujera a eventos de alta duplicación de genes. La fuerza de las firmas RIP está asociada con el tamaño de los TE, ya que los elementos pequeños muestran poca o ninguna firma RIP (Fig. 4d), lo que es consistente con que la maquinaria RIP esté inactiva en repeticiones pequeñas23. En Neurospora crassa, dos vías median RIP, una dependiente de RID y otra de Dim234. En Z. tritici, la metiltransferasa Dim2 se relacionó funcionalmente con la aparición de mutaciones similares a RIP en repeticiones, incluso durante la mitosis33,36. Además, la presencia de una copia funcional de dim2 está fuertemente correlacionada con un menor contenido de GC de TE, por lo tanto, desaminación de citosinas33,36. El gen dim2 se duplicó varias veces en algunos genomas provocando mutaciones de pérdida de función provocadas por el propio mecanismo RIP33,37. Descubrimos que la copia ancestral de dim2 compartía una mayor identidad con la copia funcional de dim2 en los genomas de los aislados de Medio Oriente que otras poblaciones (Fig. S11e). Las poblaciones europeas tenían tanto el rango más grande en el número de parálogos detectados como el número de copias más alto en general (Fig. S11f). Esto es consistente con un proceso nocivo de duplicación de genes fuera de control que afecta a un componente molecular de la maquinaria de RIP, lo que explica la pérdida de eficacia de RIP dentro de la especie.
Los patógenos distribuidos globalmente experimentan una heterogeneidad ambiental significativa que potencialmente restringe o facilita futuras adaptaciones y expansiones de rango. El uso de pesticidas en todo el mundo para combatir los patógenos agrícolas ha desencadenado la aparición paralela de resistencia con importantes consecuencias económicas6. Para rastrear la aparición global de resistencia a fungicidas en Z. tritici, analizamos mutaciones en genes de resistencia utilizando aislamientos recolectados durante tres décadas (1986 a 2016). Este lapso de tiempo cubre la introducción de varios fungicidas importantes en los campos agrícolas. La resistencia a los fungicidas azoles de uso ubicuo a menudo está mediada por mutaciones en el gen CYP5138. Las poblaciones norteamericanas recientes adquirieron la mutación Y137F pero no las mutaciones I381V o V136A que aumentaron en frecuencia en Europa durante el mismo período (Fig. 5a). Las poblaciones europeas albergaban el conjunto más diverso de mutaciones de resistencia a los azoles, en consonancia con las aplicaciones tempranas e intensas de esta clase de fungicidas. Las mutaciones I381V y V136A ocurrieron con alta frecuencia desde principios de la década de 2000, mientras que la mutación S524T solo se observó con baja frecuencia y un inicio tardío. La resistencia surgió más tarde en Oceanía y América del Norte, en consonancia con la posterior aplicación de azoles en esos lugares. No se detectaron mutaciones de resistencia en las poblaciones de Oriente Medio o África, lo que coincide con la ausencia de tratamientos con azoles en esas regiones. Encontramos patrones geográficos similares para la mutación E198AK en el gen de la beta-tubulina asociada con la resistencia al bencimidazol, así como para la mutación G143A en el gen mitocondrial cytb, conocido por causar resistencia a los fungicidas inhibidores externos de quinona (Fig. 5b). Como se esperaba de su introducción más reciente, las mutaciones relacionadas con la resistencia a los inhibidores de la succinato deshidrogenasa (SDHI) solo se observaron en las poblaciones muestreadas más recientemente en Europa (Fig. S12). En general, los análisis globales de las firmas de resistencia a los fungicidas muestran cómo las poblaciones europeas desarrollaron consistentemente las primeras mutaciones conocidas en los fungicidas recién introducidos.
a Frecuencia de las mutaciones subyacentes a la resistencia a los fungicidas azoles a lo largo del tiempo y las regiones. b Mapa que representa la frecuencia de alelos de mutaciones conocidas de resistencia a beta-tubulina (E198A/K) contra fungicidas de bencimidazol. c Ejemplos de variables bioclimáticas utilizadas para los análisis de asociación genotipo-ambiente entre regiones. Los valores representan la media de cada continente. d Gráfico de correlación entre las 19 variables bioclimáticas analizadas. e Proporción y número de variantes asociadas significativamente a cada variable bioclimática y con una frecuencia de alelos menores (MAF) superior al 5%. f Ubicación genómica de variantes significativamente asociadas con las variables bioclimáticas agrupadas en tres categorías principales (variables que describen la temperatura, los niveles de precipitación y variables que describen medidas combinadas de temperatura y precipitación).
Los cambios en las condiciones climáticas crean desafíos complejos para que los fitomejoradores creen cultivos resilientes39. Al mismo tiempo, las poblaciones de patógenos están expuestas a cambios en los patrones de temperatura y humedad. Es probable que la propagación histórica de Z. tritici haya creado una presión de selección significativa para adaptarse a los climas asociados con la variedad global de cultivo de trigo. Aquí, analizamos la arquitectura genética de la adaptación climática mediante el mapeo de la variación permanente a lo largo de las inclinaciones climáticas. El patógeno es endémico en regiones con distintos climas, desde las condiciones secas y cálidas del Medio Oriente hasta el clima oceánico templado de Europa occidental y los climas continentales húmedos de algunos lugares de América del Norte. Realizamos un mapeo de asociación genotipo-ambiente (GEA) basado en las condiciones climáticas de los lugares de muestreo. Analizamos un total de 19 variables bioclimáticas que cubren tendencias anuales, estacionalidad y factores ambientales extremos, como la temperatura máxima del mes más cálido o la precipitación del trimestre más seco (Fig. 5c, d, Datos complementarios 4).
Identificamos 1956 variantes asociadas significativamente con al menos una variable climática y 640 variantes con una frecuencia de alelos menores (MAF) superior al 5%. El número de variantes asociadas por variable climática osciló entre 36 y 541 (para BIO9 y BIO6 respectivamente), incluidos 1-190 SNP significativos con un MAF> = 5% por variable climática (Fig. 5e). Investigamos si las clases de variantes se enriquecieron en el conjunto de SNP significativamente asociados. Usando permutaciones, encontramos que tanto las variantes no sinónimas como las intergénicas se asociaron con más frecuencia con las variables climáticas de lo esperado al azar, mientras que las variantes sinónimas se agotaron significativamente (Fig. S13b). Encontramos 187 genes que estaban en proximidad o directamente afectados por variantes asociadas con variables bioclimáticas y con un MAF> = 5%, incluidos 65 que contenían variantes no sinónimas (Datos complementarios 5). Para cada GEA, recuperamos loci significativamente asociados al agrupar variantes significativas dentro de una distancia de 10 kb. Las variantes significativas se agruparon en 5–27 loci distintos por GEA consistentes con una base poligénica para la mayoría de las adaptaciones climáticas (Fig. S14–19; Datos complementarios 4). Previamente se encontró una arquitectura poligénica de termotolerancia en otros hongos como Saccharomyces cerevisiae40,41. Un gran número de loci asociados fueron compartidos entre GEA de diferentes variables climáticas. Las variables climáticas altamente correlacionadas, incluidas BIO5 y BIO10, la temperatura máxima del mes más cálido y la temperatura media del trimestre más cálido, respectivamente, también compartieron números más altos de SNP significativamente asociados (Fig. 5d, Fig. S13a). Sin embargo, también identificamos puntos críticos de loci de adaptación climática para variables climáticas en gran medida independientes (Fig. 5f). Identificamos un gran segmento del cromosoma 7 y una región telomérica del cromosoma 13 como puntos críticos para las asociaciones climáticas. El locus del cromosoma 7 se superpone con el gen Cyp51 implicado en la resistencia a los fungicidas azoles. Por lo tanto, la asociación podría deberse a correlaciones en la aplicación de fungicidas y factores climáticos. Las regiones templadas como Europa muestran una mayor resistencia a los azoles (ver arriba) que el Medio Oriente, lo que lleva a una asociación indirecta entre los genes de resistencia a los fungicidas y las variables climáticas. Sin embargo, en la misma ubicación en el cromosoma 7 hay un locus de rasgos cuantitativos (QTL) para el crecimiento a temperatura subóptima42, por lo que ese locus bien podría sustentar la adaptación climática independientemente de Cyp51. Análisis adicionales de los QTL de sensibilidad a la temperatura mostraron que tres de los cuatro loci descritos anteriormente se superponen con loci asociados con variables climáticas (Datos complementarios 6). Por ejemplo, el QTL de sensibilidad a la temperatura en el cromosoma 1 se superpone con loci asociados con múltiples variables climáticas relacionadas con la temperatura, como la temperatura media del trimestre más cálido (Fig. 6a-c). Una variante asociada a la temperatura media del trimestre más cálido y superpuesta con un QTL previamente descubierto en un cruce centroeuropeo (chr 1 en 2.090.068 pb) muestra una distribución global de ambos alelos. Por el contrario, una segunda variante (chr 10 a 452.864 pb) asociada con la temperatura media del trimestre más cálido pero que no se superpone al QTL previamente descubierto (Fig. 6b, d), no muestra variación alélica dentro de las poblaciones de Europa central. También se encontraron alelos asociados con climas más cálidos en el Medio Oeste de los EE. UU. caracterizados por inviernos fríos y altas temperaturas en verano. Nuestros análisis de asociación capturan probablemente solo un subconjunto de todos los loci que contribuyen a la adaptación climática en todo el rango de distribución global. Por lo tanto, se espera cierto grado de desajuste entre el clima y el genotipo entre las regiones geográficas si la adaptación climática es poligénica. Nuestros análisis destacan el poder de cubrir la diversidad genética global para obtener información sobre la arquitectura genética de la adaptación reciente en las especies.
un diagrama de Manhattan para asociaciones genotipo-clima para dos variables bioclimáticas relacionadas con temperaturas altas y bajas, respectivamente. Valores obtenidos del software GEMMA con el modelo lineal por defecto (test de Wald). La línea horizontal indica el umbral de Bonferroni. b Gráficas de densidad para dos ejemplos de variantes significativamente asociadas del panel A. La curva de color más claro representa los valores climáticos del sitio de muestreo para los aislamientos que portan el alelo de referencia y el color más oscuro para los aislamientos que portan el alelo alternativo. La variante que se muestra en amarillo se encuentra en el cromosoma 10 en la posición 452.864 pb. La variante en verde azulado se encuentra en el cromosoma 6 en la posición 1.686.518 pb. c Mapa que muestra las frecuencias alélicas de una variante significativamente asociada con la temperatura media del cuarto más cálido (cromosoma 1, 2 090 068 pb, GEA basada en 1103 aislamientos). Los diagramas de caja asociados representan la distribución de la temperatura media del grupo más cálido en el lugar de muestreo del aislado que porta los dos alelos. Las bisagras inferior y superior corresponden al primer y tercer cuartil, los bigotes al valor más grande están dentro de 1,5 veces el rango intercuartílico y la línea horizontal central define la mediana. d Idéntico al panel C para la variante en la posición 452864 pb en el cromosoma 10. e Mapa de calor que representa la proporción de alelos menores para todas las variantes en cada grupo de k-medias que están presentes en cada país (o estado). Las celdas de color oscuro indican que el alelo menor se encuentra al menos una vez en el país (o estado) correspondiente para todas las variantes agrupadas en el grupo de k-medias correspondiente. Una celda de color blanco indica que el alelo menor está ausente para todas las variantes clasificadas en el grupo k-mean. f Frecuencia de alelo menor clasificada en cada grupo de k-media. Los números enmarcados indican el número de variantes distintas incluidas en cada grupo. Las bisagras inferior y superior de los diagramas de caja corresponden al primer y tercer cuartil, los bigotes al valor más grande están dentro de 1,5 veces el rango intercuartílico y la línea horizontal central define la mediana. g Variables bioclimáticas asociadas a las variantes clasificadas en cada grupo k-mean.
Para identificar si las mutaciones adaptativas tienden a surgir localmente o en grandes áreas geográficas, agrupamos loci significativos en función de la presencia o ausencia de variantes adaptativas por país. Identificamos ocho grupos caracterizados por variantes adaptativas compartidas con una distribución geográfica similar (Fig. 6e, Fig. S19). Algunos grupos de variantes adaptativas están altamente localizados geográficamente (es decir, los grupos 3, 5 y 6), mientras que otros grupos están muy extendidos (es decir, el grupo 4). La mayoría de los alelos adaptativos para condiciones de frío extremo se encontraron en las poblaciones sujetas a los duros inviernos de América del Norte continental (ver grupo 3; Fig. 6e-g). Los grupos de alelos adaptativos estaban geográficamente extendidos, como las distribuciones a lo largo de la costa mediterránea (ver grupo 1). En conjunto, el panel del genoma global reveló una variación sustancial para la adaptación ambiental con patrones geográficos complejos de evolución de la adaptación local.
El análisis de un panel de mil genomas recapituló la propagación de un importante patógeno fúngico de cultivos que reveló estrechos vínculos con la historia del cultivo mundial de trigo. La divergencia temprana entre los genotipos del Medio Oriente y África de los recolectados en el resto del mundo es consistente con un solo evento de expansión desde el centro de origen que data de hace milenios. La variación genética existente estuvo fuertemente determinada por los sucesivos cuellos de botella de la colonización durante la introducción del patógeno en las Américas y Oceanía. La clara pérdida de diversidad genética y el aumento del desequilibrio de ligamiento probablemente causaron la pérdida de la variación genética adaptativa y la reducción del potencial evolutivo en las regiones colonizadas más recientemente. La actividad de TE ha sustentado el surgimiento de importantes mutaciones adaptativas en la especie20,30,43. Sorprendentemente, la actividad de TE está respaldada por una marcada relajación o incluso pérdida de las defensas genómicas después de los cuellos de botella de la población durante la colonización global. La mayor actividad de los TE es probablemente una consecuencia directa de un control reducido y puede tener consecuencias a largo plazo para el patógeno. La relajación de las defensas genómicas en poblaciones de los continentes americano, oceánico y europeo podría haberse seleccionado como un rasgo de capacidad de evolución, aumentando así la variación en la aptitud de las poblaciones. La relajación de las defensas genómicas probablemente sustenta la incipiente expansión del genoma dentro de la especie al tiempo que aumenta el riesgo de colapso mutacional. La resiliencia de los cultivos y los ecosistemas agrícolas se ve amenazada por el cambio climático. La capacidad de los patógenos para adaptarse y expandir su rango bajo regímenes alterados de humedad y temperatura, así como cambios en los patrones estacionales, es una preocupación importante. Las regiones genómicas identificadas asociadas con la adaptación a las condiciones ambientales resaltan cómo un patógeno global conlleva una gran variación para hacer frente al cambio climático. La integración de la información genética de la población sobre la adaptación de los patógenos a los gradientes climáticos es un recurso poderoso para los modelos de riesgo de la futura propagación de patógenos. Dado que el cambio climático afecta la producción de cultivos y, muy probablemente, la resistencia a los patógenos, es necesaria una investigación futura que aborde explícitamente las respuestas conjuntas del huésped y el patógeno a climas más cálidos y secos para mitigar futuras pérdidas de cultivos.
Los aislados fúngicos se cultivaron en placas V8, caldo de sacarosa de levadura (YSB) o agar de malta de levadura (YMA), o cultivo líquido antes de la extracción de ADN. La información completa sobre el origen geográfico, la fecha de recolección, los conjuntos de datos de secuenciación disponibles y las referencias se proporcionan en los Datos complementarios 1. Se utilizó tejido fúngico liofilizado o congelado para la extracción de ADN con los kits QIAGEN (DNeasy Plant Mini Kit, QIAcube HT). Las bibliotecas de secuenciación se prepararon a partir de ADN cizallado en una plataforma de secuenciación Illumina siguiendo las preparaciones de la biblioteca TruSeq. Para la recolección del Joint Genome Institute (ver Datos complementarios 1), se extrajo ADN de aislados de una sola espora, los fragmentos se trataron con reparación de extremos, cola A y ligadura de adaptadores compatibles con Illumina (IDT, Inc) usando el kit de creación de bibliotecas KAPA-Illumina (KAPA biosystems). La preparación de la biblioteca de ADN basada en placas para la secuenciación de Illumina se realizó en el sistema robótico de manipulación de líquidos PerkinElmer Sciclone NGS utilizando el kit de preparación de bibliotecas de Kapa Biosystems. Se cortaron 200 ng de ADN de muestra a 600 pb usando un ultrasonicador enfocado Covaris LE220. El tamaño de los fragmentos de ADN cortados se seleccionó mediante SPRI doble y, luego, los fragmentos seleccionados se repararon en los extremos, se colocaron en cola A y se ligaron con adaptadores de secuenciación compatibles con Illumina de IDT que contenían un código de barras de índice molecular único para cada biblioteca de muestras. Las bibliotecas preparadas se cuantificaron utilizando el kit qPCR de biblioteca de secuenciación de próxima generación de KAPA Biosystems y se ejecutaron en un instrumento de PCR en tiempo real Roche LightCycler 480. A continuación, las bibliotecas cuantificadas se prepararon para la secuenciación en la plataforma de secuenciación Illumina HiSeq utilizando un kit de clúster de extremo emparejado TruSeq, v4. La secuenciación de la celda de flujo se realizó en el secuenciador Illumina HiSeq2500 utilizando los kits de secuenciación HiSeq TruSeq SBS, v4, siguiendo una receta de ejecución indexada de 2 × 150. En general, obtuvimos 1368 conjuntos de datos de resecuenciación de Illumina para evaluar la calidad.
Utilizamos dos métodos diferentes para investigar la variación genética. En primer lugar, reunimos los conjuntos de datos de secuenciación de lectura corta de novo utilizando el software SPADES v.3.14.144 con el método "cuidadoso" (detalles de los ensamblajes en Datos complementarios 7). Usamos solo los ensamblajes con menos de 1600 contigs y una longitud total de ensamblaje entre 30 y 40 Mb (filtrados para eliminar cualquier contigs de menos de 1 kb). En segundo lugar, llamamos variantes de secuencia utilizando un mapeo de lectura corta en el genoma de referencia IPO323. Recortamos y filtramos las lecturas con Trimmomatic v.0.39, eliminando así las secuencias adaptadoras, recortando las bases iniciales y finales con una calidad inferior a 15 para la resecuenciación de 2020 y 10 para todas las resecuenciaciones anteriores, y eliminando secuencias de menos de 50 pb45. Las lecturas recortadas se asignaron al genoma de referencia de IPO32324 utilizando bowtie2 v.2.4.146. GATK v4.1.4.1 se usó para llamadas de variantes cortas con los comandos HaplotypeCaller, CombineGVCFs y GenotypeGVCFs, configurando la ploidía en 1 y el número máximo de alelos alternativos en 247. Para filtrar indeles cortos y SNP erróneamente llamados, comenzamos con un conjunto estándar de filtros estrictos que utilizan las métricas de calidad de GATK, para las cuales los umbrales se establecieron en función de la visualización de las métricas en las variantes solicitadas. Los filtros por sitio incluyeron: FS > 10, MQ < 20, QD < 20, ReadPosRankSum entre −2 y 2, MQRankSum entre −2 y 2 y BaseQRankSum entre −2 y 2. También incluimos un filtro por genotipo, eliminando cualquier genotipo con una profundidad inferior a 3.
Además, evaluamos la calidad de nuestra llamada SNP utilizando 8 aislamientos que se secuenciaron dos veces (incluidos, en algunos casos, en diferentes conjuntos de datos de secuenciación). Asumimos que la variación real entre estos pares debería ser cercana a 0, aunque no podemos excluir por completo la posibilidad de que ocurra una pequeña cantidad de mutaciones durante el cultivo o el mantenimiento de estos aislados en la colección. Usamos las diferencias, es decir, erróneamente llamadas variantes, entre los pares de resecuenciación como una estimación de los errores de genotipado y para identificar las causas de los errores de genotipado. La mayoría de las variantes denominadas erróneamente que quedaron después del filtrado duro estaban relacionadas con genotipos con números casi iguales de lecturas que respaldaban el alelo de referencia y un alelo alternativo, es decir, alelos "heterocigóticos". Dichos genotipos se llamaron con alta confianza, aunque un patrón de tipo heterocigoto debería reconocerse como errores en un organismo haploide y podría deberse a una desalineación o secuencias repetidas en los genomas. En consecuencia, implementamos un script personalizado de equilibrio alélico para reconocer tales posiciones y filtrar cualquier genotipo que tuviera menos del 90 % de lecturas compatibles con el alelo llamado. Este filtro eliminó el 75% de las variantes erróneas que quedaban entre los pares resecuenciados después del filtrado duro. Como el resto de las variantes erróneas estaban relacionadas con una profundidad de secuenciación baja, implementamos además un filtrado de datos faltantes y de baja profundidad por muestra, eliminando cualquier muestra con más del 20 % de datos faltantes y una profundidad de cobertura media inferior a 6 en los cromosomas centrales (basado en las opciones vcftools –missing-indv y– depth)48. En el siguiente paso de filtrado, eliminamos las muestras que eran clones o casi clones. Para identificar estos aislamientos, creamos una red de aislamientos con un valor de identidad por estado superior a 0.99 (medido por plink v1.949) y extrajimos los subgrafos que designan grupos de clones (con los paquetes R tidygraph y ggraphs para visualización) . En cada grupo de clones, filtramos todos los aislamientos excepto el aislamiento con la menor cantidad de datos faltantes. Estos filtros por muestra dieron como resultado un recuento final aislado de 1109.
El último paso de filtrado fue un filtro por sitio basado en el número de genotipos faltantes. Teniendo en cuenta que Z. tritici contiene cromosomas accesorios que se espera que estén presentes en algunos aislamientos y ausentes en otros, el umbral relevante de datos faltantes tuvo que adaptarse por cromosoma. Para identificar la presencia-ausencia de cromosomas accesorios, evaluamos la profundidad de cobertura en ventanas en todos los cromosomas con bedtools v.2.29.2 (opción de cobertura seguida de la opción groupby para calcular la mediana por ventana)50. Normalizamos las estimaciones de profundidad utilizando la profundidad mediana sobre todas las ventanas de los cromosomas centrales para la profundidad por ventana. Luego, la profundidad normalizada se usó para inferir variantes de presencia-ausencia o variación del número de copias de los cromosomas, en las que consideramos que cualquier cromosoma con una profundidad normalizada inferior a 0.2 estaba ausente. Con base en el número estimado de cromosomas presentes en el conjunto de datos, calculamos los umbrales de datos faltantes en el 80 % de los aislamientos genotipados con la opción de conteo máximo faltante de vcftools (NAmax = 222 para los cromosomas centrales y entre 328 y 1048 para los accesorios). cromosomas) 48.
Utilizamos un subconjunto de los SNP bialélicos filtrados (un SNP cada 1 kb, sin datos faltantes y una frecuencia de alelo menor de 0,05) para estimar la estructura de la población de nuestra colección mundial de Z. tritici. Esto se hizo por separado con un análisis de componentes principales (paquete R SNPRelate51) y con un método de agrupamiento snmf del paquete LEA52. El análisis de conglomerados corrió para un valor de K (es decir, el número de conglomerados) que va de 1 a 15 y con 10 repeticiones por K. Para identificar el mejor K, utilizamos el método de entropía implementado en snmf que evalúa la calidad de ajuste de el modelo a los datos, así como el tamaño de conglomerado más pequeño y el número de aislamientos asignados a cualquier conglomerado con un coeficiente superior a 0,75 (considerado como no mezclado). Creamos una red filogenética con un subconjunto de aislamientos (7 aislamientos seleccionados al azar por país/estado para todos los países con al menos 7 aislamientos), con el software SplitsTree553. Como un grupo externo, también incluimos aislamientos de Z. ardabiliae resecuenciados ("SRR6671804"-"SRR6671820")54, para los cuales la llamada de variantes se realizó usando los mismos parámetros y filtros que arriba, pero solo se aplicaron filtros duros (se retuvieron 11 aislamientos después de filtrar ). Para la construcción de la red, los SNP se filtraron para incluir solo variantes sin datos faltantes en Z. ardabiliae o Z. tritici, un MAF del 20 % y ninguna variante más cercana a 1000 pb para reducir los sesgos. Conservamos 9556 SNP para calcular la red SplitsTree.
Para los análisis que se basan en la comparación de distintos grupos, discretizamos las poblaciones utilizando solo aislamientos pertenecientes a una de las poblaciones con una proporción superior a 0,75 en K = 11, el mejor número de conglomerados inferido. Estos genotipos luego se usaron como entrada para la mezcla de árboles que infiere divisiones entre poblaciones y crea un árbol de población55. Nos aseguramos de que la forma del árbol fuera consistente independientemente de los posibles eventos de migración ejecutando treemix con varios eventos de migración posibles que van desde 0-6. Usamos los genomas ensamblados de Z. ardabiliae y Z. passerinii como grupos externos para enraizar el árbol56. Usamos el paquete scikit-allel python para medir la diversidad genética (pi), teniendo en cuenta solo los aislamientos no mezclados de cada grupo, en ventanas no superpuestas de 1 kb57. Para eliminar las ventanas en las que faltaban demasiados datos (es decir, aquellas que reducirían artificialmente la diversidad), seleccionamos solo las ventanas en las que se filtraron menos del 20 % de las variantes. Controlamos la variación en el número de aislamientos entre grupos submuestreando cada grupo 10 veces hasta el tamaño de grupo más pequeño (N = 16) y promediando las estimaciones de diversidad obtenidas por ventana en las 10 submuestras.
Llamamos a las inserciones TE con el software ngs-te-mapper258. En este proceso, las lecturas de secuenciación se consultan primero con una biblioteca de secuencias de TE, para lo cual usamos las secuencias de consenso de TE obtenidas de 20 genomas completamente ensamblados de 19 aislados globales59. Las "lecturas de unión" que se alinean tanto en una secuencia de consenso de TE como en el genoma flanqueante se utilizan para determinar el sitio de inserción de TE de referencia y no de referencia. Para tener en cuenta cualquier imprecisión en la detección de los sitios de inserción, las posiciones de las inserciones se redondearon a 100 pb, de modo que las inserciones del mismo elemento en una ventana corta se consideraron la misma inserción para análisis posteriores. Las inserciones encontradas en más de 10 muestras se usaron para crear un PCA (función prcomp del paquete stats R), agrupando los aislamientos en función de sus inserciones TE compartidas.
Investigamos la distribución genómica de las variantes, en relación con las estimaciones genómicas, transcriptómicas y epigenómicas. Recopilamos información de varias fuentes y agregamos los datos en ventanas de 10 kb. Utilizamos datos transcriptómicos producidos previamente60 y analizados para calcular TPM56, que representa la expresión génica durante las fases necrotrófica y asintomática de la infección para el aislado de referencia. Para incluir datos epigenómicos, utilizamos datos de ChIP-seq de marcas de histonas publicados previamente e identificamos los picos de varias marcas de histonas: H3K4me2, H3K27me3 y H3K9me2 (NCBI BioProject "PRJNA286790") evaluadas en dos réplicas biológicas. Recortamos y mapeamos las lecturas usando Trimmomatic como arriba y bowtie, y filtramos las lecturas mapeadas para mantener solo las lecturas alineadas con una calidad superior a 30 usando samtools. Los picos de las marcas de histonas se llamaron utilizando macs2 (opción: sin modelo)61. Solo se mantuvieron las regiones de pico identificadas consistentemente en ambas réplicas (intersección de herramientas de cama). La cobertura de los picos de las marcas de histonas a lo largo de los cromosomas se calculó evaluando el número de bases pertenecientes a un pico de marcas de histonas por ventana. Para eliminar ventanas con recuentos bajos de variantes debido a una capacidad de mapeo baja, usamos genmap para estimar la capacidad de mapeo y eliminamos ventanas con un valor inferior a 0,85 (umbral estimado visualmente en función de un diagrama de densidad de ventanas en todo el genoma)62.
Para analizar las mutaciones puntuales inducidas por repetición en la colección de genomas, utilizamos las mismas secuencias TE de consenso59 como genoma de referencia para el mapeo de lecturas (como lecturas individuales) con bowtie2. Utilizando un script de python personalizado basado en la biblioteca biopython63, también estimamos el contenido de GC y el índice compuesto RIP64, una estimación creada para detectar proporciones de dímeros que indican mutaciones típicas del proceso de mutación puntual inducida por repetición (RIP). Esto se hizo en las lecturas que se alinearon con las secuencias de consenso de TE, proporcionando así una estimación de RIP en todos los elementos transponibles, así como por consenso de TE. También usamos valores calculados previamente del índice compuesto RIP para 20 ensamblajes a nivel de cromosomas29.
Una de las enzimas más importantes para RIP es dim2. Basándonos en el conocimiento previo de que la cepa Zt10 contiene una copia funcional de dim233, extrajimos la secuencia del gen (Zt10_unitig_006_0417) así como sus dos genes acompañantes (Zt10_unitig_006_0416 y Zt10_unitig_006_0418). Estos se usaron luego como secuencias de consulta para la explosión del software para detectar la presencia y la ubicación de los 3 genes en ensamblajes de borrador de novo basados en la resecuenciación de Illumina. En muchos aislamientos, dim2 se encuentra en múltiples copias. Por lo tanto, identificamos la copia nativa como la copia que se encuentra entre los dos genes flanqueantes o, cuando los ensamblajes no incluyen los tres genes en un contig, la copia que se encuentra a menos de 10 kb de uno de los genes flanqueantes. Luego consideramos el porcentaje de identidad entre las copias nativas y la copia funcional de Zt10.
Las diferencias estadísticas entre los grupos geográficos se evaluaron mediante un ANOVA unidireccional con bloques, considerando el lote de secuenciación como el bloque de confusión. El efecto por lotes de secuenciación fue especialmente fuerte para los genomas de Hartmann et al.65, probablemente debido a un fuerte sesgo de GC en la secuenciación. Como análisis post-hoc, utilizamos pruebas de separación de medias (medias de mínimos cuadrados) y mostramos los resultados como letras en las gráficas correspondientes.
Obtuvimos coordenadas geográficas de los metadatos adjuntos a los aislamientos o las inferimos en función de la ubicación de muestreo más precisa disponible. Las coordenadas inferidas se pueden encontrar en Datos complementarios 1. Descargamos datos meteorológicos y climáticos cuadriculados con una resolución de 10 'de la base de datos WorldClim versión 2 (https://worldclim.org). Las coordenadas geográficas se utilizaron para aproximar las condiciones ambientales de origen de cada aislado de todas las variables bioclimáticas, que incluyen por ejemplo la amplitud diurna media y la precipitación anual como promedio entre 1970 y 2000. Con base en estas estimaciones ambientales y las variantes genómicas, identificamos asociaciones genotipo-ambiente con el software GEMMA 0.98.366. Utilizamos un enfoque LOCO (Leave-One-Chromosome-Out) para estimar la matriz de parentesco en el genoma, excluyendo el cromosoma en el que estábamos estimando las asociaciones. El umbral de significación se estableció utilizando el método de corrección de Bonferroni, es decir, dividiendo el umbral tradicional de significación de 0,05 por el número de variantes que se probaron. Los SNP significativos cercanos se agruparon en "loci significativos" si estaban más cerca de 10 kb. Para identificar los genes que son potencialmente causales de la adaptación a las condiciones climáticas, predijimos el efecto de las variantes significativas en los genes y proteínas utilizando SnpEff67. Creamos una base de datos SnpEff personalizada para que las predicciones coincidieran con la anotación del gen que estamos usando68 y establecimos la longitud del intervalo ascendente/descendente en 1 kb. También usamos las predicciones de SnpEff para comparar la distribución de efectos (sinónimos, no sinónimos y modificadores) en las variantes significativamente asociadas y en todas las variantes utilizando 200 sorteos aleatorios.
Investigamos la distribución geográfica de los alelos potencialmente adaptativos que encontramos a través del agrupamiento de k-medias de la presencia-ausencia de cada alelo por país. Por locus significativo y por variable bioclimática, seleccionamos la variante con el valor p más bajo (es decir, la variante superior en cada "pico") e identificamos si el alelo menor estaba presente o ausente por país/estado, incluidos más de 5 aislamientos. . A continuación, se utilizó la matriz de presencia/ausencia para el agrupamiento. Este análisis no reveló un patrón claro de adaptación que compartiera un número determinado de distribuciones geográficas. Aunque no hubo un mejor número claro de conglomerados, incluso cuando probamos hasta 30 conglomerados, elegimos ocho conglomerados para la representación gráfica, utilizando el método del codo. Para investigar la resistencia a fungicidas, identificamos la presencia/ausencia de alelos de resistencia conocidos en los aislamientos del conjunto de datos, siguiendo el método de la ref. 15. Luego comparamos la frecuencia de estos alelos en las diferentes ubicaciones geográficas ya lo largo del tiempo.
Más información sobre el diseño de la investigación está disponible en el Resumen de informes de Nature Portfolio vinculado a este artículo.
Todos los datos de secuenciación están disponibles en el archivo de lectura de secuencias de NCBI. Los números de acceso individuales se pueden recuperar de los Datos complementarios 1 y de la sección Métodos. Los datos climáticos se obtuvieron de la versión 2 de la base de datos WorldClim disponible públicamente.
Para garantizar la reproducibilidad de los análisis presentados en este manuscrito, todos los scripts personalizados están disponibles en https://github.com/afeurtey/WW_PopGen (https://doi.org/10.5281/zenodo.7572234)69. El procesamiento posterior y la visualización de los datos se realizaron en R, bash y python, disponibles como informes de reducción de R en el repositorio de github.
Santini, A., Liebhold, A., Migliorini, D. & Woodward, S. Rastreando el papel de la civilización humana en la globalización de los patógenos de las plantas. ISME J. 12, 647–652 (2018).
Artículo PubMed PubMed Central Google Académico
Feurtey, A. et al. Fuerte coestructura filogeográfica entre el hongo anther-smut y su huésped campion blanco. N. Phytol. 212, 668–679 (2016).
Artículo CAS Google Académico
Hartmann, FE et al. Estructuras genéticas de población congruentes e historias de divergencia en hongos anther-smut y sus plantas hospedantes Silene italica y el complejo de especies Silene nutans. mol. Ecol. 29, 1154–1172 (2020).
Artículo PubMed Google Académico
Stukenbrock, EH & McDonald, BA Los orígenes de los patógenos de las plantas en los ecosistemas agrícolas. año Rev. Phytopathol. 46, 75–100 (2008).
Artículo CAS PubMed Google Académico
Fones, HN et al. Amenazas a la seguridad alimentaria mundial por patógenos emergentes de hongos y oomicetos. Nat. Comida 1, 332–342 (2020).
Artículo Google Académico
Fisher, MC, Hawkins, NJ, Sanglard, D. & Gurr, SJ El surgimiento mundial de resistencia a los medicamentos antimicóticos desafía la salud humana y la seguridad alimentaria. Ciencia 360, 739–742 (2018).
Artículo CAS PubMed Google Académico
Khoury, CK et al. Aumento de la homogeneidad en el suministro mundial de alimentos y las implicaciones para la seguridad alimentaria. proc. Academia Nacional. ciencia 111, 4001–4006 (2014).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Bebber, DP, Ramotowski, MAT & Gurr, SJ Las plagas y los patógenos de los cultivos se mueven hacia los polos en un mundo que se calienta. Nat. Clima Cambio 3, 985–988 (2013).
Artículo ANUNCIOS Google Académico
Excoffier, L., Foll, M. & Petit, RJ Consecuencias genéticas de la expansión del rango. año Rev. Ecol. Evol. sist. 40, 481–501 (2009).
Artículo Google Académico
Petit-Houdenot, Y., Lebrun, M.-H. & Scalliet, G. Comprensión de las interacciones planta-patógeno en la infección por manchas de Septoria tritici en cereales. en Burleigh Dodds Series in Agricultural Science (ed. Oliver, R.) 263–302 (Burleigh Dodds Science Publishing, 2021). https://doi.org/10.19103/AS.2021.0092.10.
Stukenbrock, EH, Banke, S., Javan-Nikkhah, M. & McDonald, BA Origen y domesticación del hongo patógeno del trigo Mycosphaerella graminicola a través de la especiación simpátrica. mol. Biol. Evol. 24, 398–411 (2007).
Artículo CAS PubMed Google Académico
Singh, NK, Karisto, P. y Croll, D. La secuenciación profunda a nivel de población revela la interacción de la reproducción clonal y sexual en el hongo patógeno del trigo Zymoseptoria tritici. Microbio. genoma 7, 000678 (2021).
CAS PubMed PubMed Central Google Académico
McDonald , BA , Suffert , F. , Bernasconi , A. & Mikaberidze , A. ¿Qué tan grandes y diversas son las poblaciones de campo de hongos patógenos de plantas? El caso de Zymoseptoria tritici. Evol. aplicación 15, 1360–1373 (2022).
McDonald, MC et al. Rápida evolución paralela de la resistencia a los fungicidas azoles en poblaciones australianas del patógeno del trigo Zymoseptoria tritici. aplicación Reinar. Microbiol. 85, e01908–e01918 (2019).
Artículo CAS PubMed PubMed Central Google Scholar
Hartmann, FE et al. La compleja base genómica de la rápida adaptación convergente a los pesticidas en todos los continentes en un hongo patógeno vegetal. mol. Ecol. 30, 5390–5405 (2021).
Artículo CAS PubMed Google Académico
Banke, S., Peschon, A. & McDonald, BA Análisis filogenético de poblaciones de Mycosphaerella graminicola distribuidas globalmente basadas en tres loci de secuencia de ADN. gineta fúngica. Biol. FG B 41, 226–238 (2004).
Artículo CAS PubMed Google Académico
Sotiropoulos, AG et al. Los análisis genómicos globales del mildiu polvoriento del trigo revelan una asociación de la propagación del patógeno con la migración y el comercio humanos históricos. Nat. común 13, 4315 (2022).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Ceresini, PC et al. El añublo del trigo: desde sus orígenes en América del Sur hasta su surgimiento como amenaza global. mol. Patol de plantas. 20, 155–172 (2019).
Artículo PubMed Google Académico
Schoebel, CN, Stewart, J., Gruenwald, NJ, Rigling, D. y Prospero, S. Historia de la población y vías de propagación del patógeno vegetal Phytophthora plurivora. PLOS UNO 9, e85368 (2014).
Artículo ADS PubMed PubMed Central Google Scholar
Omrane, S. et al. La plasticidad del promotor MFS1 conduce a la resistencia a múltiples fármacos en el patógeno del trigo Zymoseptoria tritici. mSphere 2, e00393–17 (2017).
Artículo CAS PubMed PubMed Central Google Scholar
Meile, L. et al. Un factor de avirulencia fúngico codificado en una región genómica altamente plástica desencadena una resistencia parcial a la mancha de Septoria tritici. N. Phytol. 219, 1048–1061 (2018).
Artículo CAS Google Académico
Oggenfuss, U. et al. Una invasión a nivel de población por elementos transponibles desencadena la expansión del genoma en un patógeno fúngico. eLife 10, e69249 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
Gladyshev, E. Mutación puntual inducida por repetición y otros mecanismos de defensa del genoma en hongos. Microbiol. espectro 5, 5.4.02 (2017).
Artículo Google Académico
Goodwin, SB et al. El genoma terminado del hongo patógeno del trigo Mycosphaerella graminicola revela una estructura prescindible, plasticidad cromosómica y patogénesis sigilosa. PLoS Genet 7, e1002070 (2011).
Artículo CAS PubMed PubMed Central Google Scholar
Grandaubert, J., Dutheil, JY & Stukenbrock, EH Los determinantes genómicos de la evolución adaptativa en un patógeno fúngico. Evol. Letón. 3, 299–312 (2019).
Artículo PubMed PubMed Central Google Académico
Schotanus, K. et al. Las modificaciones de histonas en lugar de los nuevos centrómeros regionales de Zymoseptoria tritici distinguen los cromosomas centrales y accesorios. Epigenética Cromatina 8, 41 (2015).
Artículo PubMed PubMed Central Google Académico
Galazka, JM & Freitag, M. Variabilidad de la estructura cromosómica en hongos patógenos – de "fines and odds". actual Opinión Microbiol. 0, 19–26 (2014).
Artículo CAS PubMed Central Google Académico
Möller, M. et al. Desestabilización de la estructura cromosómica por metilación de la histona H3 lisina 27. PLOS Genet. 15, e1008093 (2019).
Artículo PubMed PubMed Central Google Académico
Lorrain, C., Feurtey, A., Möller, M., Haueisen, J. y Stukenbrock, E. Dinámica de elementos transponibles en patógenos fúngicos recientemente divergentes: contenido de elementos transponibles específicos del linaje y eficiencia de las defensas del genoma. G3 Genes/Genomas/Genética 11, jkab068 (2021).
Wang, C., Milgate, AW, Solomon, PS & McDonald, MC La identificación de un transposón que afecta la reproducción asexual del patógeno del trigo Zymoseptoria tritici. mol. Patol de plantas. 22, 800–816 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
van Wyk, S., Wingfield, BD, De Vos, L., van der Merwe, NA y Steenkamp, ET Análisis de todo el genoma de mutaciones puntuales inducidas por repetición en Ascomycota. Frente. Microbiol. 11, 622368 (2021).
Testa, AC, Oliver, RP & Hane, JK OcculterCut: Un estudio exhaustivo de las regiones ricas en AT en los genomas fúngicos. Genoma Biol. Evol. 8, 2044–2064 (2016).
Artículo PubMed PubMed Central Google Académico
Möller, M. et al. La pérdida reciente de la ADN metiltransferasa Dim2 disminuye la tasa de mutación en repeticiones y cambia la trayectoria evolutiva en un patógeno fúngico. PLOS Genet. 17, e1009448 (2021).
Artículo PubMed PubMed Central Google Académico
Gladyshev, E. & Kleckner, N. La homología de la secuencia de ADN induce la mutación de citosina a timina por una vía relacionada con la heterocromatina en Neurospora. Nat. Gineta. 49, 887–894 (2017).
Artículo CAS PubMed PubMed Central Google Scholar
Zhan, J., Mundt, CC & McDonald, BA Medición de la inmigración y reproducción sexual en poblaciones de campo de Mycosphaerella graminicola. Phytopathology® 88, 1330–1337 (1998).
Artículo CAS PubMed Google Académico
Habig, M., Lorrain, C., Feurtey, A., Komluski, J. & Stukenbrock, EH Las modificaciones epigenéticas afectan la tasa de mutaciones espontáneas en un hongo patógeno. Nat. común 12, 5869 (2021).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Dhillon, B., Cavaletto, JR, Wood, KV y Goodwin, SB La amplificación e inactivación accidentales de un gen de metiltransferasa elimina la metilación de citosina en Mycosphaerella graminicola. Genética 186, 67–77 (2010).
Artículo CAS PubMed PubMed Central Google Scholar
Hawkins, NJ & Fraaije, BA Penas de fitness en la evolución de la resistencia a fungicidas. año Rev. Phytopathol. 56, 339–360 (2018).
Artículo CAS PubMed Google Académico
Ceccarelli, S. et al. Fitomejoramiento y cambios climáticos. J. Agric. ciencia 148, 627–637 (2010).
Artículo Google Académico
Weiss, CV et al. Disección genética de las diferencias interespecíficas en la termotolerancia de la levadura. Nat. Gineta. 50, 1501–1504 (2018).
Artículo CAS PubMed PubMed Central Google Scholar
Maclean, CJ et al. Descifrar la base génica de la variación de la aptitud de la levadura mediante genética directa e inversa simultánea. mol. Biol. Evol. 34, 2486–2502 (2017).
Artículo CAS PubMed Google Académico
Lendenmann, MH, Croll, D., Palma-Guerrero, J., Stewart, EL & McDonald, BA El mapeo de QTL de la sensibilidad a la temperatura revela genes candidatos para la adaptación térmica y la morfología de crecimiento en el hongo patógeno de plantas Zymoseptoria tritici. Herencia 116, 384–394 (2016).
Artículo CAS PubMed PubMed Central Google Scholar
Krishnan, P. et al. Las inserciones de elementos transponibles dan forma a la regulación génica y la producción de melanina en un hongo patógeno del trigo. BMC Biol. 16, 78 (2018).
Artículo PubMed PubMed Central Google Académico
Bankevich, A. et al. SPAdes: un nuevo algoritmo de ensamblaje del genoma y sus aplicaciones a la secuenciación unicelular. J. Cómputo. Biol. J. Cómputo. mol. Biol celular. 19, 455–477 (2012).
Artículo MathSciNet CAS Google Académico
Bolger, AM, Lohse, M. y Usadel, B. Trimmomatic: un recortador flexible para datos de secuencia de Illumina. Bioinformática 30, 2114–2120 (2014).
Artículo CAS PubMed PubMed Central Google Scholar
Langmead, B. & Salzberg, SL Alineación rápida de lectura con intervalos con Bowtie 2. Nat. Métodos 9, 357–359 (2012).
Artículo CAS PubMed PubMed Central Google Scholar
Auwera, G. van der. & O'Connor, BD Genomics en la nube: uso de Docker, GATK y WDL en Terra. (O'Reilly Media, 2020).
Danecek, P. et al. El formato de llamada variante y VCFtools. Bioinformática 27, 2156–2158 (2011).
Artículo CAS PubMed PubMed Central Google Scholar
Purcell, S. et al. PLINK: un conjunto de herramientas para la asociación del genoma completo y los análisis de vinculación basados en la población. Soy. J. Hum. Gineta. 81, 559–575 (2007).
Artículo CAS PubMed PubMed Central Google Scholar
Quinlan, AR & Hall, IM BEDTools: un conjunto flexible de utilidades para comparar características genómicas. Bioinformática 26, 841–842 (2010).
Artículo CAS PubMed PubMed Central Google Scholar
Zheng, X. et al. Un conjunto de herramientas informáticas de alto rendimiento para la relación y el análisis de componentes principales de los datos de SNP. Bioinforma. buey ingl. 28, 3326–3328 (2012).
Artículo CAS Google Académico
Frichot, E. & François, O. LEA: Un paquete R para estudios de paisaje y asociaciones ecológicas. Métodos Ecol. Evol. 6, 925–929 (2015).
Artículo Google Académico
Huson, DH & Bryant, D. Aplicación de redes filogenéticas en estudios evolutivos. mol. Biol. Evol. 23, 254–267 (2006).
Artículo CAS PubMed Google Académico
Stukenbrock, EH & Dutheil, JY Los mapas de recombinación a escala fina de patógenos fúngicos de plantas revelan paisajes de recombinación dinámica y puntos críticos intragénicos. Genética 208, 1209–1229 (2018).
Artículo CAS PubMed Google Académico
Pickrell, JK & Pritchard, JK Inferencia de divisiones y mezclas de población a partir de datos de frecuencia de alelos de todo el genoma. PLoS Genet 8, e1002967 (2012).
Artículo CAS PubMed PubMed Central Google Scholar
Feurtey, A. et al. La compartimentación del genoma es anterior a la divergencia de especies en el género patógeno vegetal Zymoseptoria. Genoma BMC. 21, 588 (2020).
Artículo CAS Google Académico
Millas, A. et al. cggh/scikit-allel: v1.3.3. https://doi.org/10.5281/zenodo.4759368 (2021).
Linheiro, RS & Bergman, CM La resecuenciación del genoma completo revela las preferencias del sitio de destino natural de los elementos transponibles en Drosophila melanogaster. PLOS UNO 7, e30008 (2012).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Badet, T., Oggenfuss, U., Abraham, L., McDonald, BA y Croll, D. Un pangenoma global de calidad de referencia de 19 aislados para el hongo patógeno del trigo Zymoseptoria tritici. BMC Biol. 18, 12 (2020).
Artículo CAS PubMed PubMed Central Google Scholar
Haueisen, J. et al. Programas de infección altamente flexibles en un patógeno de trigo especializado. Ecol. Evol. 9, 275–294 (2018).
Artículo PubMed PubMed Central Google Académico
Zhang, Y. et al. Análisis basado en modelos de ChIP-Seq (MACS). Genoma Biol. 9, R137 (2008).
Artículo PubMed PubMed Central Google Académico
Pockrandt, C., Alzamel, M., Iliopoulos, CS y Reinert, K. GenMap: computación ultrarrápida de mapeabilidad del genoma. Bioinformática 36, 3687–3692 (2020).
Artículo CAS PubMed PubMed Central Google Scholar
Gallo, PJA et al. Biopython: herramientas de Python disponibles gratuitamente para biología molecular computacional y bioinformática. Bioinformática 25, 1422–1423 (2009).
Artículo CAS PubMed PubMed Central Google Scholar
Lewis, ZA et al. Reliquias de formación de heterocromatina directa de mutación puntual inducida por repetición en Neurospora crassa. Genoma Res. 19, 427–437 (2009).
Artículo CAS PubMed PubMed Central Google Scholar
Hartmann, FE, McDonald, BA & Croll, D. Evidencia de todo el genoma para la selección divergente entre poblaciones de un importante patógeno agrícola. mol. Ecol. 27, 2725–2741 (2018).
Artículo PubMed PubMed Central Google Académico
Zhou, X. & Stephens, M. Análisis de modelo mixto eficiente en todo el genoma para estudios de asociación. Nat. Gineta. 44, 821–824 (2012).
Artículo CAS PubMed PubMed Central Google Scholar
Cingolani, P. et al. Un programa para anotar y predecir los efectos de polimorfismos de un solo nucleótido, SnpEff. Volar 6, 80–92 (2012).
Artículo CAS PubMed PubMed Central Google Scholar
Grandaubert, J., Bhattacharyya, A. & Stukenbrock, EH La anotación de genes basada en RNA-seq y la genómica comparativa de cuatro patógenos fúngicos de pastos en el género Zymoseptoria identifican nuevos genes huérfanos e invasiones específicas de especies de elementos transponibles. G3 Bethesda MD 5, 1323–1333 (2015).
Artículo CAS PubMed Google Académico
Feurtey, A. Un panel de mil genomas rastrea la propagación y adaptación de un importante patógeno fúngico para cultivos. https://doi.org/10.5281/ZENODO.7572234 (2023).
Descargar referencias
Los datos producidos y analizados en este documento se generaron en colaboración con el Centro de Diversidad Genética (GDC), ETH Zurich. Nos gustaría agradecer a Lucio García y a la plataforma NGS de Syngenta por su ayuda con la secuenciación. DC y GS recibieron el apoyo de la Agencia Suiza de Innovación Innosuisse. El trabajo (propuesta: 10.46936/10.25585/60000699) realizado por el Instituto Conjunto del Genoma del Departamento de Energía de EE. El Departamento de Energía de EE. UU. operó bajo el Contrato No. DE-AC02-05CH11231 y el trabajo de laboratorio fue apoyado por el proyecto 3602-22000-015-00D del USDA-Agricultural Research Service. AF recibió el apoyo de una subvención del programa prioritario DFG SPP1819 otorgado a EHS.
Laboratorio de Genética Evolutiva, Instituto de Biología, Universidad de Neuchâtel, CH-2000, Neuchâtel, Suiza
Alice Feurtey, Guido Puccetti y Daniel Croll
Fitopatología, D-USYS, ETH Zurich, CH-8092, Zurich, Suiza
Alice Feurtey, Cécile Lorrain, Julien Alassimone y Bruce A. McDonald
Instituto Max Planck de Biología Evolutiva, Plön, Alemania
Alice Feurtey y Eva H. Stukenbrock
División de Ciencias de las Plantas, Escuela de Investigación de Biología, Universidad Nacional de Australia, Canberra, ACT, Australia
Megan C. McDonald y Peter S. Salomón
Escuela de Biociencias, Instituto de Microbiología e Infecciones, Universidad de Birmingham, Birmingham, Reino Unido
megan c mcdonald
Departamento de Industrias Primarias de NSW, Instituto Agrícola Wagga Wagga, Pine Gully Road, Wagga Wagga, NSW, 2650, Australia
andres milgate
El Instituto de Nueva Zelanda para la Investigación de Plantas y Alimentos Limited, Lincoln, Nueva Zelanda
rachael warren
Syngenta Crop Protection AG, CH-4332, Stein, Suiza
Guido Puccetti, Gabriel Scalliet y Stefano FF Torriani
Universidad Paris Saclay, INRAE, UR BIOGER, 91120, Palaiseau, Francia
Lilian Gout, Thierry C. Marcel, Frédéric Suffert, Anne Genissel y Marc-Henri Lebrun
Instituto Conjunto del Genoma del Departamento de Energía de EE. UU., Laboratorio Nacional Lawrence Berkeley, Berkeley, CA, 94720, EE. UU.
Anna Lipzen, Yuko Yoshinaga, Christopher Daum, Kerrie Barry e Igor V. Grigoriev
Departamento de Biología Vegetal y Microbiana, Universidad de California Berkeley, Berkeley, CA, 9472, EE. UU.
Ígor V. Grigoriev
USDA-Servicio de Investigación Agrícola, West Lafayette, IN, EE. UU.
Esteban B. Goodwin
Universidad e Investigación de Wageningen, Laboratorio de Fitopatología, Wageningen, Países Bajos
Michael F. Seidl y Gert HJ Química
Universidad de Utrecht, Biología Teórica y Bioinformática, Utrecht, Países Bajos
Michael F. Seidl
Genómica Ambiental, Universidad Christian-Albrechts de Kiel, Kiel, Alemania
Eva H. Stukenbrock
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
AF y DC concibieron el estudio; AF y CL realizaron análisis; AF, MCM, AM, PSS, RW, GP, GS, SFFT, LG, TCM, FS, JA, AL, YY, CD, KB, IVG, SBG, AG, MFS, EHS, MHL, MHL, GHJK, BAM, y DC aportó muestras y/o datos de secuenciación del genoma; BAM y DC supervisaron el trabajo; AF y DC escribieron el manuscrito con aportes de todos los coautores.
Correspondencia a Daniel Croll.
Los autores declaran no tener conflictos de intereses.
Nature Communications agradece a los revisores anónimos por su contribución a la revisión por pares de este trabajo. Los informes de los revisores están disponibles.
Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Feurtey, A., Lorrain, C., McDonald, MC et al. Un panel de mil genomas rastrea la propagación global y la adaptación de un importante patógeno fúngico para cultivos. Nat Comun 14, 1059 (2023). https://doi.org/10.1038/s41467-023-36674-y
Descargar cita
Recibido: 16 Septiembre 2022
Aceptado: 10 febrero 2023
Publicado: 24 febrero 2023
DOI: https://doi.org/10.1038/s41467-023-36674-y
Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:
Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.
Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt
Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.
