Un árbol filogenético, también conocido como filogenia, es una representación gráfica que ilustra las relaciones evolutivas entre un conjunto definido de especies o taxones durante un período temporal particular. Más precisamente, constituye un diagrama de ramificación que delinea las conexiones evolutivas entre diversas especies biológicas u otras entidades, basadas en atributos físicos o genéticos compartidos y divergentes. En biología evolutiva, se postula que toda la vida terrestre se origina a partir de un árbol filogenético singular, lo que significa una ascendencia común universal. La disciplina académica dedicada al estudio de los árboles filogenéticos se conoce como filogenética. Un objetivo principal implica identificar un árbol filogenético que refleje de manera óptima la ascendencia evolutiva entre un conjunto determinado de especies o taxones. La filogenética computacional, también denominada inferencia filogenética, se concentra en los enfoques algorítmicos empleados para determinar el árbol filogenético más óptimo dentro del complejo panorama filogenético.
Los árboles filogenéticos se clasifican en enraizados o no enraizados. Dentro de un árbol filogenético enraizado, cada nodo que posee descendientes significa el ancestro común inferido más reciente de esos linajes y, en ciertos casos, las longitudes de los bordes pueden interpretarse como estimaciones temporales. Cada nodo dentro de dicho árbol se designa como unidad taxonómica. Los nodos internos suelen denominarse unidades taxonómicas hipotéticas, dado su estado de observación indirecta. Estas estructuras de árbol resultan invaluables en diversas disciplinas biológicas, incluidas la bioinformática, la sistemática y la filogenética. Por el contrario, los árboles sin raíces representan exclusivamente las relaciones entre los nodos de sus hojas, sin necesidad de identificar o inferir una raíz ancestral.
Historial
El concepto de "árbol de la vida" se originó a partir de marcos filosóficos arcaicos, como la Gran Cadena del Ser, que postulaba una progresión jerárquica, similar a una escalera, desde formas de vida más simples a más complejas. Entre las primeras representaciones de árboles filogenéticos ramificados se encuentra un "cuadro paleontológico" que ilustra las interrelaciones geológicas de la flora y la fauna, presentado en el libro de Edward Hitchcock, Geología elemental (primera edición: 1840).
En su publicación fundamental de 1859, Sobre el origen de las especies, Charles Darwin presentó un "árbol" evolutivo esquemático. Más de un siglo después de su introducción, los biólogos evolutivos continúan empleando diagramas de árbol para ilustrar los procesos evolutivos, ya que estas representaciones comunican efectivamente el principio de que la especiación surge de la divergencia adaptativa y algo estocástica de los linajes.
La nomenclatura filogenética, o filogenia, se origina a partir de dos términos griegos antiguos: φῦλον (phûlon), que significa 'raza' o 'linaje', y γένεσις (génesis), que denota 'origen' o 'fuente'.
Propiedades
Árbol enraizado
Un árbol filogenético enraizado constituye un grafo dirigido caracterizado por un nodo singular, designado como raíz, que representa el ancestro común más reciente (típicamente inferido) de todas las entidades terminales u hojas dentro del árbol. Este nodo raíz carece de padre, pero funciona como progenitor de todos los nodos posteriores en la estructura de árbol. En consecuencia, la raíz posee un grado de 2, mientras que otros nodos internos exhiben un grado mínimo de 3, donde "grado" aquí denota el recuento acumulado de bordes entrantes y salientes.
La técnica predominante para enraizar árboles filogenéticos implica la incorporación de un grupo externo inequívoco, que debe ser lo suficientemente próximo para permitir inferencias a partir de datos de caracteres o secuencias moleculares, pero lo suficientemente distinto como para servir como una referencia externa definitiva. Las estrategias de enraizamiento alternativas incluyen el enraizamiento de punto medio o la aplicación de un modelo de sustitución no estacionario.
Árbol sin raíz
Los árboles sin raíces representan las interrelaciones entre los nodos de las hojas sin plantear ninguna suposición sobre los orígenes ancestrales. La identificación o inferencia de una raíz ancestral no es un requisito previo para su construcción. Los árboles enraizados pueden derivarse de homólogos no enraizados mediante la colocación estratégica de una raíz. El proceso de inferir la raíz de un árbol sin raíces requiere un mecanismo para establecer la ascendencia. Normalmente, esto se logra incorporando un grupo externo al conjunto de datos de entrada, posicionando así la raíz entre el grupo externo y los taxones restantes, o integrando suposiciones complementarias sobre las tasas diferenciales de evolución entre ramas individuales, ejemplificadas por la hipótesis del reloj molecular.
Bifurcación versus multifurcación
Los árboles filogenéticos, ya sean con o sin raíces, se pueden clasificar como bifurcados o multifurcados. Un árbol bifurcado enraizado se caracteriza por precisamente dos descendientes que se originan en cada nodo interno, constituyendo así un árbol binario. Por el contrario, un árbol bifurcado sin raíz se estructura como un árbol binario sin raíz, que es un árbol libre que posee exactamente tres vecinos en cada nodo interno. Por el contrario, un árbol multifurcado enraizado permite más de dos hijos en ciertos nodos, mientras que un árbol multifurcado sin raíz puede exhibir más de tres vecinos en algunos nodos.
Árboles etiquetados versus no etiquetados
Tanto los árboles filogenéticos enraizados como los no enraizados se pueden clasificar como etiquetados o no etiquetados. Un árbol etiquetado se define por valores específicos atribuidos a sus nodos de hoja, mientras que un árbol sin etiquetar, a menudo denominado forma de árbol, delinea exclusivamente la estructura topológica. Ciertos árboles basados en secuencias, construidos a partir de loci genómicos limitados como Phylotree, incorporan nodos internos que están etiquetados con haplotipos ancestrales inferidos.
Enumeración de árboles
La cantidad de estructuras de árbol potenciales para un número específico de nodos de hojas varía según la clasificación particular del árbol. Sin embargo, emerge un patrón consistente: invariablemente hay más árboles etiquetados que no etiquetados, más árboles multifurcados que bifurcados, y más árboles con raíces que sin raíces. Esta distinción final tiene una relevancia biológica significativa, derivada de las numerosas posiciones posibles para colocar una raíz dentro de un árbol sin raíces. Para bifurcar árboles etiquetados, el recuento total de árboles enraizados se determina mediante la siguiente fórmula:
- para
, donden ≥ §9394§ {\displaystyle n\geq 2} indica el número de nodos de hoja.n {\displaystyle n}
Para árboles etiquetados bifurcados, el recuento total de árboles sin raíces viene dado por:
para( §89§ n − §1516§ ) ! ! = ( §3031§ n − §3738§ ) ! §46 47§ n − §5455§ ( n − §6566§ ) ! {\displaystyle (2n-5)!!={\frac {(2n-5)!}{2^{n-3}(n-3)!}}} .n ≥ §9394§ {\displaystyle n\geq 3}
Dentro de la categoría de árboles bifurcados etiquetados, la cantidad de árboles sin raíces que poseen
La cantidad de árboles enraizados aumenta rápidamente con el número de puntas. Para diez consejos, el número de árboles bifurcados potenciales excede
Clasificaciones de árboles distintos
Dendrograma
Un dendrograma sirve como una designación amplia para cualquier estructura de árbol, independientemente de su naturaleza filogenética y, en consecuencia, también se refiere a la representación gráfica de un árbol filogenético.
Cladograma
Un cladograma representa exclusivamente un patrón de ramificación; específicamente, la longitud de sus ramas no significa duración temporal o la magnitud relativa de la evolución del carácter, y sus nodos internos no denotan entidades ancestrales.
Filograma
Un filograma constituye un árbol filogenético que presenta longitudes de ramas escaladas en proporción al grado de transformación del carácter.
Cronograma
Un cronograma es un árbol filogenético que transmite explícitamente información temporal a través de la longitud de sus ramas.
Dahlgrenograma
Un Dahlgrenograma es un diagrama que ilustra una sección transversal de un árbol filogenético.
Red filogenética
Una red filogenética no se clasifica rigurosamente como un árbol, sino que representa una estructura gráfica más amplia, o específicamente un gráfico acíclico dirigido en el contexto de redes enraizadas. Estas redes se emplean para mitigar ciertas limitaciones inherentes a las estructuras de los árboles.
Diagrama del husillo
Un diagrama de huso, también conocido como diagrama de burbujas, se denomina frecuentemente romerograma, una nomenclatura derivada de su popularización por parte del paleontólogo estadounidense Alfred Romer. Este diagrama ilustra la diversidad taxonómica (representada por el ancho horizontal) trazada contra el tiempo geológico (en el eje vertical) para representar las fluctuaciones en la abundancia de varios taxones a lo largo de períodos temporales. Fundamentalmente, un diagrama de huso no constituye un árbol evolutivo; sus husos taxonómicos ofuscan las relaciones precisas entre los taxones padres e hijos y presentan además el inconveniente de implicar la parafilia del linaje parental. En consecuencia, este tipo de diagrama ya no se emplea en su formato conceptualizado originalmente.
Coral de la Vida
Darwin también postuló que el coral podría servir como una metáfora más apropiada que el árbol. De hecho, los corales filogenéticos son eficaces para representar formas de vida existentes y extintas, y ofrecen varias ventajas sobre las estructuras de los árboles, como la acomodación de las anastomosis.
Construcción
Los árboles filogenéticos que comprenden una cantidad sustancial de secuencias de entrada generalmente se generan empleando metodologías filogenéticas computacionales. Los métodos de matriz de distancia, como la unión de vecinos o UPGMA, que calculan la distancia genética a partir de múltiples alineamientos de secuencias, son sencillos de implementar pero no incorporan un modelo evolutivo explícito. Numerosos algoritmos de alineación de secuencias, incluido ClustalW, también generan árboles utilizando algoritmos de construcción menos complejos basados en la distancia. La máxima parsimonia representa otro enfoque sencillo para inferir árboles filogenéticos, pero asume inherentemente un modelo evolutivo implícito, específicamente la parsimonia. Por el contrario, metodologías más sofisticadas aprovechan el criterio de optimización de máxima verosimilitud, frecuentemente dentro de un marco estadístico bayesiano, y aplican un modelo evolutivo explícito para la estimación de árboles filogenéticos. La identificación del árbol óptimo utilizando muchas de estas técnicas es un problema NP difícil; en consecuencia, se emplean algoritmos heurísticos de búsqueda y optimización junto con funciones de puntuación de árboles para determinar un árbol suficientemente robusto que se alinee con los datos empíricos.
Los métodos de construcción de árboles pueden evaluarse según varios criterios clave:
- eficiencia (refiriéndose a los requisitos de tiempo computacional y el consumo de memoria)
- poder (relativo al grado en que utiliza efectivamente los datos disponibles, o si la información se descarta de manera ineficiente)
- consistencia (definida como su capacidad de converger consistentemente en la misma solución cuando se le presentan diferentes conjuntos de datos para un problema de modelo idéntico)
- robustez (que indica su capacidad para funcionar eficazmente a pesar de las violaciones de los supuestos del modelo subyacente)
- falsificabilidad (su capacidad de indicar cuándo su aplicación es inapropiada, específicamente cuando se violan los supuestos subyacentes)
Las técnicas de construcción de árboles también han atraído el interés de los matemáticos. También se pueden construir árboles utilizando la teoría T.
Formatos de archivo
Los árboles filogenéticos se pueden representar utilizando varios formatos de codificación, cada uno de ellos diseñado para capturar su estructura anidada inherente. Estos formatos pueden incluir opcionalmente detalles como la longitud de las sucursales y otras características específicas. La adopción de formatos estandarizados es crucial para la distribución efectiva y el intercambio colaborativo de árboles filogenéticos, evitando las dificultades asociadas con la importación de resultados gráficos en diversos entornos de software. Los formatos destacados incluyen:
- Formato de archivo Nexus
- Formato Newick
Limitaciones del análisis filogenético
Si bien los árboles filogenéticos derivados de genes secuenciados o datos genómicos de varias especies ofrecen valiosos conocimientos evolutivos, estos enfoques analíticos están sujetos a limitaciones importantes. Fundamentalmente, los árboles resultantes no siempre proporcionan una descripción precisa de la historia evolutiva de los taxones bajo investigación. Como todos los hallazgos científicos, estos árboles son susceptibles de falsificación a través de investigaciones posteriores, como la adquisición de nuevos datos o la aplicación de metodologías analíticas refinadas a conjuntos de datos existentes. Los datos subyacentes pueden ser intrínsecamente ruidosos y los análisis pueden complicarse por fenómenos como la recombinación genética, la transferencia horizontal de genes, la hibridación entre especies no reconocidas inicialmente como parientes cercanos y la presencia de secuencias altamente conservadas.
Además, depender de un solo tipo de carácter, como un gen solitario, una proteína o datos exclusivamente morfológicos, presenta desafíos metodológicos. Los árboles construidos a partir de fuentes de datos distintas y no relacionadas con frecuencia divergen, lo que requiere considerable precaución al inferir relaciones filogenéticas entre especies. Este problema es particularmente pronunciado para el material genético propenso a la transferencia y recombinación lateral de genes, donde bloques de haplotipos dispares pueden poseer trayectorias evolutivas distintas. En tales análisis, el árbol filogenético generado a partir de un solo gen representa una estimación de la filogenia del gen (un árbol de genes), en lugar de la filogenia de los taxones (un árbol de especies) de los cuales se tomaron muestras de estos caracteres, aunque idealmente, estos dos deberían estar estrechamente alineados. En consecuencia, las investigaciones filogenéticas rigurosas generalmente integran múltiples genes que se originan en diversos compartimentos genómicos (por ejemplo, genomas mitocondriales o de plastidios versus genomas nucleares) o genes que se anticipa que evolucionarán bajo diferentes presiones selectivas, minimizando así la probabilidad de homoplasia (falsa homología) que surge de la selección natural.
Cuando las especies extintas se incorporan a un análisis como nodos terminales, en lugar de, por ejemplo, limitar los nodos internos, generalmente no se consideran directas. ancestros de cualquier especie existente. Además, las especies extintas normalmente no producen ADN de alta calidad para el análisis.
El espectro de materiales de ADN viables para el análisis filogenético se ha ampliado considerablemente debido a los avances en las tecnologías de extracción y secuenciación. Desarrollos tecnológicos adicionales que permitan la inferencia de secuencias a partir de fragmentos diminutos o de patrones de degradación espacial del ADN ampliarían sustancialmente la utilidad de las muestras de ADN disponibles.
Los árboles filogenéticos también se pueden construir a partir de una variedad de tipos de datos alternativos, como características morfológicas, la presencia o ausencia de tipos de genes específicos, eventos de inserción y eliminación, y cualquier otra característica observable que se presuma que transporta una señal evolutiva.
Las redes filogenéticas se emplean en escenarios donde los árboles bifurcados resultan probados. inadecuado, particularmente cuando las complicaciones sugieren una historia evolutiva más reticulada entre los organismos muestreados.
Referencias
Referencias
Schuh, R. T. y A. V. Z. Brower. 2009. Sistemática biológica: principios y aplicaciones (2ª ed.) ISBN 978-0-8014-4799-0
- Schuh, R. T. y A. V. Z. Brower. 2009. Sistemática biológica: principios y aplicaciones (2ª ed.) ISBN 978-0-8014-4799-0
- Lima, Manuel. 2014. El libro de los árboles: visualizando ramas del conocimiento. Princeton Architectural Press, Nueva York.
- MEGA, una aplicación de software gratuita para la construcción de árboles filogenéticos.
- Gontier, N. 2011. "Representación del árbol de la vida: las raíces filosóficas e históricas de los diagramas de árboles evolutivos". Evolución, educación, extensión 4: 515–538.
- Sapp, enero de 2009. Los nuevos fundamentos de la evolución: en el árbol de la vida. Oxford University Press, Nueva York.
Imágenes
- iTOL: Árbol de la vida interactivo
- Filograma de mamíferos euterianos de Miyamoto y Goodman
General
- Page, R. D. M. (2011) proporciona una descripción general completa de varias metodologías de visualización de árboles. "Espacio, tiempo, forma: viendo el árbol de la vida". Tendencias en ecología y ecología Evolución. 27 (2): 113–120. doi:10.1016/j.tree.2011.12.002. PMID 22209094.Fang, H.; Oates, M. E.; Pethica, R. B.; Greenwood, J. M.; Sardar, A. J.; Rackham, O. J. L.; Donoghue, P. C. J.; Stamatakis, A.; De Lima Morais, D. A.; Gough, J. (2013). "Un árbol de vida (secuenciado) actualizado diariamente como referencia para la investigación del genoma". Scientific Reports 3 2015. Bibcode:2013NatSR...3.2015F doi:10.1038/srep02015. PMID 23778980.Fuente: Archivo de la Academia TORIma