Introducción

¿Qué es un árbol filogenético?

Un árbol filogenético es una representación gráfica que describe las relaciones evolutivas entre un conjunto de organismos o secuencias, basada en datos moleculares, morfológicos o en ambos.

🔎 Importante:

Es un modelo de hipótesis → no representa la verdad absoluta, sino una inferencia construida a partir de datos y métodos analíticos.

🌿 ¿Qué representan los árboles filogenéticos?

🔗 Relaciones evolutivas: cómo están relacionadas las especies entre sí.
📏 Distancia genética: medida de cambio evolutivo (por ejemplo, el número de sustituciones por sitio).
⏳ Tiempo evolutivo: en el caso de árboles ultramétricos.
🌳 Eventos de especiación: reflejados en los nodos internos.

💡 Nota: en árboles obtenidos con métodos de distancia (filogramas de similitud), el enfoque es distinto: representan “quién se parece más a quién”, pero no reconstruyen ancestros ni relaciones evolutivas directas.

🧩 Componentes del árbol

🌳 Raíz: nodo que representa el ancestro común más antiguo.
🔘 Nodo: punto donde se bifurca el árbol, representando un ancestro común hipotético.
🏷️ Terminal (tip): representa una especie, gen o secuencia observada.
➖ Rama: línea que conecta nodos; puede estar escalada según distancia genética o tiempo.
📏 Escala: barra de referencia que indica cuánto equivale una unidad de longitud de rama.
- En árboles de distancia genética, número de sustituciones (cambios) esperados por sitio.
- En árboles ultramétricos, la escala corresponde a tiempo evolutivo (millones de años, por ejemplo).

🌲 Tipos de árboles filogenéticos

🌳 Enraizado
Cuenta con una raíz que marca el ancestro común más antiguo y define la dirección del tiempo evolutivo.

🌿 No enraizado
Muestra las relaciones entre los taxa, pero no indica la dirección temporal de la evolución.

⏳ Ultramétrico
Todos los terminales están a la misma distancia de la raíz. Este tipo de árbol se obtiene, por ejemplo, al aplicar relojes moleculares para estimar tiempos de divergencia.

📏 Escalado por distancia
La longitud de las ramas es proporcional a la cantidad de cambio evolutivo, como el número de sustituciones por sitio en secuencias moleculares.

🧪 Tipos de métodos para construir árboles

🧩 A) Métodos basados en distancias

Calculan una matriz de distancias genéticas y construyen un árbol que mejor las represente.

📊 Ejemplos: Neighbor-Joining (NJ), UPGMA.
💻 Programas: MEGA, PHYLIP.

🪶 B) Métodos de parsimonia

Buscan el árbol que minimiza el número total de cambios evolutivos.

⚡ Más simples y rápidos, pero pueden ser inconsistentes cuando los datos tienen alta homoplasia.
💻 Programas: PAUP*, TNT, MEGA.

🎲 C) Métodos probabilísticos

🔹 Máxima Verosimilitud (ML)

Encuentra el árbol que maximiza la probabilidad de observar los datos bajo un modelo de evolución.

💻 Programas: IQ-TREE, RAxML, PhyML.

🔹 Inferencia Bayesiana

Estima la probabilidad posterior de los árboles dado los datos y un modelo de evolución, usando MCMC para explorar el espacio de árboles.

💻 Programas: MrBayes, BEAST, RevBayes.

📂 Formatos y salidas de programas

Programa	Extensión típica	Formato	Árbol ultramétrico	Comentarios
RAxML / RAxML-NG	`.tree`, `.tre`, `.bestTree`	Newick	❌ No (por defecto)	Incluye longitudes de rama en sustituciones por sitio; usa ML.
MrBayes	`.t`, `.tre`	Nexus	❌ No (a menos que se use reloj molecular)	Guarda múltiples árboles de la cadena MCMC; puede exportar a Newick.
IQ-TREE	`.treefile`	Newick	❌ No (por defecto)	Archivo principal con longitudes de rama y soporte de nodos.
BEAST	`.trees`	Nexus o Newick	✅ Sí (por defecto)	Produce árboles calibrados en tiempo; requiere reloj molecular.
RevBayes	`.trees`, `.tree`	Nexus o Newick	⚖️ Depende del modelo	Muy flexible; formato definido por el usuario.
PAUP*	`.tre`	Nexus o Newick	⚖️ Depende del análisis	Compatible con parsimonia, ML y distancias.
MEGA	`.nwk`, `.meg`	Newick	⚖️ Depende del análisis	Interfaz gráfica; exporta fácilmente a Newick.
PHYLIP	`.tree`, `.tre`	Newick	⚖️ Depende del programa interno	Salida muy básica; normalmente Newick sin etiquetas complejas.

📑 Formato Newick y Nexus

Existen varios formatos para almacenar árboles, pero los más comunes son Newick y Nexus. Casi todos los programas utilizan alguno de estos dos, aunque con diferentes extensiones de archivo (.tree, .tre, .t, .treefile, etc.).

🌿 Newick

El formato más utilizado y universal. Es simple y compacto:

((A:0.1,B:0.2):0.3,C:0.4);

🔹 Características:

Usa paréntesis ( ) para representar la topología (quién es hermana de quién).
Las longitudes de rama se indican con :valor.
Siempre termina con ;.
Puede incluir información extra como soporte o probabilidades en etiquetas o comentarios.

🔹 Ejemplos de anotaciones:

Soporte como etiqueta clásica:
```
(A,B)90:0.05; 
```
Soporte como metadato explícito:
```
(A,B)[&pp=0.98]:0.05; 
```

📦 Nexus

El formato más flexible, usado sobre todo en análisis bayesianos y programas que requieren guardar metadatos.

Ejemplo mínimo:

#NEXUS Begin trees;    Tree myTree = ((A:0.1,B:0.2):0.3,C:0.4); End;

🔹 Características:

Comienza con #NEXUS.
Organiza la información en bloques (Begin … End;).
Permite guardar múltiples árboles en un mismo archivo.
Puede incluir particiones, modelos de evolución, soporte, tiempos, HPD, etc.

🌿 Formato Newick: cómo leerlo y escribirlo

El formato Newick es el estándar más extendido para representar árboles filogenéticos en texto plano. Es compacto, portable y lo admiten prácticamente todos los programas.

📏 Reglas de sintaxis esenciales en Newick

Paréntesis = clados
Cada par de paréntesis define un clado.
👉 Ejemplo:
```
(A,B)
```
Significa que A y B son hermanas.
Comas = separación de taxones o clados
Los elementos dentro de un mismo nivel se separan con comas.
👉 Ejemplo:
```
((A,B),C)
```

Aquí C es hermana del clado (A,B).

Longitudes de rama = :valor
Las longitudes (ej. sustituciones por sitio) se colocan después de cada taxón o nodo.
👉 Ejemplo:
```
(A:0.1,B:0.2):0.05
```
A → rama de longitud 0.1
B → rama de longitud 0.2
Nodo interno (A,B) → rama de longitud 0.05
Todo árbol termina con
👉 Ejemplo:
```
((A,B),C);
```
Soportes en nodos internos
👉 Ejemplo:
```
(A,B)90:0.05
```

💡 Los soportes (90, 85) se colocan después del ) del clado y antes de :longitud de la rama interna de ese clado.