Friday, January 11, 2008

TMRCA: Compartimos Ancestros

This is an email from GenealogiaMolecular.com

Message: TMRCA: Compartimos Ancestros


Con el Y-DNA, podemos definir el número de generaciones que hay a un antepasado en común, éste sería el antepasado paterno directo más cercano que dos varones tienen en común (tal como un abuelo o un bisabuelo remoto).

En general, cuanto más coincidencias en haplotipos entre individuos, más corto es el tiempo a un antepasado en común.

Por ejemplo, si dos individuos comparten 35 de 36 marcadores, comparten a un antepasado en común más reciente que dos individuos que compartan 32 de 36 marcadores.

Calcular el tiempo al antepasado en común más reciente se basa en probabilidad y no es una ciencia exacta. Podemos calcular el tiempo más probable que un antepasado en común pudo haber vivido, pero habrá siempre un grado de incertidumbre. Por esta razón, es mejor que piense en TMRCA como un rango de tiempo más bien que un punto en tiempo.

Utilizar los marcadores genéticos "DYS" (del cromosoma Y) para estimar el TMRCA, el tiempo al antepasado en común más reciente (MRCA), es para calcular cuántas generaciones hay a un antepasado en común.


La idea básica es simple: los individuos que tienen más marcadores iguales tendrán más cercano el Ancestro en Común. La lógica es como sigue: Imagina el cromosoma Y como reloj que hace "tictac" lentamente (es decir, cada "tic" del reloj es igual a una mutación). Así, un cromosoma es un "reloj molecular" que hace tictac aleatoriamente dentro de un rango especifico. Esto significa que un reloj que funciona más tiempo tiene una probabilidad más alta de tener más marcas que un reloj que ha funcionado por poco tiempo.


A mayor tiempo, más "tics" del reloj molecular, y más antiguo es el tiempo al MRCA.


Las estimaciones de TMRCA se basan así en el número de mutaciones por las cuales dos "cromosomas Y" que se comparan se diferencian. Puesto que las mutaciones ocurren al azar, la estimación de un TMRCA no es un número exacto (es decir, 7 generaciones por ejemplo), pero la probabilidad que el TMRCA es cierto número de generaciones es mas seguro (es decir, una probabilidad del 47% indica que el TMRCA esta a 16 generaciones o menos). Al comparar más y más marcadores, la probabilidad de precisión llega a ser más alta.


Hay dos conceptos fundamentales que necesitamos para comprender el número observado de las mutaciones y la probabilidad para el TMRCA: Debemos contar el número exacto de mutaciones y debemos poder determinar el rango del reloj (es decir, el rango de mutación).

Si contamos simplemente el número de marcadores de los cuales dos individuos discrepan como el número de mutaciones, potencialmente estaremos en problemas. Primero, algunos de los marcadores pueden diferenciarse por un paso, por dos pasos, o por más. ¿Debemos contar una diferencia de dos etapas como una mutación? ¿Dos (o más) mutaciones? Asimismo, igualmente si dos marcadores aparecen idénticos en dos individuos (y por lo tanto anotaríamos esto como ninguna mutación), allí hay una probabilidad pequeña que cada uno ha experimentado la misma mutación desde el MRCA (y por lo tanto la cuenta verdadera de la mutación para este marcador es dos). Utilizamos dos bases para encontrar el número de mutaciones verdaderas. El "Infinite Alleles Model" o modelo infinito de los alelos es solo un término de lujo de los genetistas para "lo qué usted ve es lo que usted obtiene" - el concepto que el número observado de mutaciones es igual a el número total de mutaciones. Por otro lado está el "stepwise mutational model", que corrige para los hits multiples mutantes que puede ser que hayamos perdido. Cuando el número match es muy alta, ambos métodos dan esencialmente la misma curva de probabilidad. Diferencian solamente perceptiblemente cuando los individuos son muy disímiles.


El segundo punto es el rango de mutación del reloj. Esto en función del rango de la mutación. Es muy probable que las mutaciones se diferencien de los marcadores, y los marcadores con más mutaciones tienen relojes más rápidos. Los Relojes rápidos son una buena cosa, ya que permiten más precisión en el cálculo al TMRCA.

El concepto inicial es que el rango de mutación es igual para cada marcador, algo que ajustaremos con los nuevos datos cuando estén disponibles. Calculamos nuestro TMRCA usando dos rangos diferentes de mutación --- el promedio estándar (basado en un grupo considerable de estudios) es de alrededor del 0.002 (1/500) por cada generación (de modo que en promedio haya cerca de una mutación cada 500 generaciones), y a más rápida el rango es consistente algunos de los datos.

Standard -- assumes the mutation rate per marker u is u=1/500 = 0.002 . This is the average of a number of studies. [In particular, the average pedigree rate across three studies--Heyer et al. (1997), Bianchi et al. (1998), and Kayser et al. (2000). ]

High -- u = 0.004. This places a lower bound on TMRCA, i.e., these times are likely UNDERestimates of the true times. [ Based on the highest reported value, the sperm pool pcr estimate of Holtkemper et al. (2001) ]