Em formação

Compreendendo a pontuação de recombinação em pedigrees familiares

Compreendendo a pontuação de recombinação em pedigrees familiares



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Estou tendo alguns problemas para entender a recombinação e não tenho certeza de qual elemento estou perdendo aqui. Esta figura é um exemplo do meu livro de texto. O pedigree pertence a uma família com um autossômico dominante doença, digitada para um marcador com alelos A1-A6.

Então, todas as meioses são fase conhecida, o que significa que sabemos qual combinação de alelos foi herdada de cada pai. Aparentemente, isso nos leva a sermos capazes de inequivocamente classifique III1-III5 como não recombinante (N) e III6 como recombinante (R).

Isso é onde eu me perco, não entendo como é possível pontuar inequivocamente cada indivíduo como N ou R. Além disso, se a doença é dominante, como é possível que III6 seja afetado, já que ambos os alelos se originam de ambos I1 e II2 não afetados?

EDITAR: A cor azul no gráfico de linhagem significa que a pessoa é afetada por uma doença, o branco simboliza os indivíduos não afetados. Eu acredito que as estrelas vermelhas simbolizam que a pessoa carrega o gene da doença. Isso significaria que o azul corresponde a não carregar o gene da doença. Se for esse o caso, a cor vermelha de III2 é uma falha na figura.


Ns não são não recombinantes no nível genômico. O que você sabe é que eles não mostram eventos de recombinação no locus do alelo de risco, pois os indivíduos portadores do marcador A1 mostram sinais da doença e os indivíduos igualmente saudáveis ​​não portam o marcador A1. Portanto, eles são chamados de não recombinantes. Além disso, os indivíduos da 3ª geração (exceto III6) mostram combinações de alelos que refletem a herança de um alelo de cada pai.

O que é muito importante é que A1 não é o alelo, é o marcador para o alelo de risco. Isso significa que A1 não é diretamente o alelo, mas uma região do DNA próxima ao alelo que provoca a doença, suficientemente próxima para ser co-herdada na maioria das vezes com o alelo da doença.

Para III6 você realmente sabe que uma recombinação deve ter acontecido, pois este sujeito obviamente carrega o alelo de risco (mostra a doença), mas não o marcador associado a ele, portanto, um evento de recombinação aconteceu entre o marcador e o alelo da doença.


Análise de ligação genética

Resumo

A análise de ligação é um método estatístico bem estabelecido para mapear os genes para características hereditárias em suas localizações cromossômicas. Marcadores de todo o genoma são testados em pedigrees que segregam uma característica. O método estatístico de análise de ligação combina esses dados para identificar regiões cromossômicas com probabilidade de abrigar genes para a característica. A análise de ligação paramétrica é usada para características com uma forma de herança Mendeliana. Pontuações LOD e frações de recombinação são usadas para testar as localizações dos genes. A análise de ligação sem modelo é usada para características complexas quando o modelo de herança não é conhecido. A análise de ligação pode ser usada para mapear genes para características binárias e quantitativas.


Imunologia de Infecção

Aurelie Cobat,. Erwin Schurr, em Methods in Microbiology, 2010

1 Princípio

A análise de ligação baseada em modelo pelo método clássico de pontuação de lod (Morton, 1955) requer a definição do modelo especificando a relação entre o fenótipo e fatores que podem influenciar sua expressão, principalmente um gene putativo com dois alelos (d, D) e outro relevante fatores de risco, muitas vezes referidos como o modelo genético (ou fenótipo / genótipo). No contexto de um fenótipo binário (por exemplo, afetado / não afetado, seronegativo / soropositivo), este modelo genético deve especificar, além da frequência do alelo de suscetibilidade denotado como D, o vetor de penetrância, ou seja, a probabilidade de um indivíduo ser afetado dado um genótipo (dd, Dd ou DD) e um conjunto específico de covariáveis ​​relevantes, como idade ou intensidade de exposição a um agente infeccioso. No contexto de um fenótipo quantitativo (por exemplo, níveis de infecção), a especificação completa do modelo genético inclui, além da frequência do alelo predisponente a altos valores da característica denotada como D, as três médias e variâncias específicas do genótipo que também pode ser influenciado por algumas covariáveis ​​individuais. Dado o genótipo, a distribuição do fenótipo é considerada normal, de modo que a distribuição geral é uma mistura de três distribuições normais.

O modelo genético é geralmente fornecido e estimado por análise de segregação, que é a primeira etapa para determinar a partir de dados familiares o modo de herança de um determinado fenótipo. O objetivo da análise de segregação é discriminar entre os diferentes fatores que causam a semelhança familiar, com o objetivo principal de testar a existência de um único gene, denominado gene principal. O termo gene principal não significa que seja o único gene envolvido na expressão do fenótipo, mas que, entre o conjunto de genes envolvidos, há pelo menos um gene com efeito importante o suficiente para ser diferenciado dos demais. Para um fenótipo binário, este efeito pode ser expresso em termos de riscos relativos, e. a razão da probabilidade de um sujeito ser afetado dado um genótipo ‘DD’ para a mesma probabilidade dado um genótipo ‘dd’. Para um fenótipo quantitativo, este efeito é medido pela proporção da variância fenotípica explicada pelo gene principal (também denotado como a herdabilidade). Uma maneira elegante de expressar este modelo de fenótipo / genótipo é usar uma abordagem regressiva para características binárias (Bonney, 1986), bem como para características quantitativas (Bonney, 1984). Uma revisão detalhada dos prós e contras da análise de segregação pode ser encontrada em Jarvik (1998). Observe que em estudos de ligação, a expressão "gene principal" é usada para qualquer gene que está subjacente a um pico de ligação significativo.

Quando há evidência de um gene principal por análise de segregação, a análise de ligação baseada em modelo permite confirmar e localizar esse gene, denotado abaixo como o locus do fenótipo. A análise de ligação baseada em modelo testa em famílias se o locus fenótipo co-segrega com marcadores genéticos de localização cromossômica conhecida e fornece uma estimativa da taxa de recombinação entre esses dois loci (Ott, 1999) (ver Box 2). A ligação com o locus do fenótipo pode ser testada marcador por marcador (análise de dois pontos) ou considerando um conjunto de marcadores vinculados (análise multiponto). Nesta análise, como na análise de segregação, todas as inferências para genótipos individuais no locus do fenótipo são feitas a partir dos fenótipos individuais e do fenótipo / modelo de genótipo especificado. Para fenótipos quantitativos, a probabilidade de que um indivíduo carregue o genótipo dd, dD ou DD no locus do fenótipo será calculada a partir da mistura das três distribuições normais descritas acima para as quais médias e variâncias foram estimadas por meio de análise de segregação.

Análise de ligação baseada em modelo

Princípio:

A análise de ligação baseada em modelo testa em famílias se o locus da característica co-segregou com marcadores genéticos de localização cromossômica conhecida. O método é baseado na estimativa de um único parâmetro, a fração de recombinação (denotado θ) entre o locus da característica e um determinado marcador genético. O teste de ligação é um teste de razão de verossimilhança comparando a probabilidade sob a hipótese nula de nenhuma ligação (θ0 = 0.5), euH0, para a probabilidade sob a hipótese alternativa de ligação (θ1 & amplt 0,5), euH1. A estatística de ligação é expressa classicamente como uma pontuação lod, Z(θ) = log10(euH1/euH0) Os valores críticos clássicos para declarar ligação significativa e excluir ligação são lod score ≥3 (que corresponde a um p-valor de 10 –4) e lod score & amplt – 2, respectivamente (Morton, 1955).

Exemplo:

O pedigree acima mostra a segregação de um locus de traço autossômico dominante raro (D / d, onde D é o alelo causal) com penetrância completa e ausência de fenocópias (ou seja, os indivíduos portadores dos genótipos Dd ou DD são afetados e os indivíduos portadores do genótipo dd são não afetado) e um marcador informativo (1/2). A mãe não é informativa para ligação. Como a fase é conhecida, podemos contar o número de recombinantes k (que é 1 e denotado R) fora de n = 10 meioses. A probabilidade de funcionamento do pedigree é eu(θ) = θ k (1 – θ) nk = θ(1 – θ) 9. A probabilidade do pedigree sob a hipótese nula é eu(0,5) = (0,5) 10. A estimativa de máxima verossimilhança de θ é fácil de calcular como k/n = 1/10 e a pontuação de lod é lod = log10(0,1 (1–0,1) 9 / 0,5 10) = 1,6. Os resultados da análise de ligação baseada em modelo são apresentados em tabelas de pontuação de lod, onde as pontuações de lod são tabuladas para uma série de frações de recombinação de 0 a 0,5.

Fraqueza:

A análise de ligação baseada em modelo requer a definição do modelo genético que descreve a relação entre o fenótipo e o genótipo, ou seja, a frequência do alelo da doença, o modo de herança (dominante, recessivo ou aditivo) e o padrão de penetrâncias (ou seja, a probabilidade de ser afetados, dado o status do genótipo) precisam ser especificados para inferir o genótipo do locus da doença de todos os indivíduos a partir de seu fenótipo. Esses parâmetros são geralmente estimados por análises de segregação complexas.

Força:

A abordagem de pontuação lod é o método de ligação mais poderoso quando o modelo genético assumido é o modelo verdadeiro. Esta abordagem fornece uma estimativa de probabilidade máxima da distância genética (θ) entre o marcador genético e o locus do traço da doença.

Software popular:

LINKAGE (Lathrop et al., 1984), FASTLINK (Cottingham et al., 1993), MERLIN (Abecasis et al., 2002 )

Uma lista de software de análise genética está disponível em http://linkage.rockefeller.edu/soft

A abordagem de pontuação lod é certamente o método de ligação mais poderoso quando o modelo genético assumido é (próximo o suficiente) o modelo verdadeiro. Esse é o caso em uma situação de herança monogênica em que um modelo genético simples pode ser assumido. No entanto, uma especificação incorreta do modelo genético pode levar à perda severa de poder para detectar a ligação (e, portanto, à falsa exclusão da região que contém o locus do fenótipo) e viés na estimativa da fração de recombinação (ou seja, a distância genética) entre o locus fenótipo e o locus marcador (Clerget-Darpoux et al., 1986). No entanto, essa especificação incorreta não afeta a robustez do método, ou seja, não leva a conclusões falsas em favor da ligação, desde que apenas um modelo de fenótipo / genótipo seja testado. Quando há algum conhecimento sobre a prevalência da doença em estudo e o nível de agregação familiar, um procedimento comum para reduzir o risco de especificação incorreta é gerar um número limitado de modelos genéticos realistas para usar na análise de pontuação de lod. No entanto, ao realizar a análise sob uma série de modelos genéticos diferentes, é necessário introduzir uma correção para testes múltiplos e ajustar o nível de significância do escore lod (MacLean et al., 1993). O mesmo problema ocorre quando vários marcadores são testados, e diretrizes foram propostas para adaptar os limiares de pontuação de lod ao contexto de uma pesquisa em todo o genoma. Limiares amplamente aceitos são os propostos por Lander e Kruglyak (1995). Com base em cálculos analíticos complexos, esses autores definiram o p-valores que devem ser usados ​​para reivindicar ligação sugestiva ou significativa como 1,7 × 10 –3 e 4,9 × 10 –5 (correspondendo a uma pontuação de lod de 1,9 e 3,3, respectivamente) (Lander e Kruglyak, 1995). Outro problema surge quando faltam dados de marcadores para alguns membros da família. Nesse caso, a análise de ligação também depende das frequências do alelo do marcador e a especificação incorreta dessas frequências pode afetar a potência e a robustez do método. Esta é uma questão importante porque significa que se deve ter muito cuidado ao relatar uma ligação sugestiva ou significativa no contexto de uma amostra com muitos pais desaparecidos. Observe que os dois últimos problemas (teste de múltiplos marcadores e especificação incorreta de frequências de alelos de marcadores) também são comuns aos métodos sem modelo.


Doenças complexas ocorrem como resultado de muitas variantes genômicas, associadas a influências ambientais (como dieta, sono, estresse e tabagismo). Elas também são chamadas de doenças “poligênicas” - com “poli” significando muitos e “gênicas” envolvendo genes.

A doença arterial coronariana é uma doença complexa. Os pesquisadores descobriram cerca de 60 variantes genômicas que estão presentes com mais frequência em pessoas com doença arterial coronariana. A maioria dessas variantes está dispersa pelo genoma e não se agrupa em um cromossomo específico.


Discussão

A recombinação e o rearranjo dos genomas parentais levam a um aumento da variação genética. Compreender os mecanismos que regulam a taxa de recombinação durante a meiose permitiria sua manipulação para aumentar ou diminuir as taxas de recombinação de acordo com os requisitos específicos descritos em [39]. Embora muitos genes que controlam o processo básico de formação de CO tenham sido identificados, pouco se sabe sobre os fatores que influenciam os números e distribuição de CO, e GWRR. Até onde sabemos, o presente trabalho é o estudo mais abrangente comparando taxas de recombinação meiótica e interferência de CO dentro de uma espécie e entre pools de genes da mesma espécie. Usamos dois painéis de famílias de meio-irmãos de milho compreendendo 23 populações de irmãos completos com um total de 2.233 linhas DH para analisar a variação intraespecífica das taxas de recombinação e paisagens de recombinação. Os pais dos dois painéis para o milho Dent e Flint foram escolhidos para representar a diversidade presente no germoplasma de milho europeu. Analisamos as linhas DH produzidas por na Vivo indução haplóide, que reflete uma única meiose feminina. Como esperado, o número médio de cruzamentos por linha de DH em nosso estudo (15,1) foi cerca de metade do número observado em RILs de milho (28,9) [32]. Esta desvantagem das linhas DH é contrabalançada pelo desenvolvimento mais rápido das populações DH em comparação com RILs e pela homozigosidade completa das linhas DH, que são um recurso imortal. Além disso, trabalhar com populações DH oferece a possibilidade única de analisar a interferência do CO, enquanto isso é impossível em RILs porque as meioses independentes sucessivas sobrepõem os COs que surgem durante cada meiose. O design de nossos painéis de meio-irmão conectados compreendendo um grande número de populações permitiu comparações de GWRR, paisagem de recombinação e interferência (1) entre os pais dentro de cada painel e (2) entre os painéis por meio de cruzamentos das linhas centrais com a linha B73.

Como pré-requisito para nossa abordagem, construímos mapas genéticos de alta densidade para um grande número de populações. Os comprimentos do mapa genético das 23 populações variaram de 1.180 cM a 1.893 cM com uma média de 1.508 cM, que está na faixa observada em outros mapas genéticos de alta densidade de milho [32, 33]. Devido às regiões de IBD em algumas de nossas populações, lacunas foram observadas nos mapas genéticos. No entanto, como a maioria dessas lacunas estava em regiões pericentroméricas, onde as taxas de recombinação são baixas, a maioria delas não era maior que 15 cM, a lacuna mais extrema (53,7 cM) estando no cromossomo 7 em CFF13. Para 76 marcadores, encontramos atribuições cromossômicas diferentes de sua anotação no B73 AGPv2. Fornecemos coordenadas genéticas para 118 marcadores onde nenhuma anotação estava disponível. Esses resultados podem ajudar a melhorar as futuras assembleias do genoma B73. Além disso, mapas genéticos para várias regiões cromossômicas foram encontrados não colineares com a sequência B73, como foi previamente detectado em duas outras populações de milho [33]. Essas discrepâncias podem ser a consequência de montagens incorretas no genoma B73 ou devido à falta de especificidade de locus para alguns marcadores SNP que cairiam em regiões genômicas duplicadas. A hipótese de rearranjos estruturais entre algumas das linhas parentais e B73 não pode ser excluída. No entanto, dado o desenho do experimento, a possibilidade de que ambos os pais de uma cruz dentro de um dos painéis de meio-irmão compartilhem uma variação estrutural ausente de ambos os pais de outra cruz no mesmo painel é muito limitada.

Variação intraespecífica da taxa de recombinação

O GWRR médio em nossas populações foi de 0,73 cM / Mbp, que está no mesmo intervalo que pode ser calculado a partir de outros mapas de milho [30]. Este valor é cerca de 5 vezes menor do que em A. thaliana (3,6 cM / Mb) [40], que tem um genoma 20 vezes menor que o do milho, refletindo a conhecida correlação negativa da taxa de recombinação com o tamanho do genoma entre as espécies [41]. Encontramos diferenças claras entre as taxas de recombinação em todo o cromossomo, com o cromossomo 4 tendo o valor médio mais baixo (0,60 cM / Mbp) e o cromossomo 9 o mais alto (0,88 cM / Mb). Também observamos uma correlação negativa entre a taxa de recombinação e o comprimento físico dos cromossomos (r = 0.66, P valor 0,003), semelhante ao que ocorre em humanos, camundongos e ratos [19]. Essas correlações sugerem que os mecanismos que regulam a formação de CO nesses organismos tendem a impor algum nível de homeostase no número de COs por meiose e por cromossomo. Para cromossomos muito curtos, o CO obrigatório garante que haja pelo menos um CO para cada bivalente. Observamos clara variação intraespecífica para GWRR neste estudo. Níveis semelhantes de variação para GWRR foram observados em ambos os pools, uma vez que o efeito da linha central foi removido.

O cálculo do GWRR assume o tamanho do genoma constante do milho. As diferenças de tamanho do genoma foram relatadas no milho, com as linhas de milho temperadas tendo genomas até 10% menores em relação ao B73 e essas diferenças foram correlacionadas com o número de repetições de botão [42]. Os tamanhos do genoma para as linhas em nosso estudo são desconhecidos, entretanto, a diferença de até 60% nos comprimentos dos mapas (1.180 a 1.893 cM) em nosso estudo é muito maior do que as diferenças de tamanho do genoma relatadas recentemente [42]. Portanto, pode-se supor que, além da possível variação do tamanho do genoma, os fatores genéticos que influenciam o GWRR desempenham um papel importante em nosso material vegetal. Diferenças nas frequências de recombinação entre linhagens consanguíneas de milho foram descritas com base em mapas de ligação genética e usando métodos citológicos para detectar nódulos de recombinação e calcular taxas de CO [3, 43]. Trans-actores QTL que afetam GWRR foram identificados em A. thaliana, milho, camundongo e trigo [44]. Em bovinos, vários QTLs foram mapeados para machos GWRR [45].Para dois QTL, variantes causais putativas foram detectadas nos genes REC8 (um membro da família kleisin de proteínas de 'manutenção estrutural de cromossomos'), e RNF212, um suposto homólogo da levedura ZIP3 gene, que está envolvido na recombinação meiótica. RNF212 também é conhecido por estar associado à recombinação de todo o genoma em humanos [46]. Nossas descobertas em diferentes GWRR entre linhagens de milho individuais abrem caminho para o desenvolvimento de cruzamentos específicos para identificar fatores genéticos que influenciam GWRR por mapeamento de QTL [47]. Dados os avanços na genotipagem de alto rendimento e sequenciamento do genoma, tais QTL podem ser um ponto de partida para o mapeamento preciso e subsequente clonagem de genes que determinam GWRR em plantas. A caracterização da variação estrutural e funcional de tais genes promoveria nossa compreensão dos mecanismos moleculares que regulam a recombinação meiótica em plantas e seria uma ferramenta altamente valiosa para melhoristas de plantas e geneticistas.

Paisagens de recombinação em milho

Não apenas o GWRR, mas também as paisagens de recombinação ao longo dos cromossomos são altamente variáveis ​​em nossas populações. Observamos formas características das curvas do mapa de Marey para cada um dos 10 cromossomos do milho. Os perfis gerais de recombinação para cada cromossomo tendem a seguir a densidade do gene [34], mas isso não explica as diferenças locais na taxa de recombinação entre as populações. A variação estrutural entre as linhas parentais pode ser um mecanismo que influencia as taxas de recombinação local, como mostrado para um aglomerado de retrotransposões de 26 kb que reduziu a taxa de recombinação local em torno do bz1 locus por um fator dois [48]. Para a mesma região genômica, foi demonstrado que a estrutura do haplótipo, definida pela presença de helitrons e retrotransposons, afetou fortemente a ocorrência de eventos de recombinação em plantas heterozigotas [49]. A extensa variação estrutural no genoma do milho pode ser vista já no nível do cariótipo, onde a variação em grande escala foi relatada [50], mas ainda mais no nível da sequência, onde grande variação foi observada para o conteúdo de elemento repetitivo, presença-ausência ou número de cópias variantes [42, 51, 52]. Tais variações estruturais podem influenciar o pareamento de homólogos e recombinação [53], embora regiões invertidas também possam parear normalmente no paquiteno [54]. Além das baixas taxas de recombinação nas regiões heterocromáticas pericentroméricas e NOR e um aumento geral das taxas de recombinação em direção aos telômeros, observamos torções em nossas curvas do mapa de Marey em regiões onde protuberâncias heterocromáticas foram mapeadas no milho. Este é o caso, por exemplo, no cromossomo 4L em todas as populações, mas apenas em algumas populações no cromossomo 1L, sugerindo que pode haver variação nas regiões dos botões em nossas linhagens. Embora 34 regiões distintas de botão tenham sido descritas no milho e seu progenitor teosinto selvagem, a maioria das linhagens de milho contém menos de 12 desses botões, para os quais, além disso, polimorfismos são observados entre as linhas [38, 55]. Devido à falta de dados sobre as posições dos botões em nossas linhas parentais, não pudemos examinar mais de perto a influência do polimorfismo dos botões na forma das paisagens de recombinação para cromossomos individuais. Uma vez que os botões geralmente estão localizados em regiões densas de genes e suprimem a recombinação local [38], é provável que algumas diferenças nas formas da paisagem de recombinação sejam causadas pelo polimorfismo dos botões. Também fora das regiões de botão putativo, observamos muitas diferenças locais significativas na comparação de pares de perfis de recombinação entre as populações e para os cromossomos 2, 4, 5 e 6 entre as populações agrupadas de Dent e Flint. Não encontramos nenhuma correlação significativa entre a similaridade genética dos pais, conforme determinado pelos marcadores SNP e a taxa de recombinação, um resultado corroborado por um estudo recente em A. thaliana[40]. Assim, devem existir fatores que influenciam as taxas de recombinação local, além da densidade gênica e semelhança no nível do DNA. Deve-se afirmar, porém, que para caracterizar a influência de características genômicas, como diversidade de nucleotídeos na taxa de recombinação local, a escala de 10 Mbp pode ser muito grosseira, portanto, resolução muito maior na escala de quilobases pode ser necessária, como mostrado recentemente no modelo plantar Medicago truncatula[56]. Além disso, a diversidade parental avaliada pelos SNPs principalmente gênicos da matriz MaizeSNP50 pode não refletir bem as diferenças estruturais que podem ter um grande impacto nas taxas de recombinação local [49]. Nosso estudo identificou regiões genômicas com grandes diferenças nas taxas de recombinação local entre linhagens consanguíneas. Esta é uma base importante para estudos futuros para identificar pontos críticos de recombinação e estudar a influência da variação estrutural e diversidade do genoma em cruzamentos definidos e regiões genômicas no milho.

Interferência cruzada

Foi demonstrado anteriormente que a interferência ocorre no milho [17], com base nos números e posições dos nódulos de recombinação tardia. Esse trabalho encontrou duas vias de atuação no milho, uma interferindo (P1) e a outra (P2) contribuindo com uma proporção p de crossovers não interferentes. No presente estudo, também encontramos na maioria dos casos valores de p significativamente diferente de zero, com valores médios de 0,1. Esta conclusão é compatível com as estimativas anteriores que reportaram um valor médio de 0,15 [17]. As populações onde encontramos p = 0 (CFF04, CFF06, CFF13) pode refletir principalmente um baixo poder devido a tamanhos populacionais limitados: aqui, as populações individuais têm entre 50 e 134 linhas DH, enquanto em [17], o conjunto de dados tinha mais de 200 complexos sinaptonemais de paquiteno ( SCs), cada um deles dando cerca de quatro vezes mais poder para a análise do que uma linha DH. Deve-se notar, entretanto, que nossos testes estatísticos foram muito conservadores devido à correção de Bonferroni. Ainda assim, descobrimos que CFF02 tinha uma proporção p de cruzamentos não interferentes (P2) significativamente maiores do que quase todas as outras populações quando considerados todos os cromossomos reunidos. Até onde sabemos, as diferenças nas características de interferência entre diferentes genótipos da mesma espécie não foram mostradas até agora. Valores de p entre 0 e 0,2 para cromossomos diferentes foram relatados em A. thaliana[11], e entre 0 e 0,21 em humanos [57]. Com base em comparações entre focos MLH1 e nódulos de recombinação tardia, p valores em torno de 0,3 foram encontrados no tomate [14]. Considerando a intensidade nu de interferência na via de interferência P1, nossos resultados indicaram valores variando entre 2,5 e 8 para todos os cromossomos reunidos, o que é semelhante ao intervalo de 4 a 10 encontrado anteriormente no milho [17]. No Arabidopsis, nu estava na faixa de 10 a 21 [11], enquanto nu foi estimado estar na faixa de 6,9 ​​a 7,9 no tomate [14]. Finalmente, com base nas 23 populações de irmãos completos, encontramos uma correlação negativa significativa entre os grupos de cromossomos nu e a taxa de recombinação de todo o genoma. Este resultado é consistente com a hipótese de que a interferência pode ser um dos mecanismos em ação para regular o nível de recombinação meiótica, enviesando o reparo de DSBs para não-COs ao invés de COs. Em comparação com as diferenças altamente significativas encontradas para GWRR em nosso estudo, a variação para interferência de CO é detectada aqui com muito menos poder estatístico. Em trabalhos futuros com populações maiores, fornecendo intervalos de confiança menores, mas usando o mesmo design de meio-irmão, deve ser possível estimar os efeitos dos pais fundadores sozinhos nos parâmetros de interferência, removendo os efeitos das linhas centrais, como fizemos para GWRR. Da mesma forma que para GWRR, isso também deve permitir a identificação e localização de fatores genéticos que influenciam os parâmetros de interferência.

Impacto da variação nas taxas de recombinação em estudos genéticos e programas de melhoramento aplicados

Cobrir todo o genoma usando mapas genéticos densos aumenta a chance de detectar associações marcador-traço, tanto na análise de ligação quanto no mapeamento de associação. A construção de mapas genéticos de alta densidade agora é viável para muitas espécies de culturas de uma forma muito econômica, seja por arranjos de genotipagem SNP ou por meio de abordagens de genotipagem por sequenciamento [33, 58]. Para uma estimativa precisa dos efeitos de QTL em estudos de associação de todo o genoma e previsão de alta precisão de valores de reprodução em todo o genoma, é um pré-requisito que os marcadores marcem os alelos causais ou eles devem estar em alto desequilíbrio de ligação com o QTL de interesse [24, 59]. A fase de ligação entre o marcador e os alelos QTL favoráveis ​​é crucial ao prever valores de cruzamento entre raças ou pools de genes [60]. Os eventos de recombinação podem inverter as fases de ligação do marcador e alelos QTL entre pools não relacionados e, assim, levar a precisões reduzidas na previsão dos valores de cruzamento e efeitos do marcador. No contexto de estudos de predição genômica ou de associação de todo o genoma, a compreensão da paisagem de recombinação dentro de uma espécie é de particular interesse, uma vez que regiões com altas taxas de recombinação requerem densidades de marcadores mais altas. Além disso, uma imagem detalhada de todo o genoma e local das taxas de recombinação permite o dimensionamento adequado de projetos de clonagem baseados em mapas, estratégias de seleção assistida por marcadores para características específicas e programas de cruzamento em casos onde a ligação desfavorável entre as características precisa ser quebrada. A recombinação é um fator chave que determina o sucesso com a introgressão de nova variabilidade de recursos genéticos de plantas distantemente relacionados ou material mal adaptado, uma vez que a introgressão de novos alelos ou características como genes de resistência na seleção recorrente é frequentemente acompanhada por arrasto de ligação indesejado. Esses efeitos do arrasto de ligação podem ser drásticos se as regiões de interesse estiverem localizadas em regiões (peri) centroméricas pobres de recombinação. A escolha de linhas de elite com alto GWRR como pais retrocruzados recorrentes pode ajudar a acelerar o processo de introgressão. Finalmente, a identificação de genótipos portadores de alelos para maior taxa de recombinação pode orientar a escolha de pais adequados para otimizar o número de gerações necessárias em esquemas de reprodução. A variabilidade na força de interferência também pode ser de interesse em programas de melhoramento porque acredita-se que a interferência afeta mecanicamente as taxas de recombinação. Assim como para a seleção de linhagens com maiores ou menores taxas de recombinação [61], deve ser viável desenvolver linhagens de milho com diferentes níveis de interferência de CO ou proporção de P2 COs.


RootsTech Connect 2021: Lista abrangente de sessões de DNA

Gostaria de saber exatamente quantas sessões de DNA ocorreram na RootsTech este ano e quais são as mais populares.

Infelizmente, não podíamos ver facilmente uma lista de todas as sessões, então fiz a minha. Eu queria ter certeza de incluir todas as sessões, incluindo dicas e truques e sessões de fornecedores que podem estar disponíveis apenas em seus estandes. Eu vasculhei cada menu e grupo e continuei encontrando mais e mais tesouros de DNA enterrados em lugares diferentes.

Estou compartilhando este baú de tesouro com você abaixo. E, a propósito, isso levou um dia inteiro, porque listei o link direto do YouTube E quantas visualizações cada sessão acumulou hoje.

Vendas Estendidas

Os preços de venda do Family Tree DNA RootsTech, incluindo atualizações, ainda estão disponíveis & # 8211 aqui.

  • O testículo autossômico Family Finder FamilyTreeDNA agora custa apenas US $ 49.Clique aqui para comprar usando o código de cupom RTCTFF. está oferecendo a ferramenta avançada de desbloqueio por apenas US $ 9, após uma transferência gratuita até 7 de março. Clique aqui para se inscrever, carregue seu arquivo de DNA se você tiver testado em outro lugar e, em seguida, desbloqueie usando o código RTCAU10.

MyHeritage também estendeu seus negócios com a RootsTech.

  • MyHeritage dispensou a taxa de desbloqueio de $ 29 se você transferir seu kit de DNA de outro fornecedor entre agora e 7 de março. Você pode fazer upload, gratuitamente, aqui. Você obterá todas as ferramentas avançadas gratuitamente.
  • O kit MyHeritage DNA está à venda por $ 79, aqui.

Nem Ancestry nem 23andMe vendeu show, mas você pode comprar pelos preços normais.

Todos os genealogistas sérios vão querer testar ou transferir para todos os 4 principais fornecedores e testar seu DNA Y e DNA mitocondrial no FamilyTreeDNA.

Sessões RootsTech

Como você sabe, a RootsTech estava planejando o formato TED talk este ano. Sessões de aproximadamente 20 minutos. Quando tudo foi dito e feito, havia cinco categorias de sessões:

  • As sessões selecionadas são apresentações de aproximadamente 20 minutos, com curadoria da RootsTech, o que significa que os palestrantes devem enviar. As pessoas cujas sessões foram aceitas foram encorajadas a dividir as sessões mais longas em uma série de duas ou três sessões de 20 minutos.
  • Os vídeos dos estandes dos fornecedores podem ser carregados em suas botas virtuais sem a curadoria da RootsTech, mas os vídeos com curadoria de seus funcionários também podem ser carregados nos estandes dos fornecedores.
  • As sessões do DNA Learning Center foram a convite e fornecidas por voluntários. Eles duram geralmente entre 10-20 minutos.
  • Dicas e truques também são produzidos por voluntários e duram de 1 a 15 minutos. Eles podem ser patrocinados por uma empresa e, em alguns casos, pequenos fornecedores e provedores de serviços os utilizam para chamar a atenção para seus produtos e serviços.
  • As sessões de 1 hora tendem a ser avançadas e nenhum tópico pode ser facilmente dividido em uma série.

Veja esta incrível lista de 129 sessões relacionadas ao DNA ou relacionadas ao DNA que você pode assistir gratuitamente no próximo ano. Certifique-se de marcar este artigo para que você possa consultá-lo facilmente.

Observe que comecei a compilar esta lista para mim mesmo e encurtei alguns dos nomes das sessões. Então percebi que, se eu precisava disso, você também precisava.

As 10 sessões mais vistas

Eu não sabia se deveria listar essas sessões pelo nome do palestrante ou pelo número de visualizações, então estou fazendo um pouco de ambos.

As 10 sessões mais vistas de hoje são:

Palestrante / Vendedor Título da Sessão Modelo Ligação Visualizações
Libby Copeland Como os testes de DNA em casa redefiniram a história da família Sessão com curadoria https://youtu.be/LsOEuvEcI4A 13,554
Nicole Dyer Organize suas correspondências de DNA em um diagrama Dicas e truques https://youtu.be/UugdM8ATTVo 6175
Roberta Estes Triangulação de DNA: o quê, por quê e como 1 hora https://youtu.be/nIb1zpNQspY 6106
Tim Janzen Traçando Linhas Ancestrais em 1700 Usando DNA Parte 1 Sessão com curadoria https://youtu.be/bB7VJeCR6Bs 5866
Amy Williams Reconstrução de ancestral: por que, como, ferramentas Sessão com curadoria https://youtu.be/0D6lAIyY_Nk 5637
Drew Smith Antes de testar o básico - parte 1 Sessão com curadoria https://youtu.be/wKhMRLpefDI 5079
Nicole Dyer Como interpretar um gráfico de cluster de DNA Dicas e truques https://youtu.be/FI4DaWGX8bQ 4982
Nicole Dyer Como avaliar uma hipótese ThruLines Dicas e truques https://youtu.be/ao2K6wBip7w 4823
Kimberly Brown Por que não & # 8217t eu correspondo aos meus jogos e # 8217s DNA Learning Center https://youtu.be/A8k31nRzKpc 4593
Rhett Dabling, Diahan Southard Compreendendo os resultados da etnia do DNA Sessão com curadoria https://youtu.be/oEt7iQBPfyM 4287

Libby Copeland deve estar absolutamente emocionada. Percebi que a sessão dela foi apresentada no fim de semana em um local altamente proeminente no site da RootsTech.

Sessões por palestrante

A lista abaixo inclui as sessões de língua inglesa por palestrante. Peço desculpas por não ser capaz de discernir quais sessões em outros idiomas são sobre DNA.

Não deixe que um número menor de visualizações o desanime. Eu já assisti a alguns deles e eles são ótimos. Suspeito que as sessões de palestrantes mais conhecidos ou aquelas cujas sessões foram listadas nas áreas imobiliárias nobres têm mais visualizações, mas o que você precisa pode estar esperando apenas por você em outra sessão. Você não precisa escolher e escolher, e todos eles estão aqui para você em um só lugar.

Palestrante / Vendedor Título da Sessão Modelo Ligação Visualizações
Alison Wilde Método SCREEN: um sistema de notas de correspondência de DNA que realmente ajuda DNA Learning Center https://youtu.be/WaNnh_v1rwE 791
Âmbar castanho Genealogist-on-Demand: a ajuda de que você precisa com um orçamento que você pode pagar Sessão com curadoria https://youtu.be/9KjlD6GxiYs 256
Ammon Knaupp Padrão de herança genética DNA Learning Center https://youtu.be/Opr7-uUad3o 824
Amy Williams Reconstrução de ancestral: por que, como, ferramentas Sessão com curadoria https://youtu.be/0D6lAIyY_Nk 5637
Amy Williams Reconstruindo o DNA-pai e analisando parentes no HAPI-DNA, Parte 1 Sessão com curadoria https://youtu.be/MZ9L6uPkKbo 1021
Amy Williams Reconstruindo o DNA-pai e analisando parentes no HAPI-DNA, Parte 2 Sessão com curadoria https://youtu.be/jZBVVvJmnaU 536
Ancestralidade DNA Matches Sessão com curadoria https://youtu.be/uk8EKXLQYzs 743
Ancestralidade ThruLines Sessão com curadoria https://youtu.be/RAwimOgNgUE 1240
Ancestralidade Comunidades de DNA ancestral: Trazendo novas descobertas para sua pesquisa de história da família Sessão com curadoria https://youtu.be/depeGW7QUzU 422
Andre Kearns Ajudando os afro-americanos a rastrear ancestrais escravistas usando DNA Sessão com curadoria https://youtu.be/mlnSU5UM-nQ 2211
Barb Groth Eu te encontrei: métodos para encontrar membros escondidos da família Sessão com curadoria https://youtu.be/J93hxOe_KC8 1285
Beth Taylor Noções básicas de DNA e genealogia DNA Learning Center https://youtu.be/-LKgkIqFhL4 967
Beth Taylor O que eu faço com pares de primos? DNA Learning Center https://youtu.be/LyGT9B6Mh00 1349
Beth Taylor Usando DNA para encontrar parentes desconhecidos DNA Learning Center https://youtu.be/WGJ8IfuTETY 2166
David Ouimette I Am Adopted & # 8211 Como utilizo o DNA para encontrar meus pais? Sessão com curadoria https://youtu.be/-jpKgKMLg_M 365
Debbie Kennett Segredos e surpresas: descobrindo os mistérios da história da família por meio do DNA Sessão com curadoria https://youtu.be/nDnrIWKmIuA 2899
Debbie Kennett Genealogia genética encontra CSI Sessão com curadoria https://youtu.be/sc-Y-RtpEAw 589
Diahan Southard O que é um Centimorgan Dicas e truques https://youtu.be/uQcfhPU5QhI 2923
Diahan Southard Usando o projeto cM compartilhado DNA Learning Center https://youtu.be/b66zfgnzL0U 3172
Diahan Southard Compreendendo os resultados de etnia DNA Learning Center https://youtu.be/8nCMrf-yJq0 1587
Diahan Southard Problemas com Centimorgans Compartilhados DNA Learning Center https://youtu.be/k7j-1yWwGcY 2494
Diahan Southard 4 próximos passos para o seu DNA Sessão com curadoria https://youtu.be/poRyCaTXvNg 3378
Diahan Southard Respostas às suas perguntas sobre o DNA Sessão com curadoria https://youtu.be/uUlZh_VYt7k 3454
Diahan Southard Você pode fazer o DNA & # 8211 nós podemos ajudar Dicas e truques https://youtu.be/V5VwNzcVGNM 763
Diahan Southard O que é um DNA Match? Dicas e truques https://youtu.be/Yt_GeffWhC0 314
Diahan Southard Diahan & # 8217s Dicas para correspondências de DNA Dicas e truques https://youtu.be/WokgGVRjwvk 3348
Diahan Southard Diahan & # 8217s Dicas para Y DNA Dicas e truques https://youtu.be/QyH69tk-Yiw 620
Diahan Southard Diahan & # 8217s Dicas sobre testes de mtDNA Dicas e truques https://youtu.be/6d-FNY1gcmw 2142
Diahan Southard Diahan & # 8217s Dicas sobre resultados de etnia Dicas e truques https://youtu.be/nZFj3zCucXA 1597
Diahan Southard Diahan & # 8217s Dicas sobre qual teste de DNA fazer Dicas e truques https://youtu.be/t𔃂R8H8q0U 2043
Diahan Southard Diahan & # 8217s Dicas sobre quando seus pares não respondem Dicas e truques https://youtu.be/LgHtM3nS60o 3009
Diahan Southard Três Próximas Etapas: Usando Correspondências Conhecidas Dicas e truques https://youtu.be/z1SVq8ME42A 118
Diahan Southard Três próximas etapas: MRCA / DNA e a trilha de papel Dicas e truques https://youtu.be/JB0cVyk-Y4Q 80
Diahan Southard Três Próximas Etapas: Comece Com Combinações Conhecidas Dicas e truques https://youtu.be/BSNhaQCNtAo 68
Diahan Southard Três Próximas Etapas: Ferramentas Adicionais Dicas e truques https://youtu.be/PqNPBLQSBGY 140
Diahan Southard Três Próximas Etapas: Ancestry ThruLines Dicas e truques https://youtu.be/KWayyAO8p_c 335
Diahan Southard Três Próximas Etapas: Teoria da Relatividade de MyHeritage Dicas e truques https://youtu.be/Et2TVholbAE 80
Diahan Southard Três Próximas Etapas: Quem Testar Dicas e truques https://youtu.be/GyWOO1XDh6M 111
Diahan Southard Três Próximas Etapas: Genética vs Genealogia Dicas e truques https://youtu.be/Vf0DC5eW_vA 294
Diahan Southard Três Próximas Etapas: Definição Centimorgan Dicas e truques https://youtu.be/nQF935V08AQ 201
Diahan Southard Três próximas etapas: correspondências compartilhadas Dicas e truques https://youtu.be/AYcR_pB6xgA 233
Diahan Southard Três Próximas Etapas: Estudo de Caso & # 8211 Encontrando um MRCA Dicas e truques https://youtu.be/YnlA9goeF7w 256
Diahan Southard Três próximos passos: por que usar DNA Dicas e truques https://youtu.be/v-o4nhPn8ww 266
Diahan Southard Três Próximas Etapas: Encontrar Correspondências Conhecidas Dicas e truques https://youtu.be/n3N9CnAPr18 688
Diana Elder Usando estimativas de etnia de DNA em sua pesquisa Dicas e truques https://youtu.be/aJgUK3TJqtA 1659
Diane Elder Usando DNA em um projeto de pesquisa de cliente para resolver um mistério familiar 1 hora https://youtu.be/ysGYV6SXxR8 1261
Donna Rutherford DNA e os colonizadores de Taranaki, Nova Zelândia Sessão com curadoria https://youtu.be/HQxFwie4774 214
Drew Smith Antes de testar o básico - parte 1 Sessão com curadoria https://youtu.be/wKhMRLpefDI 5079
Drew Smith Antes de testar o básico - parte 2 Sessão com curadoria https://youtu.be/Dopx04UHDpo 2769
Drew Smith Antes de testar o básico - parte 3 Sessão com curadoria https://youtu.be/XRd2IdtA-Ng 2360
Elena Fowler Whakawhanaungatanga usando DNA & # 8211 It & # 8217s complicado (herança maori) Sessão com curadoria https://youtu.be/6XTPMzVnUd8 470
Elena Fowler Whakawhanaungatanga usando DNA & # 8211 FamilyTreeDNA (herança maori) Sessão com curadoria https://youtu.be/fM85tt5ad3A 269
Elena Fowler Whakawhanaungatanga usando DNA e ancestralidade # 8211 (herança maori) Sessão com curadoria https://youtu.be/-byO6FOfaH0 191
Esmee Mortimer-Taylor DNA vivo: Anathea Ring & # 8211 Her Story Dicas e truques https://youtu.be/MTE4UFKyLRs 189
Esmee Mortimer-Taylor DNA vivo: Coretta Scott King Academy & # 8211 revelam resultados de DNA Dicas e truques https://youtu.be/CK1EYcuhqmc 82
Fonte felipe Filtros étnicos e correspondências de DNA: o caminho a seguir para encontrar sua linhagem Sessão com curadoria https://youtu.be/mt2Rv2lpj7o 553
FTDNA e # 8211 Janine Cloud Big Y: O que é? Por que eu preciso disso? Sessão com curadoria https://youtu.be/jiDcjWk4cVI 2013
FTDNA e # 8211 Sherman McRae Usando DNA para encontrar ancestrais perdidos na escravidão Sessão com curadoria https://youtu.be/i3VKwpmttBI 738
Jerome Spears Primos distantes e evasivos da África: usando DNA, eles podem ser encontrados Sessão com curadoria https://youtu.be/fAr-Z78f_SM 335
Karen Stanbary Eliminar em vez de decidir: DNA e o GPS em ação 1 hora https://youtu.be/-WLhIHlSyLE 548
Katherine Borges DNA e sociedades de linhagem Dicas e truques https://youtu.be/TBYGyLHHAOI 451
Kimberly Brown Por que não & # 8217t eu correspondo aos meus jogos e # 8217s DNA Learning Center https://youtu.be/A8k31nRzKpc 4593
Kitty Munson Cooper Noções básicas de pesquisa de parentesco desconhecido usando DNA, parte 1 Sessão com curadoria https://youtu.be/2f3c7fJ74Ig 2931
Kitty Munson Cooper Noções básicas de pesquisa de parentesco desconhecido usando DNA - parte 2 Sessão com curadoria https://youtu.be/G7h-LJPCywA 1222
Lauren Vasylyev Encontrando primos através do DNA Sessão com curadoria https://youtu.be/UN7WocQzq78 1979
Lauren Vasylyev, Camille Andrus Encontrando ancestrais por meio do DNA Sessão com curadoria https://youtu.be/4rbYrRICzrQ 3919
Leah Larkin Desembaraçando a Endogamia - Parte 1 Sessão com curadoria https://youtu.be/0jtVghokdbg 2291
Leah Larkin Desembaraçando a Endogamia - Parte 2 Sessão com curadoria https://youtu.be/-rXLIZ0Ol-A 1441
Liba Casson-Budell Iluminando a genealogia judaica Sessão com curadoria https://youtu.be/pHyVz94024Y 162
Libby Copeland Como os testes de DNA em casa redefiniram a história da família Sessão com curadoria https://youtu.be/LsOEuvEcI4A 13,554
Linda Farrell Inicie sua pesquisa na África do Sul Sessão com curadoria https://youtu.be/So7y9_PBRKc 339
DNA vivo Como fazer um swab de DNA vivo Dicas e truques https://youtu.be/QkbxhqCw7Mo 50
Lynn Broderick Considerações éticas usando resultados de DNA Sessão com curadoria https://youtu.be/WMcRiDxPy2k 249
Mags Gaulden Importância e benefícios do teste de DNA Y DNA Learning Center https://youtu.be/MVIiv0H7imI 1032
Maurice Gleeson Usando Y -DNA para pesquisar seu sobrenome Sessão com curadoria https://youtu.be/Ir4NeFH_aJs 1140
Melanie McComb Projeto de memória de Georgetown: preservando as histórias do GU272 Sessão com curadoria https://youtu.be/Fv0gHzTHwPk 320
Michael Kennedy O que você pode fazer com o seu teste de DNA? DNA Learning Center https://youtu.be/rKOjvkqYBAM 616
Michelle Leonard Compreendendo a correspondência de DNA do cromossomo X Sessão com curadoria https://youtu.be/n784kt-Xnqg 775
Minha herança Como analisar correspondências de DNA em MH Sessão com curadoria https://youtu.be/gHRvyQYrNds 1192
Minha herança DNA & # 8211 uma visão geral Sessão com curadoria https://youtu.be/AIRGjEOg_xo 389
Minha herança Ferramentas avançadas de DNA Sessão com curadoria https://youtu.be/xfZUAjI5G_I 762
Minha herança Como começar com seus fósforos de DNA Dicas e truques https://youtu.be/rU_dq1vt6z4 1901
Minha herança Como filtrar e classificar suas correspondências de DNA Dicas e truques https://youtu.be/aJ7dRwMTt90 1008
Nicole Dyer Como interpretar um gráfico de cluster de DNA Dicas e truques https://youtu.be/FI4DaWGX8bQ 4982
Nicole Dyer Como avaliar uma hipótese ThruLines Dicas e truques https://youtu.be/ao2K6wBip7w 4823
Nicole Dyer Organize suas correspondências de DNA em um diagrama Dicas e truques https://youtu.be/UugdM8ATTVo 6175
Nicole Dyer Pesquisa nos estados do sul Sessão com curadoria https://youtu.be/Pouw_yPrVSg 871
Olivia Fordiani Compreendendo a genealogia genética básica DNA Learning Center https://youtu.be/-kbGOFiwH2s 810
Pamela Bailey Procura-se informação: reunindo uma família americana separada pela escravidão Dicas e truques https://youtu.be/DPCJ4K8_PZw 105
Patricia Coleman Introdução ao DNA Painter DNA Learning Center https://youtu.be/Yh_Bzj6Atck 1775
Patricia Coleman Adicionando Dados MyHeritage ao DNA Painter DNA Learning Center https://youtu.be/rP9yoCGjkLc 458
Patricia Coleman Adicionando dados 23andMe ao DNA Painter DNA Learning Center https://youtu.be/pJBAwe6s0z0 365
Penny Walters Misturando DNA com Paper Trail DNA Learning Center https://youtu.be/PP4SjdKuiLQ 2693
Penny Walters Colaborando com DNA Matches When You & # 8217re Adotado DNA Learning Center https://youtu.be/9ioeCS22HlQ 1222
Penny Walters Diferenças de etnia entre meus 6 filhos DNA Learning Center https://youtu.be/RsrXLcXRNfs 400
Penny Walters Diferenças nos resultados de DNA entre meus 6 filhos DNA Learning Center https://youtu.be/drnzW3FXScI 815
Penny Walters Dilemas éticos em testes de DNA DNA Learning Center https://youtu.be/PRPoc0nB4Cs 437
Penny Walters Adoção e # 8211 Contexto de fundo Sessão com curadoria https://youtu.be/qC1_Ln8WCNg 1054
Penny Walters Adoção & # 8211 Utilizando Teste de DNA para Construir uma Bio Árvore Genealógica Sessão com curadoria https://youtu.be/zwJ5QofaGTE 941
Penny Walters Adoção & # 8211 Dilemas éticos e várias consequências de se procurar uma família bio Sessão com curadoria https://youtu.be/ZLcHHTSfCIE 576
Penny Walters Eu quero minha mamãe: Egito antigo e moderno Sessão com curadoria https://youtu.be/_HRO50RtzFk 311
Rebecca Whitman Koford BCG: breve tour passo a passo pelo site do BCG Dicas e truques https://youtu.be/YpV9bKG6sXk 317
Renate Yarborough Sanders DNA Entendendo o básico DNA Learning Center https://youtu.be/bX_flUQkBEA 2713
Renate Yarborough Sanders Para testar ou não testar DNA Learning Center https://youtu.be/58-qzvN4InU 1048
Rhett Dabling Encontrando terras natais ancestrais por meio do DNA Sessão com curadoria https://youtu.be/k9zixg4uL1I 505
Rhett Dabling, Diahan Southard Compreendendo os resultados da etnia do DNA Sessão com curadoria https://youtu.be/oEt7iQBPfyM 4287
Richard Price Encontrando Família Biológica Dicas e truques https://youtu.be/L9C-SGVRZLM 101
Robert Kehrer Será que eles compartilharão meu DNA (consentimento, políticas, etc.) DNA Learning Center https://youtu.be/SUo-jpTaR1M 480
Robert Kehrer O que é um Centimorgan? DNA Learning Center https://youtu.be/dopniLw8Fho 1194
Roberta Estes Triangulação de DNA: o quê, por quê e como 1 hora https://youtu.be/nIb1zpNQspY 6106
Roberta Estes Ancestrais da mãe e # 8217s DNA Learning Center https://youtu.be/uUh6WrVjUdQ 3074
Robin Olsen Wirthlin Como o DNA pode me ajudar a encontrar meus ancestrais? Sessão com curadoria https://youtu.be/ZINiyKsw0io 1331
Robin Olsen Wirthlin DNA Tools Bell Curve Dicas e truques https://youtu.be/SYorGgzY8VQ 1207
Robin Olsen Wirthlin Árvores de processo de DNA orientam você no uso de DNA na pesquisa de história da família Dicas e truques https://youtu.be/vMOQA3dAm4k 1708
Shannon Combs-Bennett DNA Basics Made Easy DNA Learning Center https://youtu.be/4JcLJ66b0l4 1560
Shannon Combs-Bennett DNA Brick Walls DNA Learning Center https://youtu.be/vtFkT_PSHV0 450
Shannon Combs-Bennett Noções básicas de genealogia genética, parte 1 Sessão com curadoria https://youtu.be/xEMbirtlBZo 2263
Shannon Combs-Bennett Noções básicas de genealogia genética - parte 2 Sessão com curadoria https://youtu.be/zWMPja1haHg 1424
Steven Micheleti, montanha Joanna Consequências genéticas do comércio transatlântico de escravos, parte 1 Sessão com curadoria https://youtu.be/xP90WuJpD9Q 2284
Steven Micheleti, montanha Joanna Consequências genéticas do comércio transatlântico de escravos - parte 2 Sessão com curadoria https://youtu.be/McMNDs5sDaY 742
Thom Reed Como a conexão com os antepassados ​​pode nos completar? Sessão com curadoria https://youtu.be/gCxr6W-tkoY 392
Tim Janzen Traçando Linhas Ancestrais em 1700 Usando DNA Parte 1 Sessão com curadoria https://youtu.be/bB7VJeCR6Bs 5866
Tim Janzen Traçando Linhas Ancestrais em 1700 Usando DNA Parte 2 Sessão com curadoria https://youtu.be/scOtMyFULGI 3008
Ugo Perego Pontos fortes e limitações dos testes genéticos para história da família DNA Learning Center https://youtu.be/XkBK1y-LVaE 480
Ugo Perego Uma jornada genética pessoal DNA Learning Center https://youtu.be/Lv9CSU50xCc 844
Ugo Perego Descobrindo o ancestral nativo americano por meio do DNA Sessão com curadoria https://youtu.be/L1cs748ctx0 884
Ugo Perego DNA mitocondrial: nossa história familiar herdada pela mãe Sessão com curadoria https://youtu.be/Z5bPTUzewKU 599
Vivs Laliberte Introdução ao Y DNA DNA Learning Center https://youtu.be/rURyECV5j6U 752
Yetunde Moronke Abiola 6% nigeriano: rastreando meu antepassado nigeriano desaparecido Sessão com curadoria https://youtu.be/YNQt60xKgyg 494

Recebo uma pequena contribuição quando você clica em alguns dos links para fornecedores em meus artigos. Isso NÃO aumenta o preço que você paga, mas me ajuda a manter as luzes acesas e este blog informativo gratuito para todos. Clique nos links nos artigos ou nos fornecedores abaixo se você estiver comprando produtos ou testes de DNA.


Resposta-chave da planilha de análise de linhagem Respostas / planilha de gráfico genético Resposta | Planilhas para impressão e.

Resposta-chave da planilha de análise de linhagem Respostas / planilha de gráfico genético Resposta | Planilhas para impressão e. . O tema mais adequado absoluto pode realmente agilizar sua vida porque maximiza soluções desafiadoras, estilos sofisticados e. Criar um tema de planilha realmente pode ajudar a economizar muito tempo. Ele mostrará como fazer um gráfico de linhagem preciso. A velocidade do programa geralmente é importante para os consumidores, mas nos dias de hoje e nos dias de hoje, ela se tornou algo não apenas desejado, mas também esperado. D não pode ser descartado. Artigo de revisão de pedigrees pedigrees khan academy. Quais membros da família acima são afetados pela doença de Huntington? Com a planilha, os alunos podem entender o assunto assunto em geral com mais facilidade. Usar planilhas significa ajudar os alunos a responder a perguntas sobre tópicos que aprenderam. Análise de dados de espectro e estatísticas de probabilidade de 6 a 8 graus.

Se estiver limpo, ele tem coagulação sanguínea normal. Análise e projeto de circuitos microeletrônicos donald. Se estiver escuro, ele tem planilha de análise de linhagem de hemofilia a partir de respostas da planilha de linhagem, fonte:

Chave de respostas para planilha de linhagem humana - kidsworksheetfun de kidsworksheetfun.com Biologia da planilha de pedigree, planilha básica de pedigree, planilha de diagrama de pedigree, planilha de gráfico de pedigree com respostas, pedigree 33 melhores imagens genéticas no pinterest a partir de respostas de planilha de pedigree, fonte: Velocidade do programa geralmente importou para consumidores, mas nesta época de trabalho, torna-se algo não só a ser desejado, mas também esperado. A planilha de análise de linhagem responde à questão de como fazer uma análise de linhagem. Elaboração de uma planilha de linhagem de respostas, planilha de linhagem de tipo sanguíneo, planilha de linhagem com chave de respostas, planilha de linhagem de anemia falciforme. Este questionário e a planilha correspondente podem ajudá-lo a avaliar. Algumas das planilhas abaixo são planilhas de linhagem com respostas, explorando os componentes de uma linhagem :, analisando linhagens simples e interpretando uma linhagem humana com várias perguntas interessantes com respostas. Chave de planilha de linhagem i ii 1 2 1 2 4 5 3 = doença de Huntington & # 039s 6 7 8 iii 1 2 3 4 5 1. Resposta à planilha de linhagem biologia atividades kidz chave em todas as respostas da planilha de análise de linhagem. A planilha de análise de linhagem responde à parte a mostra.

O distúrbio causa falta de pigmento na pele e no cabelo, fazendo com que um albino apareça muito pálido com cabelos brancos e respostas claras para a planilha que examina os pedigrees em famílias com albinismo.

Planilha de análise de linhagem a partir das respostas da planilha de linhagem, fonte: .4 interpretar diagramas de linhagem trabalhar em um pequeno grupo ou sozinho para. Se estiver escuro, ele tem hemofilia. A planilha de análise de pedigree responde à pergunta de como fazer uma análise de pedigree. Usar planilhas significa ajudar os alunos a responder a perguntas sobre tópicos que aprenderam. Algumas das planilhas abaixo são planilhas de linhagem com respostas, explorando os componentes de uma linhagem :, analisando linhagens simples e interpretando uma linhagem humana com várias perguntas interessantes com respostas. Biologia da planilha de pedigree, planilha básica de pedigree, planilha de diagrama de pedigree, planilha de gráfico de pedigree com respostas, pedigree 33 melhores imagens de genética no pinterest a partir de respostas de planilha de pedigree, fonte: Com a planilha, os alunos podem entender o assunto em geral mais facilmente. Na análise de pedigree, é sempre importante tentar separar as causas ambientais das genéticas. À medida que as tecnologias aceleram, nossa cultura se tornou uma cultura na qual esperamos gratificação imediata. Quantos machos existem?

Em um pedigree, um quadrado representa um homem. .folha de respostas parte a é a maneira mais recente de definir a felicidade em todas as facetas de nossas vidas, incluindo a vida pessoal e os relacionamentos no trabalho. Se estiver limpo, ele tem coagulação sanguínea normal. Biologia 1 teste prático resposta chave twitpic 1 5 planilha respostas chaves studylib net home scholarassignments atribuição ensaios melhores serviços personalizados de escrita kahoot world history shorts 1 resposta key a corrida por riquezas notas geográficas formulário 3 download gratuito revisão kcse. Algumas das planilhas para este conceito são trabalho de linhagem com chave de resposta, chave de resposta de trabalho de genética de linhagem humana, chave de resposta de trabalho de linhagem, trabalho de gráficos de linhagem, trabalho de linhagem de classe de nomes, problemas e respostas de prática de gráfico de linhagem, prática de linhagens.Análise de linhagem da história genética da família e seus transtornos. Criar um tema de planilha realmente pode ajudar a economizar muito tempo.

8 Melhores Imagens de Cracking Your Genetic Code Worksheet. de www.worksheeto.com Um pedigree é um gráfico dos ancestrais de uma pessoa que é usado para analisar a herança de certos trens, especialmente doenças. Quantos machos existem? Se estiver claro, ele tinha coagulação sanguínea normal. Em um pedigree, um quadrado representa um homem. Se estiver limpo, ele tem coagulação sanguínea normal. No site do Paulik & # 039s, você pode baixar o formulário de inscrição do ielts, folhas de respostas, tópicos e links para as respostas, descrição da pontuação da banda para entender o que você já deve saber sobre o teste. D não pode ser descartado.

.folha de respostas parte a é a maneira mais recente de definir a felicidade em todas as facetas de nossas vidas, incluindo a vida pessoal e os relacionamentos no trabalho.

Análise de dados de espectro e estatísticas de probabilidade de 6 a 8 graus. .folha de respostas parte a é a maneira mais recente de definir a felicidade em todas as facetas de nossas vidas, incluindo a vida pessoal e os relacionamentos no trabalho. Muitos motivadores interpretam erroneamente o material que fornecem ao se encontrar com o público. Com a planilha, os alunos podem entender o assunto assunto em geral com mais facilidade. Se estiver escuro ele tem hemofilia Musa 14 de maio de 2018 planilhas sem comentários. Se estiver escuro, ele tem hemofilia. Um pedigree é um gráfico dos ancestrais de uma pessoa que é usado para analisar a herança de certos trens, especialmente doenças. Em um pedigree, um quadrado representa um homem. Chave de resposta da planilha de linhagem genética - chave de resposta da planilha de linhagem genética e chave de resposta das planilhas de gráfico de linhagem são alguns dos itens principais que apresentaremos a você com base no título da galeria. Folha de cálculo de linhagem genética chave de resposta folha de trabalho de linhagem genética chave de resposta e folha de trabalho de gráfico de linhagem são algumas das principais coisas que iremos analisar. Chave da planilha de linhagem i ii 1 2 1 2 4 5 3 = doença de Huntington & # 039s 6 7 8 iii 1 2 3 4 5 1. É uma característica recessiva porque a geração ii não tem a doença e as gerações i e ii a têm.

Artigo de revisão de pedigrees pedigrees khan academy. 84 respostas da planilha de linhagem genética louboutinsoldes org. É um traço recessivo porque a geração ii não tem a doença e as gerações i e ii a têm. Identifique os genótipos dos seguintes indivíduos usando o pedigree fornecido acima. Se estiver limpo, ele tem coagulação sanguínea normal. 32 respostas da planilha de linhagem. Usar planilhas significa ajudar os alunos a responder a perguntas sobre tópicos que aprenderam. Análise de linhagem da história genética da família e seus transtornos. Análise e projeto de circuitos microeletrônicos donald.

Construindo Respostas para uma Planilha de Linhagem. de ecdn.teacherspayteachers.com Identifique os genótipos dos seguintes indivíduos usando o pedigree fornecido acima. Análise de dados de espectro e estatísticas de probabilidade de 6 a 8 graus. A planilha de pedigree responde às principais atividades de biologia do kidz ao longo das respostas da planilha de análise de pedigree. Muitos motivadores interpretam erroneamente o material que fornecem ao se encontrar com o público. Usar planilhas significa ajudar os alunos a responder a perguntas sobre tópicos que aprenderam. Nossa biblioteca digital salva em vários locais, permitindo que você obtenha o. Se estiver escuro ele tem hemofilia

Chave de resposta da planilha de linhagem genética - chave de resposta da planilha de linhagem genética e chave de resposta das planilhas de linhagem são alguns dos itens principais que apresentaremos a você com base no título da galeria.

Se estiver limpo, ele tem coagulação sanguínea normal. Chave de resposta da planilha de linhagem genética - chave de resposta da planilha de linhagem genética e chave de resposta das planilhas de linhagem são alguns dos itens principais que apresentaremos a você com base no título da galeria. Análise de linhagem da história genética da família e seus transtornos. Linhagem, planilha de pedigree autossômica divertida e imprimível, análise de pedigree, planilha de gráfico de linhagem divertida e imprimível, genética mendeliana de gráfico de linhagem. Com a planilha, os alunos podem entender o assunto assunto em geral com mais facilidade. Se estiver escuro, ele tem hemofilia. Na análise de pedigree, é sempre importante tentar separar as causas ambientais das genéticas. C também é teoricamente possível, mas não é necessário invocar essa possibilidade como causa. Heterozigoto com pedigree masculino e feminino apresenta traço. Planilha de gráfico de linhagem com as 11 melhores imagens de. Em um pedigree, um quadrado representa um homem. Quantos machos existem?

Um gráfico de linhagem típico para uma família que possui uma planilha de análise de linhagem - linhas-chave de linhagem de respostas de irmãs amebas de três anos atrás 9.

Folha de cálculo de linhagem genética chave de resposta folha de trabalho de linhagem genética chave de resposta e folha de trabalho de gráfico de linhagem são algumas das principais coisas que iremos analisar.

Chave da planilha de linhagem i ii 1 2 1 2 4 5 3 = doença de Huntington e # 039s 6 7 8 iii 1 2 3 4 5 1.

Se estiver limpo, ele tem coagulação sanguínea normal.

Ele mostrará como fazer um gráfico de linhagem preciso.

A planilha de análise de linhagem responde à questão de como fazer uma análise de linhagem.

Algumas das planilhas para este conceito são trabalho de linhagem com chave de resposta, chave de resposta de trabalho de genética de linhagem humana, chave de resposta de trabalho de linhagem, trabalho de gráficos de linhagem, trabalho de linhagem de classe de nomes, problemas e respostas de prática de gráfico de linhagem, prática de linhagens.

& # 183 planilha de linhagem genética chave de respostas ou planilha de linhagem genética.

Chave da planilha de linhagem i ii 1 2 1 2 4 5 3 = doença de Huntington e # 039s 6 7 8 iii 1 2 3 4 5 1.

84 respostas da planilha de linhagem genética louboutinsoldes org.

As respostas da planilha de análise de linhagem como um derivado de grandes ideias respondem a perguntas.

Este questionário e a planilha correspondente podem ajudá-lo a avaliar.

Algumas das planilhas para este conceito são trabalho de linhagem com chave de resposta, chave de resposta de trabalho de genética de linhagem humana, chave de resposta de trabalho de linhagem pdf, gráfico de linhagem trabalho, trabalho de linhagem de classe de nome, gráfico de linhagem.

Se estiver claro, ele tinha coagulação sanguínea normal.

A planilha de análise de linhagem responde à parte a mostra.

No site do Paulik & # 039s, você pode baixar o formulário de inscrição do ielts, folhas de respostas, tópicos e links para as respostas, descrição da pontuação da banda para entender o que você já deve saber sobre o teste.

Ele mostrará como fazer um gráfico de linhagem preciso.

.4 interpretar diagramas de linhagem trabalhar em um pequeno grupo ou sozinho para.

Planilha de gráfico de linhagem com as 11 melhores imagens de.

Se estiver claro, ele tinha coagulação sanguínea normal.

No site do Paulik & # 039s, você pode baixar o formulário de inscrição do ielts, folhas de respostas, tópicos e links para as respostas, descrição da pontuação da banda para entender o que você já deve saber sobre o teste.

Linhagem, planilha de pedigree autossômica divertida e imprimível, análise de pedigree, planilha de gráfico de linhagem divertida e imprimível, genética mendeliana de gráfico de linhagem.

Este questionário e a planilha correspondente podem ajudá-lo a avaliar.

Folha de cálculo de linhagem genética chave de resposta folha de trabalho de linhagem genética chave de resposta e folha de trabalho de gráfico de linhagem são algumas das principais coisas que iremos analisar.

Se estiver escuro ele tem hemofilia

C também é teoricamente possível, mas não é necessário invocar essa possibilidade como causa.

Biologia 1 teste prático resposta chave twitpic 1 5 planilha respostas chaves studylib net home scholarassignments atribuição ensaios melhores serviços personalizados de escrita kahoot world history shorts 1 resposta key a corrida por riquezas notas geográficas formulário 3 download gratuito revisão kcse.

As respostas da planilha de análise de linhagem como um derivado de grandes ideias respondem a perguntas.


Resultados

ReLERNN: um método preciso para estimar o cenário de recombinação de todo o genoma

Desenvolvemos ReLERNN, um novo método de aprendizado profundo para prever com precisão as taxas de recombinação por base em todo o genoma de apenas quatro cromossomos. Resumidamente, ReLERNN fornece um pipeline inferencial de ponta a ponta para estimar um mapa de recombinação a partir de uma amostra de população: leva como entrada um arquivo de formato de chamada variante (VCF) ou, no caso de ReLERNN para dados Pool-seq, um vetor de frequências de alelos e coordenadas genômicas. ReLERNN então usa o programa de simulação coalescente, msprime (Kelleher et al. 2016), para simular o treinamento, validação e conjuntos de dados de teste sob tamanho de população constante ou um histórico de tamanho de população inferido. É importante ressaltar que essas simulações são parametrizadas para corresponder à distribuição do estimador de Watterson, θC, calculado a partir de amostras empíricas. ReLERNN treina um tipo específico de RNN, conhecido como uma unidade recorrente bloqueada (GRU Cho et al. 2014), para prever a taxa de recombinação por base para essas simulações, usando apenas a matriz de genótipo bruto e um vetor de coordenadas genômicas para cada simulação exemplo (fig. 1 e figs. S1 e S2 complementares, Material Suplementar online). Em seguida, usa essa rede treinada para estimar as taxas de recombinação por base em todo o genoma para amostras empíricas usando uma abordagem de janela deslizante. O ReLERNN pode, opcionalmente, estimar o IC de 95% em torno de cada previsão usando uma abordagem de bootstrapping paramétrica e usa as previsões geradas durante o bootstrapping para corrigir os vieses inerentes no processo de treinamento (ver Materiais e Métodos suplementares fig. S3, Material Suplementar online).

Um desenho animado que descreve um fluxo de trabalho típico usando os quatro módulos do ReLERNN (caixas sombreadas) para (UMA) genomas sequenciados individualmente ou (B) sequências agrupadas. O ReLERNN pode opcionalmente (linhas pontilhadas) utilizar a saída do diagrama de escada, SMC ++ e MSMC para simular um histórico demográfico com msprime. Os inlays de treinamento mostram as arquiteturas de rede usadas, com o inlay GRU em (B) representando as conexões bloqueadas dentro de cada unidade oculta. Aqui, r, z, ht, e h t ˜ são a porta de reinicialização, a porta de atualização, a ativação e a ativação candidata, respectivamente (Cho et al. 2014). A matriz do genótipo codifica alelos como referência (-1), alternativa (1) ou dados preenchidos / ausentes (0 não mostrado). As posições das variantes são codificadas ao longo da linha de número real (0–1).

Um desenho animado que descreve um fluxo de trabalho típico usando os quatro módulos do ReLERNN (caixas sombreadas) para (UMA) genomas sequenciados individualmente ou (B) sequências agrupadas. O ReLERNN pode opcionalmente (linhas pontilhadas) utilizar a saída do diagrama de escada, SMC ++ e MSMC para simular um histórico demográfico com msprime. Os inlays de treinamento mostram as arquiteturas de rede usadas, com o inlay GRU em (B) que descreve as conexões bloqueadas dentro de cada unidade oculta. Aqui, r, z, ht, e h t ˜ são a porta de reinicialização, a porta de atualização, a ativação e a ativação candidata, respectivamente (Cho et al. 2014). A matriz do genótipo codifica alelos como referência (-1), alternativa (1) ou dados preenchidos / ausentes (0 não mostrado). As posições das variantes são codificadas ao longo da linha de número real (0–1).

Uma característica fundamental da arquitetura de rede do ReLERNN é a camada GRU bidirecional (fig. 1 e fig. S1 suplementar, Material Suplementar online), que nos permite modelar alinhamentos de sequência genômica como uma série temporal. Embora as redes feed-forward usem como entrada um bloco completo de dados para cada exemplo, as camadas recorrentes quebram cada alinhamento de genótipo em etapas de tempo correspondentes a coordenadas genômicas discretas e iteram ao longo das etapas de tempo sequencialmente. Em cada etapa de tempo, as GRUs modulam o fluxo de informações, usando portas de redefinição e atualização que controlam como a ativação é atualizada (Cho et al. 2014 Chung et al. 2014). Esse processo permite que o algoritmo de descida gradiente, conhecido como retropropagação ao longo do tempo, compartilhe parâmetros em etapas de tempo, bem como faça inferências com base na ordenação de SNPs - ou seja, ter uma memória espacial de associações alélicas ao longo do cromossomo. O atributo bidirecional da camada GRU significa simplesmente que cada exemplo é duplicado e revertido, de modo que os dados da sequência são analisados ​​em ambas as direções e, em seguida, mesclados por concatenação. Apresentamos um GRU generalizado para analisar dados de sequência genômica, juntamente com uma visão mais detalhada dos parâmetros de arquitetura de rede usados ​​pelo ReLERNN na figura suplementar S1, Material Suplementar online.

Desempenho em cromossomos simulados

Para avaliar nosso método, realizamos simulações coalescentes usando msprime (Kelleher et al. 2016), gerando amostras de cromossomos inteiros usando um mapa genético em escala fina estimado a partir de cruzamentos de D. melanogaster (Comeron et al. 2012). Em seguida, usamos ReLERNN para estimar a paisagem de recombinação para esses exemplos simulados. ReLERNN é capaz de prever a paisagem das taxas de recombinação por base com um alto grau de precisão em uma ampla gama de valores de parâmetros realistas, suposições e tamanhos de amostra (⁠ R 2 ≥ 0,82 ⁠ erro absoluto médio [MAE] ≤ 1,28 × 10 - 8 ⁠). É importante ressaltar que a precisão do ReLERNN é apenas modestamente diminuída ao comparar as previsões baseadas em 20 amostras (⁠ R 2 = 0,93 ⁠ MAE = 3,72 × 10 - 9 ⁠ fig. 2A) com aquelas baseadas em quatro amostras (⁠ R 2 = 0,82 ⁠ MAE = 6,66 × 10 - 9 ⁠ suplementar fig. S4, material suplementar online). Também mostramos que ReLERNN tem um desempenho igualmente bom em genótipos faseados e não faseados (C = 68.5 P = 0,17 Mann – Whitney você teste suplementar fig. S5, Material Suplementar online), sugerindo que qualquer efeito de erro de faseamento computacional pode ser mitigado tratando as entradas como variantes não faseadas.

(UMA) Previsões de taxa de recombinação para um simulado Drosófila cromossomo (linha preta) usando ReLERNN para genomas sequenciados individualmente (linha vermelha). A paisagem de recombinação foi simulada para n = 20 cromossomos sob tamanho populacional constante usando msprime (Kelleher et al. 2016), com taxas de crossover por base retiradas de D. melanogaster cromossomo 2L (Comeron et al. 2012). As fitas cinza representam 95% CI. R 2 é relatado para o modelo linear geral de taxas previstas em taxas verdadeiras e o erro absoluto médio foi calculado em todas as janelas de 100 kb. (B) Distribuição do erro bruto (⁠ r previsto - r verdadeiro ⁠) usando ReLERNN para dados Pool-seq. Pools simulados da mesma paisagem de recombinação acima, com n = 20 e (C) n = 50 cromossomos em uma faixa de profundidades de leitura simulada (⁠ 0,5 × a 5 × Inf representa profundidade de sequenciamento simulada infinita). São mostradas as previsões corrigidas por bootstrap (vermelho) e não corrigidas por bootstrap (branco NBSC).

(UMA) Previsões de taxa de recombinação para um simulado Drosófila cromossomo (linha preta) usando ReLERNN para genomas sequenciados individualmente (linha vermelha). A paisagem de recombinação foi simulada para n = 20 cromossomos sob tamanho populacional constante usando msprime (Kelleher et al. 2016), com taxas de crossover por base retiradas de D. melanogaster cromossomo 2L (Comeron et al. 2012). As fitas cinza representam 95% CI. R 2 é relatado para o modelo linear geral de taxas previstas em taxas verdadeiras e o erro absoluto médio foi calculado em todas as janelas de 100 kb. (B) Distribuição do erro bruto (⁠ r previsto - r verdadeiro ⁠) usando ReLERNN para dados Pool-seq. Pools simulados da mesma paisagem de recombinação acima, com n = 20 e (C) n = 50 cromossomos em uma faixa de profundidades de leitura simulada (⁠ 0,5 × a 5 × Inf representa profundidade de sequenciamento simulada infinita). São mostradas as previsões corrigidas por bootstrap (vermelho) e não corrigidas por bootstrap (branco NBSC).

Como o ReLERNN teve um desempenho extremamente bom em genótipos não faseados, especulamos que ele poderia ser capaz de coletar informações cruciais sobre as taxas de recombinação de um vetor de frequências alélicas sozinho. Portanto, pretendemos estender ReLERNN para trabalhar com dados Pool-seq, onde as únicas entradas são um vetor de frequências de alelos e suas correspondentes coordenadas genômicas. Surpreendentemente, ReLERNN exibe uma precisão modesta em dados de pool-seq simulados, apesar da amostra simulada e de profundidades de leitura tão baixas quanto n = 50 e cobertura = 50 × (⁠ R2 = 0,54 ⁠ MAE = 1,59 × 10 - 8 ⁠ fig. Suplementar S6, Material suplementar online). Aumentando a profundidade de leitura para 5 × nominal, a profundidade da amostra (por exemplo, n = 50 e cobertura = 250 × ⁠) produziu uma precisão substancialmente maior (⁠ R 2 = 0,69 ⁠ MAE = 1,20 × 10 - 8 ⁠ fig. Suplementar S7, Material suplementar online). Como uma tendência geral, mostramos que o erro de predição é reduzido aumentando o número de cromossomos amostrados no pool (ou seja, aumentando a resolução da frequência do alelo) e aumentando a profundidade de sequenciamento (ou seja, reduzindo o erro de amostragem) (fig. 2B). Embora exista atualmente um software para estimar LD em dados Pool-seq (Feder et al. 2012), até onde sabemos, ReLERNN é o primeiro software a estimar diretamente as taxas de recombinação usando esses dados.

Embora ReLERNN retenha a precisão em tamanhos de amostra pequenos, ele exibe uma sensibilidade um pouco maior tanto para a taxa de mutação média assumida em todo o genoma, μ ¯ ⁠, quanto para o valor máximo assumido para recombinação, ρmax. Para avaliar o grau de sensibilidade a essas suposições, executamos ReLERNN em cromossomos simulados assumindo que μ ¯ era 50% maior e 50% menor do que a taxa de mutação simulada, µverdade. Em ambos os cenários, ReLERNN prevê taxas de crossover que são altamente correlacionadas com as taxas verdadeiras (⁠ R 2 & gt 0,91 ⁠). No entanto, em ambos os cenários, MAE é inflado, mas ainda modesto, e as taxas absolutas de recombinação são subestimadas (⁠ R 2 = 0,91 ⁠ MAE = 1,23 × 10 - 8 ⁠ figura suplementar. S8, Material Suplementar online) e ligeiramente superestimada (⁠ R 2 = 0,94 ⁠ MAE = 1,28 × 10 - 8 ⁠ suplementar fig. S9, Material Suplementar online) ao assumir que μ ¯ é menor ou maior que µverdade, respectivamente. Além disso, subestimando ρmax faz com que ReLERNN subestime as taxas de recombinação aproximadamente proporcionais à magnitude da subestimativa (figs suplementares. S10 e S11, Material Suplementar online), enquanto superestimando ρmax causa apenas uma pequena perda de precisão (⁠ R 2 = 0,90 ⁠ MAE = 4,07 × 10 - 9 ⁠ fig. S12 suplementar, Material suplementar online). Juntos, esses resultados sugerem que ReLERNN está de fato aprendendo informações sobre a proporção de crossovers para mutações e, embora ReLERNN seja altamente robusto para suposições erradas ao prever taxas de recombinação relativas dentro de um genoma, cuidado deve ser tomado ao comparar taxas absolutas entre organismos com grandes diferenças nas estimativas da taxa de mutação por base ou para as espécies.Uma limitação adicional do ReLERNN é sua incapacidade de resolver totalmente os pontos críticos de taxas de recombinação estreitas (aqui definidas como regiões genômicas ≤ 10 -kb com r ≥ 50 × a média de todo o genoma). Simulamos hotspots de diferentes comprimentos [comprimento ∈ <2 kb, 4 kb, 6 kb, 8 kb, 10 kb>, r background = 2,5 e - 9, r hotspot = 1,25 e - 7] e descobrimos que os erros nos hotspots foram negativos correlacionado com o comprimento do ponto de acesso (suplementar fig. S13, Material Suplementar online), sugerindo que o sinal para crossovers em pontos de acesso está sendo inundado pela taxa de fundo dentro da janela focal, especialmente para pontos de acesso muito estreitos em relação à janela focal. Essa limitação pode ser de particular importância ao tentar resolver pontos de acesso em dados humanos, onde os comprimentos estão frequentemente entre 1 e 2 kb (Jeffreys et al. 2001 Jeffreys e maio de 2004).

ReLERNN compara favoravelmente aos métodos concorrentes, especialmente para tamanhos de amostra pequenos e sob especificação incorreta do modelo

Para avaliar a precisão do ReLERNN em relação aos métodos existentes, adotamos uma abordagem comparativa, por meio da qual fizemos previsões no mesmo conjunto de cromossomos de teste simulados usando métodos que diferem amplamente em suas abordagens. Especificamente, optamos por comparar o ReLERNN com dois tipos de métodos de aprendizado de máquina - um método de regressão impulsionado, FastEPRR (Gao et al. 2016) e um CNN recentemente descrito em Flagel et al. (2019) - e ambos LDhat (McVean et al. 2002) e LDhelmet (Chan et al. 2012), dois métodos de probabilidade aproximada amplamente citados. Simulamos independentemente 10 5 cromossomos usando msprime (Kelleher et al. 2016) [parâmetros: amostra _ tamanho ∈ <4, 8, 16, 32, 64>, recombinação _ taxa = U (0,0, 6,25 e - 8), mutação _ taxa = U (1,875 e - 8, 3,125 e - 8), comprimento = 3 e 5]. Metade deles foi simulada sob equilíbrio demográfico e a outra metade foi simulada sob um modelo demográfico realista (com base na expansão para fora da África de humanos europeus, ver Materiais e Métodos). Mostramos que ReLERNN supera todos os outros métodos, exibindo erro absoluto significativamente reduzido (⁠ | r previsto - r verdadeiro | ⁠) tanto no modelo demográfico quanto nas suposições de equilíbrio (⁠ T ≤ - 31 ⁠ P & lt 10 - 16 ⁠ post hoc de Welch duas amostras t-testes para todas as comparações figos complementares. S14 e S15, material suplementar online). ReLERNN também exibiu menos viés do que métodos baseados em probabilidade em uma gama de tamanhos de amostra (fig. 3), embora todos os métodos geralmente tenham um bom desempenho no maior tamanho de amostra testado (n = 64).

(UMA) Distribuição do erro bruto (⁠ r previsto - r verdadeiro ⁠) para cada método em 5.000 cromossomos simulados (1.000 para FastEPRR). Simulações independentes foram executadas sob um modelo de expansão do tamanho da população ou (B) equilíbrio demográfico. Os cromossomos amostrados indicam o número de sequências independentes que foram amostradas de cada simulação coalescente msprime (Kelleher et al. 2016). LDhelmet não pôde ser usado com n = 64 cromossomos e FastEPRR não pôde ser usado com n = 4.

(UMA) Distribuição do erro bruto (⁠ r previsto - r verdadeiro ⁠) para cada método em 5.000 cromossomos simulados (1.000 para FastEPRR). Simulações independentes foram executadas sob um modelo de expansão do tamanho da população ou (B) equilíbrio demográfico. Os cromossomos amostrados indicam o número de sequências independentes que foram amostradas de cada simulação coalescente msprime (Kelleher et al. 2016). LDhelmet não pôde ser usado com n = 64 cromossomos e FastEPRR não pôde ser usado com n = 4.

Também buscamos avaliar a robustez do ReLERNN para a especificação incorreta do modelo demográfico, onde diferentes modelos generativos são usados ​​para simular os conjuntos de treinamento e teste - por exemplo, treinamento em suposições de equilíbrio demográfico quando os dados de teste foram gerados por um gargalo populacional. Métodos robustos para este tipo de especificação incorreta são cruciais, já que a verdadeira história demográfica de uma amostra é freqüentemente desconhecida e os métodos usados ​​para inferir histórias de tamanho de população podem discordar ou não ser confiáveis ​​(veja a figura suplementar S21, Material Suplementar online). Além disso, as mudanças no tamanho da população alteram a paisagem de LD em todo o genoma (Slatkin 1994 Rogers 2014) e, portanto, têm o potencial de reduzir a precisão ou produzir estimativas de taxa de recombinação enviesadas.

Para este fim, treinamos ReLERNN em exemplos gerados sob equilíbrio e fizemos previsões em 5.000 cromossomos gerados pelo modelo demográfico humano especificado acima (e também realizamos o experimento recíproco fig. 4). Comparamos o ReLERNN com o CNN, LDhat e LDhelmet, com todos os métodos igualmente mal especificados (consulte Materiais e Métodos). Descobrimos que ReLERNN supera esses métodos em quase todas as condições, exibindo erro absoluto significativamente menor em ambas as direções de especificação incorreta do modelo demográfico (⁠ T ≤ - 26 ⁠ P WTT & lt 10 - 16 para todas as comparações, com exceção da comparação com LDhelmet usando 16 cromossomos (figs complementares. S16 e S17, Material Suplementar online). Mostramos que o erro diretamente atribuído à especificação incorreta do modelo (que denominamos erro marginal, ver Materiais e Métodos) é ocasionalmente maior em ReLERNN em relação a outros métodos, embora ReLERNN exiba o menor erro absoluto entre os métodos. Como principal exemplo disso, descobrimos que as previsões do LDhelmet não foram afetadas por nosso regime de especificação incorreta, mas essas previsões ainda eram, em média, menos precisas do que aquelas feitas por um ReLERNN especificado incorretamente. Curiosamente, o erro marginal é significativamente maior quando ReLERNN foi treinado em simulações de equilíbrio e testado em simulações demográficas do que sob o erro de especificação recíproco (T = 26,3 P WTT & lt 10 - 16 ⁠ suplementar fig. S18, material suplementar online). Embora isso seja verdade, é importante notar que o erro marginal médio para ReLERNN, em ambas as direções de especificação incorreta e em todos os tamanhos de amostra, nunca excedeu 3,90 × 10 - 9 ⁠, sugerindo que as informações adicionais obtidas a partir de um modelo demográfico informativo são limitadas .

(UMA) Distribuição do erro bruto (⁠ r previsto - r verdadeiro ⁠) para cada método em 5.000 cromossomos simulados após a especificação incorreta do modelo. Para a CNN e ReLERNN, as previsões foram feitas por treinamento em simulações de equilíbrio durante o teste em sequências simuladas sob um modelo de expansão do tamanho da população ou (B) treinamento em simulações demográficas enquanto testa em sequências simuladas em equilíbrio. Para LDhat e LDhelmet, as tabelas de consulta foram geradas usando valores de parâmetros que foram estimados a partir de simulações onde o modelo foi especificado incorretamente da mesma forma como descrito para CNN e ReLERNN acima. Os cromossomos amostrados indicam o número de sequências independentes que foram amostradas de cada simulação coalescente msprime (Kelleher et al. 2016). LDhelmet não pôde ser usado com n = 64 cromossomos e o modelo demográfico não pôde ser especificado incorretamente usando FastEPRR.

(UMA) Distribuição do erro bruto (⁠ r previsto - r verdadeiro ⁠) para cada método em 5.000 cromossomos simulados após a especificação incorreta do modelo. Para a CNN e ReLERNN, as previsões foram feitas por treinamento em simulações de equilíbrio durante o teste em sequências simuladas sob um modelo de expansão do tamanho da população ou (B) treinamento em simulações demográficas durante o teste de sequências simuladas em equilíbrio. Para LDhat e LDhelmet, as tabelas de consulta foram geradas usando valores de parâmetros que foram estimados a partir de simulações onde o modelo foi especificado incorretamente da mesma forma como descrito para CNN e ReLERNN acima. Os cromossomos amostrados indicam o número de sequências independentes que foram amostradas de cada simulação coalescente msprime (Kelleher et al. 2016). LDhelmet não pôde ser usado com n = 64 cromossomos e o modelo demográfico não pôde ser especificado incorretamente usando FastEPRR.

Além da especificação incorreta do modelo, as diferenças na proporção de eventos de conversão de genes homólogos para cruzamentos também podem influenciar a inferência das taxas de recombinação, pois os tratos de conversão quebram o LD dentro da janela de predição (Przeworski e Wall 2001 Gay et al. 2007). Tratamos o efeito da conversão gênica como outra forma de especificação incorreta do modelo, treinando em exemplos que careciam de conversão gênica e testando em exemplos que incluíam a conversão gênica. Como o ReLERNN usa msprime para todas as simulações de treinamento, e o msprime não pode simular a conversão de genes no momento, geramos todas as simulações de conjunto de teste com ms (Hudson 2002). Descobrimos que a inclusão da conversão gênica em nossas simulações distorceu nossas previsões, resultando em uma superestimativa da taxa de recombinação verdadeira (fig. S19 suplementar, Material Suplementar online). Além disso, a magnitude desse viés aumentou com a proporção de eventos de conversão gênica para cruzamentos, r GC r CO ⁠. Como esperado, também observamos um padrão semelhante de polarização para LDhelmet, embora a magnitude da polarização para LDhelmet tenha sido menor do que a exibida por ReLERNN para r GC r CO & gt 2 (T & gt 4,37 P WTT & lt 1,32 × 10 - 5 ⁠ fig suplementar. S19, Material Suplementar online). Como os erros nas chamadas de genótipo podem imitar a conversão de gene - por exemplo, uma amostra heterozigótica sendo chamada de homozigoto - filtrar chamadas SNP de baixa qualidade, seja pela remoção do genótipo individual ou por sites de mascaramento, tem o potencial de mitigar o viés induzido pela conversão de gene . No entanto, genótipos ausentes e locais inacessíveis têm o potencial de introduzir seus próprios preconceitos, destacando uma área onde os métodos de aprendizagem profunda podem ter uma vantagem única sobre as ferramentas tradicionais.

ReLERNN retém alta precisão em conjuntos de dados genômicos de baixa qualidade simulados

As ferramentas de aprendizagem profunda têm o potencial de funcionar excepcionalmente bem em conjuntos de dados genômicos de baixa qualidade, como aqueles com genomas de referência de baixa qualidade ou de baixa complexidade, em regimes de amostragem onde amostras individuais são precárias ou onde a base e o mapa pontuações de qualidade são suspeitas. Isso ocorre em parte porque tais atributos de qualidade genômica podem ser prontamente incorporados durante o treinamento, e métodos de aprendizado profundo podem generalizar, apesar dessas limitações. Para abordar o potencial do ReLERNN para servir como um ativo para pesquisadores que trabalham com dados de baixa qualidade - por exemplo, aqueles que estudam organismos não modelos - simulamos cromossomos de 1 Mb em uma paisagem de recombinação em escala fina aleatória e, em seguida, mascaramos frações crescentes de ambos genótipos e locais. Em seguida, treinamos ReLERNN com genótipos ausentes e inacessibilidade do genoma, e geramos previsões nos cromossomos simulados.

Mostramos que ReLERNN exibe alta precisão e baixo viés em conjuntos de dados com genótipos ausentes, mesmo quando a fração de dados ausentes aumenta para metade de todos os genótipos (fig. 5). Além disso, descobrimos que ReLERNN reduziu o viés e reduziu significativamente o erro absoluto do que o LDhelmet em 50% dos genótipos ausentes para ambos n = 4 e n = 20 (⁠ T ≤ - 2,8 ⁠ PWTT & lt 0,007 para ambas as comparações). Aqui, definimos genótipos ausentes como qualquer chamada de genótipo definida para um “.” no VCF, embora em teoria, um limite de qualidade simples para identificar genótipos ausentes também pudesse ser implementado. Além disso, testamos ReLERNN em níveis crescentes de inacessibilidade do genoma (até 75% de todos os sites inacessíveis), simulando um cenário onde a grande maioria dos sites não pode ser mapeada com precisão - por exemplo, em regiões genômicas de baixa complexidade ou para táxons sem referência assembléias. Aqui, inacessibilidade do genoma se refere a qualquer site sobrepondo uma janela na máscara de acessibilidade, onde toda a matriz de genótipos neste site é descartada. Mais uma vez, ReLERNN exibiu tendência reduzida de erro em todos os níveis de acessibilidade do genoma em relação ao LDhelmet (figura suplementar S20, Material Suplementar online). No entanto, os níveis de erro absoluto não foram significativamente diferentes entre os métodos após a correção para testes múltiplos (⁠ T ≤ - 2,1 ⁠ P WTT ≥ 0,043 para todas as comparações). Juntos, esses resultados sugerem que ReLERNN pode ser de interesse particular para pesquisadores que estudam organismos não-modelo ou para aqueles sem acesso a conjuntos de referência de alta qualidade.

(UMA) Distribuição do erro bruto (⁠ r previsto - r verdadeiro ⁠) para LDhelmet e ReLERNN quando apresentado com níveis variáveis ​​de genótipos ausentes para simulações com n = 4 e (B) n = 20 cromossomos. (C) Previsões de taxa em escala fina geradas por ReLERNN para uma paisagem de recombinação de 1 Mb (linha cinza) simulada com níveis variáveis ​​de genótipos ausentes, para n = 4 e (D) n = 20 cromossomos.

(UMA) Distribuição do erro bruto (⁠ r previsto - r verdadeiro ⁠) para LDhelmet e ReLERNN quando apresentado com níveis variáveis ​​de genótipos ausentes para simulações com n = 4 e (B) n = 20 cromossomos. (C) Previsões de taxa em escala fina geradas por ReLERNN para uma paisagem de recombinação de 1 Mb (linha cinza) simulada com níveis variáveis ​​de genótipos ausentes, para n = 4 e (D) n = 20 cromossomos.

As paisagens de recombinação são amplamente concordantes entre as populações africanas D. melanogaster

Usando nosso método, caracterizamos as paisagens de recombinação de todo o genoma de três populações de africanos D. melanogaster (amostrado em Camarões, Ruanda e Zâmbia). Cada população foi derivada do sequenciamento de dez embriões haplóides (detalhado em Pool et al. 2012 Lack et al. 2015), portanto, esses dados representam uma excelente oportunidade para explorar a alta precisão do ReLERNN em pequenos tamanhos de amostra. Os comprimentos das janelas genômicas selecionadas por ReLERNN foram aproximadamente consistentes entre as populações e variaram de 38 kb para os cromossomos 2R, 3L e 3R na Zâmbia, a 51 kb para o cromossomo X nos Camarões. Mostramos que as paisagens de recombinação em escala fina são altamente correlacionadas entre todas as três populações de D. melanogaster (em todo o genoma médio emparelhado de Spearman ρ = 0,76 ⁠ P & lt 10 - 16 ⁠ janelas de 100 kb fig. 6). O coeficiente de determinação pareado médio de todo o genoma entre as populações foi um pouco menor, R 2 = 0,63 (⁠ P & lt 10 - 16 ⁠ janelas de 100 kb), sugerindo que pode haver importantes diferenças específicas da população nos direcionadores de escala fina de alélico Associação. Essas diferenças também podem contribuir para diferenças dentro do cromossomo na taxa de recombinação entre as populações. De fato, estimamos que as taxas médias de recombinação são significativamente diferentes entre as populações para todos os cromossomos, com exceção do cromossomo 3L (⁠ P ≤ 3,78 × 10 - 4 ⁠ análise de variância unilateral). As comparações pareadas post hoc sugerem que esta diferença é amplamente impulsionada por uma elevada taxa de recombinação na Zâmbia, identificada em todos os cromossomos (⁠ P ≤ 8,21 × 10 - 4 ⁠ testes HSD de Tukey), exceto para 3L (⁠ P HSD ≥ 0,15 ⁠). ReLERNN prevê a taxa de recombinação em conjuntos de teste simulados com um alto grau de precisão para todas as três populações (⁠ R 2 ≥ 0,93 ⁠ P & lt 10 - 16 ⁠ figura suplementar. S23, Material Suplementar online), sugerindo que temos poder suficiente para discernir diferenças de escala fina nas taxas de recombinação por base em todo o genoma.

(UMA) Paisagens de recombinação de todo o genoma para Drosophila melanogaster populações de Camarões (linhas azul-petróleo), Ruanda (linhas roxas) e Zâmbia (linhas laranja). Caixas cinza denotam os limites de inversão previstos para segregar nessas amostras (Corbett-Detig e Hartl 2012 Pool et al. 2012). Os triângulos vermelhos marcam o 1% superior das janelas atípicas globais para a taxa de recombinação. Os triângulos azul, roxo e laranja marcam o 1% superior das janelas atípicas específicas da população para a taxa de recombinação, com a cor do triângulo indicando a população atípica (consulte Materiais e Métodos). (B) Taxas de recombinação por cromossomo para cada população. Spearman's ρ e R 2 são relatados como a média das estimativas de pares entre as populações de cada cromossomo. **P & lt 0,01 e ***P & lt 0,001 são baseados em testes HSD de Tukey para todas as comparações de pares.

(UMA) Paisagens de recombinação de todo o genoma para Drosophila melanogaster populações de Camarões (linhas azul-petróleo), Ruanda (linhas roxas) e Zâmbia (linhas laranja). Caixas cinza denotam os limites de inversão previstos para segregar nessas amostras (Corbett-Detig e Hartl 2012 Pool et al. 2012). Os triângulos vermelhos marcam o 1% superior das janelas atípicas globais para a taxa de recombinação. Os triângulos azul, roxo e laranja marcam o 1% superior das janelas atípicas específicas da população para a taxa de recombinação, com a cor do triângulo indicando a população atípica (consulte Materiais e Métodos). (B) Taxas de recombinação por cromossomo para cada população. Spearman's ρ e R 2 são relatados como a média das estimativas de pares entre as populações de cada cromossomo. **P & lt 0,01 e ***P & lt 0,001 são baseados em testes HSD de Tukey para todas as comparações de pares.

Ao comparar nossas estimativas de taxa de recombinação com aquelas derivadas de cruzamentos experimentais da América do Norte D. melanogaster (relatado em Comeron et al. 2012), descobrimos que os coeficientes de determinação em média sobre todas as três populações foram R 2 = 0,46, 0,70, 0,47, 0,08, 0,73 para os cromossomos 2L, 2R, 3L, 3R e X, respectivamente ( Figura suplementar S24, Material Suplementar online, janelas de 1 Mb). Esses resultados diferem daqueles observados por Chan et al. (2012), que comparou 22 D. melanogaster amostrado da mesma população de Ruanda com o mapa FlyBase e encontrado R 2 = 0,55, 0,63, 0,45, 0,42, 0,41 para os mesmos cromossomos. As pequenas diferenças que observamos entre os métodos para os cromossomos 2L, 2R, 3L e o cromossomo X podem provavelmente ser atribuídas ao fato de que estamos comparando estimativas de dois métodos diferentes, usando diferentes moscas africanas, para um mapa derivado experimentalmente diferente. No entanto, as maiores diferenças encontradas entre os métodos para o cromossomo 3R parecem menos provavelmente atribuíveis a diferenças metodológicas. Mais importante, africano D. melanogaster é conhecido por abrigar grandes inversões polimórficas, muitas vezes em freqüências apreciáveis ​​(Lemeunier e Aulard 1992 Aulard et al. 2002). Por exemplo, a inversão In (3R) K segregados em nossa população de Camarões em p = 0,9. Essas diferenças nas frequências de inversão potencialmente contribuem para a correlação excepcionalmente fraca observada usando nosso método para o cromossomo 3R.

Uma causa importante das diferenças específicas da população em paisagens de recombinação pode ser diferenças específicas da população nas frequências de inversões cromossômicas, uma vez que se espera que a recombinação seja fortemente suprimida entre os arranjos padrão e de inversão. Para testar um efeito de inferências de frequência de inversão feitas por ReLERNN, reamostramos genomas haploides da Zâmbia para criar amostras de população artificial com a inversão cosmopolita In (2L) t segregando em frequências variáveis, p ∈ <0,0, 0,2, 0,6, 1,0> ⁠. Na Zâmbia, In (2L) t surgiu recentemente (Corbett-Detig e Hartl 2012) e segregou em p = 0,22 (Lack et al. 2015), sugerindo que a recombinação dentro dos pontos de interrupção de inversão pode ser fortemente suprimida em indivíduos com o arranjo invertido em relação àqueles com o arranjo padrão. Por essas razões, prevemos que a taxa de recombinação inferida deve diminuir à medida que o arranjo invertido de baixa frequência está cada vez mais super-representado no conjunto de cromossomos amostrados (isto é, à medida que mais das amostras contêm os arranjos invertidos de alto LD). Conforme previsto, encontramos um forte efeito da frequência da amostra de In (2L) t nas taxas estimadas de recombinação para o cromossomo 2L na Zâmbia (figura suplementar S27, Material Suplementar online), demonstrando que ReLERNN é sensível à frequência de inversões recentes.

Para explorar ainda mais as diferenças específicas da população em paisagens de recombinação, adotamos uma abordagem de outlier estatístico, por meio da qual definimos dois tipos de outliers de taxa de recombinação - outliers globais e outliers específicos de população (consulte Materiais e Métodos). Outliers globais são caracterizados por janelas com variação excepcionalmente alta nas taxas de recombinação entre todas as três populações (fig. 6 triângulos vermelhos), enquanto outliers específicos de população são aquelas janelas onde a taxa de recombinação em uma população é fortemente diferenciada das taxas no outras duas populações (fig. 6 triângulos coloridos de população). Descobrimos que outliers específicos da população, mas não outliers globais, são significativamente enriquecidos dentro de inversões (P = 0,005 teste de randomização fig. 6 caixas cinza). Além disso, este enriquecimento permanece significativo ao estender os limites de inversão em até 250 kb (⁠ P rand ≤ 0,004 ⁠). No entanto, estender os limites de inversão além de 250 kb, ou restringir a sobreposição a janelas em torno apenas dos pontos de interrupção (250 kb, 500 kb, 1 Mb, 2 Mb), corrói esse padrão (⁠ P rand ≥ 0,055 para todas as comparações), sugerindo que o papel das inversões na geração de diferenças específicas da população nas taxas de recombinação é complexo, pelo menos para essas populações.

A seleção é outro fator importante que pode confundir a inferência das taxas de recombinação. Por exemplo, varreduras seletivas geram padrões localizados de alto LD em ambos os lados do local de varredura (Kim e Nielsen 2004 Schrider et al. 2015), portanto, as regiões que flanqueiam varreduras seletivas podem imitar regiões de recombinação reduzida. Na medida em que as varreduras seletivas específicas da população devem contribuir para as diferenças específicas da população nas estimativas da taxa de recombinação. Usamos diploS / HIC (Kern e Schrider 2018) para identificar varreduras seletivas duras e suaves em nossa África D. melanogaster e testamos um excesso de outliers de taxa de recombinação sobrepostos a janelas classificadas como varreduras. No total, diploS / HIC classificou 27,4%, 28,1% e 26,8% de todas as viúvas genômicas como varreduras seletivas (seja "difícil" ou "suave") para Camarões, Ruanda e Zâmbia, respectivamente, ao olhar para 5-kb janelas não sobrepostas. As taxas de descoberta falsa (FDR) associadas para chamar varreduras nessas populações foram apreciáveis: 33,9%, 33,1% e 34,7%, respectivamente (figura suplementar S26, Material suplementar online). Como esperado, as janelas classificadas como varreduras tiveram taxas significativamente mais baixas de recombinação em relação às janelas neutras em todas as três populações (⁠ P WTT ≤ 10 - 16 para todas as comparações suplementares fig. S25, Material Suplementar online). No entanto, descobrimos que nem os valores discrepantes específicos da população nem globais foram enriquecidos para varreduras seletivas (⁠ P rand ≥ 0,246 para ambas as comparações), sugerindo que, quando tratados como uma classe, os valores discrepantes da taxa de recombinação provavelmente não são causados ​​por varreduras nessas populações . Quando tratados separadamente (ou seja, testes de permutação independentes para cada janela de outlier de taxa de recombinação), identificamos sete outliers enriquecidos para varreduras no limiar de P ≤ 0,05, correspondendo a um FDR esperado de 77%. No entanto, dado nosso FDR para chamar varreduras nessas populações, nossa medida do enriquecimento em sobreposição com valores discrepantes da taxa de recombinação é provavelmente conservadora. Duas dessas janelas outlier podem representar potenciais verdadeiros positivos, um outlier em Camarões contém cinco das seis janelas não sobrepostas de 5 kb classificadas como varreduras "difíceis", a segunda de Ruanda tem 10 das 12 janelas classificadas como varreduras "duras" (Prand = 0,0 para ambas as comparações). Essas duas janelas atípicas de taxa de recombinação estão potencialmente maduras para estudos futuros sobre varreduras seletivas nessas populações e sugerem que, pelo menos em alguns casos, a seleção contribui para diferenças observadas nas estimativas das taxas de recombinação entre Drosófila populações.


Resultados

Para simular dados de linhagem realistas, SNPs foram selecionados do HapMap que abrangem 100 MB em ambos os lados de um par de sites vagamente vinculados. Existem 40 SNPs no total, com 20 SNPs fortemente vinculados em cada lado de um ponto de interrupção de recombinação forte tendo θ = 0,25. Os haplótipos para esses SNPs foram selecionados aleatoriamente no HapMap. Dados de haplótipo e genótipo de linhagem foram simulados para cada criança, selecionando uniformemente um dos alelos parentais para o primeiro locus, e loci subsequentes foram selecionados no mesmo haplótipo parental com probabilidade θ j para cada locus j. A herança foi simulada para 500 repetições de simulação.

A simulação rendeu pedigrees completamente digitados. Para cada linhagem, removemos as informações de genótipo e haplótipo para um número crescente de indivíduos não tipados. Para cada instância de um número específico de indivíduos não tipados, dois valores foram calculados no número estimado de recombinações entre o par central de loci: o haplótipo e as precisões do genótipo. A precisão foi calculada em função do eu1 distância entre o número determinístico de recombinações e a distribuição calculada. Especificamente, a precisão foi 2 - Σeu≥0|x eu- uma eu |, onde x eu foi a probabilidade estimada para eu recombinações e uma eu foi o indicador determinístico de se havia eu recombinações nos dados simulados no pedigree.

Em todos os casos, observamos uma tendência em que a melhor precisão foi obtida com dados de haplótipos em que todos no pedigree eram haplotipados. Por exemplo, um pedigree de cinco indivíduos com dois meio-irmãos é mostrado na Figura 3. Com os três fundadores não digitados, os dados do haplótipo produziram uma precisão semelhante aos dados do genótipo. Considere uma linhagem de três gerações com dois pais, seus dois filhos, um sogro e um neto para um total de seis indivíduos, três deles fundadores. Este pedigree tem uma tendência semelhante em precisão conforme o número de fundadores não tipados aumenta, Figura 4. Conforme o número de indivíduos não tipados aumenta, as precisões das estimativas de genótipo e haplótipo parecem convergir.

Previsão de recombinações para meio-irmãos. Esta é a precisão média para previsões de um pedigree com dois meio-irmãos e três pais. Quinhentas repetições de simulação foram realizadas, e a precisão média das estimativas dos dados de haplótipos é superior àquelas dos dados de genótipos. No entanto, à medida que o número de fundadores não digitados aumenta, em ambos os casos, a precisão das estimativas dos dados de haplótipos cai em relação à precisão dos dados do genótipo. As precisões das estimativas de genótipos e haplótipos parecem convergir.

Prevendo recombinações para três gerações. Esta figura mostra os resultados de precisão de um pedigree de três gerações de seis indivíduos. Novamente, quinhentas repetições de simulação foram realizadas, e a precisão média das estimativas dos dados de haplótipos é superior àquelas dos dados de genótipos. Mais uma vez, conforme o número de fundadores não digitados aumenta, a precisão das estimativas dos dados de haplótipos cai em relação à precisão dos dados do genótipo. As precisões das estimativas de genótipos e haplótipos parecem convergir.


Material eletrônico suplementar

13062_2011_277_MOESM1_ESM.PDF

Arquivo adicional 1: Loci gênicos identificados como estando sob recombinação homóloga intragênica usando os 4 métodos de análise de substituição de recombinação (valor p & lt 0,05). (PDF 129 KB)

Arquivo adicional 2: Loci gênicos sob seleção positiva inferida com base no teste geral (Teste 1). (PDF 104 KB)

Arquivo adicional 3: Loci gênicos sob seleção positiva com base no teste específico do local de filial (Teste 2). (PDF 112 KB)

13062_2011_277_MOESM4_ESM.PDF

Arquivo adicional 4: Eventos interclados inferidos pelo ClonalFrame agrupados de acordo com o clado afetado e o clado de origem. (PDF 98 KB)


Assista o vídeo: CLOSE - CÃO DE RAÇA (Agosto 2022).