Em formação

Qual é a vantagem de genomas circulares para bactérias e genomas lineares para outros organismos?

Qual é a vantagem de genomas circulares para bactérias e genomas lineares para outros organismos?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

As bactérias são um grande grupo de organismos. Eles têm genomas circulares e nunca foram para genomas lineares, enquanto outros organismos mostram a estratégia oposta e não têm genomas circulares (desconsiderando seu genoma citoplasmático). Por que eles seguiram essas estratégias diferentes?


Você pode empacotar genomas lineares com muito mais eficiência do que genomas circulares, e as bactérias simplesmente não precisam da densidade de informações para prosperar.

Para ser um pouco mais específico, é a tensão de torque aplicada na dupla hélice enquanto ela está sendo enrolada que faz a diferença. Os genomas lineares podem ser enrolados em torno das histonas, e essas histonas podem ser posteriormente formadas em padrões mais complexos e densos, de modo que o DNA de um genoma linear é condensado a uma mera fração do tamanho que tinha antes. A alta densidade permite que a divisão celular ocorra muito, muito mais facilmente do que aconteceria em células eucarióticas.

Genomas circulares não pode livrar-se das tensões de torque como os genomas lineares podem. Tentar um esquema de empacotamento semelhante ao das células eucarióticas resultaria na quebra do DNA em algum ponto antes de você atingir um alto nível de densidade de informação.

Vou olhar meus livros de BioChem novamente para encontrar uma referência mais tarde, mas espero que você tenha uma ideia sólida do "porquê" acima. Por enquanto, você pode fazer um pequeno experimento mental: pense em todas as maneiras de enrolar um único pedaço de barbante ou linha em volta das coisas para torná-lo o mais denso possível. Em seguida, pense em todas as maneiras de tentar alcançar a mesma densidade com um elástico sem quebrá-lo. A corda deve vencer na facilidade com que você pode manipulá-la e no nível de densidade que pode atingir.


Genomas Bacterianos

Todos os organismos vivos contêm DNA. Esta incrível macromolécula codifica todas as informações necessárias para programar as atividades da célula, incluindo reprodução, metabolismo e outras funções especializadas. O DNA é composto por duas fitas de desoxinucleotídeos. Cada desoxinucleotídeo contém um fosfato, um açúcar de 5 carbonos (2-desoxirribose) e uma das quatro bases nitrogenadas: adenina, citosina, timina ou guanina. O fosfato e o açúcar constituem a espinha dorsal de cada fita de DNA, enquanto as bases são responsáveis ​​por manter as duas fitas juntas por meio de ligações de hidrogênio em uma estrutura chamada de dupla hélice (veja a figura). A ordem das bases em uma fita de DNA contém a informação genética codificada. Todo o DNA encontrado em um organismo é conhecido coletivamente como genoma. O genoma humano é composto por 23 pares de cromossomos lineares e aproximadamente 3.000 megabases (Mb) de DNA, enquanto o genoma da bactéria Escherichia coli consiste em um único cromossomo circular de 4,6 Mb. Ao estudar os genomas das bactérias, somos capazes de compreender melhor suas capacidades metabólicas, sua capacidade de causar doenças e também sua capacidade de sobreviver em ambientes extremos. Muitos dos organismos modelo bacterianos bem estudados, como E. coli, têm um único cromossomo circular. No entanto, avanços na genética molecular mostraram que as bactérias possuem arranjos mais complexos de seu material genético do que apenas um único cromossomo circular por célula. Alguns genomas bacterianos são compostos de vários cromossomos e / ou plasmídeos e muitas bactérias abrigam várias cópias de seu genoma por célula. A seguir estão alguns exemplos de bactérias com genomas incomuns.


O que é DNA linear?

O DNA linear está presente nos genomas eucarióticos dentro do núcleo da célula. O DNA linear é composto por duas extremidades livres e, portanto, é uma estrutura aberta. O DNA linear pode ser isolado e separado em meio de gel de agarose, embora devido ao volume do DNA, uma mancha seria observada no gel. A fim de isolar e separar os fragmentos desejados de DNA linear, o DNA pode ser cortado usando endonucleases de restrição e então observado em um gel executado.

Figura 01: DNA linear

O processo de replicação do DNA linear é um processo muito complexo, pois envolve muitos mecanismos. A replicação ocorre de forma bidirecional, onde dois garfos de replicação são formados. O DNA linear pode conter muitas origens de locais de replicação, pois o DNA linear é muito longo e complexo. O procedimento de replicação continua até que a terminação ocorra após a resolução do problema de terminação final, uma vez que o DNA linear é composto de sequências teloméricas.


O que é o Genoma Eucariótico?

Os eucariotos são o organismo que possui um núcleo e organelas celulares ligadas à membrana. Eles têm amplos compartimentos celulares que desempenham funções distintas. Dentro do núcleo dos eucariotos, podemos encontrar o genoma eucariótico que contém toda a informação genética do organismo. Principalmente, o genoma eucariótico existe como cromossomos lineares. Além disso, as moléculas de DNA, juntamente com as proteínas histonas, formam esses cromossomos. No genoma humano, há um total de 46 cromossomos em cada célula. A membrana nuclear envolve todos esses cromossomos. Portanto, eles não podem chegar ao citoplasma da célula, a menos que se tornem moléculas de mRNA. Além disso, em eucariotos, mitocôndrias e cloroplastos contêm algumas moléculas de DNA. No entanto, eles não são DNA genômico.

Figura 02: Genoma Eucariótico

O genoma eucariótico é menos compacto e contém sequências repetitivas, bem como muitas sequências não codificantes, como íntrons e DNA espaçador. Em comparação com o genoma procariótico, o genoma eucariótico é maior e possui bilhões de pares de bases. Além disso, contém muitos genes com várias cópias.


Definição

O DNA linear se refere ao DNA com duas extremidades, enquanto o DNA circular se refere ao DNA sem extremidades.

Exemplos

O material genético no núcleo dos eucariotos é DNA linear, enquanto o material genético dos procariotos, assim como o mtDNA e o cpDNA, são DNA circular.

Ocorrência

O DNA linear ocorre exclusivamente dentro do núcleo, enquanto o DNA circular ocorre no citoplasma ou dentro das organelas.

Tamanho do DNA

Geralmente, o DNA linear é grande em tamanho, enquanto o DNA circular é pequeno.

Organização

Além disso, o DNA linear sofre um empacotamento denso e enrolamento apertado dentro do núcleo, enquanto o DNA circular não sofre empacotamento.

Facilidade de transcrição

O DNA linear é fácil de transcrever, enquanto o DNA circular grande é difícil de transcrever devido à cepa de torção que ocorre durante o desenrolamento do DNA.

Presença de Telômeros

Enquanto o DNA linear contém telômeros, o DNA circular não contém telômeros.

Fim do problema de replicação

Além disso, o DNA linear tem que enfrentar o problema de replicação final, enquanto o DNA circular não passa pelo problema de replicação final.

Em Plasmídeos

Nos plasmídeos, parte do DNA é linear, enquanto o DNA do plasmídeo superenrolado é circular.

Conclusão

O DNA linear é uma estrutura de DNA com duas extremidades. Geralmente, os cromossomos eucarióticos são lineares. Além disso, eles consistem em um grande número de pares de bases. Por outro lado, o DNA circular é o DNA sem extremidades. Os cromossomos procarióticos são circulares, enquanto os DNAs mitocondrial e cloroplástico também são circulares. No entanto, o DNA circular é pequeno. Portanto, a principal diferença entre o DNA linear e circular é a estrutura do DNA.


Existem muitas outras bactérias com vários cromossomos, mas as espécies de Vibrio têm membros que possuem dois cromossomos circulares [16]. Esses incluem V. cholerae, V. parahaemolyticus, V. vulnificus e V. fluvialis [16].

Bactérias Organização cromossômica
Agrobacterium tumefaciens Um linear e um circular
Bacillus subtilis Simples e circular
Bacillus subtilis Simples e linear
Borrelia burgdorferi Duas circulares
Brucella abortus Duas circulares
Brucella melitensis Duas circulares
Brucella ovis Duas circulares
Brucella suis biovar 1 Duas circulares
Brucella suis biovar 2 Duas circulares
Brucella suis biovar 4 Duas circulares
Escherichia coli Simples e circular
Paracoccus denitrificans Três circulares
Pseudomonas aeruginosa Simples e circular
Rhodobacter sphaeroides Duas circulares
Streptomyces griseus Linear
Vibrio cholerae Duas circulares
Vibrio fluvialis Duas circulares
Vibrio parahaemolyticus Duas circulares
Vibrio vulnificus Duas circulares

O Circular Genome Viewer

CGView (http://wishart.biology.ualberta.ca/cgview/) é um programa Java desenvolvido em 2005 como uma ferramenta para gerar mapas navegáveis ​​de alta qualidade de genomas circulares [8]. Originalmente projetado para genomas bacterianos, ele provou ser popular também para genomas organelares. CGView suporta um formato de entrada XML (Extensible Markup Language) personalizado para descrever o conteúdo e a aparência de um mapa, que o programa então converte em formato gráfico. Podem ser geradas imagens bitmap (PNG ou JPG) ou saída baseada em vetor no formato SVG (Scalable Vector Graphics). O formato SVG oferece vantagens para edição e impressão de imagens, mas o tamanho do arquivo pode ser problemático quando mapas complexos são gerados. O conteúdo de um arquivo XML de amostra e o mapa resultante gerado pelo CGView são mostrados na Figura 1. São suportados formatos de entrada mais simples, que permitem que as posições dos genes sejam descritas, mas que oferecem menos controle sobre como as informações são exibidas. Também é fornecida uma API (interface de programa de aplicativo) bem documentada, que permite que o código Java CGView seja usado em outras aplicações. Por exemplo, o programa BRIG [9] usa o código CGView e sua API associada para gerar mapas exibindo os resultados das comparações de similaridade de sequência entre um genoma bacteriano de interesse e outros genomas.

CGView converte o conteúdo de um arquivo XML (UMA) em um mapa gráfico (B) O XML descreve as características gerais do mapa (altura, largura e estilos e tamanhos de fonte, por exemplo), bem como os recursos que devem ser representados. Cada recurso pode ter um ou mais intervalos desenhados no mapa, cujas posições são descritas usando elementos ‘featureRange’. Os recursos são agrupados por elementos ‘featureSlot’, que representam anéis no mapa gráfico. Uma descrição completa do formato XML e exemplos adicionais estão disponíveis no site CGView.

CGView converte o conteúdo de um arquivo XML (UMA) em um mapa gráfico (B) O XML descreve as características gerais do mapa (altura, largura e estilos e tamanhos de fonte, por exemplo), bem como os recursos que devem ser representados. Cada recurso pode ter um ou mais intervalos desenhados no mapa, cujas posições são descritas usando elementos ‘featureRange’. Os recursos são agrupados por elementos ‘featureSlot’, que representam anéis no mapa gráfico. Uma descrição completa do formato XML e exemplos adicionais estão disponíveis no site CGView.

O aplicativo CGView continua sendo uma ferramenta popular de visualização do genoma, no entanto, o processo de criação de um mapa é intimidante e trabalhoso para muitos usuários. Primeiro, CGView é uma ferramenta de linha de comando, o que significa que os usuários devem inserir comandos e opções específicos em um ambiente de linha de comando. Embora as interfaces de linha de comando ofereçam vantagens importantes, muitos usuários preferem compreensivelmente uma interface gráfica de usuário intuitiva fornecida por meio de um servidor Web ou aplicativo independente. Em segundo lugar, o próprio CGView não identifica recursos de sequência nem realiza análises de sequência. Em vez disso, o usuário deve usar outro software para identificar recursos de interesse e, em seguida, fornecer essas informações em um formato compatível com o CGView. Embora o download do aplicativo CGView inclua documentação sobre como fazer isso, bem como um script para converter arquivos GenBank ou EMBL em um arquivo XML adequado para CGView, muitos usuários provavelmente não terão experiência ou inclinação para construir os arquivos de entrada necessários.

Criação de mapa simplificada: o CGView Server

A interface de linha de comando e API do CGView permitem que ele seja facilmente incorporado em ferramentas de visualização ou pipelines mais capazes. Uma dessas ferramentas é o CGView Server (http://stothard.afns.ualberta.ca/cgview_server/), um servidor Web lançado em 2008 que oferece uma interface conveniente para CGView e possui recursos de análise embutidos [10]. Por exemplo, até três conjuntos de dados de sequência (proteína ou DNA) podem ser carregados para o servidor, juntamente com a sequência do genoma primário de interesse (também chamada de "sequência de referência"). O BLAST é usado para comparar a sequência de referência com cada um dos conjuntos de dados carregados e os resultados são incluídos no mapa. Se a sequência de referência for carregada no formato GenBank ou EMBL, as informações do recurso serão extraídas e também exibidas. Uma variedade de outros tipos de recursos podem ser identificados ou calculados e exibidos (quadros de leitura aberta, códons de início e parada, conteúdo de GC e inclinação de GC) ou carregados em um formato simples delimitado por tabulação. Internamente, o CGView Server gera o mapa usando CGView e um arquivo de entrada XML que ele constrói de acordo com as opções fornecidas pelo usuário, informações extraídas da sequência de referência e os resultados da análise BLAST. Os usuários podem optar por fazer com que o servidor retorne um mapa exibindo toda a sequência ou, graças aos recursos de zoom do CGView, uma parte do genoma em um tamanho expandido (Figura 2).

Um mapa gerado usando o CGView Server, mostrando uma visão completa do genoma (UMA) e uma visão expandida de uma região de interesse (B) O conteúdo dos anéis de recurso (começando com o anel mais externo) é o seguinte: O Anel 1 e o Anel 2 representam recursos dos fios direto e reverso, respectivamente, lidos do arquivo de sequência primária (E. coli Acesso NRG857c: CP001855) Anel 3 (E. coli Acesso LF82: CU651637) Anel 4 (E. coli K12 substr. Acesso MG1655: NC_000913) e Anel 5 (E. coli O157: H7 str. Acesso de Sakai: NC_002695) mostra resultados de comparação de BLAST (BLASTN) com a sequência primária. Anel 6 mostra ilhas genômicas putativas NRG857c indicativas de transferência horizontal de genes [11]. Anel 7 mostra conteúdo de GC e Anel 8 mostra distorção de GC. Os resultados da comparação BLAST são desenhados em opacidade parcial - regiões mais escuras indicam a presença de acertos múltiplos para a porção correspondente da sequência de referência.

Um mapa gerado usando o CGView Server, mostrando uma visão completa do genoma (UMA) e uma visão expandida de uma região de interesse (B) O conteúdo dos anéis de recurso (começando com o anel mais externo) são os seguintes: O Anel 1 e o Anel 2 representam recursos dos fios direto e reverso, respectivamente, lidos do arquivo de sequência primária (E. coli Acesso NRG857c: CP001855) Anel 3 (E. coli Acesso LF82: CU651637) Anel 4 (E. coli K12 substr. Acesso MG1655: NC_000913) e Anel 5 (E. coli O157: H7 str. Acesso de Sakai: NC_002695) mostra resultados de comparação de BLAST (BLASTN) com a sequência primária. Anel 6 mostra ilhas genômicas putativas NRG857c indicativas de transferência horizontal de genes [11]. Anel 7 mostra conteúdo de GC e Anel 8 mostra distorção de GC. Os resultados da comparação BLAST são desenhados em opacidade parcial - regiões mais escuras indicam a presença de acertos múltiplos para a porção correspondente da sequência de referência.

Algumas limitações notáveis ​​do CGView Server incluem suporte para apenas três conjuntos de dados de sequência de comparação, a ausência de saída baseada em vetor e controle reduzido sobre a aparência de mapas em comparação com quando o aplicativo CGView é usado diretamente. A limitação de comparação de sequência existe para reduzir a carga de trabalho do servidor. A saída baseada em vetor, SVG no caso do CGView, não é suportada porque os arquivos resultantes podem ser muito grandes para enviar por e-mail, mesmo quando compactados (o CGView Server envia o mapa final para o endereço de e-mail fornecido pelo usuário ) Em vez disso, todos os mapas têm 3.000 × 3.000 pixels no formato PNG. Finalmente, o controle reduzido sobre a aparência do mapa é o resultado de fornecer uma interface Web simplificada para controlar a aparência do mapa que não fornece a flexibilidade total do formato XML usado pelo CGView.

Comparando milhares de genomas usando a ferramenta de comparação CGView

Após o lançamento do CGView Server, frequentemente recebíamos solicitações de usuários do servidor que queriam que os mapas fossem modificados. Os pedidos típicos incluíam a adição de mais conjuntos de dados de comparação, a mudança de tamanhos de fonte ou cores de recursos, a criação de mapas maiores e a rotulagem de genes específicos ou recursos de interesse. Com o tempo, desenvolvemos um pipeline de software que usamos para lidar com essas solicitações. Este pipeline consiste em uma variedade de scripts para construir ou modificar mapas complexos que potencialmente envolvem milhares de sequências. Eventualmente, lançamos este pipeline como a ferramenta de comparação CGView (CCT) (http://stothard.afns.ualberta.ca/downloads/CCT/) [12].

Embora o CCT seja uma ferramenta de linha de comando, seu uso é simplificado por meio de scripts de invólucro que automatizam o processo de construção do mapa - criar um mapa pode envolver alguns comandos simples. Por exemplo, o mapa comparando Escherichiacoli O157: H7 str. Sakai com 100 adicionais E. coli As sequências do genoma (Figura 3) exigiam quatro comandos simples para gerar (um para fazer o download da sequência primária, um para iniciar um projeto de mapa, um para fazer o download das sequências de comparação e um para completar o mapa). O último comando gera vários mapas automaticamente, diferindo em termos de tamanho e nível de detalhe, bem como em termos de como são feitas as comparações BLAST (ao nível dos nucleotídeos ou ao nível das sequências de codificação traduzidas). Os mapas que mostram comparações de sequências de codificação traduzidas também, por padrão, exibem classificações COG (Cluster of Orthologous Groups), geradas através do uso de um banco de dados de sequências de COG [13]. O conteúdo e a aparência dos mapas podem ser alterados das configurações padrão usando um arquivo de configuração simples presente no diretório do projeto de mapa e usando opções de linha de comando. Tipos de recursos personalizados adicionais podem ser mostrados, conforme descrito na seção de tutoriais do site do CCT.

Comparação do mapa CCT E. coli O157: H7 str. Sakai (acesso BA000007) com 100 adicionais E. coli sequências do genoma. Uma visão completa do genoma (A) e visão ampliada (B) são mostradas, com a última centrada nos genes da subunidade A e B da toxina I de Shiga, rotulados como ECs2974 e ECs2973, respectivamente. O conteúdo dos anéis de característica (começando com o anel mais externo) são os seguintes: Anel 1: categorias funcionais COG para sequências de codificação de fita direta Anel 2: características de sequência de fita direta Anel 3: características de sequência de fita reversa Anel 4: categorias funcionais COG para reverso sequências de codificação de fita. Os próximos 100 anéis mostram regiões de similaridade de sequência detectadas por comparações BLAST conduzidas entre as traduções de CDS (sequência de DNA codificante) do genoma de referência e aquelas de 100 E. coli genomas de comparação.

Comparação do mapa CCT E. coli O157: H7 str. Sakai (acesso BA000007) com 100 adicionais E. coli sequências do genoma. Uma visão completa do genoma (A) e visão ampliada (B) são mostradas, com a última centrada nos genes da subunidade A e B da toxina I de Shiga, rotulados como ECs2974 e ECs2973, respectivamente. O conteúdo dos anéis de característica (começando com o anel mais externo) são os seguintes: Anel 1: categorias funcionais COG para sequências de codificação de fita direta Anel 2: características de sequência de fita direta Anel 3: características de sequência de fita reversa Anel 4: categorias funcionais COG para reverso sequências de codificação de fita. Os próximos 100 anéis mostram regiões de similaridade de sequência detectadas por comparações BLAST conduzidas entre as traduções de CDS (sequência de DNA codificante) do genoma de referência e aquelas de 100 E. coli genomas de comparação.

O CCT é adequado para a análise de grandes coleções de genomas completos ou parciais gerados por meio de sequenciamento de alto rendimento, já que milhares de genomas de comparação podem ser exibidos em um único mapa simplesmente colocando cada um de seus respectivos arquivos contig (no GenBank, EMBL ou FASTA formato) no diretório 'compare_genomes' de um projeto CCT. Os metagenomas podem ser incluídos como genomas de comparação, caso em que o mapa servirá para indicar quais porções do genoma de referência são semelhantes às sequências nos metagenomas. Em alguns cenários, pode ser interessante gerar muitos mapas diferentes, usando uma variedade de genomas de referência. O CCT, em virtude de sua interface de linha de comando, pode ser executado repetidamente a partir de um script para gerar mapas separados para um grupo de sequências de referência de interesse. Como alternativa, os usuários podem usar o script incluído ‘build_blast_atlas_all_vs_all.sh’. Este script gera um mapa separado para cada genoma em um grupo de genomas completos, comparando o genoma a todos os outros da coleção. A vantagem de gerar mapas múltiplos dessa maneira é que as regiões não conservadas de cada genoma podem ser encontradas como regiões sem resultados do BLAST quando o genoma serve como referência.


Qual é a vantagem de genomas circulares para bactérias e genomas lineares para outros organismos? - Biologia

Superenrolamento de DNA refere-se ao enrolamento excessivo ou insuficiente de uma fita de DNA e é uma expressão da cepa nessa fita. O superenrolamento é importante em vários processos biológicos, como a compactação de DNA. Além disso, certas enzimas, como topoisomerases, são capazes de alterar a topologia do DNA para facilitar funções como a replicação ou transcrição do DNA. Expressões matemáticas são usadas para descrever o superenrolamento comparando diferentes estados enrolados com o DNA de forma B relaxado.

Estrutura Superenrolada de DNA Circular: Esta é uma estrutura superenrolada de moléculas circulares de DNA com baixa contorção. Observe que a natureza helicoidal do duplex de DNA é omitida para maior clareza.

Como regra geral, o DNA da maioria dos organismos é superenrolado negativamente.

Em um segmento de B-DNA & # 8220relaxado & # 8221 em dupla hélice, as duas fitas giram em torno do eixo helicoidal uma vez a cada 10,4 a 10,5 pares de bases da sequência. Adicionar ou subtrair torções, como algumas enzimas podem fazer, impõe tensão. Se um segmento de DNA sob tensão de torção fosse fechado em um círculo ao unir suas duas extremidades e depois pudesse se mover livremente, o DNA circular se contorceria em uma nova forma, como um simples oito. Essa contorção é um superenrolamento.

A simples figura oito é a superenrolada mais simples e é a forma que um DNA circular assume para acomodar muitas ou poucas torções helicoidais. Os dois lóbulos da figura oito aparecerão girados no sentido horário ou anti-horário um em relação ao outro, dependendo se a hélice está enrolada ou não. Para cada torção helicoidal adicional sendo acomodada, os lóbulos mostrarão mais uma rotação em torno de seu eixo.

A forma substantiva & # 8220supercoil & # 8221 raramente é usada no contexto da topologia de DNA. Em vez disso, as contorções globais de um DNA circular, como a rotação dos lóbulos em forma de oito acima, são chamadas de contorção. O exemplo acima ilustra que torções e contorções são conversíveis. & # 8220Supercoiling & # 8221 é uma propriedade matemática abstrata que representa a soma de torção e contorção. A torção é o número de voltas helicoidais no DNA e a contorção é o número de vezes que a dupla hélice se cruza sobre si mesma (essas são as superenroladas).

As torções helicoidais extras são positivas e levam ao superenrolamento positivo, enquanto a torção subtrativa causa superenrolamento negativo. Muitas enzimas topoisomerase detectam o superenrolamento e o geram ou dissipam à medida que mudam a topologia do DNA. O DNA da maioria dos organismos é superenrolado negativamente.

Em parte porque os cromossomos podem ser muito grandes, os segmentos do meio podem agir como se suas extremidades estivessem ancoradas. Como resultado, eles podem ser incapazes de distribuir o excesso de torção para o resto do cromossomo ou de absorver a torção para se recuperar do enrolamento inferior - em outras palavras, os segmentos podem se tornar superenrolados. Em resposta ao superenrolamento, eles assumirão uma certa contorção, como se suas extremidades estivessem unidas.

O DNA superenrolado forma duas estruturas, um plectonema ou um toróide, ou uma combinação de ambos. Uma molécula de DNA superenrolada negativamente produzirá uma hélice canhota de início único, o toroide, ou uma hélice destros de início duplo com laços terminais, o plectonema. Os plectonemas são normalmente mais comuns na natureza, e esta é a forma que a maioria dos plasmídeos bacterianos assumirá. Para moléculas maiores, é comum que estruturas híbridas se formem - uma alça em um toroide pode se estender em um plectonema. Se todos os loops em um toróide se estendem, ele se torna um ponto de ramificação na estrutura plectonêmica.

A importância do superenrolamento do DNA

O superenrolamento do DNA é importante para o empacotamento do DNA em todas as células. Como o comprimento do DNA pode ser milhares de vezes maior que o de uma célula, o empacotamento desse material genético na célula ou no núcleo (em eucariotos) é uma tarefa difícil. O superenrolamento do DNA reduz o espaço e permite que muito mais DNA seja empacotado. Em procariotos, as supercoils plectonêmicas são predominantes, devido ao cromossomo circular e à quantidade relativamente pequena de material genético. Em eucariotos, o superenrolamento do DNA existe em muitos níveis de superenrolamentos plectonêmicos e solenóides, com o superenrolamento solenoidal provando ser o mais eficaz na compactação do DNA. O superenrolamento solenoidal é obtido com histonas para formar uma fibra de 10 nm. Esta fibra é posteriormente enrolada em uma fibra de 30 nm e ainda mais enrolada sobre si mesma várias vezes.

O empacotamento do DNA aumenta muito durante eventos de divisão nuclear, como mitose ou meiose, onde o DNA deve ser compactado e segregado em células-filhas. As condensinas e coesinas são proteínas de manutenção estrutural dos cromossomos (SMC) que auxiliam na condensação das cromátides irmãs e na ligação do centrômero nas cromátides irmãs. Essas proteínas SMC induzem superenrolamentos positivos.

Superenrolamento também é necessário para a síntese de DNA e RNA. Como o DNA deve ser desenrolado para a ação do DNA e da RNA polimerase, surgirão supercoils. A região à frente do complexo da polimerase será desenrolada e esse estresse é compensado com superenroladas positivas à frente do complexo. Atrás do complexo, o DNA é rebobinado e haverá superenroladas compensatórias negativas. É importante notar que as topoisomerases como a DNA girase (Topoisomerase Tipo II) desempenham um papel no alívio de parte do estresse durante a síntese de DNA e RNA.


Estudando genomas microbianos

Nos anos anteriores ao desenvolvimento de técnicas de sequenciamento de genoma completo, estávamos restritos a estudar genomas microbianos em laboratório usando técnicas como PFGE.

Eletroforese em Gel de Campo Pulsado (PFGE) -

O princípio subjacente ao PFGE é muito semelhante à eletroforese em gel normal. O PFGE, entretanto, nos permite resolver pedaços muito grandes de DNA na 'escala do genoma' (maiores que 20 kilobases de tamanho). O PFGE ainda é uma importante técnica utilizada para estimar o tamanho dos genomas microbianos e em estudos epidemiológicos.

Você pode aprender mais sobre técnicas genômicas básicas semelhantes na página 'DNA recombinante e técnicas genéticas'.

Sequenciamento de DNA

O sequenciamento de DNA tem sido um enorme avanço no campo da genômica microbiana e, na verdade, da genética como um todo, permitindo-nos acumular grandes quantidades de dados genéticos de nossos organismos de escolha. O primeiro método de sequenciamento de DNA foi desenvolvido por Frederick Sanger e seu grupo em 1977. Seu método, denominado Sequenciamento de Sanger, foi uma plataforma para inovação no campo do sequenciamento de DNA, e agora temos métodos para sequenciar genomas bacterianos inteiros com relativa facilidade. O sequenciamento do genoma completo produz imensas quantidades de dados dos quais podemos derivar um catálogo de informações importantes. A partir da necessidade de analisar esses dados, o campo da bioinformática floresceu e se tornou parte integrante da pesquisa genética.

O sequenciamento de DNA identifica e registra cada nucleotídeo, em ordem, que compõe um pedaço de DNA.

Bioinformática-

Bioinformática é o uso de tecnologias de computação para gerenciar e analisar dados biológicos. A enorme quantidade de dados genômicos produzidos por meio do sequenciamento de DNA pode muitas vezes ser muito confusa e difícil de analisar. Portanto, a bioinformática é freqüentemente necessária para derivar informações úteis desses dados. Você pode aprender mais sobre algumas das ferramentas de bioinformática que usamos para analisar informações genéticas clicando em 'acessar recursos relacionados ao tópico' no topo da página. Usando técnicas de bioinformática, podemos mapear as posições dos genes, eliciar suas funções e inferir relações evolutivas. Juntamente com o trabalho experimental, podemos usar essas informações para aprender mais sobre como os micróbios sobrevivem e causam doenças.

Dê uma olhada em alguns de nossos trabalhos genômicos na página 'nossa pesquisa'!


1. Introdução

Marseilleviridae é uma família em expansão de grandes vírus de DNA de fita dupla que infectam amebas de vida livre do Acanthamoeba gênero. Seus capsídeos icosaédricos de 250 nm de diâmetros encerram um genoma de 340 a 390 kb predito para codificar uma média de 500 genes codificadores de proteínas [1,2,3,4,5,6,7,8,9,10,11,12] . Entre esses genes, alguns codificam funções inesperadas para um vírus, sendo os mais surpreendentes homólogos às histonas celulares [1,2]. Os vírus desta família pertencem aos NCLDVs (para grandes vírus de DNA nucleocitoplasmático), ou seja, o Nucleocitoviricota filo, de acordo com a última classificação do Comitê Internacional de Taxonomia de Vírus (ICTV) [13,14]. Os ciclos de replicação de Marseillevírus & # x02019 começam com sua fagocitose pelo Acanthamoeba hospedeiro. Uma vez no citoplasma, eles formam a chamada & # x0201cviral factory & # x0201d na vizinhança do núcleo onde a montagem do vírion e o empacotamento do DNA ocorrem simultaneamente [1]. Partículas maduras são então liberadas através da lise celular cerca de 8 h pós-infecção (pi) [1]. No entanto, a duração do ciclo de replicação é variável entre Marseilleviridae com cepas para as quais os vírions são liberados em 13 & # x0201316 h até 24 h pi. Uma vez que os marseillevírus codificam um aparelho de transcrição completo e o núcleo do hospedeiro parece permanecer intacto durante todo o ciclo, foi inicialmente assumido que os marseillevírus eram genuíno vírus citoplasmáticos, sem fase nuclear. No entanto, foi subsequentemente mostrado que as proteínas da subunidade da RNA polimerase codificadas por vírus não são empacotadas dentro dos vírions, impedindo assim o início da transcrição de genes virais [10]. Como uma solução alternativa, as proteínas nucleares são ativamente, embora transitoriamente, recrutadas pela fábrica viral para iniciar a transcrição de genes virais, colocando assim os marseillevírus entre os vírus que se replicam estritamente no citoplasma e aqueles que envolvem uma fase intranuclear [10].

Marseillevirus T19 foi o primeiro Marseilleviridae ser isolado por co-cultura com Acanthamoeba castellanii [1]. Desde então, várias cepas foram isoladas usando a mesma abordagem, principalmente de amostras aquáticas de diferentes continentes (Ásia [9,12,15], África [4,5], América do Sul [6,11], Europa [1,2, 3,8] e Austrália [7,10]). Além disso, sequências genômicas semelhantes a marseilevírus foram identificadas em dados ambientais metagenômicos reunidos [16]. Entre as cepas isoladas, treze foram totalmente sequenciadas (Tabela S1), e sua filogenia mostra que elas pertencem a cinco clados distintos [10,15] (Figura S1). A partir da análise dos genes codificados nesses genomas, estimou-se que cerca de 25% deles são de origem celular potencial, tornando as transferências gênicas horizontais (HGT) um fator que contribui para moldar o Marseilleviridae genomas [1]. Surpreendentemente, apenas 23% dessas trocas envolvem o Amebozoa hospedeiro, em oposição a 45% para bactérias e bacteriófagos [1]. Ainda mais notável, esta grande fração de genes relacionados a bactérias são submetidos a uma forte seleção purificadora e, portanto, provavelmente contribuem para a aptidão viral [7]. Um exemplo marcante é o Marseilleviridaesistema de restrição codificado e # x02013 de modificação (RM) que envolve endonucleases de restrição e metiltransferases de DNA de origem bacteriana [17]. Suspeita-se que sirva de arma contra os parasitas intracelulares da ameba, conferindo ao vírus uma vantagem seletiva.

Além das questões evolutivas, os marseillevírus & # x02019 fisiologia foram examinados por meio de várias pesquisas de todo o genoma usando vários dados ômicos. Primeiro, os dados proteômicos das partículas virais de três Marseilleviridae members were produced, namely marseillevirus [1], noumeavirus and melbournevirus [10]. This not only revealed the proteins that build the structure of the Marseilleviridae virions, but also those packaged within it that could be essential for initiating the viral replication. In addition, the marseillevirus’ transcriptional activity during an infection cycle in A. castellanii was recently surveyed by RNA sequencing (RNA-seq), showing that the host translation apparatus is downregulated during the infection [18]. This now provides us with a sufficient body of data to conduct an in-depth comparative genomics study of the Marseilleviridae família.

In this study, we first experimentally confirm the circular structure of the marseilleviruses genomes. Using available genomic, proteomic and transcriptomic data, we then reveal a strong bias in the distribution of the marseilleviruses’ genes. We examine the genomic rearrangements as well as the genomic distribution of several gene categories along the genomes. More specifically, we unveil the uneven distribution of the core genes (i.e., genes conserved in all Marseilleviridae), the virion-associated genes and the paralogous genes (i.e., genes that were duplicated during the Marseilleviridae evolution). This work helps us to better understand the global organization of the Marseilleviridae genomes, as well as the evolution and physiology of this viral family.


2.4. The Repetitive DNA Content of Genomes

Repetitive DNA is the one aspect of genome structure that we have not examined in detail. Figure 2.2 (page 34) showed us that repetitive DNA is found in all organisms and that in some, including humans, it makes up a substantial fraction of the entire genome. There are various types of repetitive DNA, and several classification systems have been devised. The scheme that we will use begins by dividing the repeats into those that are clustered into tandem arrays and those that are dispersed around the genome.

2.4.1. Tandemly repeated DNA

Tandemly repeated DNA is a common feature of eukaryotic genomes but is found much less frequently in prokaryotes. This type of repeat is also called satellite DNA because DNA fragments containing tandemly repeated sequences form ‘satellite’ bands when genomic DNA is fractionated by density gradient centrifugation (see Technical Note 2.2). For example, when broken into fragments 50� kb in length, human DNA forms a main band (buoyant density 1.701 g cm -3 ) and three satellite bands (1.687, 1.693 and 1.697 g cm -3 ). The main band contains DNA fragments made up mostly of single-copy sequences with GC compositions close to 40.3%, the average value for the human genome. The satellite bands contain fragments of repetitive DNA, and hence have GC contents and buoyant densities that are atypical of the genome as a whole (Figure 2.24).

Satellite DNA is found at centromeres and elsewhere in eukaryotic chromosomes

The satellite bands in density gradients of eukaryotic DNA are made up of fragments composed of long series of tandem repeats, possibly hundreds of kb in length. A single genome can contain several different types of satellite DNA, each with a different repeat unit, these units being anything from < 5 to > 200 bp. The three satellite bands in human DNA include at least four different repeat types.

We have already encountered one type of human satellite DNA, the alphoid DNA repeats found in the centromere regions of chromosomes (see page 38). Although some satellite DNA is scattered around the genome, most is located in the centromeres, where it may play a structural role, possibly as binding sites for one or more of the special centromeric proteins (see page 39). Alternatively, the repetitive DNA content of the centromere might be a reflection of the fact that this is the last region of the chromosome to be replicated. In order to delay its replication until the very end of the cell cycle, the centromere DNA must lack sequences that can act as origins of replication. The repetitive nature of centromeric DNA may be a means of ensuring that such origins are absent (Csink and Henikoff, 1998).

Minisatellites and microsatellites

Although not appearing in satellite bands on density gradients, two other types of tandemly repeated DNA are also classed as ‘satellite’ DNA. These are minisatellites and microsatellites. Minisatellites form clusters up to 20 kb in length, with repeat units up to 25 bp microsatellite clusters are shorter, usually < 150 bp, and the repeat unit is usually 13 bp or less.

Minisatellite DNA is a second type of repetitive DNA that we are already familiar with because of its association with structural features of chromosomes. Telomeric DNA, which in humans comprises hundreds of copies of the motif 5′-TTAGGG-3′ (see Figure 2.10), is an example of a minisatellite. We know a certain amount about how telomeric DNA is formed, and we know that it has an important function in DNA replication (Section 13.2.4). In addition to telomeric minisatellites, some eukaryotic genomes contain various other clusters of minisatellite DNA, many, although not all, near the ends of chromosomes. The functions of these other minisatellite sequences have not been identified.

The function of microsatellites is equally mysterious. The typical microsatellite consists of a 1-, 2-, 3- or 4-bp unit repeated 10� times, as illustrated by the microsatellites in the human β T-cell receptor locus (Section 1.2.1). Although each microsatellite is relatively short, there are many of them in the genome (see Table 1.3). In humans, for example, microsatellites with a CA repeat, such as:

Although their function, if any, is unknown, microsatellites have proved very useful to geneticists. Many microsatellites are variable, meaning that the number of repeat units in the array is different in different members of a species. This is because ‘slippage’ sometimes occurs when a microsatellite is copied during DNA replication, leading to insertion or, less frequently, deletion of one or more of the repeat units (see Figure 14.5). No two humans alive today have exactly the same combination of microsatellite length variants: if enough microsatellites are examined then a unique genetic profile can be established for every person. The only exceptions are genetically identical twins. Genetic profiling is well known as a tool in forensic science (Figure 2.25), but identification of criminals is a fairly trivial application of microsatellite variability. More sophisticated methodology makes use of the fact that a person's genetic profile is inherited partly from the mother and partly from the father. This means that microsatellites can be used to establish kinship relationships and population affinities, not only for humans but also for other animals, and for plants.

Figure 2.25

The use of microsatellite analysis in genetic profiling. In this example, microsatellites located on the short arm of chromosome 6 have been amplified by the polymerase chain reaction (PCR Section 4.3). The PCR products are labeled with a blue or green (more. )

2.4.2. Interspersed genome-wide repeats

Tandemly repeated DNA sequences are thought to have arisen by expansion of a progenitor sequence, either by replication slippage, as described for microsatellites, or by DNA recombination processes (Section 14.3). Both of these events are likely to result in a series of linked repeats, rather than individual repeat units scattered around the genome. Interspersed repeats must therefore have arisen by a different mechanism, one that can result in a copy of a repeat unit appearing in the genome at a position distant from the location of the original sequence. The most frequent way in which this occurs is by transposition, and most interspersed repeats have inherent transpositional activity.

Transposition via an RNA intermediate

The precise mechanics of transposition need not worry us until we deal with recombination and related rearrangements to the genome in Section 14.3. All that we need to know at this point is that there are two alternative modes of transposition, one that involves an RNA intermediate and one that does not. The version that involves an RNA intermediate is called retrotransposition. The basic mechanism involves three steps (Figure 2.26): 1.

An RNA copy of the transposon is synthesized by the normal process of transcription.

The RNA transcript is copied into DNA, which initially exists as an independent molecule outside of the genome. This conversion of RNA to DNA, the reverse of the normal transcription process, requires a special enzyme called reverse transcriptase. Often the reverse transcriptase is coded by a gene within the transposon and is translated from the RNA copy synthesized in step 1.

The DNA copy of the transposon integrates into the genome, possibly back into the same chromosome occupied by the original unit, or possibly into a different chromosome. The end result is that there are now two copies of the transposon, at different points in the genome.

Figure 2.26

Retrotransposition. Compare with Figure 1.19 (page 22), and note that the events are essentially the same as those that result in a processed pseudogene.

Figure 2.27

Retroelements. A comparison of the structures of four types of retroelement. Retroviruses and retrotransposons are LTR elements that possess long terminal repeats at each end. o mordaça gene codes for a series of proteins located in the virus core pol (more. )

DNA transposons

Not all transposons require an RNA intermediate. Many are able to transpose in a more direct DNA to DNA manner. With these elements we are aware of two distinct transposition mechanisms (Figure 2.28), one involving direct interaction between the donor transposon and the target site, resulting in copying of the donor element (replicative transposition), and the second involving excision of the element and re-integration at a new site (conservative transposition). Both mechanisms require enzymes which are usually coded by genes within the transposon. The molecular events that occur during these two types of transposition are described in Section 14.3.3.

Figure 2.28

Two mechanisms of transposition used by DNA transposons. For more details see Section 14.3.3.

In eukaryotes, DNA transposons are less common than retrotransposons (see Table 1.2), but they have a special place in genetics because a family of plant DNA transposons - the Ac/Ds elements of maize - were the first transposable elements to be discovered, by Barbara McClintock in the 1950s. Her conclusions - that some genes are mobile and can move from one position to another in a chromosome - were based on exquisite genetic experiments, the molecular basis of transposition not being understood until the late 1970s.

Figure 2.29

DNA transposons of prokaryotes. Four types are shown. Insertion sequences, Tn3-type transposons and transposable phages are flanked by short (< 50 bp) inverted terminal repeat (ITR) sequences. The resolvase gene of the Tn3-type transposon codes (more. )


Assista o vídeo: Wirusy (Junho 2022).


Comentários:

  1. Thurlow

    Isso é apenas uma convenção

  2. Simson

    Não nesta essência.

  3. Beattie

    Concorde com a informação notável

  4. Beldon

    Entre nós, aconselho você a experimentar o google.com



Escreve uma mensagem