Em formação

15: Regulação do Gene I - Agrupamento da Expressão do Gene - Biologia

15: Regulação do Gene I - Agrupamento da Expressão do Gene - Biologia


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

15: Regulação de Gene I - Agrupamento de Expressão de Gene

ScPADGRN: Uma abordagem ADMM pré-condicionada para reconstruir a rede reguladora de genes dinâmicos usando dados de sequenciamento de RNA de célula única

O desenvolvimento da doença e a diferenciação celular envolvem mudanças dinâmicas, portanto, a reconstrução de redes reguladoras de genes dinâmicos (DGRNs) é um problema importante, mas difícil na biologia de sistemas. Com os avanços técnicos recentes no sequenciamento de RNA de célula única (scRNA-seq), grandes volumes de dados de scRNA-seq estão sendo obtidos para vários processos. No entanto, a maioria dos métodos atuais de inferir DGRNs de amostras em massa podem não ser adequados para dados de scRNA-seq. Neste trabalho, apresentamos o scPADGRN, um novo método de inferência DGRN usando dados de scRNA-seq de “série temporal”. scPADGRN combina o método de direção alternada pré-condicionado de multiplicadores com agrupamento de células para reconstrução DGRN. Ele exibe vantagens em precisão, robustez e convergência rápida. Além disso, um índice quantitativo denominado Enriquecimento de Interação de Genes de Diferenciação (DGIE) é apresentado para quantificar o enriquecimento de interação de genes relacionados à diferenciação. A partir das pontuações DGIE de sub-redes relevantes, inferimos que as funções das células-tronco embrionárias (ES) são mais ativas inicialmente e podem desaparecer gradualmente com o tempo. A força de comunicação de genes contribuintes conhecidos que facilitam a diferenciação celular aumenta de células ES para células terminalmente diferenciadas. Também identificamos vários genes responsáveis ​​pelas mudanças nas pontuações DGIE que ocorrem durante a diferenciação celular com base em três conjuntos de dados reais de uma única célula. Nossos resultados demonstram que as análises de uma única célula com base na inferência de rede juntamente com cálculos quantitativos podem revelar os principais reguladores transcricionais envolvidos na diferenciação celular e no desenvolvimento de doenças.


Introdução

Existem diferentes tipos de processos na célula que trabalham juntos para realizar diferentes atividades. Dependendo dos componentes e de seus tipos de interação, em geral, temos três tipos de redes bioquímicas no nível subcelular: redes metabólicas, redes de transdução de sinal e redes reguladoras de genes. Uma rede reguladora de genes (GRN) é uma rede de interações gene-gene que governam sua expressão. A regulação da expressão gênica é importante, pois regula a quantidade de produção de proteínas na célula.

A inferência de redes regulatórias de genes é considerada um dos principais problemas da Biologia de Sistemas [1, 2]. Houve um crescimento exponencial dos métodos de engenharia reversa para reconstrução de rede nas últimas duas décadas [3-7]. Mesmo que, desde a última década, técnicas de alto rendimento como microarrays e RNA-seq tornassem a disponibilidade de dados de expressão gênica possível, a inferência de rede ainda é considerada um problema desafiador devido a fatores como estocasticidade, ruído de medição, valores de expressão perdidos, tempo limitado pontos, etc. na expressão data [8]. Além dessas restrições, o ruído introduzido devido a técnicas de alto rendimento como microarrays de DNA, onde os dados têm uma alta relação ruído-sinal, também cria um obstáculo na inferência da rede e é frequentemente esquecido durante o desenvolvimento desses métodos de engenharia reversa [9].

Diferentes abordagens têm sido usadas recentemente para inferência de rede a partir de dados de séries temporais, como modelos ODE [10], redes Bayesianas [11], modelos gráficos Gaussianos [12], redes neurais [13] e métodos da teoria da informação [14]. Revisões recentes de métodos de inferência de rede regulatória de genes e suas limitações são fornecidas em [15, 16]. Huynh-Thu et al. [15] apresentou uma revisão introdutória do campo, primeiro fornecendo o pano de fundo dos principais conceitos biológicos envolvidos e, em seguida, introduzindo diferentes abordagens de inferência de forma categorizada. O documento também fornece links para ferramentas de software publicamente disponíveis para inferência de rede. Banf et al. [16] apresentou uma revisão dos métodos de inferência GRN, suas limitações e sua aplicação em espécies de plantas A. Thaliana. O artigo também se concentra em diferentes tipos de dados que podem ser usados ​​para inferência GRN, como informações do local de ligação do fator de transcrição, dados de mapeamento de conformação da cromatina e a necessidade de integrar diferentes conjuntos de dados para obter resultados mais adequados.

Os dados de expressão podem ser medidos em estado estacionário ou gerados como uma série temporal. Geralmente, na geração de dados de séries temporais, o estado estacionário da rede é perturbado e os valores da expressão em evolução são registrados até que a rede alcance o estado estacionário novamente. Como os conjuntos de dados de séries temporais têm valores de expressão em evolução de genes registrados em diferentes instantes de tempo, eles são considerados mais informativos sobre a dinâmica da rede subjacente do que os dados em estado estacionário. As relações causais entre os genes podem ser inferidas apenas a partir de dados de séries temporais. Foi demonstrado que a abordagem de inferência GENIE3 (que é baseada em dados de estado estacionário) tem um desempenho ruim em dados de série temporal [17]. Assim, sugere que a abordagem empreendida para o processo de inferência deve fazer uso das informações de múltiplos pontos no tempo para melhor captar as interações entre os genes.

Em redes regulatórias de genes [18, 19], os genes interagem entre si para realizar funções celulares específicas. As interações gene-gene são interações regulatórias entre um gene regulador (também conhecido como fator de transcrição (TF)) e um gene alvo. Um gene alvo é expresso dependendo da atividade dos genes reguladores. A interação do gene regulador com um gene alvo pode ser ativadora ou inibidora. A ativação da regulação acelera a produção do gene alvo (e o gene alvo é expresso) enquanto, ao inibir a regulação, ela desacelera a produção do gene alvo ainda menos do que foi produzido (expresso) na ausência desse gene regulador de inibição. Geralmente, há alguma constante de síntese associada à produção de cada gene alvo. Devido a isso, um gene pode ser expresso (embora em um nível muito baixo) mesmo na ausência de qualquer gene regulador [7, 20]. Da mesma forma, há alguma constante de decaimento associada a cada gene. No entanto, a degradação do gene é um processo mais lento do que a síntese do gene. Assim, na presença de inibição da regulação, o resultado líquido pode ser visto como a degradação do gene alvo [7, 20].

Os dados de expressão gênica são na forma de níveis contínuos de expressão gênica. Na regulação gênica, um gene regulador permanece em sua forma inativa até atingir uma concentração limite. Somente quando sua concentração aumenta acima da concentração limite, ele se torna ativo [21]. A forma sigmóide da interação real na regulação gênica pode ser interpretada como uma função degrau em sua abstração lógica [22]. Portanto, o mecanismo regulatório dos genes pode ser interpretado na forma de switch, ou seja, ON ou OFF. Em uma visão de abstração lógica, um gene regulador (ou TF) em seu estado ON liga-se ao DNA e inicia a regulação de um gene alvo. Assim, o gene alvo após sua produção passa do estado DESLIGADO para LIGADO. A discretização de dados de séries temporais ajuda na identificação de genes reguladores potenciais para um gene alvo.

Os pesquisadores tentaram explorar o comportamento dos GRNs usando dados discretos. Ito et al. [23] analisou qualitativamente o comportamento de um GRN usando a abstração lógica dos níveis de expressão do gene usando dois estados ON e OFF e explorou a alternância entre dois estados para capturar o comportamento do GRN. Schaub et al. [24] usaram muitos níveis discretos para representar um estado de gene e modelar alguns aspectos de sistemas biológicos, como autorregulação negativa. Assim, a abstração lógica dos valores de expressão gênica contínua preserva as características qualitativas da dinâmica do sistema, como comportamento oscilatório, estado estacionário e acessibilidade [22]. Küffner et al. [25] propôs um modelo de rede de Petri com lógica fuzzy (PNFL) para inferência GRN. O PNFL é uma abordagem baseada em regras discretas que executa simulações para recuperar a dinâmica do sistema junto com sua topologia.

Neste artigo, apresentaremos uma abordagem baseada em sistemas discretos para a inferência de GRNs ao lidar com as questões de ruído e estocasticidade. Uma abordagem baseada em sistema discreto significa que a abordagem é baseada em um sistema discreto onde um número contável de níveis de expressão gênica existe nos dados.


Resultados

Sequenciamento, montagem e caracterização do genoma

O genoma do molusco duro M. mercenaria foi sequenciado com leituras Illumina, PacBio Single Molecule Real-Time (SMRT), genômica 10X e sequenciamento Hi-C (arquivo adicional 2: Tabela S1), resultando em um conjunto de referência de 1,79 GB com um contig N50 = 1,77 Mb (adicional arquivo 2: Tabela S2). O tamanho do M. mercenaria o genoma foi estimado em 1,78 GB (com 1,34% de heterozigosidade) com base em kanálise de mero (arquivo adicional 2: Tabela S3), que é próximo ao tamanho do genoma estimado por citometria de fluxo [30]. O sequenciamento Hi-C foi usado para posicionar e orientar 1541 scaffolds abrangendo 1,74 GB (scaffold N50 = 91,38 Mb) em 19 cromossomos contíguos, consistentes com o número haplóide (Fig. 1a, Arquivo adicional 4: Fig. S2 e Arquivo adicional 2: Tabela S4). A montagem no nível do cromossomo era de alta integridade e qualidade, pois mais de 95% das leituras de inserção curta da Illumina puderam ser mapeadas com êxito para a montagem (Arquivo adicional 2: Tabela S5). A avaliação BUSCO mostrou 90,5% de completude dos genes centrais conservados (arquivo adicional 2: Tabela S6), que é comparável ou ligeiramente inferior (provavelmente devido ao grande genoma do molusco duro, alto polimorfismo e o uso de um indivíduo não consanguíneo) do que aqueles de genomas de bivalves publicados.

Caracterização e análise filogenética do genoma do molusco duro. uma Paisagem genômica do molusco duro. Dos círculos externos para os internos: a, os 19 cromossomos na escala Mb b, número do gene IAP em cada cromossomo c, distribuição cromossômica de 159 IAPs, com linhas externas e internas indicando cadeias de sentido e anti-sentido, respectivamente. Cada hífen na margem do círculo representa uma cópia do gene IAP d

h, densidade de transposons de DNA, densidade de TE, densidade de repetição, densidade de gene e densidade de GC em todo o genoma, respectivamente, desenhados em janelas não sobrepostas de 1 Mb. b Árvore filogenética calibrada pelo tempo de moluscos duros em metazoários. Os números nas ramificações indicam o número de genes ganhos (+, verde) e perdidos (-, vermelho). Pfu, Pinctada Fucata Cvi, Crassostrea virginica Mph, Modiolus philippinarum Afa, Azumapecten farreri Senhora, Mercenaria mercenaria Rph, Ruditapes philippinarum Csq, Chrysomallon squamiferum Lgi, Lottia gigantea Bgl, Biomphalaria glabrata Aca, Aplysia californica Adu, Architeuthis dux Obi, Polvo bimaculoides Cte, Capitella teleta Hro, Helobdella robusta Ame, Apis mellifera Dme, Drosophila melanogaster Hsa, Homo sapiens Bfl, Branchiostoma floridae Nve, Nematostella vectensis. c As 10 principais vias expandidas e as três principais contraídas que foram enriquecidas com o molusco duro

A anotação usando EVidenceModeler combinando predição ab initio, homologia com outras espécies e dados de RNA-seq identificou 34.283 genes [31, 32] (arquivo adicional 2: Tabela S7). O conjunto de genes do molusco duro é ligeiramente maior do que a maioria dos bivalves sequenciados até hoje, mas semelhante ao da ostra oriental Crassostrea virginica (34.596) e menor que a do mexilhão Modiolus philippinarum (36.549). Em geral, os genomas bivalves codificam mais genes e mostram polimorfismo mais alto do que o genoma humano (Arquivo adicional 2: Tabela S8). Elementos transponíveis (TEs) representaram 49,11% do genoma com transposon de DNA (34,24%), repetições terminais longas (LTRs, 10,04%) e elementos intercalados longos (LINEs, 7,17%) compreendendo as 3 classes principais de transposon (Arquivo adicional 2 : Tabela S9).

Expansão de domínios relacionados à apoptose e rede de coexpressão

Para determinar a posição filogenética do molusco duro, dezenove genomas de metazoários (Fig. 1b) de Cnidaria, Annelida, Mollusca, Arthropoda, Chordata e Vertebrata foram selecionados para agrupamento de família de genes, que identificou 43.245 famílias de genes, incluindo 237 famílias de genes de cópia única . Os genes de cópia única dos 19 genomas de metazoários foram usados ​​para análise filogenética com um método de máxima verossimilhança. Datamos o tempo de divergência do molusco duro de seu nó mais próximo (Ruditapes philippinarum) para aproximadamente 178,9 Mya (Fig. 1b). Do ancestral Heteroconchia comum para M. mercenaria, 229 famílias de genes expandidos com enriquecimento significativo em genes relacionados à resposta imune e vias de apoptose, como sinalização de receptor semelhante a NOD, proteólise mediada por ubiquitina e sinalização de TNF-kappa B (Fig. 1c, Arquivo adicional 3: Tabela S10). A expansão das famílias de genes imunológicos e relacionados à apoptose sugere que essas famílias de genes são importantes para a adaptação do molusco duro.

Uma vez que a apoptose é uma das vias mais significativamente expandidas em M. mercenaria, focamos uma análise mais aprofundada na via de apoptose, incluindo vias de sinalização regulatória, como sinalização de receptor semelhante a NOD e vias de sinalização de TNF-kappa B. Pesquisamos domínios relacionados à apoptose no genoma de M. mercenaria e comparamos nossos resultados com os obtidos para outras espécies (Fig. 2), para melhor caracterizar a expansão de genes relacionados à apoptose. Sete domínios canônicos relacionados à apoptose, BIR, TNF, DEATH, CARD2, TIR2 (toll / receptor de interleucina 2), RING e Hsp70 foram amplamente expandidos em M. mercenaria e outros bivalves (Fig. 2). A co-expansão de TNFs e BIRs, em particular, suporta a regulação aumentada da apoptose, uma vez que em humanos, TNF e IAP (proteína contendo BIR) trabalham juntos na regulação do destino celular. Por exemplo, o TNF modula diversas respostas celulares, incluindo apoptose e necroptose, por meio de múltiplos complexos de sinalização originados da superfamília TNFR, com cIAPs como um componente integral, envolvendo o recrutamento de transdutores de sinal a jusante [11,12,13]. O número de genes contendo o domínio BIR em hard clam, 177 cópias, é o mais alto (p & lt 0,001) entre todos os metazoários estudados (Fig. 2). A expansão significativa dos domínios relacionados à apoptose em moluscos e outros bivalves sugere que os bivalves podem ter um conjunto de genes forte e complexo para regular a apoptose e o estresse celular.

Distribuição dos domínios da proteína Pfam associados à apoptose em moluscos e outros metazoários. Senhora, Mercenaria mercenaria Rph, Ruditapes philippinarum Afa, Azumapecten farreri Mph, Modiolus philippinarum Cvi, Crassostrea virginica Pfu, Pinctada Fucata Csq, Chrysomallon squamiferum Lgi, Lottia gigantea Bgl, Biomphalaria glabrata Aca, Aplysia californica Adu, Architeuthis dux Obi, Polvo bimaculoides Cte, Capitella teleta Hro, Helobdella robusta Ame, Apis mellifera Dme, Drosophila melanogaster Hsa, Homo sapiens Bfl, Branchiostoma floridae Nve, Nematostella vectensis. Abreviações de domínio: Bcl-2, proteínas reguladoras de apoptose, família Bcl-2 CARD, domínio de recrutamento de caspase DED, domínio efetor de morte IAP, inibidor de domínio de apoptose NACHT, um domínio encontrado em proteínas NAIP, CIITA, HET-E e TEP1 NB-ARC , um adaptador de ligação de nucleotídeo compartilhado por APAF-1, certos produtos do gene R e CED-4 TIR, domínio do receptor de toll / interleucina-l TNF, fator de necrose tumoral TNFR, receptor do fator de necrose tumoral zf-C3HC4_3, dedo de zinco, tipo C3HC4 (Dedo anelar). Expansão em M. mercenaria ou Bivalves é indicado por um significativo, corrigido P valor (P & lt 0,001), a partir de testes de qui-quadrado para super-representação, usando todos os genes anotados como pano de fundo. A cor, de cinza a vermelho, indica a classificação de baixo para cima

Para explorar os papéis dos IAPs na resposta imune inata do molusco, realizamos análise ponderada de rede de coexpressão de genes (WGCNA) em 39 transcriptomas de 10 órgãos, com foco em genes que mostram conectividade aumentada em hemolinfa, hepatopâncreas e brânquias, os órgãos primários na defesa inicial contra patógenos. Primeiro, identificamos 19.548 genes associados a órgãos que foram diferencialmente expressos entre quaisquer dois órgãos. Nossa análise identificou 11 módulos de genes com módulos marrom, vermelho e turquesa exibindo correlação significativa com hemolinfa, hepatopâncreas e brânquias, respectivamente (Fig. 3a, b). O molusco duro mostrou claras assinaturas transcriptômicas específicas do órgão. Os genes expressos de forma proeminente na hemolinfa estão associados às cascatas do complemento e da coagulação e à via de sinalização do TNF, e essas assinaturas transcriptômicas foram compartilhadas com outros moluscos (Arquivo adicional 5: Fig. S3). Particularmente, os genes associados à apoptose foram amplamente enriquecidos em transcriptomas de hemolinfa e guelras (arquivo adicional 5: Fig. S3 e arquivo adicional 6: Fig. S4). Na rede de co-expressão das 20 principais vias KEGG enriquecidas em genes expressos especificamente em hemolinfa (genes de módulo marrom), as vias apoptóticas foram interconectadas com a sinalização de NF-kappa B, sinalização de TNF, sinalização de receptor semelhante a NOD e vias de câncer. Essas descobertas indicam que as interações entre essas vias formam uma rede que regula a morte e a sobrevivência celular, a homeostase celular e a imunidade em moluscos duros (a sombra marrom no arquivo adicional 6: Fig. S4). Nas 20 principais vias KEGG enriquecidas do módulo marrom, muitos genes foram anotados como IAPs e enriquecidos em vias apoptóticas (29/45). Os IAPs também mostraram uma coexpressão extensa e robusta com outros genes no módulo marrom no corte do coeficiente de correlação ponderado de & gt 0,35 (3% principais) (arquivo adicional 7: Fig. S5). Este achado indica que a regulação da apoptose pode desempenhar um papel importante na resposta imune em moluscos.

Análise da rede de co-expressão de genes específicos de órgãos em moluscos, com foco em genes candidatos de resposta imune na hemolinfa. uma Módulo de construção de rede de expressão gênica para 39 amostras. Te, testículo Ov, ovário Ma, manto Gi, brânquia Fo, pé In, intestino Hep, hepatopâncreas St, estômago Ad, adutor Hem, hemolinfa. b Matriz de correlação entre módulos e órgãos. P o valor é apresentado em cada célula, e a cor indica o coeficiente de correlação

Expansão IAP por duplicação tandem e retroposição

Alguns dos genes contendo o domínio BIR (Fig. 2) estavam incompletos e uma análise posterior identificou 159 IAPs genuínos (Figs. 1a e 4b), dando ao molusco duro o maior repertório de genes IAP identificado até o momento. A expansão da família IAP no hard clam envolveu vários eventos de duplicação local em tandem e retroposição. Duplicações maciças em tandem foram observadas nos cromossomos (Chr) 5, 6 e 7. Entre os 159 IAPs, 59 (37,1%) estavam densamente ligados em matrizes tandem em Chr 5, enquanto 22 (13,8%) e 12 (7,6%) estavam duplicado em tandem em Chr 6 e 7, respectivamente (Fig. 1a). Um exemplo de matriz contém 6 IAPs replicados em tandem localizados em 12.280–12.370 quilobase (kb) em Chr 5, transcritos na mesma direção sem outros genes intercalados entre eles (Fig. 5a).

Arquiteturas de domínio de IAPs do hard clam (à esquerda, identificado neste estudo) e humanos (à direita, modificado de Kocab et al. 2016) (uma) árvore filogenética de 159 IAPs do molusco duro (b) distribuição de arquiteturas de domínio (c) e número de íntron de diferentes clados filogenéticos (d)

Divergência no perfil de expressão de IAPs duplicados em moluscos. uma Duplicação em tandem de seis IAPs em um

Região de 90 kb, com divergência de expressão entre diferentes órgãos e fases durante a exposição aérea. b Pressão seletiva nas seis IAPs duplicadas. c A predição do modelo de gene para as seis linhas IAPs duplicadas representam íntrons e as caixas representam exons. As regiões que codificam domínios diferentes são coloridas de acordo. Os números acima dos íntrons indicam a fase de cada íntron. d Limites de domínios encontrados em IAPs hard clam

Além da duplicação em tandem, uma proporção significativa de IAPs (51, 32,1%) eram sem íntron e pareciam estar distribuídos aleatoriamente entre os cromossomos (arquivo adicional 8: Tabela S11), indicando retroposição. As análises filogenéticas dos 159 IAPs revelaram 6 clados discretos com pequenas distâncias genéticas e 4 outros genes fora desses clados. O clado 1 continha 49 IAPs (Fig. 4b), dos quais 42 eram sem íntron e apresentavam arquiteturas de domínio semelhantes (um exon que codifica BIR sem intron), sugestivo de uma explosão de retroposição de um gene “parental” comum. Assim, especulamos que tanto a duplicação em tandem quanto a retroposição alimentaram a expansão evolutiva dos IAPs no genoma do molusco duro.

Mecanisticamente, a duplicação de genes pode ser facilitada por TEs associados. A análise da distribuição de TE revelou que os transposons de DNA foram significativamente enriquecidos (p & lt 0,01) em torno dos genes IAP (densidade média = 0,12) em comparação com outros genes no genoma (densidade média = 0,05), enquanto outros tipos de TEs (incluindo LINE, LTR e SINE) não mostraram nenhuma diferença significativa (arquivo adicional 9: Fig . S6). Esta descoberta indica que os transposons de DNA podem ter desempenhado um papel na expansão massiva dos genes IAP no genoma de moluscos duros.

O embaralhamento frequente de domínio levou à diversidade da estrutura do IAP

Para entender a evolução dos IAPs após a duplicação, classificamos a arquitetura de domínio dos IAPs clam em sete tipos, A – G (Fig. 4a), com base no número de cópias dos domínios BIR e RING, que são fundamentais para a função dos IAPs. O embaralhamento extensivo de domínio foi encontrado em IAPs hard clam. Conforme revelado pela classificação de arquitetura de domínio e análise filogenética (Fig. 4b), IAPs que agrupados podem ser derivados do mesmo gene ancestral e a arquitetura de domínio variou dentro do mesmo agrupamento. Clam IAPs no mesmo clado (2–5) eram compostos de 3 a 6 tipos de arquitetura de domínio diferentes, com cada clado tendo uma arquitetura de domínio dominante (& gt 50%) e proporções variáveis ​​de tipos derivados (36% a 43%) (Fig . 4c). A estrutura de domínio diverso é derivada de embaralhamento de domínio, isto é, ganhando ou perdendo os domínios BIR / RING. Por exemplo, os 6 IAPs duplicados em tandem em uma região de 90 kb em Chr 5 (Fig. 5a, Arquivo adicional 8: Tabela S11), exibiram três tipos de arquiteturas de domínio, C, F e G (Fig. 4a), indicando o embaralhamento de domínio ocorreu durante ou após a duplicação tandem.

Para investigar como o embaralhamento de domínio afetou IAP estrutura do gene, examinamos a estrutura íntron-exon dos domínios BIR, RING, BIRC6 e UBA (Fig. 5d). Notavelmente, cada domínio exibiu estruturas íntron-exon altamente conservadas. Enquanto o domínio RING estava ligado a um único exon no final do gene, a maioria dos IAPs de hard clam (exceto aqueles originados da retroposição) tinham um domínio BIR inicial que abrangia os dois primeiros exons. Os primeiros dois exons que codificam BIR foram sempre seguidos por outro exon flanqueado por introns de fase 0 e fase 1 (ou 2) (entre colchetes na Fig. 5c, d). Este achado sugere que um domínio BIR junto com o exon sucessivo pode ser inserido em um IAP como um módulo multi-exon, ou flanqueamento e fases internas do intron permitiram que os domínios fossem "misturados e combinados" a partir de um pool de construção de exon único blocos.

Para determinar se os IAPs duplicados experimentaram pressão de seleção diferente, calculamos a razão de substituição não sinônima para sinônimo (Ka / Ks) para os 6 IAPs duplicados em tandem em Chr 5 (Fig. 5a). O Ka / Ks de todos os 6 IAPs duplicados foi significativamente menor que 1 (p os valores variam de 0

9.74E-47, Fig. 5b), indicando que eles foram funcionalmente restritos pela seleção de purificação. A variação de Ka / Ks de 0,0817 a 0,4456 sugere que os genes duplicados experimentaram diferentes níveis de seleção purificadora, o que pode ser importante para a divergência de sequência e funcional.

Divergência funcional de IAPs duplicados

Para entender como os IAPs respondem aos estressores ambientais, realizamos o RNA-seq nos dias 0, 8 e 16 após os moluscos adultos serem submetidos à exposição aérea. Havia 632 genes regulados positivamente e 343 regulados negativamente no dia 8, enquanto 506 regulados positivamente e 532 regulados negativamente no dia 16. Notavelmente, a via apoptótica foi uma das vias mais significativamente enriquecidas em transcriptomas de mariscos submetidos a uma exposição aérea de 8 ou 16 dias (Fig. 6c, d). Isso indica que a apoptose foi funcionalmente importante para manter a homeostase, uma vez que a exposição aérea causa diminuição nos níveis de pH e oxigênio, levando à disfunção na homeostase celular. O enriquecimento em genes relacionados à apoptose foi atribuído principalmente à expressão da família IAP: 17 dos 27 genes diferencialmente expressos (DEGs) da via apoptótica eram IAPs no dia 8 e 12 de 23 no dia 16 (Fig. 6a , b). Além da exposição aérea, também comparamos os transcriptomas de moluscos duros submetidos a alta temperatura, baixo oxigênio e baixa salinidade. Ao todo, 134 IAPs foram expressos diferencialmente sob pelo menos um estressor ambiental, e entre 27 DEGs compartilhados por todos os estressores, três eram IAPs (Arquivo adicional 10: Fig. S7). Esses achados indicam que mais de 84% dos IAPs expandidos (134 de 159) estão envolvidos na resposta ao estresse no molusco com notável especificidade, o que destaca a importância da expansão e diversificação dos IAPs na resposta e adaptação ao estresse.

Resposta do transcriptoma de moluscos submetidos a estresse de exposição ao ar e divergência de expressão de IAP. uma, b Gráficos de vulcão de genes expressos diferenciais (DEGs) (8 dias vs 0 dias e 16 dias vs 0 dias). c, d, Vias KEGG enriquecidas em DEGs (8 dias vs 0 dias e 16 dias vs 0 dias). e, f Expressão coordenada de IAPs de molusco duro entre órgãos e durante a exposição aérea. IAPs com FPKM médio & lt 0,1 foram considerados silenciosos e excluídos

Os IAPs duplicados exibiram diversos perfis de expressão, tanto espacialmente em diferentes órgãos quanto temporalmente durante o estresse ambiental, sugerindo divergência funcional e coordenação. A divergência funcional está implícita não apenas na expressão específica do órgão dedicado de diferentes IAPs (Fig. 6c), mas também pela resposta diferencial ou padrão de expressão de membros do IAP a estressores ambientais específicos, exemplificado pela resposta diferenciada à exposição aérea (Fig. 6d ), e sensibilidade ou responsividade divergente a diferentes estressores ambientais (Arquivo adicional 11: Fig. S8), onde os IAPs expressos por hemolinfa (módulo marrom de WGCNA) mostraram divergência de expressão clara em resposta a diferentes estressores. Os IAPs no clado verde são sensíveis ao estresse de exposição aérea, enquanto os do clado roxo são sensíveis à baixa salinidade e os do clado azul são sensíveis ao estresse térmico.

Tanto no nível do clado quanto no que diz respeito ao tipo estrutural (Arquivo Adicional 12: Fig. S9 e Arquivo Adicional 13: Fig. S10), a expressão dos IAPs em resposta ao estresse ambiental era altamente variável. Geralmente, os IAPs nos clados 2, 3 e 5 exibiram dinâmica de expressão semelhante em que todos foram regulados positivamente quando os moluscos enfrentaram estresse de exposição térmica, osmótica ou aérea, mas com diferentes níveis de expressão e especificidade de órgão. Em comparação com os IAPs nos clados 2, 3 e 5, aqueles no clado 4 foram menos sensíveis às variáveis ​​ambientais e o clado 6 mostrou padrões de expressão quase opostos. IAPs com diferentes tipos estruturais (A

E) também exibiu padrões de expressão divergentes, por exemplo, IAPs do tipo D que eram particularmente sensíveis a estressores ambientais exibiam clara especificidade de órgão: alta expressão no manto e baixa expressão na hemolinfa. Em contraste, os IAPs do tipo B mostraram resposta semelhante ao estresse ambiental, mas tiveram a maior expressão na hemolinfa. Os IAPs do tipo E mostraram uma tendência oposta aos tipos B e D na resposta a múltiplos estressores.

A noção de expressão orquestrada após a duplicação é reforçada pelos seis IAPs duplicados em tandem em Chr 5 (Fig. 5a), que mostraram capacidade de resposta constitutiva à exposição aérea e viés de expressão de órgão divergente: os genes 5.357 e 3.578 atingiram os níveis de expressão mais altos 8 dias após exposição aérea, 5,359 e 3,360 foram altamente expressos em 16 dias, e 3,61 e 3,62 não exibiram mudanças significativas. Com relação à expressão diferencial entre os órgãos, 5,357 apresentaram a maior expressão nas brânquias, 5,357

5,360 foram superexpressos proeminentemente na hemolinfa, enquanto 5,361 e 5,362 foram expressos uniformemente.

Evolução dos repertórios IAP entre múltiplos filos

Para explorar a origem evolutiva dos IAPs existentes, uma abordagem filoestratigráfica com um corte E & lt e -10 foi aplicada para estimar as idades dos IAPs e genes específicos de órgãos. Definimos 10 classificações filogenéticas (filostratos) com base no banco de dados de taxonomia do NCBI e usando o primeiro filostrato (PS1) como o ponto de origem da vida celular (ou seja, genes mais antigos) e o último filostrato (PS10) como linhagem de molusco duro sob investigação (ou seja, genes mais jovens). Genes específicos de órgãos na hemolinfa, hepatopâncreas e brânquias mostraram um padrão de idade gênica semelhante, em que apenas genes específicos do hepatopâncreas continham uma porcentagem aumentada dos genes mais velhos (+ 11%) e uma porcentagem diminuída dos genes mais jovens (- 9%). A maioria dos IAPs expandidos da amêijoa dura é anterior à origem do Metazoan (50%) e Bilateria (47%), enquanto um IAP (ID, Mme.02 g01599.1, indicado por um triângulo azul na Fig. 7a) apareceu pela primeira vez com o surgimento de eucariotos. Este gene era único em estrutura e tamanho com um comprimento de 90,83 kb (arquivo adicional 8: Tabela S11) e continha um domínio BIR6 (tipo G2 na Fig. 4a). Da mesma forma, um IAP de mamífero, denominado Apollon (4,88 kb e também contendo um domínio BIR6), difere estruturalmente dos IAPs específicos de metazoários clássicos e mostra homologia com uma proteína em levedura [33]. Nossos resultados apóiam a existência de duas linhagens de IAPs, uma é a IAPs contendo BIR6, que é antiga e originada em eucariotos, e a outra linhagem é a IAPs contendo BIRs que são compartilhados por organismos multicelulares [33].

Origem de IAPs de molusco e evolução de IAP em diferentes linhagens de metazoários. uma Origem evolutiva de IAPs e genes específicos de órgãos em moluscos. Análises filoestratigráficas de genes IAPs (azul), específicos para hemolinfa (marrom), específicos para hepatopâncreas (vermelho) e específicos para brânquias (turquesa) em 10 filostratos. Apenas genes para os quais pelo menos um hit BLAST significativo (& lt e − 10) foi retornado foram incluídos. b Expansão e contração do repertório IAP em 18 espécies de diferentes linhagens de metazoários. Os eventos de ganho e perda de genes são mapeados para a árvore de espécies, indicados por números verdes e vermelhos, respectivamente. Os números em caixas amarelas indicam o número IAP ancestral previsto de cada nó. O bloco azul indica Bivalvia. Mph, Modiolus philippinarum Pfu, Pinctada Fucata Cvi, Crassostrea virginica Afa, Azumapecten farreri Senhora, Mercenaria mercenaria Rph, Ruditapes philippinarum Aca, Aplysia californica Bgl, Biomphalaria glabrata Lgi, Lottia gigantea Csq, Chrysomallon squamiferum Adu, Architeuthis dux Obi, Polvo bimaculoides Cte, Capitella teleta Hro, Helobdella robusta Ame, Apis mellifera Dme, Drosophila melanogaster Hsa, Homo sapiens Bfl, Branchiostoma floridae Nve, Nematostella vectensis. c Distribuição de IAPs com diferentes arquiteturas de domínio em 19 espécies de Metazoa. O asterisco indica arquiteturas de domínio expandidas em bivalves com uma correção significativa P valor (P & lt 0,0001) a partir de testes de qui-quadrado para super-representação, usando todos os genes anotados como pano de fundo

Nós ainda identificamos IAPs intactos entre 19 espécies e usamos uma estrutura filogenética para rastrear os destinos evolutivos desses IAPs em vários filos animais (Fig. 7b). O ancestral comum mais recente (MRCA) de todos os metazoários foi estimado em 13 IAPs, enquanto a expansão sucessiva da família IAP provavelmente ocorreu no ancestral molusco comum e linhagens subsequentes. Houve uma expansão significativa em bivalves que não ocorreu em outros taxa (bloco azul na Fig. 7b). A expansão de IAPs bivalves foi principalmente específica para linhagem (Fig. 8), pois parálogos dentro da mesma espécie se agruparam, sugerindo que sua expansão ocorreu após a especiação. A expansão significativa de IAPs em várias linhagens de bivalves implica na evolução convergente da regulação aprimorada da apoptose em bivalves estacionários que precisam lidar com o estresse ambiental sem a capacidade de evitá-la.

Análise filogenética de IAPs de Mercenaria mercenaria (Madame), Crassostrea virginica (Cvi), Crassostrea gigas (Cgi), Biomphalaria glabrata (Bgl), e Homo sapiens (Hsa) O dendrograma foi gerado usando análise Bayesiana com modelo de substituição WAG. A arquitetura do domínio é definida na Fig. 4a

Os IAPs bivalves massivamente expandidos foram dominados por tipos estruturais de domínio B, C, F e G1 (Fig. 7c), que consistem em um ou dois domínios BIR, acoplados ou desacoplados com um domínio RING. Eles diferiam consideravelmente de outros tipos de IAP (ou seja, A, D, E, G2 e G3), que têm menos cópias (& lt 5) em todos os filos animais. Além disso, o arranjo de domínio dos tipos D, E e G3 pode ter ocorrido por meio de ganho de domínio (um BIR extra), perda (domínio RING ausente) e cooptação (cooptado PC4), enquanto os tipos H e I em humanos são prováveis ​​inovações estruturais que cooptaram os domínios CARD, NACHT, NOD2_WH e NLRC4_HD.


Resultados e discussão

A supressão de reguladores mestres transcricionais metabólicos precede o acúmulo de lipídios durante o estresse ER

O acúmulo de lipídios pode ser induzido no fígado pela exposição ao inibidor da tunicamicina de glicosilação ligada a N (TM) ou ao inibidor proteassomal bortezomib, ou por superexpressão de uma proteína cliente ER mal dobrada, como o Fator VIII de coagulação [GenBank: <"tipo": "entrez-nucleotide", "attrs": <"text": "NM_001161373.1", "term_id": "238624181", "term_text": "NM_001161373.1" >> NM_001161373.1] (Rutkowski et al., 2008 Zhang et al., 2011 Chikka et al., 2013). Cada um desses tratamentos ativa a UPR ou a resposta integrada ao estresse e cada um leva a mudanças qualitativamente semelhantes na expressão dos principais genes metabólicos do fígado. Esses genes incluem fatores de transcrição e cofatores envolvidos no controle do metabolismo, bem como os alvos a jusante desses fatores que codificam as principais enzimas funcionais envolvidas no catabolismo lipídico, anabolismo, armazenamento e secreção (Rutkowski et al., 2008).

A organização temporal dessas mudanças regulatórias gênicas antes e após o início do acúmulo de lipídios não foi analisada. É provável que o primeiro desses eventos regulados esteja diretamente conectado mecanicamente à UPR e / ou resposta integrada ao estresse. Assim, examinamos o curso do tempo do acúmulo de lipídios hepáticos em camundongos do tipo selvagem em resposta à TM, que é um indutor mais robusto de estresse de ER e esteatose do que outros estímulos (Chikka et al., 2013). Monitoramos o acúmulo de lipídeos por três critérios distintos: acúmulo de Oil Red O em gotículas de lipídeos de seções frescas de fígado congeladas (Figura & # x200B (Figure1A) 1A) detecção imunohistoquímica da proteína adipofilina associada a gotículas de lipídeo (ADRP) [GenBank: <" digite ":" entrez-nucleotide "," attrs ": <" text ":" NM_007408.3 "," term_id ":" 116235488 "," term_text ":" NM_007408.3 ">> NM_007408.3] (Figura & # x200B (Figura 1B) 1B) e avaliação bioquímica direta dos níveis de triglicerídeos hepáticos (Figura & # x200B (Figura 1C). 1C). Os resultados de todos os três ensaios foram semelhantes: o conteúdo de lipídios hepáticos aumentou substancialmente no ponto de tempo de 8 h. Portanto, os principais eventos regulatórios genéticos responsáveis ​​pela alteração do metabolismo lipídico são prováveis ​​de ocorrer antes de 8 h, enquanto aqueles que ocorrem depois de 8 h após o desafio são mais prováveis ​​efeitos secundários que contribuem para a ruptura lipídica tangencialmente, se o fizerem.

O estresse ER causa acúmulo substancial de lipídios hepáticos em 8 horas. (UMA) Camundongos C57BL / 6J foram desafiados com 1 mg / kg TM nos tempos indicados, os fígados foram congelados em OCT e os lipídios foram corados com Oil Red O. Barra de escala = 50 & # x003bcm. (B) Igual a (UMA), exceto o conteúdo lipídico foi avaliado por coloração imunohistoquímica para a proteína marcadora de gotículas de lipídeos ADRP. Barra de escala = 50 & # x003bcm. (C) Igual a (UMA), exceto o conteúdo de triglicerídeos foi medido por ensaio colorimétrico após a extração de lipídeos neutros. p & # x0003c 0,001 por One-Way ANOVA. n = 3 amostras por ponto de tempo. As barras de erro aqui e em outros lugares mostram os meios & # x000b1 SDM.

Em seguida, examinamos o momento da ativação do UPR e da regulação dos genes metabólicos.TM levou a união dependente de IRE1 & # x003b1 máxima de Xbp1 mRNA dentro de 2 h este splicing persistiu por 8 h, mas foi diminuído em pontos de tempo posteriores (Figura & # x200B (Figura 2A). 2A). Da mesma forma, cada gene alvo regulado por UPR foi significativamente regulado positivamente por 2 h, atingiu o pico em 4 & # x020138 h, e diminuiu depois disso (Figura & # x200B (Figura 2B). 2B). Esses genes dependem em graus variáveis ​​da atividade de cada uma das três vias de UPR (Harding et al., 2003 Lee et al., 2003 Wu et al., 2007). Que eles são regulados uniformemente por 2 h sugere que cada um dos três ativadores transcricionais regulados por UPR canônico & # x02014ATF6 & # x003b1, ATF4 e XBP1 & # x02014 está funcionalmente ativo neste ponto de tempo muito inicial.

Supressão escalonada de genes metabólicos durante o estresse de ER. (UMA) As formas emendada (spl) e não emendada (us) de Xbp1 O mRNA foi detectado por RT-PCR de RNA total isolado de fígados de camundongos tratados com veículo (veh) ou 1 mg / kg TM nos tempos indicados. Cada pista mostra um animal separado. A imagem é mostrada na forma invertida de preto para branco para maior clareza visual. (B) A expressão dos genes alvo UPR indicados foi determinada por qRT-PCR dos animais mostrados em (UMA), com Btf3 e Ppia usados ​​como controles de normalização. A expressão aqui e nas figuras subsequentes é dada em um log2 escala em relação à condição tratada com veículo. Aqui e em outros lugares, a menos que indicado: * p & # x0003c 0.05 # p & # x0003c 0.1 por estudante bicaudal t-teste. (C & # x02013F) A expressão de genes metabólicos foi avaliada por qRT-PCR como em (B), e os genes foram agrupados de acordo com o ponto de tempo em que a regulação negativa (p & # x0003c 0.1) foi observado pela primeira vez. O processo no qual cada gene participa é listado.

Em seguida, analisamos a expressão de genes envolvidos no metabolismo lipídico, incluindo reguladores transcricionais e enzimas metabólicas limitantes da taxa-chave. Agrupamos os genes de acordo com o momento em que foram regulados negativamente pela primeira vez. Observamos imediatamente que, ao contrário dos genes-alvo UPR convencionais, a regulação dos genes metabólicos ocorria em estágios. O primeiro grupo regulamentado incluiu fatores de transcrição e cofatores selecionados. O co-regulador Pgc1b [GenBank: <"type": "entrez-nucleotide", "attrs": <"text": "NM_133249.2", "term_id": "118131021", "term_text": "NM_133249.2" >> NM_133249. 2] foi regulado para baixo em 2 h, embora não em 4 h (Figura & # x200B (Figura 2C), 2C), tornando o verdadeiro tempo de sua supressão ambíguo. Em contraste, por 4 h o co-regulador Pgc1a [GenBank: <"type": "entrez-nucleotide", "attrs": <"text": "NM_008904.2", "term_id": "238018130", "term_text": "NM_008904.2" >> NM_008904. 2] e os ativadores transcricionais Cebpa [GenBank: <"type": "entrez-nucleotide", "attrs": <"text": "NM_007678.3", "term_id": "131886531", "term_text": "NM_007678.3" >> NM_007678. 3] e Ppara [GenBank: <"type": "entrez-nucleotide", "attrs": <"text": "NM_001113418.1", "term_id": "164663879", "term_text": "NM_001113418.1" >> NM_001113418. 1] foram suprimidos (Figura & # x200B (Figura 2C). 2C). PGC-1 & # x003b2 contribui para a lipogênese, oxidação de ácidos graxos e produção e secreção de VLDL (Lee et al., 2003 Lin et al., 2003, 2005a, b Wolfrum e Stoffel, 2006), e PGC-1 & # x003b1 contribui para os dois últimos desses processos (Louet et al., 2002 Lin et al., 2005a Rhee et al., 2006). C / EBP & # x003b1 tem papéis gerais na homeostase energética, incluindo metabolismo de lipídios e glicose, enquanto PPAR & # x003b1 é um regulador mestre da oxidação de ácidos graxos (Desvergne et al., 2006).

Os genes regulados negativamente em momentos posteriores & # x02014i.e., Após o início do acúmulo de lipídios pronunciado & # x02014 incluíram reguladores transcricionais e genes a jusante que codificam enzimas limitadoras de taxa em processos metabólicos, conforme indicado nas Figuras 2D & # x02013F. Estes resultados sugerem que PGC-1 & # x003b1, C / EBP & # x003b1 e PPAR & # x003b1 (e possivelmente PGC-1 & # x003b2) são provavelmente os primeiros genes metabólicos de lipídios regulados pelo estresse ER. Além disso, os processos a jusante desses fatores & # x02014, ou seja, oxidação de ácidos graxos e biogênese e transporte de lipoproteínas & # x02014 são os primeiros afetados por meio de mecanismos reguladores de genes. Além disso, como os genes lipogênicos não são alterados até muito mais tarde (18 h), eles sugerem que a inibição da lipogênese é uma consequência secundária do estresse do RE, talvez ocorrendo como resultado de feedback negativo quando os lipídios começam a se acumular. Além disso, embora o splicing de XBP1 seja induzido por estresse ER, não encontramos evidências de que a expressão do gene lipogênico foi estimulado sob estas condições.

A exclusão de ATF6 & # x003b1 agrava a supressão do gene metabólico

Camundongos sem ATF6 & # x003b1, embora aparentemente normais e saudáveis, exibem esteatose dramática após o desafio com TM (Rutkowski et al., 2008 Yamamoto et al., 2010). Este fenótipo é ilustrado por coloração ADRP na Figura & # x200B. Figura 3A 3A, que surge de uma incapacidade de restaurar a homeostase de ER após o desafio. Portanto, raciocinamos que esses camundongos poderiam ser usados ​​para expor as mudanças de expressão gênica regulada pelo estresse que realmente estão por trás da desregulação lipídica, uma vez que essas mudanças devem ser amplificadas em Atf6& # x003b1 & # x02212 / & # x02212 animais. Um segundo benefício desses animais é que eles podem ser usados ​​para identificar mudanças de expressão verdadeiramente responsivas ao estresse, aquelas que resultam de propriedades de TM independentes de estresse de ER não deveriam diferir entre o tipo selvagem e Atf6& # x003b1 & # x02212 / & # x02212 animais, uma vez que ATF6 & # x003b1 não é pensado para agir fora do contexto de estresse ER, e sua deleção não altera a aparente atividade farmacológica da TM (Rutkowski et al., 2008).

Perda de Atf6& # x003b1 exacerba a esteatose e a supressão genética metabólica de longo prazo. (UMA) Wild-type ou Atf6& # x003b1 & # x02212 / & # x02212 camundongos foram desafiados com 1 mg / kg TM ou veículo por 48 h, e a imunocoloração ADRP foi realizada como na Figura & # x200B Figura 1. 1 Barra de escala = 50 & # x003bcm. (B & # x02013F) Wild-type ou Atf6& # x003b1 & # x02212 / & # x02212 camundongos foram desafiados com 1 mg / kg TM ou veículo por 34 h, e a expressão global de mRNA foi avaliada por microarray Affymetrix. A expressão determinada por array dos genes indicados é mostrada. Os genes foram organizados nos mesmos agrupamentos que na Figura & # x200B Figura2. 2 A significância estatística foi calculada por estudante bicaudal t-teste, comparando a expressão em tratados com TM Atf6& # x003b1 & # x02212 / & # x02212 animais contra animais de tipo selvagem tratados com TM. n = 3 animais por grupo. (G) Os camundongos foram tratados com TM ou veículo por 48 h como em (UMA), e a expressão dos genes indicados foi determinada por qRT-PCR. A significância foi determinada como em (B & # x02013F).

Abordamos esse objetivo desafiando o tipo selvagem e Atf6& # x003b1 & # x02212 / & # x02212 animais por um período prolongado (34 h) com TM e, em seguida, perfilando a expressão gênica global por microarray. Escolhemos essa abordagem em parte porque tínhamos usado anteriormente o perfil de microarray para caracterizar a expressão gênica nessas mesmas cepas de camundongos após 8 h de desafio de TM (Rutkowski et al., 2008). A realização de um segundo estudo de microarray com um chip de gene idêntico em um momento posterior nos forneceria a oportunidade única de determinar, para cada gene na matriz, sua expressão em dois genótipos diferentes, sob dois regimes de tratamento diferentes (veículo e TM) em duas vezes diferentes.

Por ter 8 combinações distintas de condições experimentais, previmos que poderíamos começar a identificar grupos de genes regulados de forma coordenada, incluindo os genes metabólicos mais responsivos ao estresse de RE. Isso se baseou no pressuposto de que os genes que fazem parte de uma via funcional comum (neste caso, o metabolismo lipídico) deveriam ser regulados de forma semelhante. Esta abordagem tem sido usada com grande efeito em leveduras e, mais recentemente, em células de mamíferos em cultura, para expor componentes anteriormente ocultos do aparelho secretor e outras vias de interesse (Schuldiner e Weissman, 2013). Aqui, nosso objetivo era inferir reguladores transcricionais ocultos usando padrões temporais de expressão gênica como uma saída.

Entre os genes metabólicos examinados, nenhum foi regulado positivamente pelo estresse de ER em nenhum dos genótipos às 34 h. Dois genes & # x02014 os reguladores lipogênicos e colesterologênicos Srebf1 [GenBank: <"type": "entrez-nucleotide", "attrs": <"text": "NM_011480.3", "term_id": "146134488", "term_text": "NM_011480.3" >> NM_011480. 3] e Srebf2 [GenBank: <"type": "entrez-nucleotide", "attrs": <"text": "NM_033218.1", "term_id": "73661203", "term_text": "NM_033218.1" >> NM_033218. 1] & # x02014 foram igualmente regulados negativamente em ambos os genótipos (Figuras 3D, E). No entanto, a grande maioria dos genes foi expressa em níveis normais ou quase normais em animais de tipo selvagem, mas profundamente suprimidos em Atf6 & # x003b1 & # x02212 / & # x02212 animais (Figuras 3C e # x02013F). O perfil de qRT-PCR de uma amostra desses genes de um experimento independente confirmou esses achados (Figura & # x200B (Figure3G). 3G). Esses dados são consistentes com a ideia de que o estresse agudo de ER inibe a oxidação de ácidos graxos e a biogênese de lipoproteínas no nível da expressão gênica e não estimula a expressão gênica lipogênica.

Grupos de genes funcionalmente relacionados se agrupam temporariamente

Tendo essas 8 condições experimentais distintas nos permitiu comparar o comportamento global da expressão do gene hepático em resposta ao estresse ER em tempos iniciais vs. tardios em animais normais vs. aqueles com uma UPR comprometida. Um mapa de calor mostrando genes regulados por TM deixa duas observações claras: primeiro, as diferenças de expressão gênica entre os dois genótipos foram muito mais extensas em 34 horas do que em 8 horas. Em segundo lugar, às 34 h, muitos genes voltaram à expressão normal ou quase normal em animais de tipo selvagem, mas permaneceram regulados, ou tornaram-se ainda mais regulados na mesma direção, em Atf6 & # x003b1 & # x02212 / & # x02212 animais.

Cada gene foi então categorizado com base em se foi regulado positivamente, regulado negativamente ou inalterado por estresse ER em tipo selvagem e Atf6 & # x003b1 & # x02212 / & # x02212 animais após 8 ou 34 h de estresse. Assim, um gene pode cair em qualquer um dos 81 (3 & # x000d7 3 & # x000d7 3 & # x000d7 3) perfis de expressão. As atribuições para todos os conjuntos de sondas são fornecidas na Tabela S1. Fomos capazes de analisar os genes desta forma em parte porque muito poucos genes diferiam em sua expressão basal (ou seja, sem estresse) entre os genótipos, quase todas as mudanças dependentes do genótipo na expressão foram causadas por TM, então as diferenças de expressão basal não foram confusas (Rutkowski et al., 2008).

Porque Atf6 & # x003b1 & # x02212 / & # x02212 animais tornaram-se mais esteatóticos do que os animais do tipo selvagem, genes que não foram diferencialmente expressos entre os dois genótipos após 34 h de tratamento com TM não foram perseguidos posteriormente, uma vez que estes provavelmente não seriam os principais contribuintes para o fenótipo esteatótico. Embora 54 combinações de expressão restantes fossem possíveis (3 & # x000d7 3 & # x000d7 3 & # x000d7 2), 90 por cento dos genes caíram em apenas 9 categorias (A & # x02013I, Figura & # x200B Figura4B). 4B). Cada categoria de genes recebeu então uma representação gráfica do padrão de expressão de seus membros (Figuras 4C e # x02013G). Os dois grupos de genes mais populosos (Grupos A e B) foram aqueles que não foram afetados pelo estresse em 8 h em qualquer genótipo, ou em animais de tipo selvagem em 34 h, mas foram regulados para cima ou para baixo, respectivamente, às 34 h em Atf6 & # x003b1 & # x02212 / & # x02212 animais (Figura & # x200B (Figura4E). 4E). Entre os genes metabólicos representados nas Figuras & # x200B, Figuras 2, 2, & # x200B, 3, 3, vários deles povoam o Grupo B e incluem genes que codificam enzimas limitantes da taxa em cada via de oxidação de ácidos graxos & # x02014Acox1, Cpt1a, e Cyp4a10 [GenBank: <"type": "entrez-nucleotide", "attrs": <"text": "NM_015729.3", "term_id": "429484482", "term_text": "NM_015729.3" >> NM_015729. 3, <"type": "entrez-nucleotide", "attrs": <"text": "NM_013495.2", "term_id": "162287141", "term_text": "NM_013495.2" >> NM_013495.2 e <"type": "entrez-nucleotide", "attrs": <"text": "NM_010011.3", "term_id": "227116293", "term_text": "NM_010011.3" >> NM_010011.3 ], que controlam a oxidação peroxissômica, mitocondrial e microssomal, respectivamente. Como a expressão desses genes não é alterada até o ponto de tempo posterior, é improvável que eles estejam proximalmente conectados ao UPR, mas mais provavelmente representam efeitos indiretos & # x02014 por exemplo, de supressão de PPAR & # x003b1. Os próximos dois grupos mais populosos (Grupos C e D) incluíram os genes que foram regulados para cima ou para baixo no início de ambos os genótipos, e cuja expressão voltou aos níveis normais em animais de tipo selvagem por 34 h, mas que permaneceram regulados em Atf6 & # x003b1 & # x02212 / & # x02212 animais. Entre os genes metabólicos, o Grupo D incluiu os co-reguladores Pgc1a e Pgc1b. Intimamente relacionados a esses grupos estavam os Grupos E e F, que incluíam genes que foram regulados para cima ou para baixo no início de ambos os genótipos, e para os quais essa regulação foi aumentada em Atf6 & # x003b1 & # x02212 / & # x02212 animais às 34 h. Os outros dois genes metabólicos regulados rapidamente, Cebpa e Ppara, foram encontrados no Grupo F.

Agrupamento de genes de acordo com a regulação temporal no tipo selvagem e Atf6 & # x003b1 & # x02212 / & # x02212 animais. (UMA) A expressão de cada conjunto de sondas no microarray Affymetrix descrito na Figura & # x200B Figura 3 3 foi agregada com dados de expressão de uma matriz idêntica publicada anteriormente comparando a expressão gênica em tipo selvagem e Atf6 & # x003b1 & # x02212 / & # x02212 animais 8 h após o desafio com veículo ou 2 mg / kg TM (Rutkowski et al., 2008). Para cada ponto de tempo, a expressão foi determinada usando um log2 escala em relação aos animais de tipo selvagem tratados com veículo naquele ponto de tempo. Apenas conjuntos de sondas mostrando significante (p & # x0003c 0,05) diferenças de expressão (1,5 vezes, ou & # x000b10,58 no log2 escala) em uma ou mais das quatro das quatro condições (tipo selvagem ou Atf6 & # x003b1 & # x02212 / & # x02212 às 8 ou 34 h) são mostrados pelo mapa de calor, que levou em consideração

45.000 conjuntos de sondas na matriz. A extensão da regulação para cima ou para baixo é mostrada pela intensidade da coloração vermelha ou azul, respectivamente. Cada coluna descreve o nível de expressão em média entre os três animais por grupo. (B, C) Cada conjunto de sondas na matriz foi caracterizado por sua expressão das quatro maneiras a seguir, com diferenças definidas como & # x0003e 1,5 vezes, p & # x0003c 0,05: (1) para cima, para baixo ou inalterado em animais tratados com TM de tipo selvagem em 8 h em relação ao tipo selvagem tratado com veículo (2) para cima, para baixo ou inalterado em Atf6 & # x003b1 & # x02212 / & # x02212 animais tratados com TM às 8 h em relação ao tipo selvagem tratado com TM (3) igual a (1) mas 34 h e (4) igual a (2) mas 34 h. Os genes que apresentaram diferença pelo critério (4) foram divididos em grupos com base em seu comportamento em relação a esses critérios, e o número de genes nos nove grupos mais populosos é mostrado em (B). O grupo de genes que foram regulados positivamente por estresse ER em animais do tipo selvagem em ambos os pontos de tempo, mas foram menos regulados positivamente em Atf6 & # x003b1 & # x02212 / & # x02212 animais & # x02014i.e., Genes que podem ser entendidos como diretamente dependentes de ATF6 & # x003b1 & # x02014 também são considerados. (C) fornece uma chave para ilustração dos padrões de expressão gênica. (D & # x02013G) Padrão de expressão para cada um dos grupos de genes mostrados em (B). Estes incluem genes mostrados na Figura & # x200B Figura 2 2 (aqueles que não se enquadram em um desses grupos são ilustrados na Figura S1), bem como genes envolvidos no processamento da proteína ER encontrados no Grupo E. Para genes representados por mais de um conjunto de sondas , o comportamento mais comumente representado e / ou mais consistente com os dados de qRT-PCR é mostrado.

Os grupos D e F foram de maior interesse para nós porque representavam os genes com maior probabilidade de estarem mecanicamente conectados de forma proximal à sinalização UPR, uma vez que eram regulados rapidamente pelo estresse ER e uma vez que sua expressão de longo prazo coincidia com o estresse e piora ER persistente acúmulo de lipídios visto em Atf6 & # x003b1 & # x02212 / & # x02212 animais. O Grupo F, em particular, foi digno de nota porque sua coorte homóloga de genes regulados positivamente & # x02014Grupo E & # x02014 incluiu uma série de genes conhecidos por serem alvos diretos de fatores de transcrição UPR e que estão, portanto, proximalmente conectados à sinalização UPR (Figura & # x200B (Figura2D 2D).

Também apoiando a validade da abordagem estava o grupo de genes que foram regulados positivamente por estresse ER em animais do tipo selvagem em ambos os pontos de tempo, mas que não foram regulados positivamente em Atf6 & # x003b1 & # x02212 / & # x02212 animais em ambos os pontos de tempo (Figura & # x200B (Figure4G). 4G). Esses genes se encaixariam no perfil esperado de alvos diretos de ATF6 & # x003b1. Embora houvesse relativamente poucos genes neste grupo, eles incluíram aqueles já descritos como alvos ATF6 & # x003b1 diretos, incluindo Erp72, p58 IPK, Erdj3, e Derl3 (Wu et al., 2007 Yamamoto et al., 2007). Esta descoberta apóia a ideia de que genes co-regulados podem ser discriminados com base em seu perfil de expressão nesta configuração.

Essa ideia foi reforçada pela análise de caminhos. Os genes de cada um dos dez grupos (A & # x02013I e ATF6) foram analisados ​​para enriquecimento funcional das vias da Ontologia Genética (GO) usando FunNet (Prifti et al., 2008). Como prova de conceito, a análise da via dos genes do Grupo ATF6 produziu & # x0201 resposta de proteína dobrada & # x0201d como o processo mais significativamente enriquecido, o que seria esperado de um grupo que engloba alvos diretos ATF6 & # x003b1 (Figura & # x200B (Figura5A). 5A). Os genes que representam processos relevantes para o metabolismo lipídico foram enriquecidos em todos os grupos regulados negativamente & # x02014B, D, F e G & # x02014, mas não nos grupos regulados positivamente A, C, E, H e I (Figuras 5B, C). Por outro lado, cada um dos grupos regulados positivamente foi enriquecido em genes que representam vias relevantes para a síntese, tráfego e degradação de proteínas. A ativação de UPR durante o estresse ER é conhecida por aumentar transcricionalmente a maquinaria de biogênese de proteína celular por meio da ação dos principais ativadores transcricionais regulados por UPR XBP1, ATF4 e ATF6 (Harding et al., 2003 Lee et al., 2003 Wu et al., 2007).Esta análise da via sugere, portanto, que, pelo menos no fígado, a supressão de genes envolvidos no metabolismo lipídico representa um foco combinado de ativação de UPR.

Genes funcionalmente relacionados agrupam-se por regulação temporal. (A & # x02013C) Cada um dos grupos de genes na Figura & # x200B Figura 4 4 foi submetido à análise da via da Ontologia Genética usando FunNet. Os sete principais enriquecimentos de via mais significativos foram então reordenados pelo número de genes desse grupo que eram via & # x0201chits, & # x0201d com as vias tendo mais & # x0201chits & # x0201d listados acima. Por questões de espaço, cinco dessas sete vias de cada grupo são mostradas. Em nenhum caso um processo de metabolismo lipídico foi enriquecido entre os grupos de genes regulados positivamente. No (B), as vias relevantes para o metabolismo lipídico estão listadas em preto e as outras vias em cinza. No (C), as vias relevantes para o processamento de proteínas estão listadas em preto.

A análise genômica funcional identifica HNF4 & # x003b1 como um regulador proximal da expressão do gene metabólico durante o estresse ER

Queríamos aproveitar o poder estatístico de nossas comparações de microarray a fim de prever fatores de transcrição regulatórios cuja atividade foi alterada pelo estresse ER - estes seriam os mais prováveis ​​de estar proximal mecanicamente conectado ao UPR. Para conseguir isso, submetemos os genes em cada grupo à análise usando oPOSSUM (Ho Sui et al., 2005), que pesquisa a região promotora / intensificadora de cada gene para locais de ligação de fator de transcrição de consenso do banco de dados JASPAR CORE. Estabelecendo a validade desta abordagem, os genes no Grupo ATF6 produziram o fator de transcrição NFYA [GenBank: <"type": "entrez-nucleotide", "attrs": <"text": "NM_001110832.1", "term_id": "161016830", "term_text": "NM_001110832.1" >> NM_001110832.1] como o único acerto estatisticamente significativo (Figura & # x200B (Figura 6A). 6A). ATF6 & # x003b1 é conhecido por dimerizar com NFYA para regular a transcrição de promotores contendo elementos ERSE e ERSE II (Yoshida et al., 2000, 2001 Kokame et al., 2001). O NFYA não foi enriquecido em nenhum outro grupo, ressaltando a especificidade do algoritmo.

A predição do fator de transcrição implica ELK4, HNF1 & # x003b1, NR2F1 e HNF4 & # x003b1 como nódulos reguladores ocultos na regulação gênica dependente do estresse hepático. (A & # x02013C) Cada um dos grupos de genes na Figura & # x200B Figura 4 4 foi submetido à análise de local único oPOSSUM, que pesquisa regiões regulatórias (neste caso, & # x000b12000 bp do local de início da transcrição) para potenciais locais de ligação de fatores de transcrição identificados no Banco de dados JASPAR CORE. Os resultados foram limitados a um Z-score & # x0003e 10 e uma pontuação de Fisher & # x0003c 0,01. (D) Os dados de (C) foram visualizados usando o plug-in BINGO para o software Cytoscape, considerando apenas genes relevantes para o metabolismo lipídico conforme anotado na análise de GO. Os locais de ligação previstos oPOSSUM são mostrados usando linhas tracejadas, enquanto os genes com locais de ligação HNF4 & # x003b1 confirmados são mostrados por linhas contínuas.

Como os genes envolvidos no metabolismo lipídico foram encontrados nos grupos B, D, F e G, buscamos resultados encontrados nesses grupos e em nenhum outro, com ênfase particular nos grupos D e F, uma vez que esses grupos contêm os genes de resposta precoce. Notavelmente, locais de ligação para dois fatores de transcrição & # x02014HNF4 & # x003b1 e NR2F1 [GenBank: <"type": "entrez-nucleotide", "attrs": <"text": "NM_010151.2", "term_id": "111185901" , "term_text": "NM_010151.2" >> NM_010151.2] & # x02014 foram enriquecidos nos Grupos B, D e F, mas não em qualquer outro grupo (Figuras 6B, C). Esses fatores têm sítios de ligação de consenso semelhantes (Kimura et al., 1993 Ellrott et al., 2002 Schmidt et al., 2010), explicando por que eles segregam juntos nesta análise. Este achado sugere que a atividade desses dois ativadores transcricionais é alterada durante o estresse ER, uma vez que os genes que contêm locais de ligação para esses fatores são regulados negativamente pelo estresse ER, e sua regulação negativa é exacerbada pelo estresse contínuo visto em Atf6 & # x003b1 & # x02212 / & # x02212 ratos. Por outro lado, os grupos A, C e E foram enriquecidos para genes com potenciais locais de ligação para ELK4, também conhecida como Proteína Acessória SRF (SAP) -1 [GenBank: <"tipo": "entrez-nucleotídeo", "attrs": < "text": "NM_007923.2", "term_id": "153792361", "term_text": "NM_007923.2" >> NM_007923.2].

Grupo I, englobando genes regulados positivamente por estresse ER de longo prazo em animais do tipo selvagem e regulados positivamente em Atf6 & # x003b1 & # x02212 / & # x02212 animais, foi enriquecido para ligação por CREB1 [GenBank: <"type": "entrez-nucleotide", "attrs": <"text": "NM_001037726.1", "term_id" : "158966706", "term_text": "NM_001037726.1" >> NM_001037726.1], que compartilha uma sequência de ligação de consenso com o fator de transcrição CREBH localizado no ER (Zhang et al., 2006). CREBH é ativado por proteólise induzida por, entre outros estímulos, estresse ER, e regula a expressão de genes de resposta de fase aguda e genes metabólicos (Zhang et al., 2006, 2012 Luebke-Wheeler et al., 2008). Consequentemente, os genes no Grupo I têm um perfil esperado para alvos CREBH & # x02014, a saber, que eles são regulados positivamente pelo estresse ER e, posteriormente, regulados positivamente em Atf6 & # x003b1 & # x02212 / & # x02212 animais, nos quais o estresse ER é exacerbado. No entanto, os genes metabólicos lipídicos não foram enriquecidos no Grupo I, e o sítio de ligação CREB1 não foi enriquecido nos grupos contendo genes metabólicos lipídicos. Além disso, diferente do gene que codifica o componente P da amiloide sérica (Apcs) [GenBank: <"type": "entrez-nucleotide", "attrs": <"text": "NM_011318.2", "term_id": "226958496", "term_text": "NM_011318.2" >> NM_011318 .2], a maioria dos genes que codificam proteínas de resposta de fase aguda (proteínas SAA, CRP, proteínas de coagulação e coagulação, etc.) não foram significativamente regulados positivamente em qualquer ponto de tempo em qualquer genótipo, sugerindo que a atividade CREBH durante genuíno O estresse ER (em oposição à endotoxina, citocinas pró-inflamatórias ou outros estímulos) pode ser mínimo, e os genes no Grupo I podem ser regulados por outro fator da família CREB.

ELK4 faz parte da família de fatores de transcrição do Fator do Complexo Ternário (TCF) que interagem com o Fator de Resposta do Soro (SRF) (Dalton e Treisman, 1992). Um papel da ELK4 na expressão do gene hepático não foi descrito, nem a ELK4 foi diretamente ligada ao estresse do RE. ELK4 demonstrou ser ativado por fosforilação dependente de JNK (Janknecht e Hunter, 1997) e JNK [GenBank: <"type": "entrez-nucleotide", "attrs": <"text": "NM_016700.4" , "term_id": "225637490", "term_text": "NM_016700.4" >> NM_016700.4] é ativado por estresse ER (Urano et al., 2000). Assim, especulamos que a atividade de ELK4 pode ser regulada durante o estresse ER no fígado por JNK ou outras quinases MAP para promover a expressão de genes nos grupos A, C e E. NR2F1, também conhecido como COUP-TF, é um receptor órfão. A deleção leva à letalidade perinatal com extensa desregulação da diferenciação neuronal (Qiu et al., 1997). Sua função no fígado é menos clara, embora tenha sido demonstrado que ele coativa a transcrição sinergicamente com HNF4 & # x003b1 (Ktistaki e Talianidis, 1997 Yanai et al., 1999).

HNF4 & # x003b1 é expresso mais fortemente no fígado, intestino, rim e pâncreas. A deleção é letal durante a gastrulação (Chen et al., 1994). Camundongos com uma deleção específica do fígado de HNF4 & # x003b1 desenvolvem esteatose concomitante com deficiência ApoB e Mttp expressão e produção de VLDL (Hayhurst et al., 2001). O knockdown hepático de HNF4 & # x003b1 pela entrega adenoviral resultou em esteatose e na produção de VLDL prejudicada, juntamente com a expressão essencialmente diminuída de um hospedeiro de genes envolvidos no metabolismo lipídico, incluindo muitos dos relatados aqui (Yin et al., 2011). Assim, a perda de HNF4 & # x003b1 fenece muitas das alterações genéticas metabólicas de lipídios que são induzidas pelo estresse de RE. A superexpressão de HNF4 & # x003b1 em hepatócitos primários resultou na regulação positiva de muitos desses mesmos genes, embora não de Srebf1 nem Srebf2 (Yin et al., 2011). Esta exceção é notável porque Srebf1 e Srebf2 são conspícuos entre os genes metabólicos analisados ​​aqui no fato de que sua regulação negativa é não exacerbado às 34 h em Atf6 & # x003b1 & # x02212 / & # x02212 ratos (Figuras 3D, E). Os locais de ligação de HNF4 & # x003b1 no genoma do fígado de camundongo foram caracterizados por ChIP-seq (Schmidt et al., 2010), e os genes nos Grupos B, D e F são alvos HNF4 & # x003b1 confirmados (Figura & # x200B (Figure6D 6D )

Nossos resultados, juntamente com a atividade conhecida de HNF4 & # x003b1, prevêem que o estresse de ER leva à diminuição da atividade de HNF4 & # x003b1, e que isso ocorre como um evento precoce na regulação do gene metabólico por estresse de ER. Para testar esta previsão, analisamos a ligação de HNF4 & # x003b1 a locais definidos por ChIP-seq nas regiões promotoras / intensificadoras de três dos quatro primeiros genes metabólicos regulados & # x02014 os reguladores de transcrição Cebpa, Pgc1a, e Ppara (o proximal Pgc1b o promotor / intensificador não contém um sítio de ligação HNF4 & # x003b1 previsto ou validado). Descobrimos que o tratamento de animais com TM por 8 h não alterou a expressão total (Figura & # x200B (Figura7A) 7A) ou a localização nuclear (Figura & # x200B (Figura7B) 7B) de HNF4 & # x003b1. No entanto, consistente com nossa previsão, descobrimos que a ligação da cromatina HNF4 & # x003b1 diminuiu significativamente em vários locais no Cebpa e Pgc1a promotores após o tratamento de animais com TM (Figura & # x200B (Figura 7C). 7C). Esta diminuição não foi uniforme, vários locais dentro dos três promotores mostraram ligação inalterada de HNF4 & # x003b1 (Figura & # x200B (Figura 7A). 7A). Juntos, esses resultados sugerem que o estresse ER reduz a atividade de HNF4 & # x003b1 em locais específicos no genoma por meio de um mecanismo que é independente do nível de expressão de HNF4 & # x003b1.

Diminuição da ligação de HNF4 & # x003b1 em Cebpa e Pgc1a promotores durante o estresse ER. (A, B) Camundongos do tipo selvagem foram desafiados com 1 mg / kg TM por 8 h, e a expressão de HNF4 & # x003b1 foi avaliada por imunotransferência (UMA) ou imunohistoquímica (B). Barra de escala = 50 & # x003bcm. (C) A ligação de HNF4 & # x003b1 às regiões regulatórias dos genes indicados foi avaliada por cromatina-IP. As regiões são fornecidas em relação ao local de início da transcrição e correspondem às regiões identificadas pela análise ChIP-seq (Schmidt et al., 2010). n = 3 & # x020134 animais por grupo. A recuperação típica de material genômico em amostras contendo anticorpo HNF4 & # x003b1 estava na faixa de 0,1 & # x020131 por cento da entrada total. * p & # x0003c 0,05 por t-teste.


Métodos

Análise filogenética e previsão da estrutura do gene

As sequências peptídicas deduzidas para membros da superfamília da insulina incluem 20 de Mollusca, 30 de Ecdysozoa e 51 de Deuterostomia (Dados Suplementares 1). Os supostos ortólogos entre humanos e ostras foram identificados pelo best-hit Blast recíproco com um E-valor corte de 1e − 5 56. As sequências Pdx foram recuperadas do NCBI (Fig. 3 suplementar). O alinhamento múltiplo foi conduzido com MAFFT 7.221 57 usando o algoritmo L-INS-I, e ajustado com TrimAl usando parâmetros –gt 0,9 –st 0,001 –cons 40 58. Árvores filogenéticas foram construídas com RAxML 59 usando o modelo evolutivo LG + Gamma + Invariante e 1000 réplicas bootstrap. UGENE 60 foi usado para visualização do alinhamento. Para as sequências de ILP de ostra 23, os peptídeos de sinal foram previstos pelo SignalP 4.1 61, cadeias de peptídeos maduras previstas a partir de pares adjacentes de resíduos básicos 62. Para a visualização do alinhamento Pdx, as cores dos aminoácidos foram codificadas de acordo com seu grau de conservação evolutiva e propriedades físico-químicas usando o esquema de cores Zappo de Jalview 63.

Material animal

Ostras do Pacífico de três anos (C. gigas) usados ​​para qPCR e hibridização in situ, RNA-seq, ATAC-seq e clonagem de genes foram do Oxford Covered Market, supostamente coletados na costa escocesa, e foram aclimatados em água do mar artificial a 16 ° C por 7 dias antes do uso. Ostras foram alimentadas com Espirulina pó durante a cultura. A identificação das espécies foi confirmada pelo sequenciamento do gene da citocromo oxidase I mitocondrial. Tecidos de três indivíduos foram dissecados para obtenção de palpos labiais, brânquias, manto, músculo adutor branco, músculo adutor transparente, neurônio, coração, hemolinfa, gônada masculina, gônada feminina, hepatopâncreas, estômago e intestino para extração imediata de RNA.

Extração de RNA e qPCR

O RNA total foi extraído seguindo um protocolo padrão TRIzol (Invitrogen, EUA) e tratado com DNase I (Promega, EUA). RNAs de três indivíduos foram igualmente misturados antes da síntese da primeira fita de cDNA com GoScript ™ RT (Promega, EUA) de acordo com as instruções do fornecedor. Primers para qPCR em ostra semelhante à insulina genes, Pdx e como um controle interno cgEF1a são fornecidos nos Dados Suplementares 4. qPCR em tempo real foi conduzida no sistema Prime Pro 48 qPCR em tempo real (Techne, Reino Unido). O método 2 −ΔΔt foi usado para calcular a quantificação relativa (RQ) dos genes alvo. O software R 64 foi usado para estatísticas e plotagem.

Ensaio para cromatina acessível por transposase

Para manter a osmolaridade, solução salina tamponada com fosfato de Dulbecco modificada (MDPBS) foi usada para incubar células de ostra por toda parte. Fragmentos de tecido de hepatopâncreas frescos foram incubados em 0,8 mg / ml de colagenase P (Sigma, 11213857001) à temperatura ambiente por 20 minutos e pipetados suavemente a cada 5 minutos para liberar células individuais. A suspensão de células foi filtrada através de um filtro de células de 40 μm (BD Falcon, EUA), transferida para um novo tubo e centrifugada por 5 min a 500 × g. O sobrenadante foi descartado e o sedimento suspenso em MDPBS para análise de viabilidade celular e contagem de células. Para cada reação 50.000 células foram coletadas em 1000 × g durante 5 min, 4 ° C. A reação de transposição, purificação, construção de biblioteca e quantificação seguiram métodos estabelecidos 65, incluindo marcação usando um kit Nextera DNA (Illumina FC-121-1030) por 30 minutos a 37 ° C, amplificação de DNA etiquetado usando NEB Next High-Fidelity 2X PCR Master Mix por 11 ciclos. A qualidade da biblioteca foi avaliada usando Agilent Tapestation.

Duas amostras foram sequenciadas usando leituras de extremidades emparelhadas de 40 bp na plataforma Illumina NextSeq 500, dando 43 e 17,5 milhões de pares de leituras, respectivamente. As leituras foram mapeadas usando Bowtie 2 (v. 2.1.0) para C. gigas genoma v.9 obtido de NCBI rendendo 79,8% e 74,8% das leituras sequenciadas, respectivamente, mapeadas para o genoma nuclear. Os picos foram chamados em cada amostra usando MACS2 (v. 2.1.1) usando parâmetros ‘—nomodel — shiftsize 250 — nolambda’. Apenas os picos recuperados em ambas as repetições e superiores a 100 bp foram retidos. Os picos foram filtrados adicionalmente para remover regiões sobrepostas com sequências repetitivas derivadas de um modelador de anotação de repetição combinado (filtros RepeatModeler 66, DUST 67 e TRF 68), produzindo um total de 168.206 regiões de cromatina aberta de consenso em todo o genoma. Os picos de consenso foram atribuídos a genes denotados por C. gigas modelos de genes obtidos do NCBI usando o script annotatePeaks.pl de Homer (v.4.9). A partir dessa anotação, as regiões de cromatina aberta correspondentes a elementos cis-reguladores putativos proximais e distais foram inferidas. A análise TFBS foi realizada usando o conjunto de motivos Gimme (v.0.11.1) 69. Matrizes de posição ponderada (PWMs) para TFBSs individuais correspondentes a PDX1 (sites PDX1 humanos: M5712_1.02, M5713_1.02, M6415_1.02 e sites Pdx1 de camundongo: M0976_1.02, M1952_1.02) foram obtidas da biblioteca online CIS-BP de fatores de transcrição e seus motivos de ligação ao DNA em http://cisbp.ccbr.utoronto.ca 70. PWMs de camundongos e humanos foram agrupados usando o comando gimme cluster para produzir um motivo de cluster médio (site de consenso) 'Pdx_A Average_2' que resultou do agrupamento de 3 sites (Human M5713_1.02, Mouse M1952_1.02, Human M6415_1.02), um segundo cluster consistindo em um único motivo que corresponde a um local duplo de dois motivos TAAT próximos um do outro (Humano M5712_1.02) e um terceiro motivo único correspondendo ao local TAAT menos proeminente (Ratinho M0976_1.02). As regiões de fundo foram geradas usando o comando 'gimme background -random' usando C. gigas genoma como referência. Os valores de limite foram obtidos com base em sequências de fundo usando o comando gimme threshold com ‘fpr = 0,01’ para cada um dos PWMs individuais e o Pdx_A Average_2 TFBS. TFBS foram identificados usando varredura gimme usando valores de corte obtidos a partir da etapa 'gimme threshold' em todos os picos de consenso. Ambos Pdx_A Average_2 e Pdx_M1952_1.01 PWMs identificaram os locais Pdx1 validados experimentalmente localizados em -1806 (TTCTAATTAC) em scaffold737: 266144-266153, mas não conseguiram reconhecer as bases flanqueadoras (5′-T e C-3 ′ respectivamente). Além disso, um conjunto pré-agrupado de 623 motivos gerados a partir de motivos CIS-BP (http://dx.doi.org/https://doi.org/10.6084/m9.figshare.1555851) 71, sites TFBS (v .3), foi usado para varrer o conjunto de picos de consenso conforme descrito acima. Os locais Pdx1 específicos não foram recuperados por quaisquer outros PWMs do Homeodomain agrupados confirmando a especificidade da análise.

Sequenciamento de RNA e análise de expressão diferencial

O sequenciamento de RNA (RNAseq) foi realizado usando sequenciamento de extremidade pareada de 75 bp (PE) na plataforma Illumina HiSeq 4000 (Illumina, Inc., San Diego, CA, EUA) de uma biblioteca TruSeq de hepatopâncreas do mesmo indivíduo usado para ATAC- seq. Um total de 33,11 milhões de leituras de PE foi obtido com rendimento de 4880 Mb Q20. Os dados foram analisados ​​juntamente com leituras de sequenciamento publicadas de órgãos adicionais (incluindo "glândula digestiva", potencialmente o mesmo que o hepatopâncreas) 23. As leituras de sequenciamento brutas foram mapeadas para o genoma da ostra com HISAT2 e posteriormente processadas com as ferramentas StringTie e Ballgown 72. As contagens de leituras mapeadas foram usadas para identificar genes expressos diferencialmente usando edgeR 73, e os níveis de expressão gênica quantificados como fragmentos por quilobase por milhão de leituras mapeadas (FPKM). Genes enriquecidos com hepatopâncreas foram definidos como aqueles genes com níveis de expressão mais elevados (p & lt 0,05) em ambas as 'glândulas digestivas' e a amostra recentemente coletada de 'hepatopâncreas' em comparação com outros órgãos (músculo adutor, palpos labiais, guelras, hemolinfa, manto, gônada masculina e gônada feminina).

Construções de plasmídeo

Para geração de ribossonda, fragmentos amplificados de cgPdx (489 bp), cgMIP123 (608 bp), cgMIP4 (679 bp), cgMILP7 (359 bp) e cgILP (332 bp) foram clonados em pGEM-T easy (Promega, EUA). Para avaliar a localização subcelular, cgPdx sequência de codificação foi amplificada com iniciadores contendo XhoI locais e ligados em XhoIvetor pEGFP-N1 digerido (Clontech, EUA) para gerar uma fusão in-frame com EGFP (construir pEGFP-Pdx). Para ensaios de luciferase, sem marcação mPdx1, cgPdx (LOC105327390 74) e cgNeuroD (LOC105336755 75) plasmídeos foram construídos por clonagem em XhoI e MluI locais no vetor de expressão pSI (Promega, EUA constroem pSI-mPdx1, pSI-cgPdx, pSI-cgNeuroD). Como construtos repórter de luciferase de pirilampo, regiões genômicas correspondentes a montante de cgILP foram ligados ao pGL4.23 [luc2/ minP] (Promega, USA constrói pGL-B1). Três versões curtas (duas com locais TAAT alterados) foram geradas por mutagênese in vitro (construções pGL-B2, pGL-B2M1 e pGL-B2M2, Fig. 4). Sítios TAAT alterados foram gerados projetando base incompatível em primers que cobrem os sítios. Os primers foram fornecidos nos Dados Suplementares 4.

Síntese de anticorpos e ChIP-qPCR

A sequência de codificação do peptídeo cgPdx 1–160 foi clonada no vetor pET-28a-SUMO e expressa em células BL21 (DE3). A proteína recombinante marcada com SUMO foi purificada por cromatografia de afinidade Ni-NTA (Qiagen), anticorpos policlonais anti-cgPdx de coelho, E9112 e E9113, foram desenvolvidos pela Abclonal (Wuhan, China). A validação dos anticorpos foi conduzida por western blotting em lisados ​​de tecido de hepatopâncreas de ostra (Fig. 11 suplementar). A sequência de codificação completa de cgPdx foi clonada no quadro (ver Dados Suplementares 4 para iniciadores) com uma etiqueta V5 no terminal C (pSF-CMV-Puro-COOH-V5, Oxford Genetics) e expressa em células HEK293T. O Western blotting foi então realizado com o lisado celular para determinar o peso molecular de cgPdx. A especificidade dos anticorpos foi testada por western blotting no anticorpo anti-PARP1 de lisado de hepatopâncreas de ostra (ab32138, abcam, Shanghai, China) foi usado como um controle positivo. Os ensaios ChIP foram realizados de acordo com um protocolo padrão (Abcam) com pequenas modificações. Em resumo, pedaços de tecido de hepatopâncreas de ostra foram dissecados, congelados em nitrogênio líquido e armazenados a -80 ° C até o uso. Células únicas foram isoladas usando métodos descritos para ATAC. As células colhidas foram reticuladas com formaldeído a 1% por 10 min em temperatura ambiente, e a cromatina solúvel obtida após sonicação foi incubada com anticorpos anti-cgPdx. Dois experimentos ChIP foram conduzidos com indivíduos diferentes.

150 mg de tecido de hepatopâncreas foram usados ​​com 10 μg de anticorpos. A proteína A (Millipore, 16–661) foi usada para precipitar imunocomplexos de cromatina, que foram lavados e, em seguida, purificados de DNA usando o kit de purificação de PCR QIAquick (Qiagen). Os primers (dados suplementares 4) foram concebidos para o exame qPCR visando potenciais locais de ligação de Pdx a montante de três genes. O DNA do chip foi então usado como o modelo para a análise qPCR, com resultados normalizados pelo DNA de entrada. O enriquecimento de dobras foi calculado de acordo com o método comum de "sinal sobre fundo" (ThermoFisher). A significância da média de enriquecimento do alvo para 1 foi calculada com uma amostra t-teste (unilateral).

Hibridação in situ

As sondas marcadas com digoxigenina foram sintetizadas a partir de construções linearizadas nas direções sentido e anti-sentido, usadas em paralelo para todos os experimentos. Todo o tecido do corpo mole de ostras juvenis (comprimento da concha de 1–3 cm) foi fixado em paraformaldeído a 4% em PBS durante a noite a 4 ° C. Os tecidos foram lavados duas vezes em PBS e desidratados através de uma série de álcool graduado antes do armazenamento em etanol 70% a -20 ° C. Para a incorporação de cera, os tecidos foram lavados em etanol 85% (15 min), etanol 100% (3 × 15 min), benzoato de metila (3 × 15 min) e benzeno (1 min) antes de transferir para parafina derretida (3 × 30 min) ) Os blocos foram solidificados a 4 ° C por pelo menos 2 h, aparados, montados e armazenados durante a noite (4 ° C) antes do corte a 10 μm. As seções foram então removidas de cera com xileno e tratadas com proteinase K (1 μg / ml, 15 min) antes da hibridização (50% formamida desionizada, 5 × citrato de sódio salino, 0,1% Tween-20, 10% dodecil sulfato de sódio, 0,3 mg / ml torula RNA, 50 μg / ml de heparina) com 50 ng / μl de sonda a 65 ° C, durante a noite. Após lavagem com solução salina 0,2 × citrato de sódio e tampão de ácido maleico, as ribossondas foram detectadas por incubação com fragmentos Fab anti-DIG conjugados com fosfatase alcalina (1: 4000 Roche Diagnostics, EUA) em tampão de bloqueio Roche em ácido maleico 100 mM (2 h, temperatura do quarto). O desenvolvimento da cor foi conduzido por incubação em NBT / BCIP (US Biological, Swampscott, MA). As seções foram lavadas com água destilada, montadas em glicerol e examinadas usando um microscópio óptico Leica MZ10F cortesia de Microscope Services Ltd, Oxford.

Ensaio de luciferase

As células HeLa (ATCC, EUA) e COS7 (gentilmente fornecido pelo Dr. Qingfeng Yan, Universidade de Zhejiang, Zhejiang, China) foram cultivadas em meio RPMI-1640 modificado (HyClone, EUA) suplementado com 10% de soro fetal bovino inativado por calor (Gibco, EUA) e penicilina-estreptomicina (Solarbio, China), em atmosfera umidificada com 5% de CO2 a 37 ° C. Os plasmídeos foram transfectados em células usando o reagente Lipofectamine 3000 (Life Technologies, EUA) de acordo com as instruções do fornecedor. Os ensaios de luciferase foram realizados em placas de 24 poços com

250.000 células e 500 μl de meio / poço Um total de 0,5 μg de DNA de plasmídeo de expressão de pSI (adicionando os vetores pSI em branco para manter constante para cada transfecção) foi transfectado com 0,2 μg de plasmídeos repórter da série pGL e 1 ng de controle de pRL-CMV Renilla plasmídeo luciferase (Promega, EUA). Em 24 h pós-transfecção, as atividades da luciferase do pirilampo e Renilla foram medidas usando um Dual-Luciferase Reporter Assay System (Promega, EUA) em um leitor multimodo Varioskan Flash (Thermo Scientific, EUA). Cada transfecção foi realizada em triplicado para réplicas biológicas e os poços divididos em dois para gerar réplicas técnicas. Do aluno t teste (bilateral) foi usado para determinar a significância das diferenças. O intervalo de confiança de 95% (CI) da soma entre cgNeuroD e cgPdx / mPdx1 foi estimado com base no conjunto de todas as combinações possíveis entre os valores relativos de luciferase dos grupos cgNeuroD e cgPdx / mPdx1. A significância foi então calculada por bootstrapping (n = 100.000), em que os valores de soma com o mesmo tamanho de amostra do grupo (cgPdx / mPdx1 + cgNeuroD) foram amostrados aleatoriamente do pool de soma.

Resumo do relatório

Mais informações sobre o desenho da pesquisa estão disponíveis no Nature Research Reporting Summary, vinculado a este artigo.


Druker BJ, Talpaz M, Resta DJ, Peng B, Buchdunger E, Ford JM, Lydon NB, Kantarjian H, Capdeville R, Ohno-Jones S, Sawyers CL. Eficácia e segurança de um inibidor específico da tirosina quinase BCR-ABL na leucemia mielóide crônica. N Engl J Med. 2001344: 1031–7.

Koivunen JP, Mermel C, Zejnullahu K, Murphy C, Lifshits E, Holmes AJ, Choi HG, Kim J, Chiang D, Thomas R, et al. Gene de fusão EML4-ALK e eficácia de um inibidor da quinase ALK no câncer de pulmão. Clin Cancer Res. 200814: 4275–83.

Storm EE, Durinck S, de Sousa e Melo F, Tremayne J, Kljavin N, Tan C, Ye X, Chiu C, Pham T, Hongo JA, et al. Ter como alvo os tumores do cólon PTPRK-RSPO3 promove a diferenciação e a perda da função das células-tronco. Natureza. 2016529: 97–100.

Tomlins SA, Rhodes DR, Perner S, Dhanasekaran SM, Mehra R, Sun XW, Varambally S, Cao X, Tchinda J, Kuefer R, et al. Fusão recorrente dos genes do fator de transcrição TMPRSS2 e ETS no câncer de próstata. Ciência. 2005310: 644–8.

Yoshihara K, Wang Q, Torres-Garcia W, Zheng S, Vegesna R, Kim H, Verhaak RG. A paisagem e a relevância terapêutica das fusões de transcrições associadas ao câncer. Oncogene. 201534: 4845–54.

Mertens F, Johansson B, Fioretos T, Mitelman F. A complexidade emergente das fusões gênicas no câncer. Nat Rev Cancer. 201515: 371–81.

Kuppers R, Dalla-Favera R. Mecanismos de translocações cromossômicas em linfomas de células B. Oncogene. 200120: 5580–94.

Davis CF, Ricketts CJ, Wang M, Yang L, Cherniack AD, Shen H, Buhay C, Kang H, Kim SC, Fahey CC, et al. A paisagem genômica somática do carcinoma de células renais cromófobo. Cancer Cell. 201426: 319–30.

Vinagre J, Almeida A, Povo H, Batista R, Lyra J, Pinto V, Coelho R, Celestino R, Prazeres H, Lima L, et al. Freqüência de mutações do promotor TERT em cânceres humanos. Nat Commun. 20134: 2185.

Groschel S, Sanders MA, Hoogenboezem R, de Wit E, Bouwman BAM, Erpelinck C, van der Velden VHJ, Havermans M, Avellino R, van Lom K, et al. Um único rearranjo de realçador oncogênico causa desregulação concomitante de EVI1 e GATA2 na leucemia. Célula. 2014157: 369–81.

Zhang Y, Chen F, Fonseca NA, He Y, Fujita M, Nakagawa H, Zhang Z, Brazma A, Grupo PTW, Grupo PSVW, et al. A análise do genoma total de alta cobertura de 1220 cânceres revela centenas de genes desregulados por alterações cis-regulatórias mediadas por rearranjo. Nat Commun. 202011: 736.

Yang L, Luquette LJ, Gehlenborg N, Xi R, Haseley PS, Hsieh CH, Zhang C, Ren X, Protopopov A, Chin L, et al. Diversos mecanismos de variações somáticas estruturais nos genomas do câncer humano. Célula. 2013153: 919–29.

Chen K, Wallis JW, McLellan MD, Larson DE, Kalicki JM, Pohl CS, McGrath SD, Wendl MC, Zhang Q, Locke DP, et al. BreakDancer: um algoritmo para mapeamento de alta resolução da variação estrutural genômica. Métodos Nat. 20096: 677–81.

Alaei-Mahabadi B, Bhadury J, Karlsson JW, Nilsson JA, Larsson E. Análise global de alterações genômicas estruturais somáticas e seu impacto na expressão gênica em diversos cânceres humanos. Proc Natl Acad Sci U S A. 2016113: 13768–73.

Seshagiri S, Stawiski EW, Durinck S, Modrusan Z, Storm EE, Conboy CB, Chaudhuri S, Guan Y, Janakiraman V, Jaiswal BS, et al. Fusões de R-espondina recorrentes no câncer de cólon. Natureza. 2012488: 660–4.

Stransky N, Cerami E, Schalm S, Kim JL, Lengauer C. A paisagem das fusões de quinase no câncer. Nat Commun. 20145: 4846.

Tomlins SA, Mehra R, Rhodes DR, Smith LR, Roulston D, Helgeson BE, Cao X, Wei JT, Rubin MA, Shah RB, Chinnaiyan AM. As fusões gênicas TMPRSS2: ETV4 definem um terceiro subtipo molecular de câncer de próstata. Cancer Res. 200666: 3396–400.

Gao Q, Liang WW, Foltz SM, Mutharasu G, Jayasinghe RG, Cao S, Liao WW, Reynolds SM, Wyczalkowski MA, Yao L, et al. Fusões de driver e suas implicações no desenvolvimento e tratamento de cânceres humanos. Cell Rep. 201823: 227–38 e223.

Zhang Y, Yang L, Kucherlapati M, Chen F, Hadjipanayis A, Pantazi A, Bristow CA, Lee EA, Mahadeshwar HS, Tang J, et al. Um compêndio de genes pan-cancerígenos desregulado por rearranjo genômico somático em mais de 1.400 casos. Cell Rep. 201824: 515–27.

Rao SS, Huntley MH, Durand NC, Stamenova EK, Bochkov ID, Robinson JT, Sanborn AL, Machol I, Omer AD, Lander ES, Aiden EL. Um mapa 3D do genoma humano com resolução de quilobases revela os princípios do loop da cromatina. Célula. 2014159: 1665–80.

Barros-Silva JD, Paulo P, Bakken AC, Cerveira N, Lovf M, Henrique R, Jeronimo C, Lothe RA, Skotheim RI, Teixeira MR. Novos parceiros de fusão 5 'de ETV1 e ETV4 no câncer de próstata. Neoplasia. 201315: 720–6.

Cancer Genome Atlas N. Caracterização molecular abrangente do câncer retal e do cólon humano. Natureza. 2012487: 330–7.

Johansen JS, Christensen IJ, Riisbro R, Greenall M, Han C, Price PA, Smith K, Brunner N, Harris AL. Níveis séricos elevados de YKL-40 em pacientes com câncer de mama primário estão relacionados à sobrevida livre de recorrência curta. Breast Cancer Res Treat. 200380: 15–21.

Cintin C, Johansen JS, Christensen IJ, Price PA, Sorensen S, Nielsen HJ. Soro YKL-40 e câncer colorretal. Br J Cancer. 199979: 1494–9.

Pelloski CE, Mahajan A, Maor M, Chang EL, Woo S, Gilbert M, Colman H, Yang H, Ledoux A, Blair H, et al. A expressão de YKL-40 está associada a uma pior resposta à radiação e menor sobrevida geral no glioblastoma. Clin Cancer Res. 200511: 3326–34.

Kang EJ, Jung H, Woo OH, Park KH, Woo SU, Yang DS, Kim AR, Lee JB, Kim YH, Kim JS, Seo JH. A expressão de YKL-40 pode ser um marcador de mau prognóstico no tecido do câncer de mama. Tumor Biol. 201435: 277–86.

Padro M, Cobler L, Garrido M, de Bolos C. A regulação negativa de FUT3 e FUT5 por shRNA altera a expressão de antígenos de Lewis e reduz as capacidades de adesão das células do câncer gástrico. Biochim Biophys Acta. 18102011: 1141–9.

Liang L, Gao C, Li Y, Sun M, Xu J, Li H, Jia L, Zhao Y. eixo miR-125a-3p / FUT5-FUT6 medeia proliferação de células de câncer colorretal, migração, invasão e angiogênese patológica via PI3K-Akt caminho. Cell Death Dis. 20178: e2968.

Potapenko IO, Luders T, Russnes HG, Helland A, Sorlie T, Kristensen VN, Nord S, Lingjaerde OC, Borresen-Dale AL, Haakensen VD. Assinaturas de expressão gênica relacionada ao glicano em subtipos de câncer de mama em relação à sobrevivência. Mol Oncol. 20159: 861–76.

Slebe F, Rojo F, Vinaixa M, Garcia-Rocha M, Testoni G, Guiu M, Planeta E, Samino S, Arenas EJ, Beltran A, et al. A lipase endotelial FoxA e LIPG controlam a captação de lipídios extracelulares para o crescimento do câncer de mama. Nat Commun. 20167: 11199.

Rippe V, Drieschner N, Meiboom M, Murua Escobar H, Bonk U, Belge G, Bullerdiek J. Identificação de um gene rearranjado por aberrações 2p21 em adenomas da tireoide. Oncogene. 200322: 6111–4.

Cancer Genome Atlas Research N. Caracterização genômica integrada do carcinoma papilar da tireoide. Célula. 2014159: 676–90.

Kloth L, Belge G, Burchardt K, Loeschke S, Wosniok W, Fu X, Nimzyk R, Mohamed SA, Drieschner N, Rippe V, Bullerdiek J. Diminuição da expressão associada ao adenoma tireoidiano (THADA) é um marcador de desdiferenciação do tecido tireoidiano . BMC Clin Pathol. 201111: 13.

Panebianco F, Kelly LM, Liu P, Zhong S, Dacic S, Wang X, Singhi AD, Dhir R, Chiosea SI, Kuan SF, et al. A fusão THADA é um mecanismo de ativação de IGF2BP3 e sinalização de IGF1R no câncer de tireoide. Proc Natl Acad Sci U S A. 2017114: 2307–12.

Bujold D, Morais DA, Gauthier C, Cote C, Caron M, Kwan T, Chen KC, Laperle J, Markovits AN, Pastinen T, et al. Portal de dados do International Human Epigenome Consortium. Cell Syst. 20163: 496–9 e492.

Consórcio EP. Uma enciclopédia integrada de elementos de DNA no genoma humano. Natureza. 2012489: 57–74.

Hou H, Yu X, Cong P, Zhou Y, Xu Y, Jiang Y: Six2 promove a stemness de células de câncer de pulmão de células não pequenas por meio da regulação transcricional e epigenética da caderina-E. Cell Prolif. 201952: e12617.

Wang CA, Drasin D, Pham C, Jedlicka P, Zaberezhnyy V, Guney M, Li H, Nemenoff R, Costello JC, Tan AC, Ford HL. A homeoproteína Six2 promove a metástase do câncer de mama por meio do controle transcricional e epigenético da expressão da caderina-E. Cancer Res. 201474: 7357–70.

Wu DW, Lin PL, Wang L, Huang CC, Lee H. O eixo YAP1 / SIX2 é necessário para a agressividade do tumor mediada por DDX3 e resistência a cetuximabe no câncer colorretal de tipo selvagem KRAS. Teranóstica. 20177: 1114–32.

Lederer M, Bley N, Schleifer C, Huttelmaier S. O papel da proteína 3 de ligação ao mRNA de IGF2 oncofetal (IGF2BP3) no câncer. Semin Cancer Biol. 201429: 3–12.

Kamburov A, Pentchev K, Galicka H, ​​Wierling C, Lehrach H, Herwig R. ConsensusPathDB: em direção a uma imagem mais completa da biologia celular. Nucleic Acids Res. 201139: D712–7.

Dia E, Poulogiannis G, McCaughan F, Mulholland S, Arends MJ, Ibrahim AE, Caro PH. IRS2 é um oncogene condutor candidato em 13q34 no câncer colorretal. Int J Exp Pathol. 201394: 203–11.

Jia Y, Xie Z, Li H. RNAs quiméricos intergenicamente spliced ​​in cancer. Trends Cancer. 20162: 475–84.

Matsumoto H, Koo SL, Dent R, Tan PH, Iqbal J. Papel dos infiltrados inflamatórios no câncer de mama triplo negativo. J Clin Pathol. 201568: 506–10.

Yang L, Lee MS, Lu H, Oh DY, Kim YJ, Park D, Park G, Ren X, Bristow CA, Haseley PS, et al. Analisando os rearranjos do genoma somático em cânceres humanos usando o sequenciamento de todo o exoma. Am J Hum Genet. 201698: 843–56.

Wang K, Singh D, Zeng Z, Coleman SJ, Huang Y, Savich GL, He X, Mieczkowski P, Grimm SA, Perou CM, et al. MapSplice: mapeamento preciso de leituras de RNA-seq para descoberta de junção de emenda. Nucleic Acids Res. 201038: e178.

Iyer MK, Chinnaiyan AM, Maher CA. ChimeraScan: uma ferramenta para identificar a transcrição quimérica em dados de sequenciamento. Bioinformática. 201127: 2903–4.

McPherson A, Hormozdiari F, Zayed A, Giuliany R, Ha G, Sun MG, Griffith M, Heravi Moussavi A, Senz J, Melnyk N, et al. deFuse: um algoritmo para descoberta de fusão gênica em dados de RNA-Seq de tumor. PLoS Comput Biol. 20117: e1001138.

Robinson JT, Thorvaldsdottir H, Winckler W, Guttman M, Lander ES, Getz G, Mesirov JP. Visualizador de genômica integrativa. Nat Biotechnol. 201129: 24–6.

Subramanian A, Tamayo P, Mootha VK, Mukherjee S, Ebert BL, Gillette MA, Paulovich A, Pomeroy SL, Golub TR, Lander ES, Mesirov JP. Análise de enriquecimento de conjunto de genes: uma abordagem baseada no conhecimento para interpretar perfis de expressão de todo o genoma. Proc Natl Acad Sci U S A. 2005102: 15545–50.

Gu Z, Eils R, Schlesner M. mapas de calor complexos revelam padrões e correlações em dados genômicos multidimensionais. Bioinformática. 201632: 2847–9.

Canisius S, Martens JW, Wessels LF. Um novo teste de independência para alterações somáticas no câncer mostra que a biologia leva à exclusividade mútua, mas o acaso explica a maior parte da coocorrência. Genome Biol. 201617: 261.

The Cancer Genome Atlas: banco de dados de genótipos e fenótipos. Baixar referências


Disponibilidade de dados e materiais

Os conjuntos de dados gerados durante o estudo atual estão disponíveis como um BioProjeto no National Center for Biotechnology Information sob o número de acesso PRJNA616061 (https://dataview.ncbi.nlm.nih.gov/object/PRJNA616061). Os conjuntos de dados de microarray de expressão gênica diurna de Arabidopsis mostrados na Tabela 1 da referência [37] estão disponíveis em ArrayExpress sob o número de acesso E-MEXP-1304 (https://www.ebi.ac.uk/arrayexpress/experiments/E-MEXP-1304/ ) Sequências de DNA correspondentes a cisos motivos regulatórios foram obtidos do banco de dados PLACE versão 30.0 (arquivos place.dat (https://www.dna.affrc.go.jp/PLACE/place_dat.shtml) e place.seq (https: //www.dna. affrc.go.jp/PLACE/place_seq.shtml)). As sequências de aminoácidos da proteína foram obtidas a partir do lançamento de Uniprot 2015.01 (ftp://ftp.uniprot.org/pub/databases/uniprot/previous_releases/release-2015_01/). Os domínios de proteína foram previstos com base no Prosite versão 6.1 (ftp://ftp.expasy.org/databases/prosite/old_releases/prosite06_1.tar.bz2) e Pfam versão 9.0 (ftp://ftp.ebi.ac.uk/pub /databases/Pfam/releases/Pfam9.0/).

Genes / proteínas de Arabidopsis do The Arabidopsis Information Resource (https://www.arabidopsis.org), versão de anotação TAIR10 (nome (identificação única do gene número de acesso Uniprot)): LHY (AT1G01060 Q6R0H1), CCA1 (AT2G46830 P92973), RVE1 ( AT5G17300 F4KGY6), RVE2 (AT5G37260 F4K5X6), RVE4 (AT5G02840 Q6R0G4), RVE5 (AT4G01280 C0SVG5), RVE6 (AT5G52660 Q8H0W3), RVE7 (AT1G18330 B3H5A8), RVE8 (AT3G09600 Q8RWU3), TOC1 / PRR1 (AT5G61380 Q9LKL2), PRR3 ( AT5G60100 F4JXG7), PRR4 (AT5G49240 Q9FJ16), PRR5 (AT5G24470 Q6LA42), PRR7 (AT5G02810 Q93WK5), PRR9 (AT2G46790 Q8L500), GI (AT1G24470 Q6LA42), PRR7 (AT5G02810 Q93WK5), PRR9 (AT2G46790 Q8L500), GI (AT1G22770 Q9SQI2502802802802) (ELF2802 AT1G227702802) (OF42802802) (OF2802802) (ELF2802) (OF42802) (OF42802802) (OF42802) (AT2802802) (AT2802) (AT2802) G46790 (AT2G46790 AT2G46790 (AT2G227702) (AT2802802) G42802802802) (AT2802802802) (AT2802802802). ), EF4L2 (AT1G72630 Q94BS8), EF4L3 (AT2G06255 Q8S8F5), EF4L4 (AT1G17455 Q570U6), LUX) / PCL1 (AT3G46640 F4J959), BOA (AT5G59570 F4J59570 F4J959) (AT1G17455 Q570U6), LUX) / PCL1 (AT3G46640 F4J959), BOA (AT5G59570 F4J59570 F4J959) (ADL873273 / AD2955701 F4J959) (ADL8955701 F4J959), ZC873273 / ATL8H4205 F4W4205959 F4J959 (ATL82059570 F4J42059), BOA (AT5G59570 F4J4959), F4J959). , FKF1 / ADO3 (AT1G68050 Q9C9W9).

Genes / proteínas de MaizeGDB (https://maizegdb.org/) para anotação de milho versão 5b, e de Phytozome (https://phytozome.jgi.doe.gov/) para anotação de sorgo versão v3.1 e versão de anotação de foxtail milheto v2.2 (nome (milho sorgo rabo de raposa painço ID de gene única)): LYL1 (GRMZM2G175227 + GRMZM2G175265 + GRMZM2G474769 Sobic.007G047400 Seita.6G055700), LYL2 (GRMZM2G014902 Sobic.007G047400 Seita.6G055700), RE2L (GRMZM2G145041 Sobic.010G275700 Seita. 4G288100), RE6L1 (GRMZM2G135052 Sobic.010G004300 Seita.4G004600), RE6L2 (GRMZM2G170148 Sobic.010G223700 Seita.4G266800), RE6L3 (GRMZM2G057408 Sobic.010G223700 Seita.4G266800), RE6L4 (GRMZM5G833032 Sobic.004G281800 Seita.1G272700), RE6L5 (GRMZM2G118693 Sobic.004G281800 Seita.1G272700), RE7L1 (GRMZM2G029850, Sobic.004G279300 Seita.1G275400), RE7L2 (GRMZM2G170322 Sobic.004G279300 Seita.1G275400), RE7L3 (GRMZMZM2.700G217.00G221G210G Seita6.700G21800G Seita221 G 279300 G279300 Seita. 7G212900), RE8L2 (GRMZM2G115070 Sobic.001G143100, Si038786m) RE8L1 (GRMZM2G415077 Sobic.001G143100 Si038786m), T1L1 (GRMZM2G148453 Sobic.004G216700 Seita.1G236100), T1L2 (GRMZM2G020081 Sobic.004G216700 Seita.1G236100), P37L1 (GRMZM2G005732 Sobic.006G057900 Seita.2G444300), P37L2 (GRMZM2G033962 Sobic.006G057900 Seita.2G444300), P59L2 (GRMZM2G488465 + GRMZM2G013913 Sobic.005G044400 Seita.8G040100), P59L1 (GRMZM2G135446 Sobic.005G044400 Seita.8G040100), P73L (GRMZM2M2.4002G024952G275M275M214002G7002G02495G024G028G024G024G024G024G024G024G5M8202G62002G0242G024G220G220G2172G6202G4202G320G420G220G420G220G220G220G220G220G2. , P95L2 (GRMZM2G367834 Sobic.002G275100 Seita.2G286100), Gi1 (GRMZM2G107101 Sobic.003G040900 Seita.5G129500), GI2 (GRMZM5G844173 Sobic.003G040900 Seita.5G129500), EF3L1 (GRMZM2G045275 Sobic.003G191700 Seita.5G204600), EF3L2 (AC233870.1_FG003 Sobic.009G257300 Seita.3G121000), EF4R1 (GRMZM2G382774 Sobic.001G340700 Seita.9G368100), EF4R2 (GRMZM2G359322 Sobic.001G340700 Seita.9G368100), EF4R3 (GRMZM5004. 003G700G2 00700 G800864G800G62002M800864G800G2M62004.00G877G Sobic00G4 00864G864G2M6200G2 002M6200G864G6200G2M6200G2 00G2M6200G2 00G2M6R6.003G864G2M6200G2. 00G864G2M5G002M5G864G2MG2M5.003G2M5G864G800G2M3G2 005G800G2M5G800G3G5005G2M5g8 2G 195800), LXL (GRMZM2G067702 Sobic.003G443600 Seita.5G468100), ZLL1 (GRMZM2G115914 Sobic.010G243900 Seita.4G249100), ZLL2 (GRMZM2G113244 Sobic.010G243900 Seita.4G249100), ZLL3 (GRMZM2G147800 Sobic.004G042200 Seita.1G087300), ZLL4 (GRMZM2G166147 Sobic.004G042200 Seita.1G087300), FFL1 (GRMZM2G106363, Sobic.005G145300 Seita.8G146900), FFL2 (GRMZM2G107945 Sobic.005G145300 Seita.8G146900).


Métodos

Materiais e tratamentos de estresse

o B. rapa A cultivar Chiffu foi plantada em uma câmara de crescimento no Oil Crops Research Institute da Academia Chinesa de Ciências Agrícolas em Wuhan a 20 ± 2 ° C com 12 h de luz e 12 h de escuridão. As raízes foram amostradas de mudas jovens. Gomos de flores frescas foram obtidos, e os outros tecidos foram amostrados aproximadamente 25 dias após a floração, incluindo caules, folhas, siliques e sementes. Três réplicas biológicas de cada tecido testado foram preparadas colhendo amostras de três indivíduos diferentes. As amostras foram rapidamente congeladas em nitrogênio líquido e armazenadas a -80 ° C até o isolamento do RNA.

UMA B. rapa Landrace (Wuxianzangcaizi) foi usado para o tratamento de metais pesados. Sementes saudáveis ​​de tamanhos semelhantes foram esterilizadas na superfície, secas e germinadas em papel de filtro úmido esterilizado. As sementes foram tratadas com meio fresco suplementado com 20 mL 15 mg / L de CdCl2 ou 50 mg / L de Pb (NO3)2 [36]. Sementes tratadas com igual quantidade de água destilada serviram como controle. Três repetições de 50 sementes foram utilizadas para cada tratamento. As sementes de tratamento e controle foram cultivadas no escuro por 24 ha 22 ° C e então cultivadas durante o fotoperíodo (ciclo de 16 horas de luz / 8 horas de escuridão) por sete dias. Os brotos e raízes de mudas de tamanhos semelhantes foram colhidos separadamente e lavados três vezes com água desionizada. As amostras foram congeladas em nitrogênio líquido até a extração do RNA.

Identificação e análise de proteínas glioxalase em B. rapa

Os acessos Pfam (http://pfam.sanger.ac.uk/) PF00903 para GLYI e PF00753 para GLYII foram usados ​​para uma pesquisa Hidden Markov Model (HMM) [34]. Toda a sequência genômica de B. rapa foi obtido do Brassica banco de dados (BRAD, http://brassicadb.org/brad/) [35]. o GLYI e GLYII genes foram extraídos de toda a sequência genômica de acordo com as descrições fornecidas por Wang et al. [37].

Análises de localizações cromossômicas, estruturas gênicas e duplicações gênicas no BrGLYI e BrGLYII genes

As posições genômicas do BrGLYI e BrGLYII genes em B. rapa os cromossomos foram analisados ​​usando uma pesquisa BLASTn. o BrGLYI e BrGLYII as estruturas dos genes foram analisadas usando o Gene Structure Display Server Program (GSDS, http://gsds.cbi.pku.edu.cn/index.php) [38]. Duplicação de BrGLYI e BrGLYII e suas posições foram comparadas entre os Arabidopsis e B. rapa subgenomas como previamente descrito [39].

Análise de sequências e construção da árvore filogenética

O software Clustal X (ftp://ftp-igbrmc.u-strasbg.fr/pub/clustalX/) foi usado para alinhamentos de aminoácidos (aa). A análise filogenética foi construída com o software MEGA 5.05 usando o método neighbour-joining (NJ) e 1.000 testes bootstrap [40].

Localização subcelular das proteínas GLYI previstas

As localizações subcelulares de todas as proteínas BrGLYI e BrGLYII previstas foram analisadas usando diferentes ferramentas online, ou seja, Wolf pSORT [41], TargeP e ChloroP [42].

Análise da sequência do promotor

Analisar os elementos regulatórios do BrGLYI e BrGLYII promotores, as sequências 5'-upstream de 1,5 kb do código de iniciação ATG foram obtidas de BRAD e analisadas usando bancos de dados PlantCARE (http://bioinformatics.psb.ugent.be/webtools/plantcare/html/) [40, 43] .

Análise de expressão gênica

o BrGLY expressão na raiz, caule, folha, flor e tecidos de sílica de repolho chinês de 7 semanas de idade e calo (Chiifu-401-42) foram analisados ​​usando os dados de transcriptomas online (http://www.ncbi.nlm.nih.gov /geo/query/acc.cgi?acc=GSE43245) [44]. Os dados foram usados ​​para gerar um mapa de calor usando o pacote Heat map Illustrator (HemI, http://hemi.biocuckoo.org/down.php) [45].

Para revelar a resposta do BrGLY genes para o estresse biótico no repolho chinês, a expressão de todos BrGLYI e BrGLYII genes em resposta à infecção por patógenos foram analisados ​​usando os dados de RNA-seq relatados (http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE74044) [46].

Os dados brutos obtidos usando a abordagem de sequenciamento do transcriptoma baseado em tag foram usados ​​para confirmar a resposta do BrGLY genes para o estresse de metais pesados, que estava acessível através do banco de dados GEO (http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE55264) [47].

Análises RT-qPCR

O RNA total foi isolado usando um kit de isolamento (BioTeke, RP3201). O cDNA foi sintetizado usando um kit de síntese (TransGen Biotech), e o RT-qPCR foi realizado conforme descrito por Li et al. [39]. A expressão relativa de BrGLY foi analisado com o Actin como um gene de manutenção usando um método previamente descrito [48]. Os primers específicos projetados estão listados em Tabela S1.


DIREÇÕES FUTURAS E IMPLICAÇÕES CLÍNICAS

A metilação do DNA varia não apenas entre os tecidos, mas também entre as regiões do cérebro, entre a substância cinzenta e a branca e, possivelmente, até mesmo entre as células (Ladd-Acosta et al, 2007 Ghosh et al, 2010). Embora a tecnologia atual limite nossa capacidade de distinguir padrões de metilação específicos de células, o advento do sequenciamento de DNA de próxima geração forneceu ferramentas poderosas para examinar o padrão de metilação de DNA em todo o genoma com resolução de nucleotídeo único (Meissner et al, 2008 Lister et al, 2009 Popp et al, 2010). À medida que a tecnologia melhora, o custo de execução da análise de sequenciamento diminuirá, tornando a tecnologia mais acessível. Desenvolvimentos técnicos recentes permitiram que a análise de metilação do DNA em todo o genoma fosse realizada mesmo com uma quantidade de amostra tão baixa quanto 150 & # x02009ng (Popp et al, 2010). Padrões aberrantes de metilação do DNA são observados em uma ampla variedade de doenças psiquiátricas e neurológicas. Com custos decrescentes e a capacidade de realizar análises de metilação em todo o genoma em quantidades limitadas de tecido, em breve será possível mapear os padrões de metilação do DNA em todo o genoma de regiões distintas do cérebro de pacientes com distúrbios neurológicos e psiquiátricos. A análise do tecido neural de pacientes psiquiátricos levará a novos insights sobre a etiologia da doença psiquiátrica e abrirá novos caminhos para a descoberta de drogas e terapias direcionadas.

Embora os protocolos atuais permitam aos cientistas quantificar com precisão a metilação do DNA na resolução de nucleotídeo único usando quantidades de tecido progressivamente menores, muitos dos métodos mais comumente usados ​​para o perfil e quantificação da metilação do DNA, como sequenciamento de bissulfito e ensaios baseados em enzimas sensíveis à metilação, são incapaz de distinguir entre 5hmC e 5mC (Tahiliani et al, 2009 Huang et al, 2010). Alguns protocolos são capazes de distinguir 5hmC de 5mC no genoma: marcação final CpG seguida por cromatografia em camada fina (Tahiliani et al, 2009) e cromatografia líquida de alto desempenho (HPLC) com detecção de UV (Liutkeviciute et al, 2009) ou espectrometria de massa em tandem (Globisch et al, 2010 Le et al, 2011). O DNA hidroximetilado pode ser enriquecido usando anticorpos que se ligam especificamente a 5hmC ou por biotinilação de 5hmC modificado e as sequências precipitadas podem ser identificadas usando chips de microarray ou por sequenciamento de DNA (Szwagierczak et al, 2010 Ficz et al, Jin 2011 et al, Pastor de 2011 et al, 2011 Wu e Zhang, 2011). Embora esses métodos possam quantificar 5hmC e identificar as sequências de DNA com as quais está associado, a resolução de um único par de bases não foi atingida. A fim de esclarecer a distribuição genômica e o papel epigenético de 5hmC no cérebro, será necessário desenvolver um método específico de locus para identificar 5hmC.

À medida que outras técnicas de alto rendimento, incluindo sequenciamento de RNA e imunoprecipitação da cromatina (ChIP), tornam-se mais acessíveis aos pesquisadores, há uma necessidade crescente de integrar dados de alto rendimento. Atualmente, a metilação do DNA, modificação de histonas e miRNA são estudados em isolamento relativo. Para entender completamente como a expressão gênica é regulada no sistema nervoso, pesquisas futuras devem considerar o epigenoma como um todo. Dissecando os mecanismos biológicos que medeiam a diafonia entre esses mecanismos biológicos e integrando dados de alto rendimento, podemos começar a estudar o epigenoma como um todo. Finalmente, para uma compreensão completa de como o epigenoma regula a expressão gênica, pesquisas futuras terão que descobrir os mecanismos biológicos que medeiam as mudanças dependentes da atividade na paisagem epigenômica do cérebro dos mamíferos.


Assista o vídeo: mRNA Splicing (Junho 2022).


Comentários:

  1. Abarron

    uma resposta importante :)

  2. Yahya

    pelo menos eu gostei.

  3. Amaethon

    Foi comigo também. Vamos discutir esta questão. Aqui ou em PM.

  4. Bernardyn

    Há algo nisso. Agora tudo está claro, obrigado por sua ajuda neste assunto.

  5. Ubayy

    A verdadeira resposta

  6. Caolabhuinn

    assim pode-se examinar infinitamente.



Escreve uma mensagem