Em formação

Por que a cisteína e a tirosina são usadas para calcular um ponto isoelétrico de sequência?

Por que a cisteína e a tirosina são usadas para calcular um ponto isoelétrico de sequência?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Por que os aminoácidos - cisteína e tirosina são usados ​​em cálculos de pontos isoelétricos para uma sequência de proteína, embora nenhum deles seja uma molécula carregada positivamente? e não são usados ​​em cálculos de encargos líquidos.


Cada aminoácido tem um ponto isoelétrico diferente: um pH onde eles não carregam carga elétrica. Este ponto isoelétrico depende das cadeias laterais:

  • Por glicina, a cadeia lateral $ -H $ é neutra (enquanto os grupos amino e ácido carbônico não são), então o IEP é5.97.
  • Por lisina, a cadeia lateral $ - (CH_2) _4 mbox {-} NH_2 $ é alcalina $ [R mbox-NH_2 + H ^ + rightleftharpoons R mbox-NH_3 ^ +] $, então terá uma forma mais alcalina IEP9.74do que a glicina.
  • Por ácido glutâmico, a cadeia lateral $ - (CH_2) _2 mbox -COOH $ é ácida $ [R mbox -COOH rightleftharpoons R mbox -COO ^ - + H ^ +] $, então terá um IEP mais ácido3.22do que a glicina.

Cada cadeia lateral tem mais ou menos contribuição para o IEP do aminoácido. Em sua pergunta

  • a cadeia lateral da cisteína $ -CH_2 mbox-SH $ é um ácido fraco $ [R mbox-SH rightleftharpoons R mbox-S ^ - + H ^ +] $ então o IEP é5.07
  • a cadeia lateral da tirosina $ -CH_2 mbox-Ph mbox - { scriptsize (p)} OH $ é um ácido ainda mais fraco $ [R mbox-OH rightleftharpoons R mbox-O ^ - + H ^ +] $ então o IEP é5.66

E cada aminoácido tem mais ou menos contribuição para o IEP de uma proteína.

Referências:


Um canto da biologia estrutural

Vamos começar com a definição do ponto isoelétrico:

O ponto isoelétrico (pI) é um pH em que a carga líquida da proteína é zero. No caso das proteínas, o ponto isoelétrico depende principalmente de sete aminoácidos carregados: glutamato (grupo δ-carboxil), aspartato (grupo ß-carboxil), cisteína (grupo tiol), tirosina (grupo fenol), histidina (cadeias laterais de imidazol), lisina (grupo ε-amônio) e arginina (grupo guanidínio). Além disso, deve-se levar em consideração a carga de grupos terminais de proteínas (NH2 i COOH). Cada um deles tem sua constante de dissociação de ácido única, denominada pK.
Além disso, a carga líquida da proteína está em estreita relação com o pH da solução (tampão). Mantendo isso em principal, podemos usar a equação de Henderson-Hasselbach para calcular a carga de proteína em determinado pH:

& # 8211 para macromoléculas carregadas negativamente:

& # 8211 para macromoléculas carregadas positivas:

* Arg não foi incluído no estudo e o pK médio de todas as outras escalas foi tomado

Algoritmo mais avançado, implementado no ProMoST, leva em consideração a localização do aminoácido carregado:

aa Termo N meio Termo C
K
R
H
D
E
C
VOCÊ*
Y
10.00
11.50
4.89
3.57
4.15
8.00
5.20
9.34
9.80
12.50
6.08
4.07
4.45
8.28
5.43
9.84
10.30
11.50
6.89
4.57
4.75
9.00
5.60
10.34
* pK foi retirado de Byun et al. 2011

Além disso, diferentes valores de pK são usados ​​para os terminais N e C, dependendo do aminoácido não carregado, se aplicável:

aa N C aa N C aa N C aa N C
G
UMA
S
P
7.50
7.58
6.86
8.36
3.70
3.75
3.61
3.61
V
T
eu
eu
7.44
7.02
7.48
7.46
3.69
3.57
3.72
3.73
N
Q
M
F
7.22
6.73
6.98
6.96
3.64
3.57
3.68
3.98
C
X *
Z **
B ***
7.11
7.26
6.96
7.46
3.78
3.57
3.54
3.57
* X & # 8211 média de todos os aminoácidos
** Z = (E + Q) / 2
*** B = (N + D) / 2

Agora, tendo essas poucas informações, podemos tentar escrever um programa de computador simples que calcule o ponto isoelétrico. Usaremos o compilador gratuito DevC ++, pois o programa será escrito na linguagem de programação C ++. Para ler a próxima seção, você deve ter pelo menos conhecimento básico em C ++.


Como funciona a Calculadora de Peptídeos?

A calculadora de peptídeos é uma das ferramentas mais úteis para o químico de peptídeos calcular o peso molecular do peptídeo e muito mais. Com a calculadora de peptídeos e seu uso fácil, os químicos de peptídeos podem ter acesso a uma calculadora de peptídeo de peso molecular e calculadora de aminoácidos, o ponto isoelétrico, uma calculadora de carga líquida de peptídeo em pH neutro, a hidrofilicidade média, a porcentagem de aminoácidos hidrofílicos, o gráfico da carga líquida vs. pH e uma calculadora de hidrofobicidade exibida em um gráfico.

Para calcular as diferentes características do peptídeo, a calculadora de peptídeo aplicará as fórmulas descritas abaixo:

Para a calculadora de peso molecular de peptídeo e calculadora de aminoácidos de peso molecular, a seguinte fórmula é aplicada:

M: Peso molecular da sequência de aminoácidos

Mn: Peso molecular do terminal N

Mc: Peso molecular do terminal C

Ni: Número de resíduos de aminoácidos

Mi: Peso molecular dos resíduos de aminoácidos

Para a calculadora de aminoácidos de peso molecular, você pode inserir o código de 1 ou 3 letras do aminoácido desejado e a ferramenta fornecerá o valor da mesma forma que calcularia o peso molecular do peptídeo.

A calculadora de carga líquida de peptídeo em um determinado pH é baseada na fórmula abaixo:

Z: Carga líquida da sequência de peptídeo

Ni: Número de resíduos de arginina, lisina e histidina e o terminal N

pKai, pKa: valores do terminal N e dos resíduos de arginina, lisina e histidina

Nj: Número de resíduos de ácido aspártico, ácido glutâmico, cisteína e tirosina e o terminal C

pKaj, pKa: valores do terminal C e dos resíduos de ácido aspártico, ácido glutâmico, cisteína e tirosina

pH: valor do PH

Os valores de pKa para cisteína (pKa = 8,33), ácido aspártico (pKa = 3,86), ácido glutâmico (pKa = 4,25), histidina (pKa = 6,0), lisina (pKa = 10,53), arginina (pKa = 12,48), tirosina ( pKa = 10,07), o terminal N (pKa = 9,69) e o terminal C (pKa = 2,34) são baseados em Principles of Biochemistry, Lehninger (1982).

A calculadora de ponto isoelétrico fornece o pH no qual a carga líquida do peptídeo é zero. O ponto isoelétrico é calculado por aproximação (precisão ± 0,01).

O cálculo da hidrofilicidade média de um peptídeo é baseado nos dados de Hopp & ampWoods. O valor de hidrofilicidade para cada aminoácido na sequência do peptídeo é indicado em um gráfico de barras. A proporção de resíduos hidrofílicos para o número total de aminoácidos é relatada em%.

Para obter mais informações sobre a calculadora de peptídeos, leia nosso documento de detalhes.


Base teórica do cálculo do ponto isoelétrico, ou seja, como calcular o ponto isoelétrico da proteína


Algoritmo mais avançado, implementado no ProMoST, leva em consideração a localização do aminoácido carregado:

aa Termo N meio Termo C
K
R
H
D
E
C
VOCÊ*
Y
10.00
11.50
4.89
3.57
4.15
8.00
5.20
9.34
9.80
12.50
6.08
4.07
4.45
8.28
5.43
9.84
10.30
11.50
6.89
4.57
4.75
9.00
5.60
10.34
* pK foi retirado de Byun et al. 2011
Além disso, diferentes valores de pK são usados ​​para os terminais N e C, dependendo do aminoácido não carregado, se aplicável:
aa N C aa N C aa N C aa N C
G
UMA
S
P
7.50
7.58
6.86
8.36
3.70
3.75
3.61
3.61
V
T
eu
eu
7.44
7.02
7.48
7.46
3.69
3.57
3.72
3.73
N
Q
M
F
7.22
6.73
6.98
6.96
3.64
3.57
3.68
3.98
C
X *
Z **
B ***
7.11
7.26
6.96
7.46
3.78
3.57
3.54
3.57
* X - média de todos os aminoácidos
** Z = (E + Q) / 2
*** B = (N + D) / 2


Agora, tendo essas poucas informações, podemos tentar escrever um programa de computador simples que calcule o ponto isoelétrico. Usaremos o compilador gratuito DevC ++, pois o programa será escrito na linguagem de programação C ++. Para ler a próxima seção, você deve ter pelo menos conhecimento básico em C ++.


Por que a cisteína e a tirosina são usadas para calcular um ponto isoelétrico de sequência? - Biologia

Aminoácidos

Proteínas são formados por polimerização de monômeros que são conhecidos como aminoácidos porque eles contêm uma amina (-NH2) e um ácido carboxílico (-CO2H) grupo funcional. Com exceção do aminoácido prolina, que é uma amina secundária, os aminoácidos usados ​​para sintetizar proteínas são aminas primárias com a seguinte fórmula genérica.

Esses compostos são conhecidos como a-aminoácidos porque o -NH2 grupo está no átomo de carbono próximo ao -CO2Grupo H, o denominado átomo de carbono do ácido carboxílico.

A química dos aminoácidos é complicada pelo fato de que o -NH2 grupo é uma base e o -CO2O grupo H é um ácido. Em solução aquosa, um íon H + é, portanto, transferido de uma extremidade da molécula para a outra para formar um Zwitterion (do alemão significa íon mongrel, ou íon híbrido).

Zwitterions são simultaneamente carregados eletricamente e eletricamente neutros. Eles contêm cargas positivas e negativas, mas a carga líquida da molécula é zero.

Mais de 300 aminoácidos estão listados no Manual Prático de Bioquímica e Biologia Molecular, mas apenas os vinte aminoácidos na tabela abaixo são usados ​​para sintetizar proteínas. A maioria desses aminoácidos difere apenas na natureza do R substituinte. Os aminoácidos padrão são, portanto, classificados com base nestes R grupos. Aminoácidos com substituintes não polares são considerados hidrofóbico (odiava água). Aminoácidos com polar R grupos que formam ligações de hidrogênio com a água são classificados como hidrofílico (amante da água). Os aminoácidos restantes têm substituintes que carregam cargas negativas ou positivas em solução aquosa em pH neutro e são, portanto, fortemente hidrofílicos.

Os 20 Aminoácidos Padrão

NOME ESTRUTURA
(EM pH NEUTRO)
Grupos R não polares (hidrofóbicos)
Glicina (Gly)
Alanine (Ala)
Valina (Val)
Leucina (Leu)
Isoleucina (Ile)
Proline (Pro)
Metionina (Met)
Fenilalanina (Phe)
Triptofano (Trp)
Grupos R polares (hidrofílicos)
Serine
(Ser)
Treonina
(Thr)
Tirosina
(Tyr)
Cisteína
(Cys)
Asparagina
(Asn)
Glutamina
(Gln)
Grupos R com carga negativa
Ácido aspártico (Asp)
Ácido glutâmico
(Glu)
Grupos R com Cobrança Positiva
Lisina
(Lys)
Arginina
(Arg)
Histidina
(Seu)

Use as estruturas dos seguintes aminoácidos na tabela de aminoácidos padrão para classificar esses compostos como não polares / hidrofóbicos, polares / hidrofílicos, carregados negativamente / hidrofílicos ou carregados positivamente / hidrofílicos.

Aminoácidos como estereoisômeros

Com exceção da glicina, todos os aminoácidos comuns contêm pelo menos um átomo de carbono quiral. Esses aminoácidos existem, portanto, como pares de estereoisômeros. As estruturas dos isômeros D e L da alanina são mostradas na figura abaixo. Embora os aminoácidos D possam ser encontrados na natureza, apenas os isômeros L são usados ​​para formar proteínas. Os isômeros D são mais frequentemente encontrados presos às paredes celulares das bactérias e em antibióticos que atacam as bactérias. A presença desses isômeros D protege a bactéria das enzimas que o organismo hospedeiro usa para se proteger da infecção bacteriana, hidrolisando as proteínas da parede celular bacteriana.

Alguns derivados biologicamente importantes dos aminoácidos padrão são mostrados na figura abaixo. Qualquer pessoa que tenha usado uma "quotanti-histamina" para aliviar os sintomas de exposição a um alérgeno pode apreciar o papel que a histamina, um derivado descarboxilado da histidina, desempenha na mediação da resposta do corpo às reações alérgicas. L-DOPA, que é um derivado da tirosina, tem sido usado para tratar a doença de Parkinson. Este composto ganhou notoriedade alguns anos atrás no filme Despertar, que documentou seu uso como tratamento para outros distúrbios neurológicos. A tiroxina, que é um éter iodado da tirosina, é um hormônio que atua na glândula tireóide para estimular a taxa de metabolismo.

O ácido acético e a amônia freqüentemente desempenham um papel importante na discussão da química dos ácidos e bases. Um desses compostos é um ácido fraco e o outro é uma base fraca.

Assim, não é surpreendente que um íon H + seja transferido de uma extremidade da molécula para a outra quando um aminoácido se dissolve em água.

O zwitterion é a espécie dominante em soluções aquosas em pH fisiológico (pH 7). O zwitterion pode sofrer reações ácido-base, entretanto, se adicionarmos um ácido forte ou uma base forte à solução.

Imagine o que aconteceria se adicionássemos um ácido forte a uma solução neutra de um aminoácido em água. Na presença de um ácido forte, o -CO2 - a extremidade desta molécula pega um íon H + para formar uma molécula com uma carga líquida positiva.

Na presença de uma base forte, o -NH3 A extremidade + da molécula perde um íon H + para formar uma molécula com uma carga líquida negativa.

A figura abaixo mostra o que acontece com o pH de uma solução ácida de glicina quando esse aminoácido é titulado com uma base forte, como o NaOH.

Para entender essa curva de titulação, vamos começar com a equação que descreve a expressão da constante de equilíbrio de dissociação de ácido para um ácido, HA.

Agora vamos reorganizar o Kuma expressão,

leve o log para a base 10 de ambos os lados desta equação,

e então multiplique ambos os lados da equação por -1.

Por definição, o termo do lado esquerdo desta equação é o pH da solução e o primeiro termo do lado direito é o pKuma do ácido.

O sinal negativo no lado direito desta equação é frequentemente visto como & quotinconveniente & quot. A derivação, portanto, continua aproveitando o seguinte recurso da matemática logarítmica

para dar a seguinte forma desta equação.

Esta equação é conhecida como Equação de Henderson-Hasselbach, e pode ser usado para calcular o pH da solução em qualquer ponto da curva de titulação.

O seguinte ocorre à medida que avançamos da esquerda para a direita ao longo desta curva de titulação.

  • O pH aumenta inicialmente à medida que adicionamos base à solução porque a base desprotona parte do H carregado positivamente3N + CH2CO2Íons H que estavam presentes na solução fortemente ácida.
  • O pH então se estabiliza porque formamos uma solução tampão na qual temos concentrações razoáveis ​​de um ácido, H3N + CH2CO2H, e sua base conjugada, H3N + CH2CO2 - .
  • Quando praticamente todo o H3N + CH2CO2As moléculas H foram desprotonadas, não temos mais uma solução tampão e o pH sobe rapidamente quando mais NaOH é adicionado à solução.
  • O pH então se nivela como parte do H neutro3N + CH2CO2 - as moléculas perdem prótons para formar H carregado negativamente2NCH2CO2 - íons. Quando esses íons são formados, mais uma vez obtemos uma solução tampão na qual o pH permanece relativamente constante até que praticamente todo o H3N + CH2CO2As moléculas H foram convertidas em H2NCH2CO2 - íons.
  • Nesse ponto, o pH sobe rapidamente até atingir o valor observado para uma base forte.

A curva de titulação de pH nos diz o volume de base necessário para titular o H carregado positivamente3N + CH2CO2Molécula H para o H3N + CH2CO2 - zwitterion. Se adicionarmos apenas metade da base, apenas metade dos íons positivos seriam titulados para zwitteriões. Em outras palavras, a concentração do H3N + CH2CO2H e H3N + CH2CO2 - os íons seriam os mesmos. Ou, usando o simbolismo da equação de Henderson-Hasselbach:

Como as concentrações desses íons são iguais, o logaritmo da razão de suas concentrações é zero.

Assim, neste ponto particular da curva de titulação, a equação de Henderson-Hasselbach fornece a seguinte igualdade.

Podemos, portanto, determinar o pKuma de um ácido medindo o pH de uma solução na qual o ácido foi meia titulado.

Como existem dois grupos tituláveis ​​na glicina, obtemos dois pontos nos quais o aminoácido é titulado pela metade. O primeiro ocorre quando metade do H positivo3N + CH2CO2As moléculas H foram convertidas em H neutro3N + CH2CO2 - íons. A segunda ocorre quando metade do H3N + CH2CO2 - zwitterions foram convertidos em H carregado negativamente2NCH2CO2 - íons.

Os seguintes resultados são obtidos quando esta técnica é aplicada à glicina.

Vamos comparar esses valores com o pKumado ácido acético e do íon amônio.

As propriedades de ácido / base do grupo a-amino em um aminoácido são muito semelhantes às propriedades da amônia e do íon amônio. A a-amina, entretanto, tem um efeito significativo na acidez do ácido carboxílico. A -amina aumenta o valor de Kuma para o ácido carboxílico por um fator de cerca de 100.

O efeito indutivo da a-amina só pode ser sentido na a -CO2Grupo H. Se olharmos para a química do ácido glutâmico, por exemplo, o a -CO2Grupo H no R o substituinte tem uma acidez próxima à do ácido acético.

Quando titulamos um aminoácido da extremidade inferior da escala de pH (pH 1) para a extremidade superior (pH 13), começamos com um íon que tem uma carga líquida positiva e terminamos com um íon que tem uma carga líquida negativa .

Em algum lugar entre esses extremos, temos que encontrar uma situação em que a grande maioria dos aminoácidos esteja presente como o zwitterion sem carga elétrica líquida. Este ponto é chamado de ponto isoelétrico (pI) do aminoácido.

Para aminoácidos simples, em que o R grupo não contém nenhum grupo titulável, o ponto isoelétrico pode ser calculado pela média do pKuma valores para os grupos a-ácido carboxílico e a-amino. Glicina, por exemplo, tem um peu de cerca de 6.

Em pH 6, mais de 99,98% das moléculas de glicina nesta solução estão presentes como o H neutro3N + CH2CO2H zwitterion.

Ao calcular o peu de um aminoácido que tem um grupo titulável no R cadeia lateral, é útil começar escrevendo a estrutura do aminoácido em pH fisiológico (pH 7). A lisina, por exemplo, pode ser representada pelo diagrama a seguir.

Em pH fisiológico, a lisina tem uma carga líquida positiva. Assim, temos que aumentar o pH da solução para remover a carga positiva a fim de atingir o ponto isoelétrico. O peu para a lisina é simplesmente a média do pKumados dois -NH3 + grupos.

Neste pH, todos os grupos de ácido carboxílico estão presentes como -CO2 - íons e a população total do -NH3 + grupos é igual a um. Assim, a carga líquida da molécula neste pH é zero.

Se aplicarmos a mesma técnica ao pKuma dados para o ácido glutâmico, fornecidos acima, obtemos um peu de cerca de 3,1. Os três aminoácidos nesta seção, portanto, têm p muito diferenteseu valores.

Assim, não é surpreendente que uma técnica comum para separar aminoácidos (ou as proteínas que eles formam) envolva colocar uma mistura no centro de um gel e, em seguida, aplicar uma forte voltagem neste gel. Esta técnica, que é conhecida como eletroforese em gel, baseia-se no fato de que os aminoácidos ou proteínas que carregam uma carga positiva líquida no pH em que a separação é feita se moverão em direção ao eletrodo negativo, enquanto aqueles com uma carga negativa líquida se moverão em direção ao eletrodo positivo.


Aminoácidos

Um aminoácido é um composto que contém um grupo amina ( left ( ce <-NH_2> right) ) e um grupo carboxil ( left ( ce <-COOH> right) ) na mesma molécula. Embora qualquer número de aminoácidos possa ser imaginado, os bioquímicos geralmente reservam o termo para um grupo de 20 aminoácidos que são formados e usados ​​por organismos vivos. A figura abaixo mostra a estrutura geral de um aminoácido. Qualquer uma das estruturas é considerada correta para um aminoácido.

Figura ( PageIndex <1> ): um aminoácido é uma molécula orgânica que contém um grupo amina, um grupo carbonila e uma cadeia lateral ( left ( ce right) ), todos ligados a um átomo de carbono central. Os aminoácidos podem ser mostrados com ou sem cargas. Estas são estruturas equivalentes.

Os grupos amina e carboxila de um aminoácido estão ambos ligados covalentemente a um átomo de carbono central. Esse átomo de carbono também está ligado a um átomo de hidrogênio e um ( ce) grupo. É este ( ce) grupo que varia de um aminoácido para outro e é chamado de cadeia lateral de aminoácido.

Figura ( PageIndex <2> ): cinco dos vinte aminoácidos biologicamente relevantes, cada um com uma cadeia lateral distinta ( left ( ce direito)). A cadeia lateral da alanina é apolar, enquanto a da treonina é polar. O triptofano é um dos vários aminoácidos cuja cadeia lateral é aromática. O ácido aspártico possui uma cadeia lateral ácida, enquanto a lisina possui uma cadeia lateral básica.

A natureza das cadeias laterais é responsável pela variabilidade nas propriedades físicas e químicas dos diferentes aminoácidos. Cada aminoácido é agrupado com base nas propriedades da cadeia lateral. Os grupos são designados como polares (hidroxílico, contendo enxofre, amídico), não polar (alifático e aromático), ácido ou básico.

Figura ( PageIndex <3> ): Vinte aminoácidos.

Além do nome completo do aminoácido, há também abreviações de uma e três letras para cada um. Essas abreviações são especialmente úteis ao listar os aminoácidos em uma proteína (uma cadeia de muitos aminoácidos que será discutida posteriormente).

Regras para classificação de aminoácidos

As regras a seguir (junto com duas exceções) podem ajudá-lo a classificar os aminoácidos como apolares, polares ácidos (às vezes chamados de ácidos), polares básicos (às vezes chamados de básicos) ou polares neutros. Veremos duas exceções, mas observe que a transição de não polar para polar neutro é uma transição gradual (como as cores de um arco-íris), então você pode ver variações em como os aminoácidos são classificados se você olhar para outras fontes.

  1. Não polar os aminoácidos (são 9) contêm cadeias alifáticas (hidrocarbonetos) ou anéis aromáticos.
  2. Ácido polar os aminoácidos (2) contêm um grupo ácido carboxílico (ou carboxilato) na cadeia lateral (grupo R). Isto é além de aquele na espinha dorsal do aminoácido.
  3. Polar básico os aminoácidos (3) contêm um grupo amina (pode ser neutro ou carregado) na cadeia lateral (grupo R). Isto é além de aquele na espinha dorsal do aminoácido.
  4. Neutro polar os aminoácidos (6) contêm um hidroxil (-OH), enxofre ou amida no grupo R).

Existem duas exceções importantes às regras acima.

  1. Tirosina tem um grupo aromático e um grupo -OH e é considerado neutro polar.
  2. Metionina contém enxofre, mas como parte da cadeia de carbono. O enxofre tem a mesma eletronegatividade do carbono, por isso é considerado não polar.

Ligação de enxofre para cisteína e cistina

Um covalente ligação dissulfeto (ligação de enxofre) pode se formar entre os grupos R contendo enxofre de duas moléculas de cisteína (chamados grupos sulfidrila). As ligações dissulfeto entre os resíduos de cisteína podem afetar o dobramento e a estabilidade da proteína. As ligações dissulfeto se formam entre os resíduos de cisteína sob condições de oxidação (pH alto). As ligações dissulfeto podem ser quebradas em condições de redução (pH baixo). No laboratório, os pesquisadores costumam usar beta mercaptoetanol (BME) para quebrar as ligações dissulfeto de uma proteína durante um western blot.


Por que a cisteína e a tirosina são usadas para calcular um ponto isoelétrico de sequência? - Biologia



Ponto isoelétrico, o pH no qual uma determinada molécula não carrega nenhuma carga elétrica líquida, é um parâmetro crítico para muitas técnicas de bioquímica analítica e proteômica, especialmente para eletroforese em gel 2D (2D-PAGE), focagem isoelétrica capilar (cIEF), cristalografia de raios-X e cromatografia líquida - espectrometria de massa (LC-MS)

  • A entrada deve ser UMA sequência em texto simples ou várias sequências em formato FASTA (o limite é definido em 50.000 caracteres)
  • A entrada deve ser em um código de aminoácido de uma letra, a entrada pode ser maiúscula ou minúscula.
  • Alfabeto permitido: VXCDBFMOLNYIQTGHWESKPAUR.
  • Todos os caracteres não-aminoácidos serão removidos da sequência.
  • Para grandes conjuntos de dados, use a versão independente ou divida sua entrada em blocos de 50 mil.

Disponível também como pacote PyPi (pip install isoelectric)

100 vezes (de acordo com o Google Scholar)
--> Este site foi visitado> 100.000 vezes nos últimos dois anos (estatísticas)


O ponto isoelétrico de um aminoácido é o $ mathrm$ em que a molécula não carrega nenhuma carga líquida [1]. Ele pode ser calculado pela média dos valores $ mathrm pK_ mathrm a $ relevantes, como você mencionou.

Sua confusão parece resultar da escolha dos valores $ mathrm pK_ mathrm a $ relevantes. Para isso, devemos nos referir à curva de titulação do aminoácido.

Para um aminoácido neutro [2] :

A partir da curva, podemos inferir que o $ mathrm$ é simplesmente a média dos dois valores $ mathrm pK_ mathrm a $ do ácido carboxílico e do grupo amino.

Para um aminoácido básico [2] :

A partir da curva, podemos inferir que o $ mathrm$ é simplesmente a média dos dois valores $ mathrm pK_ mathrm a $ dos dois grupos amino. O $ mathrm pK_ mathrm a $ do grupo ácido carboxílico não é relevante.

Para um aminoácido ácido [3] :

A partir da curva, podemos inferir que o $ mathrm$ é simplesmente a média dos dois valores $ mathrm pK_ mathrm a $ dos dois grupos de ácido carboxílico. O $ mathrm pK_ mathrm a $ do grupo amino não é relevante.


Métodos

Ponto isoelétrico, equação de Henderson-Hasselbalch, pKa valores para os grupos ionizáveis ​​de proteínas

O ponto isoelétrico (pI) é o pH em que a carga líquida de uma proteína é zero. Para polipeptídeos, o ponto isoelétrico depende principalmente das constantes de dissociação (pKa) para os grupos ionizáveis ​​de sete aminoácidos carregados: glutamato (grupo δ-carboxil), aspartato (grupo ß-carboxil), cisteína (grupo tiol), tirosina (grupo fenol), histidina (cadeias laterais de imidazol), lisina (ε-amônio grupo) e arginina (grupo guanidínio). Além disso, a carga dos grupos terminais (NH2 e COOH) pode afetar significativamente o pI de peptídeos curtos. Geralmente, os grupos ionizáveis ​​Glu, Asp, Cys e Tyr não têm carga abaixo de seus pKa e negativamente carregado acima de seu pKa. Da mesma forma, os grupos ionizáveis ​​His, Lys e Arg são carregados positivamente abaixo de seus pKa e sem carga acima de seu pKa [5]. Isso tem certas implicações. Por exemplo, durante a eletroforese, a direção da migração da proteína no gel depende da carga. Se o pH do tampão (e, como resultado, o pH do gel) for superior ao ponto isoelétrico da proteína, as partículas irão migrar para o ânodo (eletrodo negativo), e se o pH do tampão for inferior ao ponto isoelétrico, elas irão migrar para o cátodo. Quando o pH do gel e o ponto isoelétrico da proteína são iguais, as proteínas param de migrar.

No geral, a carga líquida da proteína ou peptídeo está relacionada ao pH da solução (tampão). Podemos usar a equação de Henderson-Hasselbalch [6] para calcular a carga em um determinado pH:

- para resíduos carregados negativamente:

Onde pKn é a constante de dissociação de ácido do aminoácido carregado negativamente

- para resíduos carregados positivamente:

Onde pKp é a constante de dissociação de ácido do aminoácido carregado positivamente

A carga de uma macromolécula em um determinado pH é a soma das cargas positivas e negativas dos aminoácidos individuais dadas pelas Eqs. 1 e 2. Quando o pKa os valores são definidos, a única variável nas equações é o pH do buffer, e alterando iterativamente o pH, podemos calcular facilmente o ponto isoelétrico. O resultado será quase certamente diferente do ponto isoelétrico real porque muitas proteínas são quimicamente modificadas (por exemplo, os aminoácidos podem ser fosforilados, metilados, acetilados), o que pode alterar sua carga. A ocorrência de cisteínas (carga negativa), que podem oxidar e perder carga ao formar ligações dissulfeto na proteína, também é problemática. Além disso, deve-se considerar a exposição do resíduo carregado ao solvente, desidratação (efeito Born), interações carga-dipolo (ligações de hidrogênio) e interações carga-carga [5].

No entanto, a consideração mais crítica para a determinação precisa do ponto isoelétrico é o uso de pKa valores. Infelizmente, pKa as estimativas diferem dependendo da configuração experimental em que foram medidas. Mais de 600 diferentes pKa valores foram relatados para os grupos ionizáveis ​​[15]. A Tabela 4 mostra os valores mais comumente usados, incluindo dois novos pKa conjuntos (proteína_IPC e peptídeo_IPC) propostos neste estudo. A maioria dos algoritmos usa um modelo de nove parâmetros (sete pKa valores correspondentes a aminoácidos carregados e dois para os grupos terminais), mas também existem algoritmos mais avançados, por exemplo, Bjellqvist [16] (17 parâmetros) e ProMoST [17] (72 parâmetros), que tiram vantagem de especificar adicionais pKa valores para cargas de aminoácidos particulares, especialmente aqueles localizados nos terminais polipeptídicos. Além disso, alguns modelos não estavam completos, por exemplo Grimsley et al. [15] não forneceu pKa valor para arginina. Da mesma forma, o modelo Dawson não incluiu a carga de grupos de terminais. Portanto, os valores ausentes foram introduzidos (tirando a média de outros pKa valores ou conjuntos semelhantes) para melhorar os resultados (os modelos com menos de nove parâmetros sempre tiveram um desempenho pior do que aqueles com pelo menos todos os nove parâmetros, ver por exemplo os resultados para Patrickios, modelo de seis parâmetros).

Conjuntos de dados

O objetivo do presente estudo foi derivar computacionalmente mais preciso pKa conjuntos usando os dados atualmente disponíveis. Para treinamento e validação, os seguintes conjuntos de dados foram usados:

O peptídeo IPC pKa conjunto foi otimizado usando peptídeos de três experimentos de alto rendimento:

5.758 peptídeos não modificados de Gauci et al. [18] - peptídeos de lisado de peixe-zebra fracionado usando focagem isoelétrica

Conjunto de dados PHENYX (7.582 peptídeos) [4] - peptídeos da linha de células Drosophila Kc167 fracionada usando foco isoelétrico em dispositivo de eletroforese fora do gel

Conjunto de dados SEQUEST (7.629 peptídeos) [4] - peptídeos da linha celular de Drosophila Kc167 fracionada usando foco isoelétrico em dispositivo de eletroforese off-gel

A proteína IPC pKa conjunto foi otimizado usando proteínas de dois bancos de dados:

SWISS-2DPAGE, versão 19.2 (2.530 proteínas) [19] - com base nos dados da literatura sobre pI vinculado aos números de acesso UNIPROT

PIP-DB (4.947 entradas) [20] - com base em dados da literatura, fornecer pI e informações de sequência para cerca de metade dos registros (para obter detalhes, consulte a Tabela 5).

Primeiro, os dados brutos dos conjuntos de dados individuais foram analisados ​​no formato fasta unificado com informações sobre o ponto isoelétrico armazenado nos cabeçalhos. Em seguida, conjuntos de dados consistindo de proteínas e conjuntos de dados consistindo de peptídeos foram mesclados em dois conjuntos de dados (IPC_protein e IPC_peptide, respectivamente). Os dados foram cuidadosamente validados, por exemplo, se múltiplos experimentais pI valores foram relatados, a média foi usada. A primeira e principal forma de splicing da proteína (mais amplamente expressa) tirada do UniProt [21] foi usada para SWISS-2DPAGE. Nenhuma informação sobre os métodos experimentais usados ​​para a obtenção de pontos isoelétricos ou sua especificidade foi usada implicitamente durante este estudo. Da mesma forma, como as informações sobre modificações pós-translacionais (PTMs) não foram incluídas diretamente no SWISS-2DPAGE e PIP-DB, não foi possível investigar em detalhes a contribuição dos PTMs para pI e eles foram considerados ausentes. Outliers que representam possíveis erros de anotação em bancos de dados foram removidos (proteínas com erro padrão médio (MSE) & gt 3 entre o ponto isoelétrico experimental e a média prevista pI observe que, sob este ponto de corte, nenhum peptídeo foi removido, deve ser enfatizado que outliers removidos não diferem de outras proteínas no que diz respeito ao conteúdo de aminoácidos, distúrbio protéico previsto [22] e estrutura secundária [23]; para detalhes, consulte o arquivo adicional 1 : Tabela S4). Em seguida, dados redundantes foram removidos usando CD-HIT [24] (limite de identidade de sequência de 0,99 foi usado neste caso, era adequado usar uma identidade de sequência tão alta porque mesmo mutações únicas nos resíduos carregados podem levar a mudanças dramáticas em pI além disso, outros limites de identidade de sequência deram resultados semelhantes, dados não mostrados). Esta etapa também removeu duplicatas (várias entradas atribuídas à mesma sequência provenientes de dois bancos de dados diferentes). Finalmente, 25% das proteínas e peptídeos escolhidos aleatoriamente foram excluídos para o teste final, e os 75% restantes foram usados ​​para treinamento com validação cruzada de 10 vezes.

Estatísticas detalhadas para os conjuntos de dados podem ser encontradas na Tabela 5. Os principais arquivos do conjunto de dados estão disponíveis como Arquivos adicionais 2 e 3 e / ou online na seção “Conjuntos de dados” do site do IPC.

Cálculo do ponto isoelétrico

Conforme observado antes, o ponto isoelétrico é determinado calculando iterativamente a soma das Eqs. 1 e 2 para os grupos carregados individuais para um determinado pH. O cálculo pode ser executado exaustivamente, mas isso não seria prático. Em vez disso, o algoritmo de bissecção [25] é usado, que em cada iteração divide pela metade o espaço de busca (inicialmente, o pH é definido como 7) e depois se move para cima ou para baixo em 3,5 (metade de 7) dependendo da carga. Na próxima iteração, o pH é alterado em 1,75 (metade de 3,5) e assim por diante. Este processo é repetido até que o algoritmo alcance a precisão desejada. A bissecção melhora a velocidade em 3-4 ordens de magnitude e, após aproximadamente uma dúzia de iterações, o algoritmo converge com precisão de 0,001. Em seguida, a melhoria da velocidade pode ser obtida começando a busca a partir de uma aproximação grosseira da solução em vez de 7 (neste caso, um pH de 6,68 foi usado, que é o ponto isoelétrico médio para aproximadamente 318.000 proteínas retiradas do SwissProt banco de dados [26], limite de identidade de sequência de 90% foi usado).

Medidas de desempenho

Para medir o desempenho, duas métricas foram usadas, ou seja, a raiz do desvio quadrático médio (RMSD) e o número de outliers, definido como pI previsões com um erro padrão médio (MSE) maior do que o limite determinado em comparação com o experimental pI. Para remover potenciais outliers, para os conjuntos de dados de proteínas, um MSE de três foi usado, e para conjuntos de dados de peptídeos, um MSE de 0,25 foi usado. Além disso, para a análise preliminar, foi utilizada a correlação de Pearson.

Otimização

O procedimento de otimização foi projetado para obter nove ótimas pKa valores (correspondentes aos terminais N e C e às cargas C, D, E, H, K, R e Y). A função de custo foi definida como o desvio quadrático médio (RMSD) entre os pontos isoelétricos verdadeiros dos conjuntos de dados disponíveis e aqueles calculados usando o novo pKa conjunto (s). A otimização foi realizada usando um procedimento basin-hopping [10] que usa um algoritmo de Monte Carlo padrão com o critério de Metropolis para decidir se aceita uma nova solução. O publicado anteriormente pKa os valores foram usados ​​como sementes iniciais. Para limitar o espaço de busca, um algoritmo de Newton truncado [27] foi usado, com 2 limites de unidade de pH para o pKa variáveis ​​(por exemplo, se o ponto de partida para Cys pKa foi de 8,5, a solução foi permitida no intervalo [6,5, 10,5]). A otimização foi executada repetidamente várias vezes usando pKa conjuntos até que o algoritmo convergisse e nenhuma solução melhor pudesse ser encontrada. Para evitar overfitting, os conjuntos de dados IPC_protein e IPC_peptide foram divididos aleatoriamente em conjuntos de dados de treinamento de 75% (usados ​​para pKa otimização) e conjuntos de dados de teste de 25% (não usados ​​durante a otimização). Durante o treinamento, a validação cruzada aninhada de 10 vezes foi usada [28]. Assim, o IPC foi otimizado separadamente nas partições k-1 e testado na partição restante. O treinamento foi repetido dez vezes em todas as combinações. O resultado pKa conjuntos foram calculados. Em geral, esse processo resultou em uma convergência mais lenta do algoritmo e um tempo de treinamento mais longo, mas evitou o sobreajuste. Além do modelo de nove parâmetros (nove pKa valores para resíduos carregados) também modelos mais avançados semelhantes a Bjellqvist e ProMoST também foram testados. Seu desempenho estava em um nível semelhante, portanto, o modelo mais simples de nove parâmetros foi usado na versão final do IPC.

Implementação

O IPC, Isoelectric Point Calculator está disponível como um servidor web (Fig. 4) implementado em linguagem de script do lado do servidor PHP. Além disso, foram usadas a biblioteca de gráficos JavaScript HTML5 CanvasJS (http://canvasjs.com) e bootstrap (http://getbootstrap.com). Além disso, o IPC pode ser usado em qualquer sistema operacional como um programa autônomo escrito em linguagem Python (arquivo adicional 4).

Saída exemplar da calculadora IPC para o Mycoplasma genitalium Proteoma G37 (476 proteínas). O gráfico de dispersão com os pontos isoelétricos previstos versus peso molecular para todas as proteínas é apresentado na parte superior. Então, para proteínas individuais, pI previsões baseadas em diferentes pKa conjuntos são apresentados juntamente com o peso molecular e a composição de aminoácidos


Assista o vídeo: Ponto Isoelétrico dos Aminoácidos (Agosto 2022).