quarta-feira, 25 de outubro de 2017

Resumo do Tutorial do Autodock

Esse texto tem como objetivo auxiliar pessoas que estejam fazendo ou que almeijam fazer o tutorial do Autodock, disponível em: http://autodock.scripps.edu/faqs-help/tutorial/using-autodock-4-with-autodocktools


Resumo - Tutorial Autodock

A docagem molecular é o processo de "encaixar" uma molécula na outra,
a molécula que "encaixa" (ligante) tem várias conformações possíveis
para o processo, o software simula automaticamente cada uma delas
(em função das configurações do seu algorítimo) e nos apresenta as
propriedades e resultados de cada conformação.

O objetivo do Autodock é simular a docagem molecular, para melhor
visualização do processo foi usada uma interface gráfica chamada
AutoDockTools (ADT).

O tutorial começa ensinando a setar o diretório onde serão manipulados
todos os arquivos de entrada e saída que serão manipulados durante o
processo, após isso ele apresenta a interface gráfica do AutoDock e
seus elementos. Antes de formatar a molécula para o AutoDock, é
necessário resolver diversos problemas potenciais, o primeiro deles é
a remoção das águas cristalográficas, resolvido simplesmente
selecionado todos os HOH da molécula e deletando.

Macromolécula aberta - HIV Protease - Código pdb: 1hsg

Moléculas de água selecionadas

Moléculas de água deletadas

Hidrogênios adicionados
 


Após esse primeiro contato o tutorial apresenta diversos elementos de
interação com a interface do ADT.

Agora chegamos ao passo 2, que consiste em preparar o ligante para
o AutoDock, aqui carregamos o ligante no software, o tutorial segue
ensinando a encontrar a raiz da árvore de torsão do ligante, a qual
será destacada através de uma esfera verde, em seguida o tutorial
ensina a mostrar e modificar a quantidade de ângulos de torsão, logo
após essa formatação salvamos o arquivo no formato .pdbqt, que é o
formato de arquivo certo para o ligante.

Ligante aberto no software - No caso, o inibidor o qual será docado na macromolécula com a finalidade de quebrar sua função

Zoom do ligante dentro da macromolécula
 

Ligante dentro da macromolécula

Ligante (em destaque) dentro da macromolécula
 
 Raiz do ligante (zoom)



No passo 3 prepararemos a macromolécula, selecionando ela dentro
do software e salvando-a como um .pdbqt.

Após isso chegamos no passo 4, aqui o tutorial nos ensina a criar
uma caixa onde definimos um escopo para a busca do AutoDock, ele segue
mostrando como setar os parâmetros da caixa.
 
 Grade definida no software


No passo 5 aprendemos a preparar o arquivo de parâmetro AutoGrid,
o AutoDock não usa o receptor diretamente, em vez disso, ele usa um
conjunto de “mapas’ pré-calculados produzidos pelo AutoGrid, então nós
selecionamos o ligante e salvamos um arquivo de saída com o parâmetro
.gpf (Grid Parameter File).




O passo 6 simplesmente mostra como executar o AutoGrid. Também é possível executá-lo através do terminal usando o mesmo comando citado no tutorial:



Após isso chegamos no passo 7, onde é ensinado a preparar o
arquivo de parâmetro do AutoDock. Nesse passo é ensinado a configurar
o algorítimo genético o qual é usado na simulação da docagem, aqui
será gerado um arquivo de saída .dpf (Docking Parameter File) o qual
conterá as informações configuradas para o algorítimo genético.

Exemplo de arquivo .dpf gerado
É importante notar a linha em destaque, rmstol. Esse valor é o que irá definir a quantidade de clusters que o Autodock irá resultar (será explicado posteriormente), o valor padrão (2.0) é muito grande para um ligante tão pequeno, então é recomendado ajustar para um valor mais baixo, no caso usei 0.5.


Enfim chegamos na parte de rodar o AutoDock, no passo oito é
explicado quais arquivos de entrada e qual comando é usado para a
execução do AutoDock. Também é possível executar o AutoDock através do terminal, usando o mesmo comando citado no tutorial:





O arquivo de saída final é um .dlg, que contém todas as iterações do
algorítimo genético, o tutorial também ensina a visualizar o resultado terminar
dentro do software o qual pode ser analisado por diversos ângulos e
formas diferentes.


É possível abrir o arquivo .dlg com um editor de texto, assim, podendo
fazer uma análise mais específica, após as iterações nos é apresentado
a tabela de histograma de cluster organizada pelo AutoDocking de acordo
com as conformações que ele encontrou, para simplificar o resultado, o
software organiza conformações parecidas em clusters (considerando essas
conformações como apenas um valor), na última coluna ele apresenta um
histograma feito de hashtags representando graficamente a quantidade de
conformações dentro de cada cluster:

(Para facilitar a localização dessa representação, é possível apertar CTRL+F no documento e digitar "####")

Abaixo a representação gráfica dos clusters por um histograma.



A próxima tabela é a RMSD, que é um valor médio para o desvio médio de
átomos de uma estrutura X, relativamente a uma estrutura Y.

A etapa final é a escolha da melhor conformação possível do ligante. Para isso é necessário levar em conta diversos fatores, primeiramente é fundamental que tenham sido rodadas, pelo menos, 50 vezes o algorítimo e também que o rmsd esteja de acordo com sua molécula (como dito anteriormente). A próxima questão é: o número de avaliações de energia combinam com a dimensionalidade do  problema de busca? Geralmente a resposta convergirá para o cluster com menor energia de ligação. Entretanto, é necessário também levar em consideração o cluster mais populoso.

quarta-feira, 2 de agosto de 2017

 Programas para análise de pockets, cavidades, túneis/canais e poros em proteínas

Para garantir maior proteção ao sítio ativo ou seletividade com relação ao substrato, muitas enzimas possuem suas cavidades catalíticas profundamente escondidas, acessíveis apenas por meio de túneis que conectam tais cavidades ao meio externo. Outras proteínas, como as proteínas membranares, possuem como função realizar o transporte de pequenas moléculas ou íons através de membranas, conduzindo-os até seu destino final por meio de canais. O estudo desses e outros tipos de espaços vazios podem ajudar na elucidação dos mecanismos de atividade biológica ou acessibilidade às proteínas. Softwares como Caver Analyst e Mole permitem que forma, tamanho, propriedades físico-químicas e até a dinâmica de pockets, cavidades, túneis/canais, e poros (figura 1) possam ser analisados.


Figura 1. Tipos de espaços vazios existentes em proteínas: A - pockets, B - cavidades, C - túneis/canais, D - poros.

Definição dos tipos de espaços vazios

- Pocket: depressão na superfície da proteína que serve como sítio de ligação para ligantes ou outras biomoléculas.

- Cavidade: espaço vazio dentro de uma proteína. Pode ocorrer de forma totalmente isolada ou não, possuindo comunicação com o meio externo por meio de túneis/canais. Geralmente constitui-se como o sítio ativo de uma enzima.

- Túneis/canais: espaço vazio que conecta o meio externo ao interior de uma cavidade.

- Poros: canal que transpassa a proteína de um ponto a outro, muito frequente em proteínas de membrana.

A seguir é apresentado um tutorial em três etapas para mostrar como dar os primeiros passos na busca por túneis e afins utilizando-se os softwares Caver Analyst (versão 1.0) e Mole (versão 2.13.9.6). Como exemplo de aplicação, a estrutura utilizada será a da enzima CYP1A P450 (código PDB: 4I8V), presente em mamíferos e pertencente à subfamília das enzimas citocromo P450. Essas enzimas constituem um grupo bastante grande e diverso de proteínas responsáveis por catalisar a reação de oxidação de compostos endógenos e exógenos (estranhos à vida), geralmente a partir de uma reação de monooxigenase. Estudo recente identificou um conjunto de canais de acesso ao sítio ativo (quatro ao todo), os quais, por possuírem distintas características entre si, acabam influenciando diretamente na maneira da enzima controlar suas especificidades com relação a diferentes substratos.

Tutorial - Mole

Por apresentar uma operacionalidade mais simples, opte por começar sua busca por espaços vazios a partir de Mole. Este possui uma interface de interação bastante autoexplicativa (posicionando o mouse sobre um parâmetro, surge na tela uma explicação sobre o significado dele) e que ajuda o usuário já ir se familiarizando com a linguagem/nomenclatura do assunto. 

Mole também está disponível na internet. Este tutorial focará sua explicação no programa, mas praticamente tudo o que será visto aqui pode ser feito da mesma forma no servidor online. No entanto, além de você ter o Java instalado em seu computador, as configurações de permissão dele devem ser modificadas. Do contrário, problemas com relação à segurança do computador impedirão que o servidor funcione corretamente. Em “Painel de Controle Java” e dentro da aba “Segurança”, abaixe o nível de segurança para um inferior (médio). Se esta opção não estiver disponível em seu computador, outra maneira de habilitar Mole consiste em introduzir o site de seu servidor na lista de sites permitidos. Ainda na aba “Segurança”, edite a seção “Lista de Exceções de Sites”, introduzindo o site em questão, como mostra a figura 2.

    
                                 Figura 2. Configurações do “Painel de Controle Java”.

Etapa 1: Carregando uma estrutura

Ao abrir o programa, o qual possui ícone de abertura dentro da pasta criada pelo processo de instalação, a tela inicial (figura 3) oferece três possibilidades de escolha. Geralmente a abertura de estruturas já processadas por outros programas ocorre com inúmeros erros de segmentação, deformando-as. Portanto, pelo menos por enquanto, opte por baixar a estrutura direto a partir do portal Protein Data Bank. No lugar da opção sugerida pelo programa (1TQN), digite “4I8V” e clique em “Download”.


                                             Figura 3. Interface de abertura de Mole.

Na tela de visualização, quatro cadeias aparecerão, conforme também indicado na primeira seção da aba “Refinement”, denominada “Chains”. Por enquanto, trabalhe apenas com a cadeia “A”, desmarcando as demais opções.

Etapa 2: Localizando espaços vazios

Automaticamente, ao carregar a estrutura, o programa já é capaz de detectar algumas cavidades. Ao todo, só a cadeia “A” possui doze cavidades (além de mais nove cavidades internas) a partir dos parâmetros iniciais sugeridos pelo programa na aba “Refinement”, à direita na tela. Para detectar outras cavidades ou ainda mais tipos de espaços vazios, um ajuste nos parâmetros é necessário. Experimente variar os parâmetros das seções “Cavity Parameters” e “Tunel Parameters” de forma aleatória até achar os espaços vazios de interesse. Resíduos na seção “Active Residues” também podem ser marcados ou desmarcados para filtrar a pesquisa. A mudança de parâmetros imediatamente inicia um novo processo de busca e os resultados aparecem em questão de segundos na aba “Results”, logo abaixo.

Porém, uma maneira mais eficiente de fazer isso é indicar um ponto de partida. Como já citado anteriormente, a estrutura 4I8V possui ao todo quatro canais que permitem que diferentes tipos de substratos adentrem a cavidade catalítica da enzima. De acordo com a literatura, um desses túneis (saída entre as hélices E, F e I e a folha beta-5) permite que moléculas de solvente consigam atingir a cavidade catalítica de CYP1A P450. Ao tomar inicialmente um ponto entre alguns resíduos convenientes (GLU 226, GLY 225, LEU 496, THR 497 e MET 498) em “Residues” da seção “Specific Point/Residue(s)”, o túnel (também conhecido como túnel S) é localizado, aparecendo na tela (destacado em laranja), como mostra a figura 4.


Figura 4. Resultado final do procedimento de procura de túneis a partir de um ponto inicial.

Por fim, uma forma ainda mais fácil de achar túneis seria a partir do próprio programa via um processo automático. Ao clicar em “Auto” do grupo “Tunnels”, o programa é capaz de achar automaticamente os túneis mais prováveis.

Etapa 3: Analisando as propriedades

Após localizar os túneis ou outros espaços vazios de interesse, chegou a hora de analisá‑los. A partir da aba “Results”, ao lado de cada espaço vazio identificado, aparecem informações que permitirão conhecê-los melhor. Clique em “Details” para ter acesso a essas informações. Tomando o túnel S como exemplo, tal janela traz o perfil do túnel, mostrando como o raio do mesmo varia ao longo de toda a sua extensão. Clicando em “Lining and Properties” na mesma janela, diversas propriedades físico-químicas do túnel são mostradas (hidrofobicidade, polaridade, mutabilidade, etc.), sendo toda a informação detalhada entre os diversos segmentos de resíduos que compõem o túnel.

A                                                B

Figura 5. Janelas abertas a partir de “Details”, trazendo o perfil de variação do raio do túnel S em função da distância (A) e as propriedades físico-químicas do mesmo (B).

Um pouco sobre Caver Analyst

Agora que você já tem alguma noção de como achar túneis e afins, realizar o mesmo tipo de busca a partir de Caver Analyst torna-se muito mais fácil. Ao contrário do que ocorre em Mole, uma estrutura já previamente processada em outro programa pode ser aberta sem problemas. Caver Analyst possui abas específicas para computar túneis e cavidades (poros ou pockets são exclusivos de Mole). A partir das abas “Tunnel” e “Cavities”, janelas podem ser abertas para a escolha dos parâmetros de busca. Alguns termos diferentes aparecem, mas são detalhados no manual do programa (disponível nas referências abaixo).

O grande diferencial do programa é que ele também pode efetuar busca por túneis ou cavidades a partir de simulações de dinâmica molecular ou um conjunto menor de frames de uma simulação. Dependendo da configuração de seu computador, o programa não é capaz de abrir trajetórias muito grandes. Por isso, na dúvida, selecione um trecho mais interessante de sua trajetória (contendo menos frames) para que o programa possa funcionar de maneira mais rápida.

Ao contrário de Mole, Caver Analyst não contabiliza propriedades físico-químicas, mas alguma análise pode ser feita a partir da geração de gráficos que são capazes de mostrar como diferentes aspectos variam ao longo da extensão do túnel. Uma opção particular do programa são os mapas de calor (figura 6), os quais mostram como o raio de um túnel varia ao longo de toda a extensão do mesmo durante uma trajetória.



Figura 6. Exemplo de mapa de calor gerado em Caver Analyst.

Referências

1)   URBAN, F.; TRUAN, G.; POMPON, D. Access channels to the buried active site control substrate specificityin CYP1A P450 enzymes. Biochimica et Biophysica Acta, 2014.


3)      MOLE 2.0 – USER MANUAL. 39 p. 

terça-feira, 4 de julho de 2017

TUTORIAL - GROMACS (VERSÃO 4.6.7)

SIMULAÇÃO DE UMA PEQUENA MOLÉCULA EM SOLVENTE NÃO AQUOSO

Passo 1: Preparar um arquivo em formato .pdb da estrutura desejada

A partir de qualquer programa que permita editar moléculas (Discovery Studio, Avogadro, etc.), desenhe a estrutura de interesse e salve-a em formato .pdb.

Passo 2: Obter arquivos .pdb de acordo com o campo de forças OPLS-AA

Servidor LigParGen: carregue o arquivo .pdb criado e obtenha os arquivos .itp e .pdb a partir dos parâmetros do campo de forças OPLSA-AA. 

Servidor Virtual Chemistry: obtenha a caixa de simulação do solvente escolhido (formato .pdb) e seu correspondente arquivo .itp, ambos de acordo com o campo de forças OPLS-AA.

Passo 3: Montar arquivo de topologia da molécula (3-aminopropanol):

Em um editor de textos apropriado (Notepad++), monte o arquivo de topologia como mostrado a seguir. Salve o arquivo no formato apropriado (.top).

; The force field files to be included
#include "oplsaa.ff/forcefield.itp"

; Include H9 topology
#include "H9_E30742.itp"

; Include trichloromethane topology
#include "trichloromethane.itp"

[ system ]
H9 in trichloromethane

[ molecules ]
;molecule name number
H9               1

Passo 4: Fazer a simulação

Preparação

a) Caixa de simulação

editconf -f H9_E30742-01.pdb -o H9_E30742-02.pdb -bt cubic -c -d 1.2

b) Solvatação

genbox -cp H9_E30742-02.pdb -o H9_E30742-03.pdb -p topologia.top -cs trichloromethane_T298.15.pdb

Após isso é necessário atualizar o arquivo de topologia adicionando uma linha com o número de moléculas de solvente que o programa adicionou na caixa.

; The force field files to be included
#include "oplsaa.ff/forcefield.itp"

; Include H9 topology
#include "H9_E30742.itp"

; Include trichloromethane topology
#include "trichloromethane.itp"

[ system ]
H9 in trichloromethane

[ molecules ]
;molecule name number
H9               1
trichloromethane 129

Minimização de energia

grompp -f minimizacao.mdp -o minimizacao.tpr -c H9_E30742-03.pdb -p topologia.top

mdrun -s minimizacao.tpr -v

Restrição NVT

grompp -f restricaoNVT.mdp -o restricaoNVT.tpr -c confout.gro -p topologia.top

mdrun -s restricaoNVT.tpr -v

Restrição NPT

grompp -f restricaoNPT.mdp -o restricaoNPT.tpr -c confout.gro -p topologia.top -t state.cpt

mdrun -s restricaoNPT.tpr -v

Simulação

grompp -f dinamica.mdp -o dinamica.tpr -c confout.gro -p topologia.top -t state.cpt

mdrun -s dinamica.tpr -v

Análise

Etapa 1: manter molécula inteira e centralizada

trjconv -f dinamica.trr -s dinamica.tpr -o md1.xtc -pbc whole -center

Grupo para centralização: 3-aminopropanol (H9)

Grupo para output: todo o sistema (System)

Etapa 2: remover translação e rotação em torno do centro de massa

trjconv -f md1.xtc -s dinamica.tpr -o md2.xtc -fit rot+trans

Quando solicitado pelo programa, escolha as mesmas opções da etapa anterior.

Visualização no VMD: carregue md2.xtc sobre confout.gro