Computing threedimensional structure of a protein by homology modelling. Bioinformatics tutorial.

This is a part of our little project, we performed during the course of Laboratory of Bioinformatics.

To begin with, I want to thank all of my groupmates, who helped me with it, since I am not that good with biology, as they are. And, secondly, if you are doing homology modelling, you should really focus on following links at the uniprot and read a lot about all the ligands and residues, protein family and it’s functions, following all the articles provided, than, modelling itself, won’t make a deal. Cheers.

Abstract

Performing this project we are going to do a homology modelling of protein structure. Homology modelling is the technology used to build an atomic-resolution model of the target sequence based on the known structure of the related homologous protein. It is possible, because proteins with the more than 20% sequence identity usually have the same three-dimensional structure, which depends on the type of the residues. We are going to find homologous protein sequences, perform a structural alignment to select the common sequence parts and then we will use our template homologous protein to build a model of the target sequence using Modelleler software. After that we are going to analyze quality of the obtained model and try to interpret the results.

… 

 

Экскурсия в Broad Institute

Сегодня у нас была экскурсия в Броад институт. Фактически, экскурсия идет сейчас и этот пост я пишу прямо из конференц-зала.

Это место – передовая современной биофинорматики, тут находится 52 машины для секенирования генома (как раз расшифровки и определения того, где какое основание в ДНК находится), которые работают 24 часа в сутки, 7 дней в неделю, для того чтобы проводить расшифровку генома для различных исследований и медицинских в том числе

Когда открывали этот институт, в основу легла идея того, что все данные, которые будут проходить через этот институт, будут становиться общественным достоянием и будут публиковаться в открытом доступе. Сейчас, кстати, они секвенируют порядка тера базовых пар, что очень и очень много.

Например, тут исследуют, какие гены могут активировать раковую мутацию, или отвечать за генетическу болезнь. Причем, они зачастую не интерпретируют результаты, а просто высылают результаты дальше по цепочке. Для этого у них есть Illumina HiSeq 2500 (требуется порядка 16-24 часов для секвенирования), HiSeq 2000 (2-2.5) дня или MiSeq. Стоимость этих игрушек порядка 700 тысяч долларво каждой. На секвенирование генома от поступления генетического матрериала для отправки готового генома уходит примерно 2-2.5 недели.

В принципе благодаря таким лабораториям и институтам можно будет в будущем получать достоверную картину вероятности проявления генетической болезни. Потому что даже сегодня, выделив участки ДНК, отвечающие за появление чего-то плохого, можно не бояться даже при вероятности заболеть в 80%, потому что выборка могла быть построена только на больных людях и на самом деле вероятность заболеть у пациента куда меньше.

В общем, благодаря таким местам мы все более приближаемся к персонализированной медицине, что не может не радовать. Для того, чтобы понять, насколько большая работа предстоит человечеству для того, чтобы полностью победить рак, представьте себе снайпера, который должен попасть в копеечную монету с расстояния порядка 100км. Представили? Так вот, суть в том, что все имеет еще более маленький масштаб, потому что за проявление каких-то последствий может отвечать участок в 100-200 оснований из 1 миллиарда, и это необходимо находить и каким-то образом интерпретировать и думать о том, как с этим бороться.

И это в принципе относится ко всему в биоинформатике, потому что 99.9% генома у всех людей совпадают и очень сложно искать участки и выявлять то, за что они отвечают.