Новейшие Библейские Археологические Открытия

На заглавную страницу На уровень выше

Программа "Геном человека"

ЧТО ЭТО ТАКОЕ?

ЧТО УЖЕ СДЕЛАНО

ОБРАБОТКА ДАННЫХ

ДРУГИЕ ГЕНОМЫ

 

ЧТО ЭТО ТАКОЕ?

Основными задачами международного проекта "Геном человека" (Human Genome Project - HGP) являются секвенирование - т.е. определение последовательности нуклеотидов суммарного набора молекул ДНК клетки человека и картирование (т.е. идентификация генов и локализация места их расположения на хромосомах).

Благодаря тому, что уже идентифицировано множество генов, ответственных за многие болезни человека: онкологические, наследственные, нейродегенеративные, сердечно-сосудистые и т.д., полное выполнение программы "Геном человека" может кардинальным образом изменить здравоохранение. В последнее время активно прогрессирует медицинское приложение геномики - медицинская геномика, в частности, геномная диагностика. Ученые и врачи смогут больше узнать о происхождении конкретных заболеваний и о причинах предрасположенности тех или иных людей к этим заболеваниям. В свою очередь, фармацевтические и биотехнологические фирмы смогут намного быстрее и дешевле создавать новые лекарства, которые будут вызывать гораздо меньше побочных эффектов (например, аллергических реакций).Геном человека, или совокупность всех его генов и межгенных участков ДНК, составляет более 3 млрд. нуклеотидных пар или пар оснований.

Десять лет назад эта величина казалась очень большой, и, учитывая прошлый уровень развития техники секвенирования и информационных систем обработки данных, предположения о прочтении генома человека выглядели фантастически.

Тем не менее, в 1988г. один из первооткрывателей знаменитой двойной спирали ДНК, лауреат Нобелевской премии Дж.Уотсон, публично высказал мысль о реальности возможности полного раскрытия нуклеотидной последовательности ДНК человека. В том же самом 1988 с аналогичной идеей выступил выдающийся российский молекулярный биолог и биохимик, академик А.А. Баев (1904-1994). Сначала эта идея была встречена весьма скептически. Критики считали, что решение данной задачи мало реально и нецелесообразно в научном отношении, к тому же потребует разорительных затрат. Однако время шло, и очень скоро научное сообщество во всем мире стало обсуждать ее всерьез.

С 1989 г. и в США, и в СССР функционируют соответствующие научные программы. В 1990 году правительство США запустило проект Human Genome Project. Цель этого проекта, рассчитанного на 15 лет, состояла в определении полной структуры генома человека. Возглавил реализацию программы Национальный институт генома человека. В СССР по решению правительства было открыто финансирование и организован Научный совет по программе "Геном человека" под руководством А.А. Баева. Расположившийся в головном учреждении программы - Институте молекулярной биологии им. В.А. Энгельгардта РАН, совет весьма быстро создал инфраструктуру, объединил исследования многих разрозненных групп. Сейчас Российская геномная программа финансируется Министерством науки и технологий РФ и поддерживается Президиумом РАН.

Для координации национальных исследовательских программ возникла Международная организация по изучению генома человека (HUGO), вице-президентом которой несколько лет был академик А.Д. Мирзабеков (директор Институте молекулярной биологии им. В.А. Энгельгардта РАН). Ученые шести стран мира (сейчас стран - участниц больше) договорились о работе с различными хромосомами и фрагментами генома человека и совместном определении полной структуры генома. На долю Российских ученых пришлось исследование структур 3 и 19 хромосом человека. С самого начала работ по геномному проекту мир договорился об открытости, доступности всей получаемой информации для его участников независимо от их вклада и государственной принадлежности. Сейчас существуют общедоступные базы данных, в которых аккумулирована информация о структуре генома человека.

Основным соперником HUGO в области определения структуры генома человека является возглавляемая Крейгом Вентером частная компания "Celera Genomics", подразделение корпорации "Applera" (ранее - "PE Biosystems"). Собранная в этой фирме группа специалистов применяет несколько отличный от используемого HGP методический подход при секвенировании генома и создала свою, ориентированную прежде всего на коммерцию, систему обработки и предоставления данных.

К настоящему времени, в реализации проекта "Геном человека" достигнут серьезный прогресс.

ЧТО УЖЕ СДЕЛАНО

В конце февраля 2001 года две конкурирующие между собой организации HGP (Human Genome Project) и "Celera Genomics" практически одновременно опубликовали статьи в "Nature" (HGP) и "Science" ("Celera") о почти что полном окончании работ по секвенированию генома человека. По заявлению представителей HGP, эта международная общественная организация в настоящий момент располагает последовательностью 95% хромосомной ДНК человека и намерена отсеквенировать оставшиеся 4% к 2003 году, завершив таким образом первую часть проекта.

Осуществлявшая секвенирование генома человека на коммерческих условиях "Celera Genomics" "прочитала" 96,5% последовательности и даже организовала бесплатный доступ к своей базе данных (правда, по 1 мегабазе в неделю). В дальнейшие планы "Celera" входит закончить начатые геномные проекты (например, секвенирование генома мыши) и активно расширять сферу своей деятельности за счет исследований в области функциональной геномики и протеомики. В начале февраля представители ряда коммерческих и нучных организаций объявили о создании Human Proteome Organization (HUPO). Основной целью HUPO будет выполнение проекта "Протеом человека". В координационный совет HUPO вошел и один из высших менеджеров компании "Celera".

ОБРАБОТКА ДАННЫХ

В любой соматической (не половой) клетке человека 23 пары хромосом (22 пары соматические и одна пара - половые: XX хромосомы у женщин и XY хромосомы у мужчин). Каждая хромосома представляет из себя молекулу ДНК. Все молекулы ДНК одной клетки человека состоят в общей сложности из 3,2 млрд. пар нуклеотидов (или по-другому, пар оснований).

Для определения нуклеотидной последовательности используются специальные приборы - секвенаторы, позволяющие проводить процесс "чтения" образцов ДНК в автоматическом или полуавтоматическом режиме. В данный момент существует два основных подхода к секвенированию геномов: первый заключается в том, что ДНК хромосомы разделяют на небольшие фрагменты, которые затем зачитываются. Это легко применимо для небольших геномов, но в случае генома человека это сложно ввиду большого количества таких маленьких кусочков. Поэтому используют второй подход. Молекулу хромосомной ДНК делят, наоборот, на достаточно большие куски (несколько десятков тысяч нуклеотидов), секвенируют и сравнивают их нуклеотидные последовательности в надежде найти общие концевые участки. Если это удается, куски объединяют и т. д. В дальнейшем, объединенные по принципу перекрывания прочитанные участки молекулы ДНК становятся все крупнее, постепенно приближаясь к целой хромосоме.

Сравнение полученных при секвенировании очередных фрагментов ДНК данных с уже известными нуклеотидными последовательностями производится с помощью стандартных алгоритмов поиска, таких как "Blast" (basic local alignment search tool - "базовый инструментарий поиска локальных блоков"), после чего они помещаются в базу данных. Как уже упоминалось выше, полный геном человека состоит из 3,2 млрд. пар оснований. Если при этом учитывать, что для точного определения структуры и места локализации на хромосоме небольшого фрагмента ДНК он должен быть прочитан несколько раз, то становиться ясно - обработка данных секвенирования геномов является весьма сложной и нетривиальной проблемой. Сюда входят задачи управления данными, хранения значительных объемов информации, адаптации общедоступного программного обеспечения или создание новых программных продуктов, предназначенных для обработки значительных массивов данных, интеграция гетерогенных приложений и т.д.

Обычной лаборатории, занимающейся секвенированием геномов, приходится ежедневно определять нуклеотидную последовательность нескольких сотен тысяч фрагментов ДНК: только это ежедневно дает в среднем несколько десятков Гбайт данных. Безусловно, значительной степени успех работы по составлению генома человека зависит от уровня развития информационной инфраструктуры, способной быстро и точно получать, анализировать и хранить огромные объемы данных. Так, только в распоряжении Центра биомедицинских исследований Уайтхеда Массачусетского технологического института - одной из множества научных организаций, принимающих активное участие в реализации международного проекта "Геном человека" (Human Genome Project) находится 123 секвенсора; 17 четырехпроцессорных SMP-серверов; дисковые массивы Compaq StorageWorks емкостью 5 Тбайт; базы данных Sybase; множество разработанных в самом институте программных приложений. Технической поддержкой исследований и обслуживанием оборудования занимаются девять системных администраторов. Полученные при секвенировании нуклеотидные последовательности хранятся в плоских файлах Unix-систем, в то время как данные, сгенерированные информационными системами, хранятся в реляционных базах данных Sybase. Один раз в сутки вновь собранные и обработанные результаты секвенирования автоматически пересылаются по Internet в GenBank - общедоступную базу данных, обслуживаемую Национальным центром биотехнологической информации США. Оттуда новые данные поступают в другие общедоступные базы данных в Европе и Японии.

Основным конкурентом финансируемому правительствами ряда стран проекту "Геном человека" (Human Genome Project) и является частная американская компания "Celera Genomics" - подразделение корпорации "Applera" (раньше - PE Biosystems), осуществляющая работы по определению структуры генома человека на коммерческой основе. В состав группы "Celera Genomics" (штаб-квартира расположенна в Роквилле, штат Мериленд, США), входит три бизнес-подразделения - On-line Information Business, Discovery Sciences и Discovery Services."Celera" разработала собственную инфраструктуру для генерации, интеграции и анализа биологической информации, ориентированную на электронную коммерцию. Подписчики "Celera", к примеру, обращаются к своим собственным базам данных, работающим на серверах "Celera", через Internet; база данных каждого подписчика обновляется еженедельно. Помимо доступа к оперативным данным, подписчики могут получить аннотации (подробную информацию о том, был ли тот или иной ген обнаружен раньше, запатентован и т. д.), сравнительную информацию о геномах (например, сравнение с геномами плодовой мушки и мыши), доступ к вычислительным ресурсам "Celera" и широкому диапазону программных инструментальных средств.

В распоряжении "Celera" находится 300 секвенаторов 3700 DNA, а также созданный в сотрудничестве с Compaq Computer собственный суперкомпьютерный центр (по мнению специалистов "Celera", второго по размеру в мире). Здесь уже установлено более 200 серверов Compaq AlphaServer ES40, оснащенных процессорами Alpha/500 МГц, 11 серверов GS140 и система хранения StorageWorks емкостью 50 Тбайт, три системы WildFire, одна из которых укомплектована оперативной памятью емкостью 128 Гбайт. Все это оборудование подключено к коммутируемой магистрали, с пропускной способностью 500 Гбайт/сек. Недавно, при посредничестве Министерство энергетики США было заключено соглашение об исследованиях и разработках между работающей в интересах этого ведомства лаборатории Sandia National Laboratories и "Celera Genomics". Технологии для проекта, направленного на разработку нового поколения программных решений и компьютерного оборудования, специально ориентированного на потребности биологии предоставит корпорация Compaq Computer. Альянс будет использовать процессоры Compaq Alpha, объединенные в массово-параллельные конфигурации.

Compaq и Sandia займутся совместной разработкой аппаратного и программного обеспечения систем, а также работать над увеличением вычислительной мощности, стремясь достичь уровня 100 триллионов операций в секунду (100 TeraOPS). Ожидается, что благодаря доступу к некоторым разработанным Sandia компьютерным технологиям участники соглашения смогут в конце концов добиться быстродействия до 1000 TeraOPS (cейчас Sandia Labs. эксплуатирует самый мощный существующий суперкомпьютер CplantTM на базе Linux, который включает свыше 1600 процессоров Alpha). Прототип системы на основе будущих поколений машин серии AlphaServer SC планируется создать к 2004 году.

Совместная работа "Celera" и "Sandia" будет направлена прежде всего на разработку мощных алгоритмов для биологических исследований, а также новых технологий визуализации для анализа огромных массивов экспериментальных данных. Все три группы будут участвовать в интеграции оборудования и программного обеспечения систем, а также в оптимизации производительности. Это позволит объединить возможности трех лидеров в области биоинформатики, высокопроизводительных вычислений и массово-параллельных систем. Необходимость такого глубокого сотрудничества определяются требованиями, предъявляемым программным обеспечением исследований в области функциональной геномики и протеомики к вычислительной мощности и управлению данными. Несомненно, что решаемые в рамках этих научных направлений задачи окажутся гораздо более сложными, чем выяснение нуклеотидной последовательности генома человека.

ДРУГИЕ ГЕНОМЫ

Секвенированием геномов (т.е. определением нуклеотидной последовательности суммарного набора молекул ДНК клетки какого-либо организма), их картированием (т.е. идентификацией генов и локализацией места их расположения на хромосоме) и сравнительным анализом структур геномов разных организмов занимается направление современной молекулярной биологии под   названием   геномика.

Первым полностью секвенированным геномом стал расшифрованный в 1977 г. геном бактериофага ?X174, состоящий всего из 5386 пар нуклеотидов (или пар оснований - п.о.). В дальнейшем были получены нуклеотидные последовательности геномов ряда вирусов. Первыми свободно живущими организмами, чьи геномы были полностью прочитаны, стали микоплазма Micoplasma genitalium и бактерия Haemophilus influenzae. Эти микроорганизмы оказались выбраны, т.к. являются патогенами (т.е. вызывают заболевания) человека. Всего на начальном этапе реализации геномных проектов были изучены 8 разных представителей мира микроорганизмов, а к концу 1998 г. - уже 18 организмов с размерами генома от 1 до 20 Мb (Мb - миллион пар оснований). В их числе представители многих родов бактерий: спирохеты, хламидобактерии, кишечная палочка, возбудители пневмоний, сифилиса, гемофилии, метанобразующие бактерии, микоплазмы, цианобактерии. К настоящему времени определена полная структура геномов более чем 100 микроорганизмов, основную часть которых составляют патогены. Таким образом, уже с первых шагов геномика дала развитие двум своим направлениям: медицинской и сравнительной геномике.

Сейчас расшифровка геномов ведется с все возрастающей скоростью. Помимо исследования геномов простых организмов, установлена нуклеотидная последовательность ДНК архебактерии, находящихся в лестнице эволюционного развития как бы между эукариотами (клеточными организмам) и прокариотами (бактериями). Кроме того, определено полное строение генома пекарских дрожжей (Saccharomyces cerevisiae, первого одноклеточного эукариотического организма). Первым многоклеточным организмом с полностью секвенированным геномом стал круглый червь Caenorhabditis elegans (нематода). Следующими в списке стали плодовая мушка дрозофила (первого насекомое) и арабидопсис (первое растение), чьи ДНК были сравнительно недавно "расшифрованы". Вершиной достижений современной геномики можно назвать определение последовательности нуклеотидов ДНК мыши и человека. Все это позволило перейти от сравнения структуры отдельных генов или их групп к сравнению строения полных геномов организмов, находящихся на разных уровнях эволюционного развития - эволюционной геномике.

На уровень выше

Современные биотехнологии

Клонирование

Трансгенные растения

Трансгенные животные

Программа "Геном человека"

Рак

СПИД

Проказа

Последнее обновление: 01.01.2003          E-mail: nenahov@lipetsk.ru           Вэбсайт: Http://www.lipetsk.ru/~wyatt

На начало На заглавную страницу

  

 

Hosted by uCoz