Читать онлайн ДНК и её человек. Краткая история ДНК-идентификации бесплатно
- Все книги автора: Елена Клещенко
Научный редактор Светлана Боринская, д-р биол. наук
Редактор Мария Несмеянова
Руководитель проекта А. Шувалова
Корректор И. Астапкина
Компьютерная верстка М. Поташкин
Оформление обложки и макет А. Бондаренко
В книге использованы иллюстрации, предоставленные автором
Все права защищены. Данная электронная книга предназначена исключительно для частного использования в личных (некоммерческих) целях. Электронная книга, ее части, фрагменты и элементы, включая текст, изображения и иное, не подлежат копированию и любому другому использованию без разрешения правообладателя. В частности, запрещено такое использование, в результате которого электронная книга, ее часть, фрагмент или элемент станут доступными ограниченному или неопределенному кругу лиц, в том числе посредством сети интернет, независимо от того, будет предоставляться доступ за плату или безвозмездно.
Копирование, воспроизведение и иное использование электронной книги, ее частей, фрагментов и элементов, выходящее за пределы частного использования в личных (некоммерческих) целях, без согласия правообладателя является незаконным и влечет уголовную, административную и гражданскую ответственность.
© Клещенко Е., 2019
© Бондаренко А., художественное оформление, макет, 2019
© ООО «Альпина нон-фикшн», 2019
* * *
От автора
Книга адресована тем, кто хочет понять, как связаны наша ДНК и наша индивидуальность. Не в высшем философском смысле, а в прикладном, в том самом, который интересует ученых и криминалистов: кому принадлежит образец биоматериала и что еще мы можем сказать об этом человеке, имея только его ДНК? Надо ли для точной идентификации читать весь геном (“но это очень дорого!”). Может ли ошибаться тест на отцовство и чем он отличается от поиска предков человека по Y-хромосоме. Почему биологи уверены, что под Екатеринбургом найдены останки Николая II и его семьи и почему сомневаются представители церкви. Почему многих американцев обеспокоил арест “убийцы из Золотого штата” – это же хорошо, что его арестовали, разве нет?
Тем, кто хочет разобраться в этом, придется вникнуть в устройство ДНК и, главное, понять, как с ней работают. Но я постаралась рассказать об этом как можно проще и с минимумом формул. Идея книги в том, чтобы любой читатель, даже с подготовкой по биологии на уровне школы, мог заглянуть в настоящие научные публикации и разобраться в сути. Зайти чуть дальше новостного “ученые выделили ДНК и установили”.
В конце концов, это интересно само по себе. Истории открытий, которые сделали возможным анализ ДНК на современном уровне, не менее занимательны, чем детективные сюжеты, и не все же мне писать о бандитах, террористах и насильниках – в книге должны быть и положительные герои. А наука о ДНК – это прежде всего люди. Харизматичные, практичные, немного (или без “немного”?) сумасшедшие, упрямые, невыносимые, благородные, уверенно планирующие невозможное – самые разные, но скучно не будет в любом случае.
Это случилось в декабре 2002 г. Лидия, 26-летняя американка, беременная третьим ребенком, рассталась со своим партнером по имени Джейми. Чтобы получить материальную помощь, она обратилась в государственные органы. Как часть рутинной процедуры, Лидия и ушедший от семьи папа должны были пройти генетическое тестирование, чтобы подтвердить отцовство.
Сказать, что результат удивил, – значит не сказать ничего. Джейми действительно был отцом детей, а вот Лидия, если верить ДНК-анализу, не была их матерью. Повторный тест выполнили на всякий случай в другой лаборатории – то же самое.
Лидия заявила, что все это бред, что она прекрасно помнит, как носила и рожала своих детей (интересно, такое вообще-то возможно запамятовать?!). Причем рожала не в лесу, а в цивилизованных условиях, под наблюдением врачей-акушеров, так что врет ваше ДНК-тестирование. Сожалеем, но ДНК-тестирование никогда не врет, отвечали официальные лица. Ситуация у нас с вами подозрительная, известны случаи, когда психически нестабильные похитительницы детей убеждали себя, что они этих детей сами родили, а где-то в это время рыдали настоящие матери. Что до свидетельств медработников – кто знает, может, они подкуплены? А ДНК обманывать не будет, это – наука. Давайте разбираться.
Лидию вызвали в департамент социальных служб и уведомили, что детей у нее могут изъять в любое время. “Когда я села, они подошли, закрыли дверь и просто… начали бомбардировать меня вопросами вроде «Кто вы такая?»”.
Разбирательство продолжалось 16 месяцев. “Я обедаю с детьми и вдруг начинаю плакать. Они смотрят на меня, будто хотят спросить: что случилась, мамочка? Обнимают меня, а я не могу ничего им объяснить, потому что сама не понимаю”. Да и никто не понимал, к кому Лидия ни обращалась, от врачей до юристов. Тысячелетиями оставался бесспорным принцип римского права Mater semper certa est – “Мать всегда известна точно” – и вот на тебе. Хорошо, пофантазируем и допустим, что одного ребенка Лидия во временном помрачении ума могла у кого-то похитить. Но нескольких, да еще родных друг другу?..
Чем все закончилось, мы обязательно узнаем. (Маленький спойлер: анализ не врал.) Но сначала надо разобраться, что это за ДНК-тестирование и почему ему веры больше, чем свидетельству врачей, принимавших роды у женщины.
Как устроена ДНК
Краткая предыстория
Начать придется все-таки с рассказа о двойной спирали. Читатель торопится к детективным сюжетам, и я за годы работы в научной журналистике немного устала от зачина “ДНК состоит из кирпичиков-нуклеотидов” – но ничего не поделаешь, надо. Когда в самом интересном месте непонятно ключевое слово, это раздражает.
То, что потомство бывает похоже на родителей, заметить нетрудно, о возможных причинах этого феномена рассуждали еще античные мыслители. Гиппократ в книге “О семени и природе ребенка” писал так: “Семя мужское исходит из всей той влаги, которая содержится в человеке и от которой отделяется то, что есть наиболее сильного. И доказательством того, что отделяется наиболее сильное, служит то, что, когда мы совершим соитие, то, испустивши из себя столь маленькую часть, делаемся, однако, слабыми. (…) Семя как женщины, так и мужчины происходит из всего тела, и из слабых частей – слабое, а из сильных – сильное (…) И если от какой-либо части тела для семени больше привходит от мужчины, чем от женщины, то ребенок более похож на отца; если же от какой части тела более привносится от женщины, то ребенок бывает более похож на мать. Но никогда быть не может, чтобы плод всеми своими частями был похож на мать, а на отца не был совершенно похож, или наоборот…”[1] Ну разве это не прекрасно?
Данная гипотеза создавала трудности, которые видел и сам Гиппократ. Например, если загадочное вещество наследственности формируется во всех частях тела, почему от здоровых и крепких людей иногда рождаются слабые дети, а от искалеченных почти всегда рождаются здоровые: одноногий отец зачинает вполне двуногих младенцев? Гиппократ подыскивал этому довольно увлекательные объяснения, однако время решить вопрос по-настоящему еще не пришло.
Но практическое применение идей наследственности началось задолго до отца медицины: с незапамятных времен люди одомашнивали дикие виды и занимались селекцией. Несколько утрируя, можно сказать, что сельскохозяйственная генетика сделала свои первые шаги, когда древняя женщина выбрала из кучки самые крупные зерна злаков и не стала варить из них похлебку, а сохранила, чтобы посеять. Или когда древний мужчина сказал: эту ярочку сейчас не режем, а приведем к ней соседского барана, самого большого в деревне, получатся ягнята и тоже вырастут большими.
По-видимому, первые научные соображения о наследственности, сохранившие значимость до наших дней, высказал в XIX в. Грегор Мендель – монах, а затем аббат августинского монастыря святого Фомы в Брюнне (сейчас Брно). С 1854 г. в течение восьми лет Мендель проводил опыты по скрещиванию гороха. Ему повезло с объектом исследований: горох быстро растет, у него легко выбрать признаки, представленные не множеством вариаций (как, например, цвет глаз у человека), а всего двумя. Так, горошины могут быть желтыми или зелеными, гладкими или морщинистыми.
Мендель ввел понятие наследственного задатка (или, в других переводах, наследственного фактора) – некой материальной субстанции, которая определяет тот или иной признак. Он также предположил, что каждое растение имеет пары наследственных задатков, так что признак определяется не единственным задатком, а комбинацией двух. Это предположение объясняло, почему при любых вариантах скрещивания, если посмотреть на потомство, соотношение растений с желтыми и зелеными горошинами не бывает произвольным, каким угодно, а всегда близко к отношениям целых чисел – 3:1, 1:1. А заодно – почему признаки распределяются независимо, то есть отдельно взятая горошина может быть желтой морщинистой, желтой гладкой, зеленой морщинистой или зеленой гладкой: цвет – это одна пара наследственных задатков, морщинистость – другая. Сегодня мы называем “наследственные задатки” генами, а их двойной набор – диплоидностью. Подавляющее большинство животных диплоидно, мы, люди, в том числе.
8 марта 1865 г. Мендель доложил свои результаты Обществу естествоиспытателей в Брюнне и опубликовал статью в “Трудах…” этого общества. Однако статья под скромным названием “Опыты над растительными гибридами” (1866) прошла почти незамеченной. Мендель и сам разуверился в важности своих результатов, когда они не подтвердились на других видах, в частности на ястребинке (небольшой желтый цветок, похожий на одуванчик). Дело в том, что семена у ястребинки образуются путем апомиксиса, или партеногенеза, то есть без оплодотворения, из материнской клетки, и никакого взаимодействия отцовских и материнских задатков тут быть не может. Но кто мог знать тогда, что горох – “правильное” растение, честно показывающее истинные генетические закономерности, а ястребинка – “неправильное”.
В итоге наблюдения Грегора Менделя не были восприняты как фундаментальное открытие. Их значение поняли только тогда, когда законы Менделя переоткрыли в начале ХХ в. независимо друг от друга трое ботаников – Карл Корренс (Германия), Хуго де Фриз (Голландия) и Эрих Чермак (Австрия).
Очевидно, не знал о работе Менделя и Чарльз Дарвин (ходят легенды о письме от Менделя в архиве Дарвина, но даже в этих легендах письмо не распечатано). Это досадно: представление о дискретных, ни с чем не смешивающихся единицах наследственности помогло бы ответить как минимум на одно важное замечание критиков.
На заре существования дарвиновской теории ей всерьез угрожал так называемый кошмар Дженкина, по имени британского инженера Флеминга Дженкина, задавшего простодушный вопрос, на который тогдашние натуралисты не находили достойного ответа. Вот вы говорите, что полезные признаки передаются потомству и широко распространяются, спрашивал Дженкин. Но ведь если признак редкий, это означает, что он, скорее всего, будет только у одного из родителей. Следовательно, потомство получит только половинку признака, что мы и наблюдаем в природе: посмотрите, как изменяется цвет кожи у мулатов, квартеронов и окторонов – людей с половиной, четвертой и восьмой частью негритянской крови, у которых лишь один из прадедушек или прабабушек был чернокожим. Значит, даже самый полезный для выживания признак обречен постепенно исчезать, растворяться бесполезными признаками, а не закрепляться и распространяться; не работает ваш естественный отбор!
Наследственные задатки Менделя помогли бы решить эту проблему: потомок получает от родителя либо вариант, отвечающий за полезный признак, либо другой вариант, и никаких четвертей и восьмых долей тут природой не предусмотрено. А если признак в самом деле полезный, то потомков у его носителя будет больше, чем у тех, кто этим признаком не обладает, – вот и распространение.
О цвете кожи у потомков негроидов и европеоидов мы еще поговорим: в криминалистике это важная тема, и там все оказалось непросто. А сейчас – о веществе наследственности.
Вещество наследственности: где находится, из чего состоит
Слова “ген” вместо наследственного задатка, а также “генетика” – наука, изучающая гены, – появились в 1900-е гг., после переоткрытия законов Менделя. Но чем дальше развивалась генетика, чем больше накапливалось наблюдений, тем острее вставал вопрос о материальном носителе генетической информации. Наблюдения подсказывали, что это какая-то молекула, содержащаяся в хромосомах – палочкообразных тельцах, которые становятся видимыми в ядре при микроскопировании окрашенных препаратов делящихся клеток. Хромосомы есть практически у всех живых существ. В большинстве клеток многоклеточных организмов они парные (как и “наследственные задатки” Менделя): каждая хромосома представлена двумя экземплярами. При делении клетки они таинственным образом удваиваются и расходятся по дочерним клеткам – это красивое явление называется “танцем хромосом”. Наконец, когда с ними происходит что-то нештатное, например в клетку попадает неправильное число хромосом, хромосома теряет участок или приобретает лишний, это драматически отражается на внешних признаках организма – фенотипе, как говорят генетики.
Специальную фразу, которой биологи пугают небиологов, – “генотип влияет на фенотип” – можно перевести на человеческий язык как “совокупность наследственных факторов определяет внешние признаки”. Заметим, что фенотип – это не только цвет глаз и полоски на шкуре, но и, например, активность какого-нибудь фермента.
Таким образом, гены, чем бы они ни были, находятся в хромосомах. Важнейшую роль в установлении этого факта в 1910-е гг. сыграл Томас Морган с его опытами по скрещиванию дрозофил. В 1933 г. Морган получил Нобелевскую премию, и к тому времени хромосомная теория наследственности была общепринятой. Николай Владимирович Тимофеев-Ресовский в начале 1930-х гг. вместе с Максом Дельбрюком и Карлом Циммером пытался оценить физический размер гена в хромосоме, облучая дрозофил гамма-лучами. Через зависимость частоты мутаций от дозы облучения они вычислили минимальный объем в клетке, повреждение которого приводит к мутации. Кстати, оценка оказалась довольно точной: получалось, что “ген” по порядку величин близок к размерам аминокислоты или нуклеотида. Конечно, в реальном гене дрозофилы тысячи нуклеотидов, но повреждение одного из них может испортить весь ген.
Вот как писал о хромосоме Эрвин Шрёдингер в своей знаменитой книге “Что такое жизнь с точки зрения физика?” (What is Life? The Physical Aspect of the Living Cell) (1945). “Наиболее существенную часть живой клетки – хромосомную нить – можно с полным основанием назвать апериодическим кристаллом. В физике мы до сих пор имели дело только с периодическими кристаллами. Для физика периодические кристаллы являются весьма интересными и сложными объектами. (…) Однако по сравнению с апериодическими кристаллами они кажутся несколько элементарными и скучными. Различие в структуре здесь такое же, как между обычными обоями, на которых один и тот же рисунок повторяется с правильной периодичностью, и шедевром вышивки, скажем, рафаэлевским гобеленом, который повторяет сложный, последовательный и полный замысла рисунок, начертанный великим мастером”[2].
Но ДНК далеко не сразу прошла кастинг на роль Самой Главной Молекулы. Белки, как изначально понятно, основа жизни, практически ее синоним, “жизнь есть форма существования белковых тел” – сказал небиолог, но биологи с этим афоризмом были в целом согласны. Белки и назвали гордо – протеины, “первые”. А вещество, впервые обнаруженное в клетках гноя, получило имя, абсолютно неподходящее для будущей громкой славы…
История ДНК в науке начинается так. После окончания учебы в университете в 1877 г. немецкий биохимик Альбрехт Коссель стал научным сотрудником у своего бывшего преподавателя, Феликса Гоппе-Зейлера, в Страсбургском университете. В то время Гоппе-Зейлер проявлял большой интерес к веществу, которое впервые выделил в 1869 г. еще один его бывший ученик, швейцарец Фридрих Мишер, в Тюбингенском университете. Мишер исследовал лейкоциты из гноя с бинтов, которые брал в хирургической клинике. Он разработал метод выделения ядер из клеток, а из них получил вещество, которое назвал нуклеином (ядро по-гречески – “нуклеус”). Эта странная субстанция была не похожа ни на какие до сих пор известные органические вещества. Она была настолько странной, что Гоппе-Зейлер проверил результаты младшего коллеги, и только после этого, в 1871 г., статья “О химическом составе клеток гноя”[3] была опубликована. Новое вещество содержало много фосфора и обладало свойствами кислоты – как выяснилось, в его составе были фосфатные группы, от той самой фосфорной кислоты H3PO4, которую все знают со школьных уроков химии. В белках фосфора практически нет, значит, “нуклеин” – не белок. Возникла даже идея, что это вещество играет роль запаса фосфора, который может понадобиться клетке. (А вот Аристотель писал про мозг, что этот очевидно бесполезный холодный и влажный орган служит для охлаждения крови. Нам легко смеяться над заблуждениями предков.)
Честь открытия ДНК принадлежит Мишеру, но проанализировал “нуклеин” Альбрехт Коссель, лауреат Нобелевской премии по физиологии или медицине 1910 г. Он показал, что нуклеин на самом деле состоит из двух компонентов, белкового и небелкового, и назвал второй из них нуклеиновой кислотой. С 1885 по 1901 г. он со своими студентами исследовал состав этого вещества, выделяя его из различных источников. Коссель открыл азотистые основания в ДНК: – аденин – А, тимин – Т, гуанин – G и цитозин – С (а также урацил – U, который содержится вместо Т в РНК). А вот то, что нуклеиновые кислоты содержат пятиуглеродный сахар – или рибозу, или дезоксирибозу, – установил еще один человек, Феб (Фибус) Левен в Рокфеллеровском институте. Он же предложил понятие нуклеотида как элементарной единицы нуклеиновой кислоты – азотистое основание плюс рибоза либо дезоксирибоза плюс остаток фосфорной кислоты.
Открытие дезоксирибозы в составе нового вещества добавило к его названию еще пять слогов: ДезоксирибоНуклеиновая Кислота – ДНК (англ. DNA, франц. ADN, нем. DNS…). Другая нуклеиновая кислота, с рибозой вместо дезоксирибозы и урацилом вместо тимина, стала, соответственно, рибонуклеиновой, РНК. Длинновато и неуклюже – знать бы заранее, каким важным окажется вещество из гноя, можно было бы придумать что-нибудь покрасивее. С другой стороны, если бы эти молекулы назвали “Священной Книгой Жизни” или “Основой Эволюции”, вряд ли нам сейчас было бы проще.
Кстати: ДНК – дезоксирибонуклеиновая КИСЛОТА, поэтому ДНК – ОНА, а не “он” или “оно”. Когда биологи слышат выражения вроде “ваше ДНК”, “человеческое ДНК” – сердятся и могут побить.
Итак, ДНК состоит из четырех нуклеотидов – А, Т, G, С. Отсюда и возникли сомнения в том, что она может быть веществом наследственности. Представлялось невероятным, что четырьмя нуклеотидами можно записать большой объем информации. К тому же считалось, что они регулярно повторяются в линейной молекуле, то есть, по Шрёдингеру, ДНК – это обои, а не гобелен. А вот в белках, например, целых 20 аминокислот – примерно столько букв в английском алфавите, а если учесть модификации аминокислот, то и русский алфавит белки обгонят.
Казалось бы, Левену, открывшему нуклеотиды и даже соединившему их в цепочку, оставался один шаг до открытия структуры ДНК, – но он этого шага не сделал, а предположил, что ДНК состоит из четырехнуклеотидных молекул, по одному нуклеотиду каждого вида. Это вещество представлялось примитивным, в том числе и самому Левену. “Химия нуклеиновых кислот может быть изложена кратко. Действительно, нескольких графических формул, которые не заполнят даже одну печатную страницу, может быть достаточно, чтобы выразить весь запас современных знаний по этому вопросу”[4], – писал он в 1931 г.[5] Парадокс: Левен сильно продвинул вперед изучение структуры нуклеиновых кислот, но он же существенно подорвал репутацию ДНК, поддерживая мнение, что эта неинтересная молекула состоит из четырех нуклеотидов, взятых в равных количествах. Когда решался вопрос о возможном носителе наследственной информации, серьезные люди ставили на белки.
Интересно, что у статьи о структуре “тимонуклеиновой кислоты”[6] (так тоже называли ДНК – ее выделяли из тимуса, и она содержала азотистое основание тимин, которого нет в РНК) два автора: Фибус Левен и некий E. S. London. Это Ефим Семенович Лондон, ленинградский патофизиолог, биохимик и радиобиолог. Чтобы получить удобные для исследования небольшие молекулы, соавторы расщепляли нуклеиновые кислоты в желудочно-кишечном тракте собак, которым вставили фистулы по И. П. Павлову, примерно такие же, как для изучения условных и безусловных рефлексов. (Помните в учебнике: звонит звонок, и у собаки выделяется желудочный сок?) Но эти собаки сами по себе ученых не интересовали, а играли роль своего рода химических реакторов: чем бы ни была эта тимонуклеиновая кислота, в биохимии живой клетки не может быть ничего такого, чего не переварило бы хищное млекопитающее. Вот этих собак и готовил к опыту Е. С. Лондон. Кстати, благодарность Павлову, в лабораторию которого Левен приезжал работать, в статье тоже есть. Левен вместе с семьей эмигрировал из России в Америку в 1891 г., уже взрослым, и свободно говорил по-русски. А современным студентам, изучающим молекулярную биологию с биоинформатикой и свысока глядящим на классическую физиологию, не мешает помнить, что их любимые науки начинались некоторым образом в собачьем кишечнике.
Явление двойной спирали
А затем появились экспериментальные данные в пользу того, что за перенос генетической информации отвечает все-таки ДНК, а не белок. Это показали в 30–40 гг. ХХ в. американские генетики Освальд Эвери, Колин Маклеод и Маклин Маккарти. Они проводили опыты со стрептококком – возбудителем пневмонии, по сути, продолжая исследования, которые еще в 1928 г. провел Фредерик Гриффит, британский военный медик[7].
У Streptococcus pneumoniae есть два штамма – один образует шероховатые колонии, другой гладкие. Как выяснилось позднее, “гладкие” бактерии заключены в полисахаридную капсулу, которая защищает их от иммунной системы хозяина. Поэтому инъекция гладких бактерий убивает подопытную мышку, а животное, которому ввели “шероховатый” штамм, выздоравливает. Гладкие стрептококки погибают при нагревании. Инъекция мертвых бактерий, естественно, не повредит мыши, удивительно другое: когда Гриффит смешал живых безвредных “шероховатых” стрептококков с убитыми “гладкими” и ввел их мыши, животное умерло, а из его организма удалось выделить живых “гладких” стрептококков. Было такое впечатление, что безобидные бактерии пообщались с покойными убийцами и научились у них плохому. Если убавить метафоричности – позаимствовали у них какое-то вещество, которое к тому же сумели передать новым поколениям бактерий, плодящихся в мышке!
Так вот, Эвери, Маклеод и Маккарти сумели определить, что это вещество – ДНК. Только когда они удаляли ДНК из экстракта “гладких” бактерий, его смешивание с безвредными “шероховатыми” оставило их безвредными, инфицированные мыши не погибли. Во всех остальных случаях, когда экстракт очищали от полисахаридов, липидов, белков или РНК, но не от ДНК, эффект был тот же, что и при смешивании с целыми мертвыми бактериями: мыши погибали, из них можно было выделить живой патогенный штамм.
Теперь мы знаем, что бактерии умеют поглощать ДНК из внешней среды и приспосабливать ее для своих нужд: вдруг у покойных собратьев в геноме есть что-то полезное, что позволит выжить, к примеру, при встрече с антибиотиком? Эти прагматичные и безжалостные существа присваивали чужие гены и сами себя превращали в ГМО задолго до компании Monsanto. Собственно, даже не так: на ранних стадиях эволюции обмен генами был рутинным событием и для бактерий в некотором смысле остается рутиной по сей день, а генетическую межвидовую изоляцию “придумали” высшие организмы.
Еще одно подтверждение того факта, что вещество наследственности – именно ДНК, получили американские генетики Альфред Херши и Марта Чейз. За эти опыты Херши получил Нобелевскую премию по физиологии и медицине 1969 г. (совместно с Максом Дельбрюком и Сальвадором Лурия, которые доказали другую важную вещь: что мутации у бактерий возникают не “в ответ” на факторы отбора, а случайным образом, в том числе и до того, как эти факторы начнут действовать; отбор лишь сохраняет полезные мутации и отбраковывает вредные). Марту Чейз на премию не выдвинули, дополнительно обидно, что в некоторых русских источниках встречается “эксперимент Херши – Чейза”: об исполнителе эксперимента и соавторе статьи не знают даже, что это женщина.
Для эксперимента Херши и Чейз выбрали бактериофаг Т 4. Бактериофаги – вирусы бактерий, одни из самых простых объектов живой природы. (Хотя насчет “живой” идут бесконечные споры. Вирусы и бактериофаги не могут размножаться вне клетки, к тому же бактериофаг можно закристаллизовать, как, например, молекулу белка. Так, может быть, их следует рассматривать как своего рода паразитические молекулярные комплексы? Не считаем ведь мы живыми прионы – белки с аномальной структурой, которые катализируют превращение нормальных клеточных белков в себе подобные и тем самым вызывают тяжелые заболевания – энцефалопатии). Так или иначе, вирусы и фаги размножаются, потомство у них похоже на родителя, и “вещество наследственности” у них должно быть. Что важно, фаг не проникает внутрь бактерии целиком: он, как шприц, впрыскивает в нее свое содержимое, оболочка остается снаружи клетки, а потом внутри бактерии образуются новые фаги.
Херши и Чейз показали, что фаги вводят в бактериальную клетку свою ДНК, а не белок, с помощью очень изящного опыта. Было известно, что белки содержат кислород, азот, углерод и серу, а нуклеиновые кислоты – кислород, азот, углерод и фосфор. Сера присутствует в белках, но не в ДНК, а фосфор – наоборот, в ДНК, но не в белке. Экспериментаторы получили две разновидности фагов: одни имели в своем составе радиоактивную серу 35S, другие – радиоактивный фосфор 32P. Иначе говоря, в одних фагах радиоактивную метку несли только белки, в других – только ДНК. Так вот, когда бактерий инфицировали фаги первого типа, метка оставалась снаружи, в растворе, а когда второго – меченый фосфор попал внутрь клетки, и новые фаги, которые вышли из этой клетки, тоже были немного радиоактивными. Вывод из этих экспериментальных данных читатель может сделать сам.
Статья Херши и Чейз вышла в 1952 г.[8] В то время уже никто не сомневался, что носителем информации должна быть именно ДНК. Было известно, какие компоненты входят в ее состав, была известна загадочная закономерность, именуемая правилом Чаргаффа: в ДНК попарно равны концентрации гуанина и цитозина, аденина и тимина. Оставалось понять, как все это организовано в пространстве, как устроена молекула. И началась большая гонка, описанная в книге Джеймса Уотсона “Двойная спираль”. Победили в ней, как всем известно, Уотсон и Фрэнсис Крик.
Помогли им в этом рентгенограммы, которые получила Розалинд Франклин – еще одна женщина, сумевшая сделать научную карьеру в эпоху, когда девушка уже могла учиться в Кембридже, но по окончании не могла быть уверена, что получит ученую степень даже при самых блестящих успехах. Рентгеноструктурный анализ – замечательный метод исследования биомолекул. Нужно получить кристалл, направить на него рентгеновское излучение и по картине дифракции лучей рассчитать распределение электронной плотности, координаты атомов, а следовательно, и структуру. Расчеты достаточно сложные, в докомпьютерную эпоху задача была, мягко говоря, нетривиальной. Неорганические кристаллы начали изучать с помощью рентгеноструктурного анализа еще в начале ХХ в. Но потом выяснилось, что кристаллы можно получить и из крупных органических молекул – это трудно, но возможно.
Поглядев на рентгенограммы Розалинд Франклин (особенно важную роль сыграла легендарная “фотография № 51”), Уотсон и Крик выдвинули предположение, что ДНК состоит из двух нитей, соединенных друг с другом азотистыми основаниями и закрученных одна вокруг другой. К 28 февраля 1953 г. Уотсон и Крик уже были уверены в своей правоте; Крик даже заявил в местном пабе, что они “раскрыли секрет жизни”. Их знаменитая статья[9] вышла 25 апреля 1953 г. (таким образом, в 2018 г. человечество отметило 65 лет знакомства с двойной спиралью). Статья заканчивалась горделиво-скромно: “От нашего внимания не ускользнуло, что специфическое взаимодействие, которое мы постулировали, сразу же предоставляет возможный механизм копирования генетического материала”. Действительно, двойная спираль не только соответствовала рентгенограмме, полученной Франклин, но и давала ответ на самый главный вопрос – каким образом информация копируется и передается по наследству!
Морис Уилкинс, получивший Нобелевскую премию 1962 г. вместе с Уотсоном и Криком, не участвовал в построении модели, но работы по изучению структуры ДНК, в том числе и работа Розалинд Франклин, были начаты во многом благодаря ему. Сама же Франклин не дожила до вручения премии – она умерла от рака в 1958 г. в возрасте 37 лет.
Теперь два абзаца биохимии, чтобы подвести итог достижениям отцов (и матерей) молекулярной биологии. Постарайтесь это пережить, а кому не хочется – просто посмотрите на рис. 4 (справа) и переходите к следующей главе. Молекула пятиатомного углевода дезоксирибозы в составе ДНК замкнута в цикл, к ней присоединены азотистое основание и фосфат. Атомы углерода в дезоксирибозе пронумерованы, от одного до пяти; цифры помечены штрихами (в отличие от углеродов азотистого основания, которые пронумерованы без штрихов). К 5’ – углероду присоединен “собственный” фосфат нуклеотида, к 3’ – углероду – фосфат другого нуклеотида, соседа по цепочке. По ним названы и концы нуклеотидной цепи – 5’ – и 3’ – конец. “Начало” цепи, ее “левый” конец (мы читаем слева направо, и последовательность нуклеотидов в ДНК нам удобнее записывать таким же образом) – это 5’ – конец. Любая цепочка ДНК (или РНК) растет от 5’ – к 3’ – концу – новый нуклеотидный остаток всегда присоединяется к 3’ – атому.
Азотистые основания – это то, благодаря чему четыре нуклеотида различаются между собой (остатки дезоксирибозы и фосфаты у всех нуклеотидов одинаковые). Два больших, аденин и гуанин (см. рис. 4), называются пуринами, а два маленьких, с одним шестичленным циклом – тимин и цитозин – пиримидинами. Это и есть те самые “буквы” А, Т, G, С, которыми записывается генетическая информация. Что существенно – этими нуклеотидами две цепочки двойной спирали держатся друг за друга. Напротив аденина всегда стоит тимин, а напротив гуанина – цитозин. Таким образом, последовательность нуклеотидов в одной цепочке однозначно определяет последовательность нуклеотидов в другой цепочке, что позволяет ДНК копироваться.
Теперь мы знаем, что такое ген!
Следующие десятилетия тоже прошли не зря. Структура молекулы – это прекрасно, однако надо было понять, каким образом ДНК копируется (реплицируется), как записанная в ней информация превращается в признаки.
Наиболее важное и удивительное свойство двойной спирали – это, конечно, заложенная в ее структуре способность к самокопированию. Если разделить две нити, то на каждой можно начать строить ее копию, в итоге получить вместо исходной двойной спирали две одинаковые и по-сестрински разделить их между сестринскими клетками. Или построить на определенном участке ДНК молекулу матричной РНК (мРНК) – инструкцию для синтеза белка. Ура, наконец-то мы узнали, что такое ген – фрагмент ДНК, в котором записана последовательность аминокислот определенного белка, плюс регуляторные участки, через которые происходит включение и выключение гена. (Правда, есть и такие гены, которые кодируют не матричную РНК и через нее белок, а просто РНК, имеющую самостоятельные функции.)
Разобрались с репликацией ДНК, расшифровали генетический код, то есть разгадали, каким образом можно записывать последовательности из 20 аминокислот четырьмя нуклеотидами. Оказалось, природа использует элегантный шифр – каждой аминокислоте соответствуют три нуклеотида; таких комбинаций существует, как нетрудно подсчитать, 64, поэтому одной аминокислоте могут соответствовать несколько триплетов – код вырожденный, как говорят математики.
Стало понятно, что ДНК в ядре клетки – это библиотека, в которой книги не выдают на дом, но позволяют снимать копии и забирать с собой. Или, в современных образах, – магазин электронных книг, который может продать бесконечное количество экземпляров той или иной книги в удобном для чтения формате. Копии книг – это матричные РНК, рибосомы (клеточные машинки для синтеза белка) читают их по триплетам и в соответствии с этими триплетами строят белок. Таким образом, поток информации идет в направлении от ДНК к РНК и затем от РНК к белку. Это и есть центральная догма молекулярной биологии, которую сформулировал Фрэнсис Крик в 1958 г.
Возможно, “догма” не самое подходящее слово. Как писал историк молекулярной биологии Хорас Джадсон в книге “Восьмой день творения” (The Eighth Day of Creation) о своем разговоре с Фрэнсисом Криком: “«Я имел в виду, что догмой называют идею, для которой нет обоснованных подтверждений. Понимаете?!» Крик издал восторженный рев. «Да я просто не знал, что значит «догма»! И мог бы с тем же успехом назвать ее Центральной Гипотезой или как-то в этом роде. Это я и хотел сказать. Догма – только слово-крючок»”. В любом случае сегодня центральная догма “ДНК → РНК → белок” ни у кого не вызывает ни малейших сомнений: обоснованных подтверждений более чем достаточно. Хотя теперь известно, что информация может передаваться от РНК к ДНК (например, в жизненном цикле некоторых вирусов с РНК-геномом), общей картины это не меняет. Магистральный поток информации направлен от ДНК к белкам – строителям и строительным материалам всего живого.
Как читать ДНК
Фредерик Сенгер и его метод секвенирования
Конечно, все захотели читать ДНК – черпать информацию о жизни прямо из источника. Но как читать буквы, если эти буквы – молекулы?
Необходим был удобный метод определения нуклеотидной последовательности, и такие методы стали появляться. Правда, большая часть их сегодня имеет лишь историческую значимость: для нынешних биологов “плюс-минус” секвенирование или “секвенирование по Максаму – Гилберту методом химической деградации” – что-то вроде микроскопа Левенгука.
Слово “секвенирование”, собственно, и означает “определение последовательности” (от англ. sequence); говорят о секвенировании ДНК, РНК, белков. Предложенное в 1970 г. секвенирование по Максаму – Гилберту, если коротко, подразумевало расщепление ДНК в растворах, организованное таким образом, чтобы получались молекулы всех возможных длин. Но это не самый рациональный подход. ДНК – именно та молекула, которая умеет копироваться сама на себе. Если взять у клетки ферменты, которые работают с ДНК, и научиться их использовать в наших целях, можно добиться многого. Почему бы, например, вместо того чтобы нарезать ДНК столькими способами, сколько в ней букв, не нарастить на ней дочерние цепи всех возможных длин? На этой идее основано секвенирование по Сенгеру – метод, также изобретенный в 70-е гг. прошлого века и благополучно доживший до наших дней.
Английский биохимик Фредерик Сенгер (1918–2013) – один из четырех человек, получивших две Нобелевские премии, и единственный, у которого обе – по химии (1958 и 1980 гг.): за определение структуры белка инсулина и за метод секвенирования ДНК. В 1975 г. Сенгер в совместной статье с Аланом Коулсоном представил метод “плюс-минус” секвенирования[10]. С помощью этого метода группа Сенгера почти полностью прочла геном бактериофага φX174 (5386 нуклеотидов) – по тем временам большой успех[11]. Однако все эти достижения затмило секвенирование по Сенгеру методом терминаторов, он же метод обрыва цепи, или дидезоксиметод[12]. Но сначала нужно объяснить, как молекулы ДНК сортируют по размеру с помощью электрофореза.
Мы помним, что ДНК – это кислота. Кислотные свойства определяются остатками фосфорной кислоты в ее составе – фосфатами. Из школьного курса известно, что анионы кислоты заряжены отрицательно: H3PO4 → H+ + H2PO4– . Поэтому, если через раствор, содержащий ДНК, пропустить ток, молекулы ДНК направятся к положительно заряженному электроду. А если раствор заменить гелем – несъедобным желе, молекулярной сеткой, заполненной жидкостью? Тогда молекулы ДНК не поплывут к плюсу туманным облачком, а каждая станет продвигаться со своей скоростью – чем длиннее молекула, тем труднее ей будет просачиваться через ячейки геля. Если же сделать в геле углубления (лунки) у отрицательного электрода, поместить в них ДНК и включить ток, от минуса к плюсу протянутся дорожки, и в них будут полоски, в каждой – молекулы ДНК определенного размера. Это называется “электрофорез ДНК”, или просто форез.
Теперь можем рассказать, как работает метод Сенгера. Реакционную смесь делят на четыре части. В каждую из четырех добавляют праймер (затравку для синтеза) – короткую молекулу ДНК, комплементарную началу участка, который нужно секвенировать. Праймер связывается с этим участком, образуя с ним двойную спираль. (Исследуемую ДНК перед этим, конечно, надо “расплести”, сделать однонитевой.) Фермент ДНК-полимераза, используя анализируемую ДНК в качестве матрицы, начинает наращивать праймер, соединяя в цепочку нуклеотиды. К обычным нуклеотидам в реакционной смеси добавлены необычные. Во-первых, некоторые нуклеотиды содержат радиоактивную метку (потом объясню зачем). Во-вторых, в каждой из четырех смесей небольшое количество одного из четырех нуклеотидов модифицировано – лишено OH-группы. К такому нуклеотиду (дидезоксинуклеотиду) нельзя присоединить следующий. А количество подобрано таким образом, чтобы среди новых цепочек были оборванные на каждом аденине – в одной пробирке, тимине – в другой, гуанине – в третьей, на каждом цитозине – в четвертой. И если потом внести реакционные смеси в лунки и провести электрофорез, получатся “лесенки”. Сложно, но станет яснее, если посмотреть на рис. 5 и 6.
Автоматическое распознавание
Как это происходило на практике? О-о… Классическое секвенирование по Сенгеру – процедура, которая у старшего поколения ассоциируется с золотым веком молекулярной биологии, когда было мало простого, покупного и готового и все умели работать руками, не то что сейчас. Не удержусь и расскажу подробнее: я ее еще застала.
Итак, гель нам понадобится не агарозный, как для крупных фрагментов, сильно различающихся по размеру, а полиакриламидный и очень тонкий. Разделить молекулы ДНК, различающиеся всего на один нуклеотид, – серьезная задача. Гель готовим из акриламида (канцероген; распишитесь, студенты, что поняли, а также насчет радиоактивной метки – хоть фосфор-32 и смешной по активности изотоп, но все-таки пить его не надо). Горячую прозрачную жидкость заливаем в пространство между двумя идеально плоскими стеклами размером примерно А3 с зажатыми по краям полосками пластика – спейсерами. Стеклянная струйка сбегает вниз, гель заливается, заливается, залива… черт-черт, пузырь застрял и не всплывает! Подхватываем что-нибудь твердое, вроде ножниц, стучим по стеклу деликатно, но сильно: уходи, пузырь, уходи! Если повезло, пузырь неохотно поднимается вверх, если нет – застывает в геле, делая значительную его часть непригодной для фореза, а студент слышит у себя за спиной: “Ничего, ручки кривые, зато старательный”… Сверху заливаем чуть менее крепкий гель, в который вставляют гребенку, чтобы получились лунки. Ждем. Гель застыл. В реакционные смеси добавляем глицерина, чтобы смесь не всплывала в растворе, а сиропчиком оседала на дно лунки, а также синего и фиолетового красителя с отрицательно заряженными молекулами, чтобы видно было, достаточно ли далеко прошел форез: раствор ДНК сам по себе прозрачен, по нему не поймешь. Вносим смесь в лунки. Аккуратненько, только не мимо лунки, а то будет каша. Не путаем, что куда, запоминаем, а лучше записываем. Готово. Ставим электрофорез. На табло источника питания четырехзначное число, обозначающее вольты, кстати, распишитесь, студенты, что поняли насчет высокого напряжения.
По прошествии изрядного времени, когда мы видим, что синее и фиолетовое пятна проехали к плюсу сколько надо, снимаем гель и сушим. Он у нас слегка радиоактивный, мы не забыли? При синтезе меченые нуклеотиды включались в цепочки ДНК, поэтому все новые молекулы фонят. Мы берем гель в темную комнату и аккуратно прижимаем его к рентгеновской пленке размером с наше стекло. Зажимаем в металлическую коробку и оставляем, скажем, до завтра. Потом проявляем пленку – и вуаля: если все сделали правильно, на прозрачной пленке темнеют полосочки, выстроенные лесенкой. Это называется “радиоавтограф геля”. Каждая полоска соответствует нуклеотиду ДНК. Кстати, сама идея метить молекулы ДНК, заставляя полимеразу включать в них нуклеотиды с радиоактивными изотопами, для удобства последующих наблюдений тоже принадлежит Фредерику Сенгеру.
Вот теперь наконец-то читаем нашу ДНК! Сначала две полоски на левой дорожке, затем одна на правой, затем на второй слева – ААGТ… Одному это расшифровывать не с руки. Зовешь помощника, даешь ему в руки линейку, велишь диктовать, а сам вбиваешь в компьютер буквы ДНК – текст, который никто еще не читал, кроме вас двоих и Господа Бога, если он вникал в такие мелочи, а не предоставил все эволюции. За один раз на четырех дорожках можно прочесть несколько сотен нуклеотидов, в идеале до тысячи. (Для сравнения, “плюс-минус” секвенирование давало около 80 нуклеотидов.) Уф-ф.
Теперь, с появлением приборов-секвенаторов, взаимодействие человека и ДНК стало менее интимным и утомительным. Человек ставит реакционную смесь в прибор и идет пить кофе… то есть писать обзор литературы для статьи. Никакой романтики преодоления трудностей. (Шучу. На самом деле трудности теперь в других местах – например, там, где начинается обработка огромного количества данных.)
Принцип метода остается тем же, что и в классическом секвенировании по Сенгеру, – синтез четырех наборов нуклеотидных цепочек, кончающихся на А, на Т, на G и на С. Только электрофорез теперь происходит не в плоском геле, а в капилляре, из которого синтезированные молекулы выходят поочередно, от самых коротких к самым длинным. И метка не радиоактивная, а флуоресцентная: каждый терминаторный нуклеотид светится своим цветом, условно говоря, А – зеленым, Т – красным, С – синим, G – желтым. (Реакционных смесей уже не четыре, а одна!) Регистрирующее устройство фиксирует вспышки на выходе из капилляра и отмечает пики свечения каждого цвета. Прибор выдает график с четырьмя кривыми, где пики соответствуют нуклеотидам; последовательность нуклеотидов сохраняется в памяти компьютера.
Первые автоматические секвенаторы начала поставлять фирма Applied Biosystems (1986). Они использовали принцип, разработанный в Калифорнийском технологическом институте, в лаборатории Лероя Худа. Что интересно, в первоначальном варианте секвенирования от Applied Biosystems реакционных смесей было четыре, и флуоресцентную метку несли не дидезоксинуклеотиды, а праймеры. Это было своего рода промежуточное звено между сенгеровским методом и последующим автоматизированным – реакция идет в четырех смесях, но все продукты бегут по одной дорожке электрофореза. Эволюция техники иногда похожа на эволюцию живых существ: полезные изменения накапливаются последовательно.
Applied Biosystems (к тому моменту подразделение компании PerkinElmer) принимала непосредственное участие в создании компании Celera Genomics, основателем которой был знаменитый Крейг Вентер, человек, который многое сделал для того, чтобы чтение ДНК вышло на новый уровень – от сотен и тысяч нуклеотидов к целым геномам. Celera Genomics вскоре прославилась как главный конкурент международного проекта “Геном человека”, а Крейг Вентер, как он сам пишет в своей автобиографии, был одним из первых клиентов Applied Biosystems еще в то время, когда руководил лабораторией в Национальных институтах здравоохранения. Важную роль в его последующих успехах, да и вообще в секвенировании генома человека сыграли автоматические секвенаторы. И наоборот: поставленная грандиозная задача – 3 млрд нуклеотидов, во времена, когда и тысячи считались успехом! – способствовала автоматизации секвенирования.
В 1995 г. Институт геномных исследований Крейга Вентера (TIGR) прочитал первый полный геном бактерии Haemophilus influenzae (1,8 млн нуклеотидных пар). И заодно, “просто чтобы проверить метод”, геном Mycoplasma genitalium (0,58 млн н.п.) – той самой бактерии, на основе которой Крейг Вентер с соавторами в первом десятилетии будущего века начнет создавать синтетический геном. Секвенирование полных бактериальных геномов микробиологи восприняли как сенсацию, историческое событие, Вентеру на конференции, когда он объявил об этом, аплодировали стоя. В 1998 г. был секвенирован геном многоклеточного организма – круглого червя Caenorhabditis elegans (100 млн н.п.).
Проект “Геном человека” стартовал в 1990 г. О получении первой “черновой” последовательности руководитель международного проекта Фрэнсис Коллинз и Крейг Вентер торжественно объявили 26 июня 2000 г. в Белом доме. Окончательное завершение проекта было анонсировано в апреле 2003 г.
Кстати: многие издания писали тогда, что, мол, “расшифрован генетический код человека”. Некоторых биологов это бесило почти так же, как “ваше ДНК”. Дело в том, что по-русски кодом принято называть шифр – правило соответствия между двумя системами символов, в нашем случае – между аминокислотами белка и нуклеотидными триплетами. Генетический код, то есть соответствие аминокислот и триплетов, у человека тот же, что у всех живых организмов, и расшифрован он давно! По-английски же кодом можно назвать и шифр, и шифровку, так что аналогичный английский заголовок не кажется глупым. Впрочем, сейчас уже и в русском языке так прочно прижился “код” как текст компьютерной программы, что это значение задним числом легитимизирует и “генетический код человека”.
Стоимость проекта “Геном человека” составила $3 млрд – по доллару за букву. Сейчас цена вопроса – порядка $1000 геном (в России пока подороже), ближайшая цель конкурирующих фирм – снижение до сотен долларов.
Во всем этом Сенгер уже не принимал непосредственного участия. В 1983 г. он ушел в отставку и прожил три десятилетия, с удовольствием работая в своем саду. Младшие коллеги о нем не забывали – тот же Крейг Вентер с гордостью приводит факсимиле поздравительной записки от Сенгера по поводу расшифровки генома H. influenzae. В 1992 г. в Великобритании был создан Институт Сенгера – некоммерческий геномный исследовательский центр. Двукратный нобелиат напутствовал коллег словами: “Пусть только попробуют не добиться успеха”. Но сам он не любил публичности и даже отказался от рыцарского звания за научные заслуги. Умер Фредерик Сенгер в 2013 г. в возрасте 95 лет. Вот как он объяснял, почему так рано удалился от дел: “Я и сам не думал об отставке, пока внезапно не осознал, что через несколько лет мне будет 65 и я буду иметь право перестать работать и заняться чем-то, чего я всегда хотел и на что не имел времени. Это возможность выглядела неожиданно привлекательной, особенно потому, что наша работа достигла высшей точки с методом ДНК-секвенирования, и я в некотором роде чувствовал, что продолжать – значит двигаться к низшей точке. Решение, что я принял, было мудрым – не только потому, что я получил огромное удовольствие от своего нового образа жизни, но и потому, что старение не улучшило мою производительность в лаборатории, и я думаю, что если б я продолжил работать, то мог бы найти это разочаровывающим и чувствовал бы вину за то, что занимаю место, нужное молодым людям”[13].
Новое поколение выбирает…
В современных научных статьях по исследованию ДНК часто можно встретить аббревиатуру NGS. Это расшифровывается как next generation sequencing, методы секвенирования нового поколения – собирательное название для новейших методов, не использующих cенгеровскую терминацию. Все они появились после двухтысячного года, все требуют довольно сложного оборудования и программного обеспечения. Для большинства из них ДНК надо сначала фрагментировать – порезать на фрагменты в несколько сотен нуклеотидов, а затем состыковывать прочтенные кусочки текста в единую последовательность. Часто NGS называют также “высокопроизводительным”, или “параллельным”, секвенированием, потому что одновременно читается множество кусочков ДНК.
Подробно про каждый метод рассказывать не будем, только общий принцип в двух словах.