В то время как первая линейная последовательность аминокислот в белке (инсулине) была установлена Фредом Сэнгером в 1949 году, разработка методов чтения ДНК оказалась делом долгим. В 1960-х и 1970-х продвижение было медленным и секвенирование измерялось в нескольких парах оснований в месяц или даже в год. Например, в 1973 году Аллан Максэм и Уолтер Гилберт из Гарвардского университета опубликовали статью, описывающую, как с помощью их нового метода секвенирования{76} были установлены двадцать четыре пары оснований. Одновременно шло и секвенирование РНК, продвигавшееся несколько быстрее. И все же по сравнению с возможностями современных технологий даже для чтения нескольких букв кодированного текста в ту пору требовались поистине героические усилия.
Большинство людей узнали о геномике при первой расшифровке человеческого генома, которая увенчалась моим появлением в Белом доме в 2000 году рядом с моими коллегами-соперниками и президентом Клинтоном, где мы торжественно объявили об открытии последовательности человеческого генома. На самом деле первые идеи о расшифровке ДНК относятся к временам полувековой давности, когда Уотсон и Крик предложили модель ее атомной структуры. Большой скачок в нашем познании случился, когда в 1965-м группа под руководством Роберта Холли из Корнеллского университета опубликовала последовательность из семидесяти семи рибонуклеотидов аланиновой транспортной РНК (тРНК) из клетки дрожжей Saccharomyces cerevisiae{77} как часть работы по выявлению того, как тРНК помогает собирать аминокислоты в белки. Секвенирование РНК продолжало лидировать, когда в 1967 году группа Фреда Сэнгера установила последовательность нуклеотидов рибосомальной 5S-РНК E. coli, короткой молекулы из 120 нуклеотидов{78}. Первый реальный геном, который был успешно расшифрован, был вирусной РНК: в 1976 году лабораторией Вальтера Фирса в Гентском университете в Бельгии был секвенирован бактериофаг MS2. Фирс изучал бактериофаги (которые захватывают для своего размножения бактерии) совместно с Робертом Л. Синшаймером из Калтеха, а потом с Харом Гобиндом Кораной в Мэдисоне (Висконсин).
Технология секвенирования ДНК, которая дала мне возможность секвенировать человеческий геном, зародилась в середине 1970-х, когда группа Фреда Сэнгера в Кембридже разработала новую технику – первую, которую можно было назвать «более-менее секвенированием». За ней последовала методика, которую Сэнгер назвал дидезокси-секвенированием ДНК, но которая в его честь теперь называется «секвенированием по Сэнгеру». В нем применяются дидезоксинуклеотиды, или нуклеотиды-терминаторы, которые останавливают ДНК-полимеразу, не давая ей добавлять нуклеотиды к растущей цепочке ДНК. У дидезоксинуклеотидов нет гидроксильной группы (–ОН), что означает, что после того, как ДНК-полимераза прицепит их к растущей нуклеотидной цепочке, дальше нельзя добавить никаких нуклеотидов. Прикрепив радиоактивный фосфат к одному из четырех нуклеотидов, чтобы пометить фрагменты, стало возможным прочесть порядок А, Т, Ц и Г, прикладывая гель, использованный для разделения оснований, к рентгеновской пленке[7].
Группа Сэнгера использовала его новые инструменты секвенирования для установления первой последовательности генома ДНК-вируса, принадлежащего бактериофагу phi X 174{79}; эта последовательность была опубликована в Nature в 1977 году. Клайд Хатчинсон (ныне сотрудник Института Вентера) стажировался в лаборатории Сэнгера (от Университета Северной Каролины, где он с 1968 года был штатным преподавателем) и внес свой вклад в секвенирование генома