Но данные, которые привлекли наибольшее внимание в последние годы, связаны с чтением генетического кода человека. За это мы можем поблагодарить британца Фредерика Сэнгера (1918–2013), одного из величайших новаторов в молекулярной биологии: «Из трех основных видов деятельности, связанных с научными исследованиями – мышлением, разговорами и действиями, я предпочитаю последний и, вероятно, именно он у меня лучше всего получается»[44]. Он был прав. Став первым, кто раскрыл структуру белка (это оказался инсулин), Сэнгер в середине 1970-х разработал методы секвенирования ДНК, за что во второй раз стал лауреатом Нобелевской премии.

Со времени новаторской работы Сэнгера стоимость секвенирования человеческого генома (генетического кода в ДНК человека) резко упала – с миллиардов долларов до сотен. Одной из причин является появление секвенирования «следующего поколения» – прорыва, который сравнивают с переходом от самолета братьев Райт к современному Боингу.

В 1997 г. химики Кембриджского университета Шанкар Баласубраманиан и Дэвид Кленерман начали разрабатывать свой метод, согласно которому образец ДНК делится на фрагменты, которые иммобилизуются на поверхности чипа и локально амплифицируются. Затем каждый фрагмент декодируется, вплоть до «буквы» генетического кода (нуклеотида – подробнее позже), с использованием флуоресцентно окрашенных букв, добавленных ферментом. Обнаружив цветные буквы, включенные в каждую позицию чипа, и повторив этот цикл сотни раз, можно прочитать последовательность каждого фрагмента ДНК[45].


Рисунок 6. Метод локальной фиксации потенциала. Адаптировано из книги Александра Д. Рейеса «Прорывной метод, который стал жизненно важным для нейробиологии» (A Breakthrough Method that Became Vital to neuroscience). (Nature, 2019)


Еще одно достижение в области секвенирования нового поколения относится к 1970-м гг., когда Стив Хладки и Денис Хейдон из Кембриджа зафиксировали поток тока через одиночный ионный канал в искусственной мембране. Поскольку ДНК является заряженной молекулой, она также может пройти через этот открытый канал и при прохождении вызывает колебания тока, соответствующие генетической последовательности. Последующее развитие коммерческого «нанопорового секвенирования» компанией Oxford Nanopore Technologies (в частности, ее основателем Хэганом Бэйли) можно проследить до исследований 1980-х гг., когда впервые было обнаружено движение ДНК через поровые белки[46].

Используя новую технологию секвенирования, можно считывать значительно более длинные участки ДНК, чем ранее, поэтому в 2021 г. международная группа из 30 учреждений – Консорциум Telomere-to-Telomere (T2T) – опубликовала первый «длинно читаемый» геном[47]. Это было важное открытие, поскольку исторический проект последовательностей человеческой ДНК, опубликованный в июне 2000 г., пропускал целых 15 % генома: более ранние технологии секвенирования параллельно считывали код миллионов фрагментов ДНК, каждый из которых был относительно небольшим и содержал до 300 букв кода. В результате они не могли справиться с повторяющимися участками кода ДНК, скрывающимися в геноме, особенно с центромерами – защемленными частями хромосом, которые играют ключевую роль в делении клеток. Сквозная последовательность 2021 г., основанная на длинном чтении от 10 000 до 100 000 букв, выявила 115 новых генов, кодирующих белки, и, вероятно, содержит множество областей, которые играют роль в регуляции генов и других функциях.


Рисунок 7. Как ДНК, проходящая через канал нанопоры, генерирует сигнал (дизайн – Ёритака Харазоно. TogoTV. cc BY 4.0)