Синтез этих новых направлений привел к формированию обширной области современной науки – информатики. Новое великое открытие XX века – расшифровка в 1953 году Ф. Криком и Дж. Уотсоном структуры молекулы ДНК, стимулировало бурное проникновение ее в генетику. Выяснилось, что эта молекула действительно представляет собой закодированный текст. Алфавитом этого текста служат четыре вида химических соединений – нуклеотидов. Их обозначают буквами А (аденин), Г (гуанин), Т (тимин) и Ц (цитозин). Текст линеен, т. е. представляет собой полимерные цепи, состоящие из названных нуклеотидов. Но его общая структура гораздо сложнее, чем просто последовательность букв (А, Г, Т, Ц). У сложных организмов, состоящих из клеток, имеющих ядро (эукариот), цепи двойные. Буквы одной цепи соединены с буквами другой по принципу комплементарности: аденин соединяется только с тимином, а гуанин только с цитозином. Химические свойства нуклеотидов таковы, что цепи закручиваются в знаменитую «двойную спираль», которую математически корректно было бы называть «двойным винтом». Еще нагляднее модель закручивающейся веревочной лестницы. Аналогия с веревочной лестницей возникает потому, что молекула ДНК способна, сохраняя кручение, сворачиваться в клубок и вообще образовывать сложные вторичные формы. Ее текст может разбиваться на отдельные «главы», называемые хромосомами. Например, ДНК человека образует структуру из 23 отдельных частей, каждая из которых состоит из пары хромосом (рис. 1).
Рис. 1. 23 пары хромосом человека, пара X/Y определяет мужской пол
Хромосомы в парах содержат, как норму, один и тот же «по смыслу» текст. Их поэтому называют гомологичными. Как и положено осмысленному тексту, текст ДНК состоит из «предложений», получивших название генов. При передаче наследственной информации между поколениями живых организмов именно гены являются минимальными неделимыми смысловыми единицами. Заложенный в них смысл – это программа синтеза белков. «Жизнь есть способ существования белковых тел…» – Ф. Энгельс. Уже во времена этого классика было известно, что основным материалом живого служат химические соединения, по-русски названные белки, а по-научному – полипепти́ды. Их формулы представляют собой линейные полимерные цепи, составленные из 20 видов химически модифицированных молекул из класса аминокислот. Иначе говоря, это тоже тексты, но написанные алфавитом из 20 букв. Помимо основных полимерных связей между соседними звеньями цепи, в молекулах белков образуются дополнительные связи между разными их участками. В результате молекулы белков образуют весьма сложные пространственные вторичные, третичные и даже четвертичные структуры. На рис. 2 показана такая структура белка аспартатаминотрансфераза (АСТ), первого белка, текст которого был установлен в полном объеме в 1972 году.
Рис. 2. Молекула белка аспартатаминотрансфераза (АСТ)
Эти свойства белков позволили им образовать следующий по уровню сложности элемент жизни – клетку. Клетка является уже не просто белковой структурой, а процессором, способным выполнять записанные в генетических текстах программы. В клетках высших форм жизни (эукариот) важнейшей операцией является исполнение алгоритма деления (митоз). В процессе исполнения этого алгоритма происходит копирование генетических текстов путем удвоения хромосом и образование пары генетически эквивалентных клеток. Взаимодействие между клетками приводит к их дифференциации и образованию все более сложных структур – органов. Многократное повторение митоза приводит, в конечном счете, к образованию полноценных особей различных видов эукариот. Можно сказать, что человек – это некая n-ричная белковая структура. Компактные образования внутри клетки (органеллы) по-сути являются блоками молекулярного компьютера. Ядро и ядрышко это хранилище самой ДНК («накопитель» генетической памяти). Для достижения клеткой состояния, способного к митозу, она непрерывно производит весь необходимый для поддержания ее статуса живого объекта комплекс белков – рис. 3.