. Если бы надо было отразить внесоматическую информацию, накопленную людьми (библиотеки и т. д.), то соответствующая точка оказалась бы далеко справа за границей диаграммы


Сплошная линия на нем указывает время самого первого появления на Земле различных главных таксономических групп. Конечно, в природе существует значительно большее число таких групп, чем указано точками на этом графике. Изображенной на нем кривой соответствует огромное количество точек, которыми следовало бы обозначить десятки миллионов различных таксономических групп, появившихся на нашей планете с того времени, когда на ней возникла жизнь. Главные из них, которые возникли в самое последнее время, как правило, наиболее сложны.

Некоторое представление о сложности организма может быть получено, если просто изучать его поведение, то есть число различных функций, которые он призван выполнять в своей жизнедеятельности. Но о сложности можно судить также по минимуму информации, заключенному в генетическом материале организма. Типичная человеческая хромосома имеет одну очень длинную молекулу ДНК, завитую в спираль, так что место, которое она занимает в пространстве, значительно меньше, чем если бы она была распрямлена. Эта молекула ДНК построена из более мелких строительных блоков, несколько напоминающих ступеньки и боковинки веревочной лестницы. Блоки называются нуклеотидами и существуют в четырех различных вариантах. Язык жизни, наша наследственная информация, определяется последовательностью четырех различных типов нуклеотидов. Можно сказать, что алфавит языка наследственности состоит всего из четырех букв.

Но книга жизни очень богата, типичная молекула ДНК хромосомы человека состоит примерно из пяти миллиардов частей или нуклеотидов. Наследственные программы всех других таксонов на Земле записаны тем же языком, тем же кодом. И этот единый для всех язык наследственности является одним из свидетельств происхождения всех организмов на Земле от единого предка, от общего для всех начала жизни, которое отделено от нас примерно четырьмя миллиардами лет.

Информация, содержавшаяся в любом послании, обычно измеряется в единицах, называемых битами – сокращение от binary digit, что значит «двоичный знак». Простейшие арифметические вычисления используют не десять разрядов (как делаем мы вследствие того, что по случайности эволюции обладаем десятью пальцами), а только два – 0 и 1. Так что на любой достаточно четкий вопрос может быть дан ответ в виде 0 или 1, «да» или «нет». Если бы наследственный код был описан на языке, имеющем не четыре, а две буквы, то число битов в молекуле ДНК равнялось бы удвоенному числу пар нуклеотидов. Но так как существует четыре типа нуклеотидов, число битов информации в ДНК в четыре раза больше числа пар нуклеотидов. Таким образом, если одна хромосома имеет пять миллиардов (5 · 10>9) нуклеотидов, она содержит двадцать миллиардов (2 · 10>10) битов информации. (Символ 10>9 указывает, что за единицей следует определенное число нулей – в данном случае девять.)

Как много информации содержится в двадцати миллиардах битов? Чему она будет соответствовать, если записать ее в обычной книге современным человеческим языком? Наши алфавитные языки, как правило, имеют от двадцати до сорока букв плюс одну-две дюжины цифр и знаков препинания; таким образом, для таких языков оказывается достаточно шестидесяти четырех независимых значков. Так как 2>6 равняется 64 (2 × 2 × 2 × 2 × 2 × 2), то не потребуется более шести битов, чтобы определить каждый значок. Мы можем представить себе ситуацию в виде «игры в двадцать вопросов», в которой каждый ответ соответствует одному биту. Предположим, что значок, который загадан, – это буква Н. Мы можем найти ее следующим образом.