Кроме того, гены не равномерно распределены между разными хромосомами. При средней плотности один ген на 100 т. п. н. генома их содержание в хромосоме 19 составляет около 2 на 100 т. п.н., а в хромосомах 2, 13 и Y – хромосоме – от 0,15 до 0,7. Если сравнить плотность генов с плотностью расселения людей, то Y – хромосома напоминает нашу Сибирь, а хромосома 19 – Европейскую часть России. Для сравнения: в геноме бактерий содержится свыше 1000 генов на 1,0 млн. п. н., у дрожжей около 450 генов на 1,0 млн. п. н., а у червя C. elegans – около 200. Следовательно, плотность расположения генов на единицу длины генома заметно падает по мере эволюционного усложнения организмов.
«Жи, ши – пиши через и»
После секвенирования генома человека и ряда других организмов был проведен детальный компьютерный анализ нуклеотидных последовательностей. Подсчитано, например, сколько в ДНК может идти подряд букв А, или как часто Г встречается после Ц. И тут выяснилось, что в генах эти сочетания подчиняются определенным правилам, тогда как в промежутках между генами, там, где ничего существенного в ДНК не записано, частота сочетаний разных нуклеоти–дов близка к случайной. Где много генов, там много букв Г и Ц, а где генов нет, там много букв А и Т. Здесь опять можно провести параллель с обычным текстом. По правилам грамматики русского языка, которые мы учили в школе, «жи, ши – пиши через и», в словах после букв ж и ш буква ы не встречается. Нечто подобное характерно и для генетических текстов – в кодирующих участках некоторые сочетания нуклеотидов практически не встречаются, а распределение других сочетаний сильно отличается от случайного. Это был один из первых, но далеко не единственный результат анализа ДНК.
Знаки препинания (Генетическая пунктуация)
Как в письменном языке пунктуация (точки, запятые, тире и т.д.) используется для членения и графической организации текста, так и в ДНКовом тексте существуют всевозможные знаки–сигналы, обозначающие границы отдельных функциональных элементов. Без таких сигналов генетическая информация не может быть правильно считана с носителя. Классический пример из лингвистики – предложение «Убить нельзя помиловать». Если не поставить запятую, то остается непонятным, то ли убить, то ли помиловать. Так и в гене. Знаки препинания, в отличие от генетического кода, не так универсальны в живом мире. Часть из них у низших организмов (прокариот) существенно отличаются по сравнению с высшими (эукариота–ми), включая человека.
Вот как выглядит, например, одна из страниц ДНКового текста, содержащаяся в томе (хромосоме) 11 человека (рис. 17).
Глядя на этот рисунок, даже специалисту сразу трудно что–то понять. Однако простая компьютерная программа быстро позволяет найти здесь участок, кодирующий белок интерферон. Это осуществляется в результате того, что в генах имеются специальные сигналы–ярлычки, которые можно рассматривать как знаки препинания в ДНКовом тексте. И компьютер способен их различить. Рассмотрим главные их них.
Так, в генах человека, как и у других высших организмов, имеются специальные последовательности–сигналы, которые определяют начало и конец процесса транскрипции, то есть синтеза мРНК.
Рис. 17. Страница Энциклопедии человека, на которой записана последовательность нуклеотидов ДНК человека, кодирующая белок альфа–интерферон. Ген интерферона выделен курсивом. Подчеркнут участок, кодирующий белок, состоящий из 188 аминокислот. Жирным шрифтом выделены знаки пунктуации в этом гене, обеспечивающие его правильную транскрипцию с образованием мРНК и последующую правильную трансляцию этой мРНК