В ней выделяются гены – части ДНК, содержащие необходимую информацию для биосинтеза белков и нуклеиновых кислот (кодирующие последовательности ДНК). Совокупность всех генов Y-ДНК называется кодирующей Y-ДНК (примерно 2% всех нуклеотидов), остальная, не кодирующая Y-ДНК часть – «мусорной» Y-ДНК (около 98%). Считается, что мусорная Y-ДНК не имеет критически важной функциональности, поэтому всякие ее изменения проходят практически без последствий (по крайней мере в фенотипе [В: Фенотип]) для носителя Y-ДНК и его потомков по мужской линии. Но именно мусорная Y-ДНК является объектом изучения ДНК-генеалогии. И вот почему.
Как известно, Y-ДНК передается от отца к сыну без изменений. Почти. В ходе такой «передачи» осуществляются сложные процессы, связанные, в частности, с репликацией (синтезом копии, копированием) отцовской хромосомы, осуществляемой ферментом ДНК – полимеразой, а также определенным набором молекулярных инструментов «копировальной машины» [5; 20]. В сложных процессах, повторяемых к тому же многократно, неизбежны сбои, приводящие к ошибкам копирования, отличиям копии от оригинала, то есть к мутациям. Считается, что сбои носят случайный характер; для их формализованного описания используются модели теории вероятностей и математической статистики.
ДНК-генеалогия рассматривает небольшие мутации двух типов: SNP (снип [В: Однонуклеоидный полиморфизм]) и STR (стир [В: Микросателлиты]). Ниже рассматриваются только снипы, «точечные», связанные с заменой основания в одном нуклеотиде. Если представить мусорную Y-ДНК длинным словом, написанным буквами короткого алфавита , то снип – это ошибка машинистки, перепечатывающей это слово на пишущей машинке, всего в одной букве. Понятно, что это нереально хорошая машинистка, так как вероятность её единственной опечатки очень мала. Возвращаясь к теме: принято, что снип (определенная замена оснований в определенном нуклеоиде Y-ДНК) может случиться примерно один раз за 50 миллионов лет [5]. Современное человечество, как считают ученые, несколько моложе. Но позиций нуклеоидов в Y-ДНК много, на каждой он может появиться в одном из 4-х вариантов, немало и разных Y-ДНК. В общем, дело не так безнадёжно, как кажется; мутации случаются.
Итак, снип оставляет «зарубку», метку на Y-ДНК и, поскольку эта мутация практически необратима, такая же метка будет у всех прямых потомков по мужской линии носителя этого снипа. Таким образом, первый помеченный становится основателем нового рода, родоначальником. Здесь было бы корректнее говорить о снип-роде, который является скорее теоретическим понятием, чем привычный всем род, понимаемый как как «группа, людей, возводящих своё происхождение к общему предку родоначальнику по одной линии» [В: Род] (см. ниже).
Снипы находят различные группы исследователей, занимающиеся анализом ДНК ныне живущих мужчин или костных останков; они кодируют их и направляют в Международное общество генетической генеалогии (ISOGG) для включения в регулярно обновляемое филогенетическое дерево Y-хромосомы (дерево снипов) [11; В: Филогенетическое дерево]. Построение такого дерева – проблема, требующая, по-видимому, наряду с понятными формальными инструментами, предоставляемыми математиками, использовать и неформальную информацию типа: «И родил Иаков 12 сыновей». Или устраивать голосования «избранных» специалистов и чиновников.
Действительно, ISOGG располагает некоторым (постоянно изменяющимся) множеством снипов. Между снипами устанавливается отношение «вышележащий-нижележащий», типа «предок-потомок»; образуются направленные «сверху-вниз» цепочки снипов, которые нужно «склеить», совместив одни и те же повторяющиеся в цепочках снипы. Возникает структура, которую математики называют ориентированным графом, вообще говоря, несвязным. Сделать из него «дерево» – задача кудесников (в хорошем смысле) ISOGG. И они это делают [11].