Ну что здесь сказать? Когда человек не имеет понятия о том, о чем говорит, и «выходит на публику с сомнениями», когда рассуждают «по понятиям», где надо «по науке», то там может помочь только методичное просвещение. Например, следующее.
Если этот «критик» говорит о 6-маркерных гаплотипах, то там одна мутация образуется в среднем раз в 1/0.0074 = 135 условных поколений, то есть раз в 135х25 = 3375 лет. Если речь о 12-маркерных гаплотипах, то там одна мутация образуется в среднем раз в 1/0.02 = 50 условных поколений, то есть раз в 50х25 = 1250 лет. Если – о 37-маркерных гаплотипах, то там одна мутация образуется в среднем раз в 1/0.09 = 11 условных поколений, то есть раз в 11х25 = 275 лет. Но в среднем – это не обязательно точно раз в 275 лет, как часы. Это может быть мутация через 100 лет, и через 600 лет, и как угодно, но при большом числе гаплотипов это получается в среднем раз в 275 лет. Поэтому критик не понимает того, что просто «гаплотипов» в таких случаях писать нельзя, надо обязательно указывать, какой протяженности гаплотипы. Как мы видим, и в случае 37-маркерных гаплотипов вполне возможно, что за 400–500 лет в них не происходит мутации. Но если речь о 111-маркерных гаплотипах, в которых мутация происходит в среднем раз в 125 лет, то за промежуток времени 400–500 лет мутации должны наблюдаться. Хотя и при бросании монеты бывает, что орел или решка выпадают подряд 4–5, и даже 6 раз. Хотя в среднем выпадают каждый второй раз.
Поэтому принцип должен быть такой, что при рассмотрении и обсуждении мутаций надо всегда исходить из вероятностного характера процесса.
Вообще при обсуждении вопроса в понятиях «точны» или «неточны», надо сначала определиться, «точны» для чего, для какой задачи, которая должна ставиться. Если задача ставится вычислить время рождения или смерти общего предка с точностью до года, то никакие статистические методы для этого в принципе не подходят, включая ДНК-генеалогию. Не подходят и задачи, в которых требуются проводить расчеты с точностью до десятилетий. ДНК-генеалогия решает задачи в первую очередь концептуальные, на уровне открытий, пересмотров старых концепций, и создания концепций новых. Никто же не требует в астрофизике расчета времени «большого взрыва» Вселенной с точностью до сотен лет, и тем более до года, там оценки идут на сотни миллионов и миллиарды лет, и не в сотне лет точности была важность новой концепции.
Например, когда 20 лет назад популяционными генетиками было сообщено, что носители гаплогруппы R1b жили в Европе 30 тысяч лет назад, во времена неандертальцев, то расчетов вообще никаких не делалось, это было предложено «по понятиям», подхвачено, и устоялось в науке. Потребовалось больших трудов убедить научную общественность, что R1b появились в Европе всего лишь около 5000 лет назад, как показали расчеты ДНК-генеалогии[58], и это имело концептуальную значимость. В той ситуации было неважно, это 5000±3000 лет назад, 5000±1000 лет назад, или 4800±400 лет назад (последняя величина была показана в расчетах). Таких примеров можно привести много, и каждый раз это был фактический прорыв в науке, прорыв разного масштаба.
Обычно расчеты общих предков выборок в ДНК-генеалогии проводятся с точностью 10–15 %, и причина этого довольно проста – мы постулируем, что величина константы скорости мутации определяется с точностью ±10 %, и тогда точность расчетов по определению не может быть лучше, чем ±10 %. На самом деле сотни и тысячи расчетов показали, что точность определения констант скоростей мутаций составляет примерно 2.5–3.0 %, но для расчетов мы оставляем те же 10 %. Лучше пусть доверительный интервал расчетов будет больше, чем претендовать, что наши расчеты точны, и время от времени подвергаться обвинениям, что другие данные показывают несколько отличающуюся величину. Не все знают, что расчеты погрешностей дело весьма условное, и зависит от закладываемых параметров доверительности. Если мы хотим результаты с доверительностью 95 %, или 99 %, то погрешности при тех же исходных величинах будут уже другими. В ДНК-генеалогии неразумно считать с требуемой доверительностью 95 % или 99 %, потому что тогда мы выходим уже не на концептуальность, а на точность, которой в обычно используемых сериях гаплотипах нет и быть не может. Даже если выборки будут состоять из десятков и сотен тысяч протяженных гаплотипов, в них непременно окажутся «примесные» гаплотипы, из других субкладов, из несимметричных ДНК-линий, да и просто ошибки типирования, которые неизбежны в больших сериях.