5.6.1. Массив расстояний Distprimates представляет собой матрицу 12 × 12, с расстояниями, вычисляемыми по 6-параметрической модели подстановки основания. Названия таксонов в порядке записей матрицы находятся в переменной с именем Namesprimates. Выполните алгоритм присоединения соседей для этих данных с помощью команды nj(Distprimates,Namesprimates{:}).

Нарисуйте метрическое дерево, получившееся в результате.

5.6.2. Используйте имеющиеся знания и свой ответ на предыдущую задачу, чтобы изобразить корневое топологическое дерево, которое могло бы описать эволюционную историю пяти гоминоидов, упомянутых во введении.

5.6.3. Сколько возможных некорневых топологических деревьев может описать эволюцию 12 приматов? Сколько возможных корневых топологических деревьев может описать эволюцию пяти гоминоидов упомянутых во введении к главе?

5.6.4. Команды Nameshominoids=Namesprimates(1:5),  Dist hominoids=Dist primates(1:5,1:5) извлекут имена и расстояния между первыми пятью приматами, гоминоидами, упомянутыми во введении к этой главе. Используйте программу nj на данных расстояния только для этих пяти, нарисовав полученное метрическое дерево. Согласуется ли полученная топология с топологией, приведенной в задаче 5.6.1? Согласуется ли метрическая структура? Объясните, как могли возникнуть какие-либо расхождения, которые заметили.

5.6.5. Используйте команду Seqhominoids=Seqprimates([1:5],:)  для извлечения последовательностей для гоминоидов. Некоторые последовательности имеют пробелы, обозначаемые символом «–». Сайты, где любая последовательность имеет пробел, который должен быть удален перед вычислением расстояний, нужно предварительно отфильтровать. Команды gaps=(Seq hominoids =='-'), gapsites=find(sum(gaps)), Seq nogaps=Seq hominoids, Seq nogaps(:,gapsites)=[ ] найдут и удалят эти сайты. Используя последовательности без пробелов, вычислите расстояние Джукса-Кантора, 2-параметрическое расстояние Кимуры и логарифмическое расстояние. Напомним, что [DJC, DK2, DLD]=distances(Seqnogaps) сделает это легко.

а. Насколько похожи эти расстояния с расстояниями в массиве Distprimates?

б. Используйте каждый массив расстояний, который создаете, для построения дерева методом присоединения соседей. Все ли они одинаковы с топологической точки зрения? А с метрической?

5.6.6. Исследуйте, насколько разумны модели Джукса-Кантора и Кимуры замещения оснований для описания происхождения гоминоидов от общего предка. Сделайте это, рассматривая две последовательности одновременно, используя compseq.m для вычисления частотного массива оснований в двух последовательностях. Затем вычислите базовые распределения для каждой последовательности и матрицы Маркова, которые описывали бы эволюцию одного в другое. Близки ли они к модели Джукса-Кантора или Кимуры? Выбор другой модели, который делает Хаясака в работе 1988 года, кажется ли необходимым? Объясните почему.

5.6.7. Повторите решение задачи 5.6.5, но используйте все 12 последовательностей приматов.  Какое из расстояний, по вашему мнению, наиболее целесообразно использовать? Объясните почему.

5.6.8. Из последовательностей гоминоидов выделите первые 10 информативных сайтов. Используйте их для вычисления оценки экономии (вручную) каждого из деревьев в начале этой главы, а также деревьев с соседними парами (шимпанзе, горилла) и (орангутан, гиббон). Какое из трех является наиболее экономным?

5.6.9. Повторите решение предыдущей задачи, но используя 10 информативных сайтов, выбранных для равномерного распределения между информативными сайтами. Считаете ли, что этот выбор информативных сайтов должен быть более или менее обоснованным, по сравнению с предыдущей задачей? Объясните почему. Очевидно, что использование всех информативных сайтов было бы предпочтительнее, но это невозможно сделать вручную, потому что для этих 5 таксонов их 90.