11.7. Функции R
Приведем некоторые функции, которые могут быть использованы при работе над данным разделом.
Приведено название функции, а в скобках название пакета, в котором функция расположена. Для использования функция необходима загрузка пакета, а если его еще нет, то и установка.
Если названия пакета не приведено – это означает, что функция имеется в базовом пакете и не требуется предварительная загрузка пакета.
Для реализации идей данного раздела могут быть использованы следующие пакеты: caret,klaR, leaps, MASS, pROC, rms и stats.
11.7.1. Выбор вперед, назад и пошаговый
Есть несколько функций R для этого класса:
– может использоваться step в пакете stats для поиска соответствующих подмножеств для линейной регрессии и обобщенных линейных моделей (функции lm и glm, соответственно). Аргумент direction управляет методом поиска признака (например, «both,» «backward» или «forward»). Более общая функция – функция stepAIC в пакете MASS, который может обработать дополнительные типы моделей. В любом случае, статистика AIC (или в ее разновидности) используется в качестве целевой функции;
– функция fastbw в пакете rms проводит подобные поиски;
– у функции regsubsets в пакете leaps есть подобная функциональность;
– пакет klaR содержит функцию stepclass, которая ищет пространство предикторов для моделей, максимизирующая точность кросс-проверки.
Функция train пакета caret позволяет уменьшить риск смещения при выборе предикторов.
11.7.2. Рекурсивное удаление предикторов
Пакеты caret и varSelRF содержат функции ля рекурсивного удаления предикторов.
рекурсивное удаление предикторов только в моделях случайного леса
универсальная обертка для любых предсказательных моделей
11.7.3. Методы фильтрации
В пакете caret имеется функция sbf, которая выбирает предикторы для модели с оценкой результативности ресемплированием.
Часть 2. Краткое описание Rattle
Вторая часть книги является краткой инструкцией для работы с Rattle. Организация материала продиктована порядком построения моделей, предусмотренным Rattle в виде последовательности вкладок программы.
Вторая часть книги является переводом краткого руководства по Rattle.
Эта часть полезна как на этапе первоначального знакомства с Rattle, так и на этапе постоянного использования в качестве краткого справочника.
Текст не содержит подробностей и будет полезен тем, кто либо только начинает работать с предсказательными моделями, либо хочет апробировать некоторую идею.
12. Работа новичка с Rattle
12.1. Интерфейс Rattle
Рассмотрим интерфейс Rattle. Интерфейс основан на ряде последовательных вкладок, через которые выполняется предсказательное моделирование трендов. Для любой вкладки, как только мы предоставили запрошенную информацию, нажмем кнопку Выполнить для выполнения действия. Отметим в меню кнопку Help (Справка).
Интерфейс Rattle спроектирован как простой интерфейс к мощному комплекту базовых инструментов для моделирования финансовых данных. Общий процесс состоит в последовательном движении по вкладкам, слева направо, выполняя соответствующие действия. Для любой вкладки мы конфигурируем опции и затем нажимаем кнопку Выполнить (или F2) для выполнения соответствующей задачи. Важно отметить, что задачи не выполняются, пока кнопка Выполнить (или F2, или пункт меню Выполнить в закладке Tools (Инструменты)) не нажата.
Строка состояния внизу окна укажет на завершение действия. Сообщения от R (например, сообщения об ошибках) могут появиться на консоли R, на которой был запущен Rattle. Так как Rattle – простой графический интерфейс, находящийся поверх