Вы предоставляете просто входные данные, и позволяете машине делать выводы и находить шаблоны.

Этот тип обучения может быть полезен для кластеризации данных, когда данные группируются в соответствии с тем, насколько они похожи на своих соседей и отличаются от всего остального.

Как только данные кластеризованы, можно использовать различные методы для изучения этих данных и поиска шаблонов.

Например, можно создать алгоритм машинного обучения с постоянным потоком сетевого трафика и позволить ему независимо изучать активность в сети – базовый уровень, нормальную сетевую активность, а также выбросы и, возможно, злонамеренное поведение, происходящее в сети.

Третий тип алгоритма машинного обучения, обучение с подкреплением, это алгоритм машинного обучения с набором правил и ограничений и позволяет ему учиться достигать целей.

Вы определяете состояние, желаемую цель, разрешенные действия и ограничения.

И алгоритм выясняет, как достичь цели, пробуя различные комбинации разрешенных действий, и его награждают или наказывают в зависимости от того, было ли решение правильным.

Алгоритм изо всех сил старается максимизировать свои вознаграждения в рамках предусмотренных ограничений.

И вы можете использовать обучение с подкреплением, чтобы научить машину играть в шахматы или преодолеть какие-либо препятствия.

Таким образом, машинное обучение – это широкая область, и мы можем разделить его на три разные категории: контролируемое обучение, неконтролируемое обучение и обучение с подкреплением.

И есть много разных задач, которые мы можем решить с помощью них.

В контролируемом обучении, в наборе данных есть метки, и мы используем их для построения модели классификации данных.

Это означает, что, когда мы получаем данные, у них есть метки, которые говорят о том, что представляют эти данные.

В примере с сердцем, у нас была таблица с метками, это сердечный ритм, возраст, пол и вес.

И каждой такой метке соответствовали значения.

При неконтролируемом обучении у нас нет меток, и мы должны обнаружить эти метки в неструктурированных данных.

И такие вещи обычно делаются с помощью кластеризации.

Обучение с подкреплением – это другое подмножество машинного обучения, и оно использует вознаграждение для наказания за плохие действия или вознаграждение за хорошие действия.

И мы можем разделить контролируемое обучение на три категории: регрессия, классификация и нейронные сети.

Модели регрессии строятся с учетом взаимосвязей между признаками x и результатом y, где y – непрерывная переменная.

По сути, регрессия оценивает непрерывные значения.

Нейронные сети относятся к структурам, которые имитируют структуру человеческого мозга.

Классификация, с другой стороны, фокусируется на дискретных значениях, которые она идентифицирует.

Мы можем назначить дискретные результаты y на основе многих входных признаков x.

В примере с сердцем, учитывая набор признаков x, таких как удары в минуту, вес тела, возраст и пол, алгоритм классифицирует выходные данные y как две категории: истина или ложь, предсказывая, будет ли сердце работать нормально или нет.

В других классификационных моделях мы можем классифицировать результаты по более чем двум категориям.

Например, прогнозирование, является ли данный рецепт рецептом индийского, китайского, японского или тайского блюда.

И с помощью классификации мы можем извлечь особенности из данных.

Особенности в этом примере сердцем, это сердечный ритм или возраст.

Особенности – это отличительные свойства шаблонов ввода, которые помогают определить категории вывода.

Здесь каждый столбец является особенностью, а каждая строка – точкой ввода данных.