Обучение без учителя (Unsupervised learning) – это направление машинного обучения, работает с неразмеченными данными и работает без обратной связи.
Обучение модели (Model training) – это настройка параметров модели нейронной сети для правильной работы с заданными данными.
Обучение с временной разницей (Temporal difference learning) – это класс методов обучения с подкреплением без использования моделей, которые обучаются путем самонастройки на основе текущей оценки функции ценности. Эти методы производят выборку из среды, например методы Монте-Карло, и выполняют обновления на основе текущих оценок, например методы динамического программирования90.
Обучение с подкреплением (Reinforcement learning) – это направление машинного обучения, фокусируется на процессах принятия решений и системах вознаграждения. Может выучить серию действий.
Обучение с самоконтролем (Self-Supervised Learning) – это одна из разновидностей машинного обучения, применение которой может быть полезным в переходе от контролируемого обучения с целью снижения издержек на обработку больших массивов информации и человеческие ресурсы. Использование этой технологии должно помочь в работе с неструктурированными данными, а наибольшая польза от ее применения заключается в повышении качества распознавания голоса при работе с интеллектуальным голосовым помощником при регистрации обращений.