English:
The agent generates 5 creative campaign ideas for a cosmetics product launch. Then, using self-consistency logic, it:
– evaluates each for completeness and strength,
– selects the top 2,
– and synthesizes a composite concept from them.
→ Такой модуль заменяет субъективный отбор и усиливает прозрачность выбора в агенте.
Применение в MAS (мультиагентной системе)
Русский: Генератор-агент создаёт 3 сценария развития стартапа. Аналитик-агент сравнивает их по ключевым метрикам (срок окупаемости, уровень риска, масштабируемость).
Оценщик формирует итог: «Сценарий 2 более устойчив, но Сценарий 3 имеет наибольший потенциал при достаточном финансировании. Рекомендую гибридную стратегию.»
English:
A scenario generator agent creates 3 startup development paths.
An analyst agent compares them using key metrics (ROI time, risk, scalability).
Evaluator summarizes: “Scenario 2 is more stable, but Scenario 3 has higher upside with funding. Recommend a hybrid strategy.”
→ Self-consistency prompting реализуется как логика согласования и отбора внутри агентной экосистемы.
5. Саморефлексия и переоценка. Reflexion prompting
Цель
Побудить модель к анализу собственного ответа: выявить ошибки, слабые места, логические сбои и предложить улучшение. Увеличивает точность, надёжность и интерпретируемость reasoning-вывода.
Когда применять
– После генерации ответа, если он вызывает сомнения
– При обучении модели действовать «как критик» своих решений
– Внутри reasoning loop, как этап самопроверки
– Для создания агентов, способных учиться на ошибках
– При генерации программного кода, стратегий, планов, где важна верификация
Пример промпта
Проанализируй свой предыдущий ответ:
– какие логические допущения ты сделал?
– возможны ли ошибки или слабые места?
– как можно улучшить этот ответ?
Reflect on your previous answer:
– What assumptions did you make?
– Are there any weaknesses or potential errors?
– How would you revise it to improve accuracy or clarity?
Механизм работы
Reflexion prompting активирует мета-уровень reasoning:
– Модель интерпретирует собственный вывод как внешний текст
– Анализирует его по заданным критериям
– Формулирует замечания, улучшения или полный пересмотр
– Может перейти к самогенерации улучшенного ответа
Этот паттерн усиливает способность модели к внутренней самокритике, особенно в сложных цепочках с промежуточными рассуждениями.
Риски / Ошибки
Модель может «притворяться» критичной, не выявляя реальных слабых мест
Возможна имитация саморефлексии без настоящей переоценки
При частом применении – рост количества токенов без пропорционального улучшения
Требуется чёткая постановка критериев оценки и качества
Связанные техники
– Self-consistency prompting – можно сравнить результат до и после рефлексии
– Step-back prompting – близко по цели, но более направлено на смену перспективы
– Auto-correction loops – reflexion может быть встроена как этап цикла
– Reverse prompting – позволяет посмотреть, как бы модель пересформулировала задачу
– Prompt ranking – может использоваться для выбора до/после рефлексии
Применение в ИИ-агентах и MAS
– Reflexion – критически важный этап reasoning-цикла в агентных системах, особенно перед финальным выводом.
– Может быть реализован как отдельный агент-критик в MAS: получает результаты от других агентов, анализирует, предлагает улучшения.
– В продуктах с высоким требованием к качеству (финансовые отчёты, код, стратегии) позволяет автоматизировать ревью и self-review.
– Используется для создания reasoning loops с inner reward shaping, где качество промежуточного вывода влияет на поведение в следующем шаге.