GPT, StableDiffusion, AlphaGo – как нейросети переосмыслили реальность

Когда в 2016 году AlphaGo сделала тот самый 37-й ход в партии против Ли Седоля, весь мир замер. Профессиональные игроки сначала решили, что это ошибка – такой ход не встречался за четыре тысячелетия истории го. Но к концу игры стало ясно: нейросеть открыла новую стратегию, неочевидную для человеческого мышления. Этот момент прекрасно иллюстрирует, как современные нейросети, будучи созданными человеком, начали превосходить его в отдельных областях.

Возьмем GPT – языковую модель, которая перевернула наше представление о работе с текстом. В её основе лежит простая на первый взгляд идея: предсказывать следующее слово в последовательности. Но масштаб реализации делает её революционной. Обрабатывая триллионы слов, GPT выявляет сложнейшие языковые паттерны, учится стилистическим нюансам и даже имитирует творческий процесс. При этом она не понимает текст в человеческом смысле – просто невероятно точно угадывает статистические взаимосвязи. Это, как если бы кто-то выучил наизусть все книги в библиотеке и научился бесконечно комбинировать фразы, сохраняя видимость смысла.

StableDiffusion предложил совершенно иной подход к генерации изображений. В отличие от GPT, работающей с дискретными токенами4, эта модель оперирует в непрерывном пространстве изображений. Процесс напоминает художника, который начинает с хаотичных мазков и постепенно уточняет их, сверяясь с текстовым описанием. Особенно поражает, как система научилась соединять абстрактные концепции – например, визуализировать «любовь в стиле киберпанк» или «экзистенциальный ужас в акварели». При этом каждый такой запрос раскрывает удивительный факт: нейросеть не оперирует смыслами, а лишь устанавливает сложные корреляции между фрагментами текста и элементами изображений.

Эволюция AlphaGo демонстрирует ещё один важный аспект. Первые версии обучались на партиях профессиональных игроков, имитируя человеческий стиль. Но настоящий прорыв случился с AlphaGo Zero, которая начала с чистого листа и через самообучение открыла принципиально новые стратегии. За несколько дней она прошла путь, на который человечеству потребовались тысячелетия. Особенно показательно, что её стиль игры сначала казался «неестественным» профессионалам, но затем радикально изменил современное понимание го.

Эти три примера раскрывают парадокс современного ИИ. С одной стороны, системы демонстрируют феноменальные результаты в узких областях. С другой – их «понимание» остаётся поверхностным, основанным на статистике, а не на осмыслении. GPT не размышляет о смысле текста, StableDiffusion не испытывает эмоций от создаваемых образов, AlphaGo не чувствует азарта от победы. Они лишь невероятно точно оптимизируют свои функции, создавая иллюзию разумности.

Такой подход порождает удивительные последствия. Когда нейросеть пишет стихотворение или рисует картину, она не следует культурным традициям и не выражает внутреннего состояния. Она вычисляет наиболее вероятные комбинации элементов, которые люди склонны считать осмысленными. Это принципиально иной способ «творчества» – без интенции, но с впечатляющей результативностью.

Но что именно позволяет этим системам достигать таких результатов? Всё дело в том сырье, из которого они строят свои предсказания – огромных массивах человеческого творчества, знаний и опыта. Но здесь же скрываются и главные ограничения – ведь нейросеть не может выйти за рамки того, что уже было создано и зафиксировано людьми.

Глава 3. Данные – «топливо» для ИИ

Почему Big Data