AI Агенты: Что за монстр? Решил вот разобраться, что такое AI агенты. С одной стороны, вроде понятно — что-то умное, с другой — как только начинаешь углубляться, кажется, что каждый понимает это по-своему. Да и вообще, когда что-то становится модным, как термин Big Data, туда накидывают всё подряд.
Попробую накидать своё понимание и мысли. Возможно, это поможет кому-то (включая меня самого) лучше разобраться.
Что такое AI агент?Если кратко, AI агент — это программное обеспечение, которое:
1. Использует технологии ИИ (от классического ML до современных LLM).
2. Может активно взаимодействовать с внешним миром (то есть не просто отвечает на вопросы, а действует).
3. Ориентирован на выполнение конкретной задачи.
По сути, это как Джеймс Бонд 007, только не в смокинге, а с промптом внутри.
Почему "активное взаимодействие"?Вот что важно. Раньше мы привыкли, что ИИ — это что-то пассивное: спросил → ответили.
AI агент же идёт дальше:
- Может писать и отправлять письма.
- Запускать скрипты.
- Работать с API.
- Даже заказывать вам пиццу или сделать перевод, если слишком устали.
Это делает их более полезными, но и сложными в разработке, потому что тут нужна куча интеграций, правил и тестов.
LLM — обязательно или нет?Не обязательно. Хотя сейчас все ассоциируют AI с LLM (например, ChatGPT), агент может использовать что угодно:
- Правила и паттерны.
- ML модели.
- Баесовские алгоритмы
.
Но LLM сейчас как тренд, так что почти все новые агенты завязаны на них. Они бомбят модель запросами (промптами) для решения задач.
Как агенты думают?Самое интересное — это как AI агент строит цепочку действий. Вот примеры популярных подходов:
1. Chain of Thought (CoT): Линейная цепочка. Подходит для задач, где каждый шаг зависит от предыдущего.
Пример: Планирование поездки: выбрать город → забронировать билеты → заказать отель.
2. Tree of Thought: Строит дерево решений, где каждая ветка — возможный вариант.
Пример: Подбор маршрута, где есть несколько вариантов транспорта и остановок.
3. Graph of Thought: Строит граф, учитывая сложные связи и перекрёстки.
Пример: Организация логистики с учётом множества складов и точек доставки.
Агент не просто выполняет один алгоритм, а как будто придумывает его на ходу, адаптируясь под новые данные.
В чём будущее?AI агенты — это движение от детерминированных решений (где всё заранее запрограммировано) к вероятностным.
Это похоже на переход от шахматного алгоритма к чему-то более гибкому, способному решать задачи с миллионом неизвестных.
Будущее тут за такими вещами:
-
Узкая специализация: Один агент = одна задача. Много задач = связка агентов.
-
Автономность: Минимум ручного управления. Агент должен учиться, адаптироваться и даже сам исправлять свои ошибки.
-
Интеграции: Чем больше систем умеет использовать агент, тем больше пользы он приносит.
Кстати если вы читали (или хотя бы слышали) книгу Даниэла Канемана «Думай медленно, решай быстро», то знакомы с концепцией Системы 1 и Системы 2. Канеман объясняет, что:
Система 1 — быстрая, интуитивная, но иногда ошибочная.
Система 2 — медленная, аналитическая, но требует больше времени и усилий.
Эта аналогия как раз описывает разницу между работой LLM и AI-агентов.
https://youtu.be/KrRD7r7y7NY?si=USrlIMO0pN2IAJWU#AI