| АРХИТЕКТУРА |
Тип агента | Coding agent, OS-level [7] | General-purpose, multi-agent [19] | Stateful workflow engine [18] | Long-horizon planning [20] | Role-based multi-agent [22] | IDE coding assistant [23] | General automation [11] | UI generation (не agentic) [6] | Coding agent, open-source [29] |
Петля оркестрации | «Dumb loop» + sub-agents; Fork/Teammate/Worktree [7] | Runner loop; Agents-as-tools + Handoffs [19] | Compiled state graph; super-step checkpoints [18] | Planning + subagent spawning; write_todos [20] | Crew + Flow; sequential/parallel/hierarchical [22] | IDE-integrated; Air multi-agent env [23] | Shell-first; management agents → handoffs [11] | Single LLM call; нет петли [6] | Event-driven JSONL; peer-to-peer agents [29] |
MCP поддержка Model Context Protocol | Нативный встроен с Claude 3.5+ [8] | Нативный с марта 2025 [8] | Через плагин langchain-mcp-adapters [8] | Через плагин через LangGraph [20] | Через плагин crewai-tools + MCP [9] | Нативный встроен в Junie [23] | Частично через shell tools [11] | Нет не agentic [6] | Нативный встроен [29] |
| ПАМЯТЬ |
Память cross-session помнит ли между запусками | Да CLAUDE.md + MEMORY.md + 3-уровневый индекс [2] | Да SQLite / Redis; 4 стратегии [19] | Да JSON Stores по namespace; SQLite checkpointer [18] | Да MemoryMiddleware через LangGraph Store [20] | Частично Flows — в рамках run; Memory class для cross-run [22] | Нет Сессионная; observation masking ≠ persistence [23] | Да Filesystem + git как внешняя память [11] | Нет Запрос-ответ без истории [6] | Да SQLite sessions + AGENTS.md; Letta-style memory blocks [29] |
Context Management | Compaction; JIT retrieval (grep/glob); 3-tier index; 95% сокращение [2] | Compaction; AGENTS.md priority stack (32 KiB); progressive disclosure [3] | Observation masking; structured notes; time-based clearing [18] | Auto-summarization; file-offloading [21] | Task-scoped context; sequential isolation [22] | Observation masking: скрывает старые tool outputs [2] | KV-cache priority; filesystem offload; todo.md в конце контекста [11] | Минимальный; нет long-running [6] | Compaction через configurable hook; /compact команда [29] |
| НАДЁЖНОСТЬ |
Error Handling | Ошибки как tool results; петля не ломается [7] | Tripwire exceptions; retry логика в Runner [19] | 4 класса: transient / LLM-recoverable / user-fixable / unexpected; RetryPolicy [18] | LoopDetection middleware; self-correction loop [21] | Task-level retry; agent fallback [22] | IDE build feedback интегрирован в цикл [23] | Улучшалась с каждым рефакторингом [11] | Stripe-паттерн: max 2 retry; быстрый fail [6] | LSP diagnostics loop; undo file changes после tool error [29] |
Verification Loops тесты, линтеры, LLM-as-judge | Computational (тесты) + inferential (LLM-judge); +2–3× качества [12] | Guardrails как input/output validators; параллельный режим [19] | Interrupt для human review; conditional routing [18] | CI-тесты как enforcement; не документация [3] | GuardrailEvents (с 2025); agent role constraints [22] | IDE build + lint feedback в петле [14] | Верификация через shell + state machines [11] | Нет (UI generation) [6] | LSP diagnostics; type-check loop встроен [29] |
Guardrails | ~40 capabilities независимо; 3 стадии; модель ≠ enforcement [7] | 3 уровня: input / output / tool; tripwire; параллельный / блокирующий режим [19] | Conditional routing; interrupt для human review [18] | Middleware guards; LoopDetection [21] | Agent role constraints; GuardrailEvents (с 2025) [22] | IDE permissions; required safeguards [23] | Shell execution + logit masking + state machines [11] | Нет (UI generation, не agentic) [6] | allow/deny/require-approval per tool; --dangerously-skip-permissions флаг [29] |
| МАСШТАБИРОВАНИЕ |
Multi-agent модель | Fork / Teammate / Worktree; sub-agent → 1–2k токенов резюме [7] | Agents-as-tools + Handoffs; specialist берёт полное управление [19] | Nested state graphs; subgraph composition [18] | write_todos planning + subagent spawning [21] | Role-based: Agent + Task + Crew; Flows для детерм. backbone [22] | Junie CLI: subagents + Air multi-agent env [23] | Management agents → simple handoffs [11] | Нет [6] | Event-driven messaging; JSONL append-only; peer-to-peer; Tab/@mention [29] |
Observability трейсы, метрики, OpenTelemetry | Встроенный трейсинг; OpenTelemetry gen_ai.* [13] | OpenAI Traces API; spans per tool call [3] | LangSmith integration; step-level traces [18] | LangSmith + custom callbacks [21] | Агрегированные метрики через callbacks [22] | IDE-integrated logs; нет внешних трейсов [23] | Внутренние логи; нет публичного OTel [11] | Vercel Analytics; нет agent-level трейсов [6] | OpenTelemetry gen_ai.*; pluggable providers [29] |
Model Routing | Opus → planning; Sonnet → impl; Haiku → grep; prompt cache −90% [7] | Per-agent model spec; model field в subagent [19] | Per-node model config; LangChain router [18] | Динамический роутинг через middleware [21] | Per-agent LLM config; LiteLLM unified (100+ провайдеров) [22] | BYOK: OpenAI, Anthropic, Google, Grok [23] | Anthropic + OpenAI + другие; KV-cache приоритет [11] | Один вызов модели [6] | 75+ провайдеров через AI SDK; per-agent model config; BYOK [29] |
| ЭКОСИСТЕМА |
Model dependency | Claude only[7] | OpenAI (+ 100+ via API)[19] | Model-agnostic[18] | Model-agnostic[21] | Model-agnostic LiteLLM [22] | LLM-agnostic BYOK [23] | Multi-provider Anthropic + OpenAI + др. [11] | Vercel AI SDK[6] | Model-agnostic 75+ провайдеров; BYOK [29] |
Лучший для... | Coding agents, long-running tasks, OS-level access [7] | Быстрый путь в production; triage → specialist паттерны [19] | Сложные stateful workflows; crash recovery; enterprise [18] | Long-horizon задачи с planning и subagent spawning [21] | Multi-agent прототипирование; role-based collaboration [22] | Coding assistance; multi-IDE workflows [23] | General automation; production харнес как продукт [11] | UI generation; не agentic использование [6] | Model experimentation; multi-provider setups; open-source альтернатива Claude Code [29] |