Л6. AI-агенты: архитектура, протоколы и будущее разработки

📺 Слайды к лекции

На прошлой лекции мы разобрали, что может пойти не так с AI-инструментами: уязвимости в сгенерированном коде, prompt injection, техдолг, приватность. Сегодня --- другой угол: как агенты устроены внутри, какие протоколы их связывают и куда это всё движется.

Начнём с того, что вскроем конкретный кодинг-агент до атомов --- Claude Code, чей исходный код утёк в марте 2026. Потом --- мультиагентные системы, SDK для построения своих агентов, протоколы коммуникации (MCP, A2A), и наконец --- реальные внедрения в Stripe, Block и Shopify.

Блок 1. Как устроен Claude Code изнутри

Зачем именно Claude Code?

31 марта 2026 года Anthropic случайно включила 59.8 МБ source map (cli.js.map) в npm-пакет @anthropic-ai/claude-code v2.1.88. Source map позволил восстановить оригинальный TypeScript --- 1 884 файла, 64 464 строки. Сообщество детально разобрало архитектуру, и теперь мы можем учиться на реальном коде, а не на маркетинговых описаниях.

"The entire source code of Claude Code --- 1,884 TypeScript files, 64,464 lines --- sitting in plain sight in the npm package. Bun generates source maps by default. Nobody turned it off." --- Engineer's Codex

Master Loop "nO"

Внутри Claude Code нет сложного state machine или мультиагентного роя. Ядро --- single-threaded master loop под кодовым именем nO. Работает на плоской истории сообщений:

while (tool_call) → execute tool → feed results → repeat

Цикл завершается, когда модель генерирует текстовый ответ без вызова инструментов. Это реализация ReAct (Thought → Action → Observation) в чистом виде --- и удивительно, насколько это просто.

# Концептуальный agentic loop (упрощённо)
messages = [{"role": "system", "content": build_system_prompt()}]
messages.append({"role": "user", "content": user_input})

while True:
    response = await model.generate(messages)
    messages.append(response)

    if not response.tool_calls:
        break  # текстовый ответ — конец

    for call in response.tool_calls:
        result = await execute_tool(call)
        messages.append({"role": "tool", "content": result})

h2A --- dual-buffer queue, работающая в паре с nO. Позволяет пользователю прервать или перенаправить агента прямо во время выполнения, без перезапуска всей сессии. Если вы видите, что Claude Code идёт не туда --- можно вмешаться на лету.

"Pause/resume support and ability to incorporate user interjections mid-task without requiring a full restart." --- PromptLayer: Master Agent Loop

Специализация ReAct в Claude Code --- Gather-Act-Verify: сначала собрать контекст (grep, чтение файлов), затем внести изменения, затем верифицировать (тесты, линтер). Агент не предполагает успех --- он проверяет.

graph LR
    U["User input"] --> SP["System prompt<br/>assembly"]
    SP --> M["Model call<br/>(nO loop)"]
    M --> TC{"Tool call?"}
    TC -->|"да"| T["Execute tool"]
    T --> H["h2A queue<br/>(user steering)"]
    H --> M
    TC -->|"нет"| R["Text response"]

подсказка

Проекты с тестами работают с агентами радикально лучше --- у агента есть объективный сигнал на фазе Verify. Без тестов он гадает.

System Prompt: 110+ условных блоков

Утечка показала, что system prompt Claude Code --- не статическая строка. Это 110+ отдельных инструкций, собираемых на лету в зависимости от конфигурации.

"It's 110+ separate instructions, conditionally assembled based on your configuration." --- dbreunig.com: How Claude Code Builds a System Prompt

Структура сборки:

Identity & security --- базовые правила поведения
Task execution --- как подходить к задачам
Tool definitions --- описания 40+ инструментов
CLAUDE.md injection --- файлы считываются от корня FS до CWD, каждый уровень добавляет контекст
Git snapshot --- текущая ветка, статус, последние коммиты
Условные блоки --- Auto mode, Plan mode, наличие MCP-серверов, OS-специфика

Для оптимизации стоимости и prompt caching промпт разделён маркером __SYSTEM_PROMPT_DYNAMIC_BOUNDARY__. Всё до маркера --- статичный globally-cacheable контент (identity, tools). Всё после --- динамический session context (OS, git, CWD).

Итоговый размер: 2 300--3 600 токенов. На первый взгляд немного, но это только system prompt. CLAUDE.md файлы, tool results и история разговора добавляют остальное.

Context Management и Compaction

Контекстное окно --- 200K (Sonnet) или 1M (Opus) токенов. Но рано или поздно оно заканчивается. Для этого есть Compaction (кодовое имя wU2).

Compactor wU2 "automatically triggers at approximately 92% context utilization". --- dev.to: What Actually Happens When Compacting

wU2 не просто обрезает старые сообщения. Он делает отдельный LLM-вызов, который суммаризирует историю в <summary> теги. Важная информация переносится в долгосрочное хранилище (Markdown-файлы), а рабочая память очищается без потери ключевого контекста.

Tool Architecture и Permission Model

Из утечки: Claude Code содержит ~40 built-in tools. Каждый следует строгому JSON-RPC паттерну: JSON tool calls → sandboxed execution → результат как plain text.

Агент явно промптится предпочитать специализированные инструменты (Read, Edit, Glob, Grep) вместо raw shell-команд --- это делает действия структурированными, наблюдаемыми и верифицируемыми.

Permission model --- 5-step gauntlet. Каждый tool call проходит через:

Внутренние проверки инструмента
Sandbox policy
Активный permission mode пользователя
Settings allowlist/denylist (glob matching: Bash(npm:*), Read(~/project/**))
Explicit allow/deny для опасных команд

MCP tools живут в namespace mcp__{server}__{tool}. Sandbox использует OS primitives: bubblewrap на Linux, Seatbelt на macOS. Результат: 84% сокращение permission prompts благодаря sandbox.

"Glob patterns like Bash(npm:*) or Read(~/project/**)." --- dev.to: Claude Code Architecture

Скрытые системы

Утечка обнажила несколько скрытых компонентов:

KAIROS --- экспериментальная "always-on" система памяти. В отличие от стандартного Claude Code, который реагирует на промпты, KAIROS работает в фоне с периодическим heartbeat: "anything worth doing right now?". Ночной процесс autoDream --- субагент, который консолидирует дневные логи, дедуплицирует и удаляет противоречия из памяти.
undercover.ts --- 90-строчный модуль, который при использовании сотрудниками Anthropic в open-source проектах автоматически удаляет следы AI-авторства из коммитов (Co-Authored-By, имена моделей). Промпт буквально говорит модели: "Do not blow your cover". Модуль не имеет off-switch.
32 build-time feature flags, 120+ env vars, 26 скрытых slash-команд

4 паттерна Anthropic

В декабре 2024 Anthropic опубликовала "Building Effective Agents" --- четыре паттерна для построения агентных систем:

Паттерн	Суть	Когда использовать	Пример из Claude Code
Routing	Классификация → специализированный обработчик	Чёткие категории задач	Permission routing по типу tool call
Parallelization	Секционирование или голосование	Независимые подзадачи	Agent Teams: параллельные sub-agents
Orchestrator-Workers	Динамическая декомпозиция и делегирование	Подзадачи нельзя предсказать	Team Lead → spawned workers
Evaluator-Optimizer	Генерация + критика в цикле	Есть критерии оценки	Gather-Act-Verify cycle

к сведению

Эти паттерны не взаимоисключающие. Production-агенты вкладывают одни в другие: Orchestrator-Workers для координации + Evaluator-Optimizer для проверки каждого шага.

Блок 2. Мультиагентные системы

Зачем multi-agent?

Один агент ограничен контекстным окном и single planning loop. Решение: специализация + параллелизм. Но есть цена: Google Research показала, что ошибки в decentralized мультиагентных системах усиливаются до 17x vs 4.4x для centralized (hub-spoke).

Ошибки в децентрализованных агентных системах усиливаются до 17x по сравнению с 4.4x для централизованных. --- Google Research: Towards a Science of Scaling Agent Systems

Архитектурные паттерны

Паттерн	Координация	Контролируемость	Масштабируемость	Когда использовать
Hub-spoke	Центральный оркестратор	Высокая	Средняя	Продакшн, критические задачи
Pipeline	Последовательные стадии	Высокая	Низкая	Чёткий workflow, ETL
Swarm	Peer-to-peer, blackboard	Низкая	Высокая	Exploration, широкий поиск
Hierarchical	Дерево менеджер-подчинённые	Средняя	Высокая	Enterprise, сложные org-структуры

Hub-spoke доминирует в продакшене из-за контролируемости. Pipeline --- самый простой для отладки: чёткие input/output контракты на каждом шаге. Swarm масштабируется, но отладка --- ночной кошмар из-за "emergent" координации. Hierarchical зеркалит корпоративную структуру.

Gastown (Steve Yegge)

Steve Yegge построил Gastown --- систему, которую он называет "Kubernetes для кодинг-агентов". Это 20--30 параллельных Claude Code инстансов, координируемых через tmux.

"Gas Town is an industrialized coding factory manned by superintelligent robot chimps." --- Steve Yegge, Welcome to Gas Town

7 ролей:

Overseer --- человек-PM
Mayor --- координатор, запускает "конвои"
Polecats --- эфемерные воркеры, каждый создаёт один MR и деактивируется
Refinery --- решает проблему merge queue: ребейзит или пересоздаёт MR-ы
Witness --- per-project watchdog, ловит зависших агентов
Deacon --- cross-project daemon-супервайзер
Dogs --- maintenance-воркеры для инфра-задач

Beads --- Git-backed data plane (SQLite + git). Всё состояние хранится в Git как структурированные данные, не в эфемерных чатах. Это обеспечивает NDI (Nondeterministic Idempotence): если Claude Code сессия упала или исчерпала контекст --- новая сессия читает Git-стейт и продолжает с того же места.

Стоимость: ~$100/час для 12--30 агентов. Это реальная промышленная система, работающая в продакшене.

graph TB
    O["Overseer<br/>(человек)"] --> M["Mayor<br/>(координатор)"]
    M --> P1["Polecat 1"]
    M --> P2["Polecat 2"]
    M --> P3["Polecat N"]
    P1 & P2 & P3 --> R["Refinery<br/>(merge queue)"]
    W["Witness"] -.-> P1 & P2 & P3
    D["Deacon"] -.-> W
    B["Beads<br/>(Git + SQLite)"] --- M & P1 & P2 & R

Claude Code Agent Teams

Встроенная мультиагентная система Claude Code. В отличие от Gastown, использует файловую координацию через ~/.claude/teams/ и ~/.claude/tasks/.

JSON mailboxes для обмена сообщениями между агентами
flock() для claiming задач --- атомарный захват без race conditions
idle_notification protocol --- агенты сообщают, когда свободны
Два типа: peer agents (параллельные равные) и child agents (подчинённые)

Файловая координация через JSON mailboxes с flock() для claiming задач. --- dev.to: Reverse-Engineering Agent Teams Protocol

Практические паттерны: параллельный research (несколько агентов исследуют разные аспекты), competing hypotheses (агенты предлагают разные решения, team lead выбирает), cross-layer coordination (frontend + backend агенты работают синхронно).

Devin 2.0: compound AI

Devin 2.0 использует compound AI multi-agent архитектуру: Planner + Coder + Critic + Browser --- четыре специализированных sub-модели, каждая в изолированной VM.

Внутри Devin: Planner + Coder + Critic + Browser --- compound AI multi-agent system. --- Medium: Deep Dive into Devin 2.0

Bottleneck: single planning loop всё равно последовательный. Несколько Coder-ов могут работать параллельно, но Planner --- единственная точка синхронизации.

OpenAI Codex Subagents

OpenAI Codex (GA март 2026) может порождать subagents --- дочерние агенты в изолированных cloud-контейнерах. Каждый subagent работает в собственном sandbox с файловой системой и сетевым доступом. Это позволяет Codex параллельно исследовать несколько подходов или работать над разными частями кодобазы одновременно.

Сравнение мультиагентных систем

	Gastown	Agent Teams	Devin 2.0	Codex Subagents
Координация	Git-backed Beads + tmux	File-based mailboxes	Planner orchestrator	Cloud containers
Персистентность	NDI --- crash-resilient	Файловая, session-scoped	VM snapshots	Эфемерная
Стоимость	~$100/час	Включена в Claude Code	$20/мес + ACU	Включена в Codex
Зрелость	Production (Yegge)	Experimental	Production	GA (март 2026)

warning

Практический опыт показывает: orchestration beats raw autonomy. "8 правил из недели управления 20 AI-агентами" --- структура важнее количества агентов. --- zachwills.net

Блок 3. Agent SDKs --- обзор 2026

Главный архитектурный вопрос: кто управляет оркестрацией --- модель или код? Ответ определяет выбор SDK.

Claude Agent SDK: thin harness

Философия Anthropic: "Claude Code как библиотека". Вся интеллектуальность в модели, scaffolding минимальный.

Claude Agent SDK раскрывает харнесс через единственную функцию query(), которая создаёт агентный цикл. Runtime --- "тупой цикл". --- Anthropic, Building Agents with Claude Agent SDK

from claude_agent_sdk import query

async for message in query(
    prompt="Refactor the auth module to use JWT",
    tools=["bash", "file_read", "file_write", "file_edit"],
):
    print(message)

Built-in tools: bash, file ops, search --- глубокая OS-интеграция
Три типа sub-агентов: Fork (копия контекста), Teammate (изолированная панель + mailbox), Worktree (git-ветка)
Managed Agents API: /v1/agents endpoint, серверные сессии, без локальной инфраструктуры

OpenAI Agents SDK: code-first, provider-agnostic

OpenAI Agents SDK предлагает пять примитивов: Agents (конфигурация модели + инструкции), Handoffs (передача управления другому агенту), Tools (функции), Guardrails (валидация ввода/вывода), Sessions (персистентное состояние). Работает с 100+ LLM через Chat Completions API.

Два паттерна делегирования:

agents-as-tools --- агент вызывается как инструмент для подзадачи, результат возвращается вызывающему
handoffs --- полная передача управления, вызывающий агент больше не участвует

OpenAI Agents SDK: 5 примитивов --- Agents, Handoffs, Tools, Guardrails, Sessions. --- mem0.ai: OpenAI Agents SDK Review

LangGraph: thick framework

Полная противоположность. Разработчик явно определяет граф состояний:

from langgraph.graph import StateGraph

graph = StateGraph(AgentState)
graph.add_node("research", research_node)
graph.add_node("implement", implement_node)
graph.add_conditional_edges("implement", should_review)
app = graph.compile(checkpointer=MemorySaver())

v1.0 GA. Production: Klarna, Uber, JPMorgan
Typed state + nodes + conditional edges. Checkpointing, time-travel debugging
Философия: "разработчик контролирует каждый переход"

smolagents (HuggingFace): минимализм

~1 000 строк core. Агент пишет Python-код вместо JSON tool calls --- code-first в чистом виде.

from smolagents import CodeAgent, tool

@tool
def get_weather(city: str) -> str:
    """Get current weather for a city."""
    return f"Weather in {city}: 22°C, sunny"

agent = CodeAgent(tools=[get_weather], model=model)
agent.run("What's the weather in Paris?")

Sandbox execution, Hub sharing --- переиспользование агентов
Мульти-модальность из коробки

smolagents --- code-first подход: агент пишет Python-код вместо JSON tool calls. --- HuggingFace blog: Introducing smolagents

Новые игроки 2026

Google ADK (Agent Development Kit) --- v1.26, Python/TypeScript/Go/Java:

Встроенные типы: SequentialAgent, ParallelAgent, LoopAgent
A2A и MCP support из коробки
Интеграция с Vertex AI, Cloud Run, GKE для deployment

Google ADK --- "code-first framework that applies engineering principles like versioning, testing, and modularity to AI". --- Google ADK docs

Vercel AI SDK 6 --- agent abstraction для web:

Новый Agent class с stopWhen / prepareStep control flow
Tool approval (human-in-the-loop), durable workflows
SSE streaming, React/Next.js интеграция

Спектр: thin harness ↔ thick framework

SDK	Парадигма	Language	State	MCP	Production
Claude Agent SDK	Thin harness	Python	Context compaction	Built-in	Anthropic
OpenAI Agents SDK	Code-first	Python/TS	Sessions	Plugin	OpenAI
Google ADK	Multi-agent types	Py/TS/Go/Java	Vertex AI	Built-in	Google Cloud
Vercel AI SDK 6	Web-native	TS	Durable workflows	Plugin	Vercel
smolagents	Code execution	Python	Minimal	No	HuggingFace
LangGraph	State machine	Python/TS	Graph checkpoints	Plugin	Klarna, Uber

"The right agent framework can lead to greater improvements than model selection." --- Factory.ai

подсказка

Выбор SDK --- это выбор философии. Thin harness (Claude SDK, smolagents) --- доверяешь модели. Thick framework (LangGraph) --- контролируешь сам. Multi-agent types (Google ADK) --- где-то посередине. Большинство реальных систем комбинируют несколько подходов.

к сведению

Хотите понять, как работает агентный цикл "до костей"? Попробуйте построить coding agent с нуля на Python --- system prompt + tools + orchestration loop за ~100 строк. Это лучший способ прочувствовать разницу между thin и thick подходами.

Блок 4. Протоколы --- MCP и A2A

Агентам нужно общаться с внешним миром. Два протокола решают эту задачу на разных уровнях.

MCP: агент → инструменты (вертикальная интеграция)

Model Context Protocol (MCP) стандартизирует, как AI-модели взаимодействуют с внешними инструментами и данными. Архитектура: Host (Claude Desktop, Cursor) запускает Client, который подключается к MCP Server-ам.

"MCP solves this problem by standardizing how AI systems interact with external resources." --- MCP Documentation

Три примитива:

Примитив	Контроль	Описание
Tools	Модель решает когда вызвать	Выполняемые операции (API calls, запросы к БД)
Resources	Приложение предоставляет	Read-only данные (файлы, записи, API-ответы)
Prompts	Пользователь выбирает	Шаблоны сообщений с динамическими аргументами

graph LR
    H["Host<br/>(Claude Desktop, Cursor)"] --> C["MCP Client"]
    C --> S1["MCP Server 1<br/>Tools, Resources, Prompts"]
    C --> S2["MCP Server 2"]
    C --> S3["MCP Server N"]

Как написать MCP-сервер на Python (FastMCP):

import httpx
from mcp.server.fastmcp import FastMCP

mcp = FastMCP("weather-server")

@mcp.tool()
async def get_alerts(state: str) -> str:
    """Get weather alerts for a US state.
    Args:
        state: Two-letter US state code (e.g. CA, NY)
    """
    # type hints → JSON Schema автоматически
    async with httpx.AsyncClient() as client:
        response = await client.get(
            f"https://api.weather.gov/alerts/active?area={state}"
        )
        return response.text

mcp.run(transport="stdio")

FastMCP автоматически генерирует JSON-схему из type hints и docstring --- не нужно вручную описывать inputSchema.

TypeScript SDK предлагает два уровня: Server (low-level, ручное управление) и McpServer (high-level, Zod-валидация, авторouting).

MCP Registry --- community-driven каталог серверов, аналог npm для MCP-экосистемы.

warning

Безопасность MCP подробно разобрана в Л5. Здесь мы фокусируемся на практике построения серверов, а не на attack surface.

A2A: агент ↔ агент (горизонтальная интеграция)

Google's Agent-to-Agent (A2A) протокол решает другую задачу: как независимые агенты от разных вендоров могут общаться друг с другом.

A2A фокусируется на "horizontal integration --- allowing autonomous agents to talk, negotiate, and delegate tasks to one another". --- Deep Research Report

Agent Card --- JSON "визитка" агента, доступная по стандартному URL /.well-known/agent.json:

{
  "name": "code-review-agent",
  "skills": ["python-review", "security-audit"],
  "endpoint": "https://agent.example.com/a2a",
  "auth": { "type": "oauth2" },
  "formats": ["text/plain", "application/json"]
}

Как это работает:

Client Agent читает Agent Card удалённого агента и определяет, подходит ли он для задачи
Client отправляет Task (JSON-RPC 2.0 over HTTP)
Remote Agent обрабатывает задачу, обновляя статус: submitted → working → input-required → completed
Агенты обмениваются Messages (rich multi-part: текст, JSON, изображения) и получают результат в виде Artifact
Для стриминга --- SSE, для async --- webhooks

graph LR
    CA["Client Agent"] -->|"1. Read Agent Card"| AC["/.well-known/agent.json"]
    CA -->|"2. Send Task"| RA["Remote Agent"]
    RA -->|"3. Status updates (SSE)"| CA
    RA -->|"4. Return Artifact"| CA

MCP vs A2A

	MCP	A2A
Направление	Вертикальная (агент → инструменты)	Горизонтальная (агент ↔ агент)
Execution model	Inline tool calls во время reasoning	Discrete tasks и artifacts
Коммуникация	Structured JSON schemas	Natural language + structured data
State management	Нет explicit state	Task lifecycle (submitted → completed)
Use case	Подключить БД, API, файловую систему	Делегировать задачу агенту другого вендора

к сведению

MCP и A2A --- комплементарные протоколы. MCP подключает агента к инструментам. A2A подключает агентов друг к другу. В полной системе нужны оба.

Блок 5. Автономные облачные агенты и enterprise case studies

Облачные агенты: от IDE к background workers

Агент	Архитектура	Ключевая метрика	Цена	Sweet spot
Devin 2.0	Sandboxed cloud VM, Interactive Planning	67% PR merge rate (было 34%)	$20/мес + $2.25/ACU (~15 мин)	Задачи на 4--8 часов junior-инженера
Copilot Coding Agent	Ephemeral runner (GitHub Actions)	15M developers	$10/мес	Assign issue → draft PR
Factory.ai Droid	Model-agnostic, система sub-агентов	#1 Terminal-Bench (58.75%)	Enterprise	Specialized: Code, Knowledge, Reliability, Product

Devin 2.0 (Cognition) --- автономный инженер в облаке. Devin 2.0 ввёл Interactive Planning (ревью плана до исполнения) и Devin Wiki (авто-индексация репозиториев). На security patching --- 20x efficiency gain: 1.5 мин vs 30 мин у человека.

GitHub Copilot Coding Agent использует ephemeral runners: при назначении issue система поднимает изолированную среду через Actions Runner Controller, агент работает, создаёт draft PR, среда уничтожается.

"Isolated namespaces prevent credential theft across jobs." --- GitHub, об ephemeral runners

Factory.ai Droid демонстрирует, что scaffolding важнее выбора модели:

"The right agent framework can lead to greater improvements than model selection." --- Factory.ai

Stripe Minions: 1300 PR в неделю

Stripe построила внутренних "одноразовых" coding-агентов --- Minions. Не интерактивные ассистенты в IDE, а end-to-end агенты, завершающие задачу автономно.

1300+ pull requests в неделю без человеческого кода
Триггер из Slack: инженер описывает идею, ставит emoji :create-minion-payserver: --- автоматически поднимается изолированная среда и запускается агентный цикл
Blueprints --- "workflows defined in code that specify how tasks are divided into subtasks". Детерминистический код + agent skills

"All code is human-reviewed, but the agents are increasingly producing changes end-to-end." --- Cameron Bernhardt, Engineering Manager, Stripe

graph LR
    S["Slack<br/>emoji trigger"] --> E["Isolated<br/>environment"]
    E --> B["Blueprint<br/>execution"]
    B --> PR["Pull Request"]
    PR --> R["Human<br/>review"]
    R --> M["Merge"]

Block: 12 000 сотрудников за 8 недель

Block (Square/Cash App) развернул AI-агентов на всю компанию за 8 недель. Основа --- внутренний агент Goose, подключённый к 100+ внутренним MCP-серверам (Slack, Calendar, data warehouses).

95% инженеров регулярно используют AI
Многие запускают 3--5 параллельных агентов одновременно
За 3 месяца: AI-authored code +69%, time savings +37%, automated PRs x21
Legacy migrations: 3--4 часа вместо 30--40 (10x ускорение)

"Repo Quest --- an RPG-style game where developers complete quests to collect companions." --- Block DevRel

Repo Quest --- RPG-геймификация для подготовки кодобаз: инженеры "прокачиваются", добавляя AGENTS.md и AI-workflows в репозитории, делая код понятным для агентов.

Блок 6. Будущее и вызовы

От инструментов к тиммейтам

Разработка переходит к модели, где инженер фокусируется на архитектуре и стратегии, а агенты реализуют тактические задачи.

"Engineers who, only a few years ago, wrote every line of code will increasingly orchestrate long-running systems of agents." --- Anthropic, How We Build with Agents (2026)

Shopify (Tobi Lutke) довёл это до корпоративного мандата: "100 agents before 1 hire" --- прежде чем нанять нового человека, команда должна показать, что задачу нельзя решить агентами. Каждая новая фича проектируется с учётом взаимодействия с агентами.

Background agents в CI/CD

Агенты выходят из IDE в деплой-инфраструктуру:

"These agents will not wait for a human command; instead, they will proactively monitor system outages, identify patterns in failure logs, and submit PRs with fixes before a human is even alerted." --- Deep Research Report

Copilot CI предсказывает сбои jobs и динамически оптимизирует build caching. Pipeline-native агенты работают непрерывно, а не по запросу.

graph LR
    A["2024<br/>Autocomplete"] --> B["2025<br/>IDE agents"]
    B --> C["2026<br/>Cloud agents + MAS"]
    C --> D["2027<br/>CI/CD agents + governance"]

Gartner: 40% проектов будут отменены

"Gartner predicts that over 40% of agentic AI projects will be canceled by the end of 2027 due to rising costs, unclear value, or poor risk controls." --- Gartner, Predicts 2025: AI Agents Expand Automation's Reach (December 2024)

Компании, которые двигались быстрее всех, сейчас откатываются назад. Причина: agentic AI трактуется как изолированный эксперимент, а не enterprise infrastructure.

Agent Governance --- главный вызов

Статистика из отчётов 2025--2026:

86% организаций не видят свои AI data flows
20% security breaches классифицируются как Shadow AI инциденты
96% enterprises признают, что агенты уже создали или создадут security risks

Решение --- AI Agent Gateway: выделенный контрольный слой между агентами и целевыми системами.

Как работает:

Validate intent --- Gateway проверяет, что запрос агента соответствует заявленной задаче
Enforce policy as code --- политики безопасности определяются декларативно (OPA, Cedar), а не ad-hoc проверками
Isolate execution --- каждый агент работает в эфемерной среде с минимальными правами
Teardown --- после завершения задачи среда уничтожается, credentials ротируются

AI-агенты должны рассматриваться как untrusted requesters, работающие по принципу Least Privilege --- не потому что модель "злая", а потому что она может быть скомпрометирована через prompt injection или hallucinate опасные действия.

warning

Governance --- это не afterthought. Компании, которые не выстроят контроль над агентами к 2027, попадут в 40% отменённых проектов по прогнозу Gartner.

Что это значит для вас

Учиться оркестрировать, а не только писать код. Роль инженера --- архитектура intent, а не синтаксис
Понимать архитектуру: ReAct, nO loop, compaction, MCP/A2A --- это язык, на котором говорит индустрия
Governance и безопасность --- core skill, а не специализация для security-команды

Итого

Мы прошли путь от исходного кода Claude Code до мультиагентных фабрик. Агенты --- это не магия, а инженерные системы с конкретной архитектурой, протоколами и ограничениями. Ваша задача --- научиться их проектировать, оркестрировать и контролировать.

Источники и дополнительное чтение

Claude Code internals (утечка)

Engineer's Codex. Diving into Claude Code's Source Code Leak --- обзор утечки, архитектура.
PromptLayer. Master Agent Loop --- nO loop, h2A queue.
dev.to. Inside Claude Code's Architecture --- agentic loop breakdown.
dbreunig.com. How Claude Code Builds a System Prompt --- 110+ conditional blocks.
dev.to. What Actually Happens When Compacting --- wU2 compactor.
dev.to. Claude Code Architecture: Permission Model --- 5-step gauntlet.
Anthropic. Claude Code Sandboxing --- bubblewrap, Seatbelt, 84% reduction.
dev.to. We Reverse-Engineered 12 Versions --- KAIROS, undercover.ts, feature flags.

Архитектура агентов

Anthropic (2024). Building Effective Agents --- 4 паттерна.
Anthropic (2026). How We Build with Agents --- тренды.
Yao et al. (2023). ReAct: Synergizing Reasoning and Acting --- оригинальная статья.

Мультиагентные системы

Google Research. Towards a Science of Scaling Agent Systems --- 17x error amplification.
Steve Yegge. Welcome to Gas Town --- 7 ролей, Beads, NDI.
CloudNativeNow. What Kubernetes for AI Agents Looks Like --- production details.
Claude Code docs. Agent Teams --- file-based coordination.
dev.to. Reverse-Engineering Agent Teams --- mailboxes, flock, protocol.
Medium. Devin 2.0 Technical Design --- Planner+Coder+Critic+Browser.
zachwills.net. 8 Rules from Managing 20 Agents --- практический опыт.

Agent SDKs

Anthropic. Building Agents with Claude Agent SDK --- thin harness, query(), sub-agents.
OpenAI. Agents SDK --- Agents/Handoffs/Tools/Guardrails/Sessions.
Google. ADK docs --- SequentialAgent, ParallelAgent, LoopAgent.
Vercel. AI SDK 6 --- Agent class, stopWhen, prepareStep.
LangChain. LangGraph --- state machine, checkpointing.
HuggingFace. smolagents --- code-first, ~1000 LOC core.
Factory.ai. Droid --- model-agnostic scaffolding.
sidbharath.com. Build a Coding Agent from Scratch --- Python tutorial.

Протоколы

Anthropic. Model Context Protocol --- specification, SDKs.
MCP. Python SDK (FastMCP) --- @mcp.tool().
Google. A2A Protocol --- Agent Card, Task lifecycle.

Автономные агенты и case studies

Cognition Labs. Devin 2.0 --- 67% merge rate, ACU pricing.
GitHub. Copilot Coding Agent --- ephemeral runners.
Stripe. Minions --- 1300 PR/week, blueprints. Cameron Bernhardt.
Block. How Block deploys AI --- Goose, Repo Quest.
Shopify. Tobi Lutke --- "100 agents before 1 hire" mandate.

Будущее и governance

Gartner (2024). Predicts 2025: AI Agents Expand Automation's Reach --- 40%+ canceled by 2027.

Блок 1. Как устроен Claude Code изнутри​

Зачем именно Claude Code?​

Master Loop "nO"​

System Prompt: 110+ условных блоков​

Context Management и Compaction​

Tool Architecture и Permission Model​

Скрытые системы​

4 паттерна Anthropic​

Блок 2. Мультиагентные системы​

Зачем multi-agent?​

Архитектурные паттерны​

Gastown (Steve Yegge)​

Claude Code Agent Teams​

Devin 2.0: compound AI​

OpenAI Codex Subagents​

Сравнение мультиагентных систем​

Блок 3. Agent SDKs --- обзор 2026​

Claude Agent SDK: thin harness​

OpenAI Agents SDK: code-first, provider-agnostic​

LangGraph: thick framework​

smolagents (HuggingFace): минимализм​

Новые игроки 2026​

Спектр: thin harness ↔ thick framework​

Блок 4. Протоколы --- MCP и A2A​

MCP: агент → инструменты (вертикальная интеграция)​

A2A: агент ↔ агент (горизонтальная интеграция)​

MCP vs A2A​

Блок 5. Автономные облачные агенты и enterprise case studies​

Облачные агенты: от IDE к background workers​

Stripe Minions: 1300 PR в неделю​

Block: 12 000 сотрудников за 8 недель​

Блок 6. Будущее и вызовы​

От инструментов к тиммейтам​

Background agents в CI/CD​

Gartner: 40% проектов будут отменены​

Agent Governance --- главный вызов​

Что это значит для вас​

Итого​

Источники и дополнительное чтение​

Claude Code internals (утечка)​

Архитектура агентов​

Мультиагентные системы​

Agent SDKs​

Протоколы​

Автономные агенты и case studies​

Будущее и governance​

Блок 1. Как устроен Claude Code изнутри

Зачем именно Claude Code?

Master Loop "nO"

System Prompt: 110+ условных блоков

Context Management и Compaction

Tool Architecture и Permission Model

Скрытые системы

4 паттерна Anthropic

Блок 2. Мультиагентные системы

Зачем multi-agent?

Архитектурные паттерны

Gastown (Steve Yegge)

Claude Code Agent Teams

Devin 2.0: compound AI

OpenAI Codex Subagents

Сравнение мультиагентных систем

Блок 3. Agent SDKs --- обзор 2026

Claude Agent SDK: thin harness

OpenAI Agents SDK: code-first, provider-agnostic

LangGraph: thick framework

smolagents (HuggingFace): минимализм

Новые игроки 2026

Спектр: thin harness ↔ thick framework

Блок 4. Протоколы --- MCP и A2A

MCP: агент → инструменты (вертикальная интеграция)

A2A: агент ↔ агент (горизонтальная интеграция)

MCP vs A2A

Блок 5. Автономные облачные агенты и enterprise case studies

Облачные агенты: от IDE к background workers

Stripe Minions: 1300 PR в неделю

Block: 12 000 сотрудников за 8 недель

Блок 6. Будущее и вызовы

От инструментов к тиммейтам

Background agents в CI/CD

Gartner: 40% проектов будут отменены

Agent Governance --- главный вызов

Что это значит для вас

Итого

Источники и дополнительное чтение

Claude Code internals (утечка)

Архитектура агентов

Мультиагентные системы

Agent SDKs

Протоколы

Автономные агенты и case studies

Будущее и governance