Перейти к основному содержимому

Л6. AI-агенты: архитектура, протоколы и будущее разработки

📺 Слайды к лекции

На прошлой лекции мы разобрали, что может пойти не так с AI-инструментами: уязвимости в сгенерированном коде, prompt injection, техдолг, приватность. Сегодня --- другой угол: как агенты устроены внутри, какие протоколы их связывают и куда это всё движется.

Начнём с того, что вскроем конкретный кодинг-агент до атомов --- Claude Code, чей исходный код утёк в марте 2026. Потом --- мультиагентные системы, SDK для построения своих агентов, протоколы коммуникации (MCP, A2A), и наконец --- реальные внедрения в Stripe, Block и Shopify.


Блок 1. Как устроен Claude Code изнутри

Зачем именно Claude Code?

31 марта 2026 года Anthropic случайно включила 59.8 МБ source map (cli.js.map) в npm-пакет @anthropic-ai/claude-code v2.1.88. Source map позволил восстановить оригинальный TypeScript --- 1 884 файла, 64 464 строки. Сообщество детально разобрало архитектуру, и теперь мы можем учиться на реальном коде, а не на маркетинговых описаниях.

"The entire source code of Claude Code --- 1,884 TypeScript files, 64,464 lines --- sitting in plain sight in the npm package. Bun generates source maps by default. Nobody turned it off." --- Engineer's Codex

Master Loop "nO"

Внутри Claude Code нет сложного state machine или мультиагентного роя. Ядро --- single-threaded master loop под кодовым именем nO. Работает на плоской истории сообщений:

while (tool_call) → execute tool → feed results → repeat

Цикл завершается, когда модель генерирует текстовый ответ без вызова инструментов. Это реализация ReAct (Thought → Action → Observation) в чистом виде --- и удивительно, насколько это просто.

# Концептуальный agentic loop (упрощённо)
messages = [{"role": "system", "content": build_system_prompt()}]
messages.append({"role": "user", "content": user_input})

while True:
response = await model.generate(messages)
messages.append(response)

if not response.tool_calls:
break # текстовый ответ — конец

for call in response.tool_calls:
result = await execute_tool(call)
messages.append({"role": "tool", "content": result})

h2A --- dual-buffer queue, работающая в паре с nO. Позволяет пользователю прервать или перенаправить агента прямо во время выполнения, без перезапуска всей сессии. Если вы видите, что Claude Code идёт не туда --- можно вмешаться на лету.

"Pause/resume support and ability to incorporate user interjections mid-task without requiring a full restart." --- PromptLayer: Master Agent Loop

Специализация ReAct в Claude Code --- Gather-Act-Verify: сначала собрать контекст (grep, чтение файлов), затем внести изменения, затем верифицировать (тесты, линтер). Агент не предполагает успех --- он проверяет.

graph LR
U["User input"] --> SP["System prompt<br/>assembly"]
SP --> M["Model call<br/>(nO loop)"]
M --> TC{"Tool call?"}
TC -->|"да"| T["Execute tool"]
T --> H["h2A queue<br/>(user steering)"]
H --> M
TC -->|"нет"| R["Text response"]
подсказка

Проекты с тестами работают с агентами радикально лучше --- у агента есть объективный сигнал на фазе Verify. Без тестов он гадает.

System Prompt: 110+ условных блоков

Утечка показала, что system prompt Claude Code --- не статическая строка. Это 110+ отдельных инструкций, собираемых на лету в зависимости от конфигурации.

"It's 110+ separate instructions, conditionally assembled based on your configuration." --- dbreunig.com: How Claude Code Builds a System Prompt

Структура сборки:

  1. Identity & security --- базовые правила поведения
  2. Task execution --- как подходить к задачам
  3. Tool definitions --- описания 40+ инструментов
  4. CLAUDE.md injection --- файлы считываются от корня FS до CWD, каждый уровень добавляет контекст
  5. Git snapshot --- текущая ветка, статус, последние коммиты
  6. Условные блоки --- Auto mode, Plan mode, наличие MCP-серверов, OS-специфика

Для оптимизации стоимости и prompt caching промпт разделён маркером __SYSTEM_PROMPT_DYNAMIC_BOUNDARY__. Всё до маркера --- статичный globally-cacheable контент (identity, tools). Всё после --- динамический session context (OS, git, CWD).

Итоговый размер: 2 300--3 600 токенов. На первый взгляд немного, но это только system prompt. CLAUDE.md файлы, tool results и история разговора добавляют остальное.

Context Management и Compaction

Контекстное окно --- 200K (Sonnet) или 1M (Opus) токенов. Но рано или поздно оно заканчивается. Для этого есть Compaction (кодовое имя wU2).

Compactor wU2 "automatically triggers at approximately 92% context utilization". --- dev.to: What Actually Happens When Compacting

wU2 не просто обрезает старые сообщения. Он делает отдельный LLM-вызов, который суммаризирует историю в <summary> теги. Важная информация переносится в долгосрочное хранилище (Markdown-файлы), а рабочая память очищается без потери ключевого контекста.

Tool Architecture и Permission Model

Из утечки: Claude Code содержит ~40 built-in tools. Каждый следует строгому JSON-RPC паттерну: JSON tool calls → sandboxed execution → результат как plain text.

Агент явно промптится предпочитать специализированные инструменты (Read, Edit, Glob, Grep) вместо raw shell-команд --- это делает действия структурированными, наблюдаемыми и верифицируемыми.

Permission model --- 5-step gauntlet. Каждый tool call проходит через:

  1. Внутренние проверки инструмента
  2. Sandbox policy
  3. Активный permission mode пользователя
  4. Settings allowlist/denylist (glob matching: Bash(npm:*), Read(~/project/**))
  5. Explicit allow/deny для опасных команд

MCP tools живут в namespace mcp__{server}__{tool}. Sandbox использует OS primitives: bubblewrap на Linux, Seatbelt на macOS. Результат: 84% сокращение permission prompts благодаря sandbox.

"Glob patterns like Bash(npm:*) or Read(~/project/**)." --- dev.to: Claude Code Architecture

Скрытые системы

Утечка обнажила несколько скрытых компонентов:

  • KAIROS --- экспериментальная "always-on" система памяти. В отличие от стандартного Claude Code, который реагирует на промпты, KAIROS работает в фоне с периодическим heartbeat: "anything worth doing right now?". Ночной процесс autoDream --- субагент, который консолидирует дневные логи, дедуплицирует и удаляет противоречия из памяти.
  • undercover.ts --- 90-строчный модуль, который при использовании сотрудниками Anthropic в open-source проектах автоматически удаляет следы AI-авторства из коммитов (Co-Authored-By, имена моделей). Промпт буквально говорит модели: "Do not blow your cover". Модуль не имеет off-switch.
  • 32 build-time feature flags, 120+ env vars, 26 скрытых slash-команд

4 паттерна Anthropic

В декабре 2024 Anthropic опубликовала "Building Effective Agents" --- четыре паттерна для построения агентных систем:

ПаттернСутьКогда использоватьПример из Claude Code
RoutingКлассификация → специализированный обработчикЧёткие категории задачPermission routing по типу tool call
ParallelizationСекционирование или голосованиеНезависимые подзадачиAgent Teams: параллельные sub-agents
Orchestrator-WorkersДинамическая декомпозиция и делегированиеПодзадачи нельзя предсказатьTeam Lead → spawned workers
Evaluator-OptimizerГенерация + критика в циклеЕсть критерии оценкиGather-Act-Verify cycle
к сведению

Эти паттерны не взаимоисключающие. Production-агенты вкладывают одни в другие: Orchestrator-Workers для координации + Evaluator-Optimizer для проверки каждого шага.


Блок 2. Мультиагентные системы

Зачем multi-agent?

Один агент ограничен контекстным окном и single planning loop. Решение: специализация + параллелизм. Но есть цена: Google Research показала, что ошибки в decentralized мультиагентных системах усиливаются до 17x vs 4.4x для centralized (hub-spoke).

Ошибки в децентрализованных агентных системах усиливаются до 17x по сравнению с 4.4x для централизованных. --- Google Research: Towards a Science of Scaling Agent Systems

Архитектурные паттерны

ПаттернКоординацияКонтролируемостьМасштабируемостьКогда использовать
Hub-spokeЦентральный оркестраторВысокаяСредняяПродакшн, критические задачи
PipelineПоследовательные стадииВысокаяНизкаяЧёткий workflow, ETL
SwarmPeer-to-peer, blackboardНизкаяВысокаяExploration, широкий поиск
HierarchicalДерево менеджер-подчинённыеСредняяВысокаяEnterprise, сложные org-структуры

Hub-spoke доминирует в продакшене из-за контролируемости. Pipeline --- самый простой для отладки: чёткие input/output контракты на каждом шаге. Swarm масштабируется, но отладка --- ночной кошмар из-за "emergent" координации. Hierarchical зеркалит корпоративную структуру.

Gastown (Steve Yegge)

Steve Yegge построил Gastown --- систему, которую он называет "Kubernetes для кодинг-агентов". Это 20--30 параллельных Claude Code инстансов, координируемых через tmux.

"Gas Town is an industrialized coding factory manned by superintelligent robot chimps." --- Steve Yegge, Welcome to Gas Town

7 ролей:

  • Overseer --- человек-PM
  • Mayor --- координатор, запускает "конвои"
  • Polecats --- эфемерные воркеры, каждый создаёт один MR и деактивируется
  • Refinery --- решает проблему merge queue: ребейзит или пересоздаёт MR-ы
  • Witness --- per-project watchdog, ловит зависших агентов
  • Deacon --- cross-project daemon-супервайзер
  • Dogs --- maintenance-воркеры для инфра-задач

Beads --- Git-backed data plane (SQLite + git). Всё состояние хранится в Git как структурированные данные, не в эфемерных чатах. Это обеспечивает NDI (Nondeterministic Idempotence): если Claude Code сессия упала или исчерпала контекст --- новая сессия читает Git-стейт и продолжает с того же места.

Стоимость: ~$100/час для 12--30 агентов. Это реальная промышленная система, работающая в продакшене.

graph TB
O["Overseer<br/>(человек)"] --> M["Mayor<br/>(координатор)"]
M --> P1["Polecat 1"]
M --> P2["Polecat 2"]
M --> P3["Polecat N"]
P1 & P2 & P3 --> R["Refinery<br/>(merge queue)"]
W["Witness"] -.-> P1 & P2 & P3
D["Deacon"] -.-> W
B["Beads<br/>(Git + SQLite)"] --- M & P1 & P2 & R

Claude Code Agent Teams

Встроенная мультиагентная система Claude Code. В отличие от Gastown, использует файловую координацию через ~/.claude/teams/ и ~/.claude/tasks/.

  • JSON mailboxes для обмена сообщениями между агентами
  • flock() для claiming задач --- атомарный захват без race conditions
  • idle_notification protocol --- агенты сообщают, когда свободны
  • Два типа: peer agents (параллельные равные) и child agents (подчинённые)

Файловая координация через JSON mailboxes с flock() для claiming задач. --- dev.to: Reverse-Engineering Agent Teams Protocol

Практические паттерны: параллельный research (несколько агентов исследуют разные аспекты), competing hypotheses (агенты предлагают разные решения, team lead выбирает), cross-layer coordination (frontend + backend агенты работают синхронно).

Devin 2.0: compound AI

Devin 2.0 использует compound AI multi-agent архитектуру: Planner + Coder + Critic + Browser --- четыре специализированных sub-модели, каждая в изолированной VM.

Внутри Devin: Planner + Coder + Critic + Browser --- compound AI multi-agent system. --- Medium: Deep Dive into Devin 2.0

Bottleneck: single planning loop всё равно последовательный. Несколько Coder-ов могут работать параллельно, но Planner --- единственная точка синхронизации.

OpenAI Codex Subagents

OpenAI Codex (GA март 2026) может порождать subagents --- дочерние агенты в изолированных cloud-контейнерах. Каждый subagent работает в собственном sandbox с файловой системой и сетевым доступом. Это позволяет Codex параллельно исследовать несколько подходов или работать над разными частями кодобазы одновременно.

Сравнение мультиагентных систем

GastownAgent TeamsDevin 2.0Codex Subagents
КоординацияGit-backed Beads + tmuxFile-based mailboxesPlanner orchestratorCloud containers
ПерсистентностьNDI --- crash-resilientФайловая, session-scopedVM snapshotsЭфемерная
Стоимость~$100/часВключена в Claude Code$20/мес + ACUВключена в Codex
ЗрелостьProduction (Yegge)ExperimentalProductionGA (март 2026)
warning

Практический опыт показывает: orchestration beats raw autonomy. "8 правил из недели управления 20 AI-агентами" --- структура важнее количества агентов. --- zachwills.net


Блок 3. Agent SDKs --- обзор 2026

Главный архитектурный вопрос: кто управляет оркестрацией --- модель или код? Ответ определяет выбор SDK.

Claude Agent SDK: thin harness

Философия Anthropic: "Claude Code как библиотека". Вся интеллектуальность в модели, scaffolding минимальный.

Claude Agent SDK раскрывает харнесс через единственную функцию query(), которая создаёт агентный цикл. Runtime --- "тупой цикл". --- Anthropic, Building Agents with Claude Agent SDK

from claude_agent_sdk import query

async for message in query(
prompt="Refactor the auth module to use JWT",
tools=["bash", "file_read", "file_write", "file_edit"],
):
print(message)
  • Built-in tools: bash, file ops, search --- глубокая OS-интеграция
  • Три типа sub-агентов: Fork (копия контекста), Teammate (изолированная панель + mailbox), Worktree (git-ветка)
  • Managed Agents API: /v1/agents endpoint, серверные сессии, без локальной инфраструктуры

OpenAI Agents SDK: code-first, provider-agnostic

OpenAI Agents SDK предлагает пять примитивов: Agents (конфигурация модели + инструкции), Handoffs (передача управления другому агенту), Tools (функции), Guardrails (валидация ввода/вывода), Sessions (персистентное состояние). Работает с 100+ LLM через Chat Completions API.

Два паттерна делегирования:

  • agents-as-tools --- агент вызывается как инструмент для подзадачи, результат возвращается вызывающему
  • handoffs --- полная передача управления, вызывающий агент больше не участвует

OpenAI Agents SDK: 5 примитивов --- Agents, Handoffs, Tools, Guardrails, Sessions. --- mem0.ai: OpenAI Agents SDK Review

LangGraph: thick framework

Полная противоположность. Разработчик явно определяет граф состояний:

from langgraph.graph import StateGraph

graph = StateGraph(AgentState)
graph.add_node("research", research_node)
graph.add_node("implement", implement_node)
graph.add_conditional_edges("implement", should_review)
app = graph.compile(checkpointer=MemorySaver())
  • v1.0 GA. Production: Klarna, Uber, JPMorgan
  • Typed state + nodes + conditional edges. Checkpointing, time-travel debugging
  • Философия: "разработчик контролирует каждый переход"

smolagents (HuggingFace): минимализм

~1 000 строк core. Агент пишет Python-код вместо JSON tool calls --- code-first в чистом виде.

from smolagents import CodeAgent, tool

@tool
def get_weather(city: str) -> str:
"""Get current weather for a city."""
return f"Weather in {city}: 22°C, sunny"

agent = CodeAgent(tools=[get_weather], model=model)
agent.run("What's the weather in Paris?")
  • Sandbox execution, Hub sharing --- переиспользование агентов
  • Мульти-модальность из коробки

smolagents --- code-first подход: агент пишет Python-код вместо JSON tool calls. --- HuggingFace blog: Introducing smolagents

Новые игроки 2026

Google ADK (Agent Development Kit) --- v1.26, Python/TypeScript/Go/Java:

  • Встроенные типы: SequentialAgent, ParallelAgent, LoopAgent
  • A2A и MCP support из коробки
  • Интеграция с Vertex AI, Cloud Run, GKE для deployment

Google ADK --- "code-first framework that applies engineering principles like versioning, testing, and modularity to AI". --- Google ADK docs

Vercel AI SDK 6 --- agent abstraction для web:

  • Новый Agent class с stopWhen / prepareStep control flow
  • Tool approval (human-in-the-loop), durable workflows
  • SSE streaming, React/Next.js интеграция

Спектр: thin harness ↔ thick framework

SDKПарадигмаLanguageStateMCPProduction
Claude Agent SDKThin harnessPythonContext compactionBuilt-inAnthropic
OpenAI Agents SDKCode-firstPython/TSSessionsPluginOpenAI
Google ADKMulti-agent typesPy/TS/Go/JavaVertex AIBuilt-inGoogle Cloud
Vercel AI SDK 6Web-nativeTSDurable workflowsPluginVercel
smolagentsCode executionPythonMinimalNoHuggingFace
LangGraphState machinePython/TSGraph checkpointsPluginKlarna, Uber

"The right agent framework can lead to greater improvements than model selection." --- Factory.ai

подсказка

Выбор SDK --- это выбор философии. Thin harness (Claude SDK, smolagents) --- доверяешь модели. Thick framework (LangGraph) --- контролируешь сам. Multi-agent types (Google ADK) --- где-то посередине. Большинство реальных систем комбинируют несколько подходов.

к сведению

Хотите понять, как работает агентный цикл "до костей"? Попробуйте построить coding agent с нуля на Python --- system prompt + tools + orchestration loop за ~100 строк. Это лучший способ прочувствовать разницу между thin и thick подходами.


Блок 4. Протоколы --- MCP и A2A

Агентам нужно общаться с внешним миром. Два протокола решают эту задачу на разных уровнях.

MCP: агент → инструменты (вертикальная интеграция)

Model Context Protocol (MCP) стандартизирует, как AI-модели взаимодействуют с внешними инструментами и данными. Архитектура: Host (Claude Desktop, Cursor) запускает Client, который подключается к MCP Server-ам.

"MCP solves this problem by standardizing how AI systems interact with external resources." --- MCP Documentation

Три примитива:

ПримитивКонтрольОписание
ToolsМодель решает когда вызватьВыполняемые операции (API calls, запросы к БД)
ResourcesПриложение предоставляетRead-only данные (файлы, записи, API-ответы)
PromptsПользователь выбираетШаблоны сообщений с динамическими аргументами
graph LR
H["Host<br/>(Claude Desktop, Cursor)"] --> C["MCP Client"]
C --> S1["MCP Server 1<br/>Tools, Resources, Prompts"]
C --> S2["MCP Server 2"]
C --> S3["MCP Server N"]

Как написать MCP-сервер на Python (FastMCP):

import httpx
from mcp.server.fastmcp import FastMCP

mcp = FastMCP("weather-server")

@mcp.tool()
async def get_alerts(state: str) -> str:
"""Get weather alerts for a US state.
Args:
state: Two-letter US state code (e.g. CA, NY)
"""
# type hints → JSON Schema автоматически
async with httpx.AsyncClient() as client:
response = await client.get(
f"https://api.weather.gov/alerts/active?area={state}"
)
return response.text

mcp.run(transport="stdio")

FastMCP автоматически генерирует JSON-схему из type hints и docstring --- не нужно вручную описывать inputSchema.

TypeScript SDK предлагает два уровня: Server (low-level, ручное управление) и McpServer (high-level, Zod-валидация, авторouting).

MCP Registry --- community-driven каталог серверов, аналог npm для MCP-экосистемы.

warning

Безопасность MCP подробно разобрана в Л5. Здесь мы фокусируемся на практике построения серверов, а не на attack surface.

A2A: агент ↔ агент (горизонтальная интеграция)

Google's Agent-to-Agent (A2A) протокол решает другую задачу: как независимые агенты от разных вендоров могут общаться друг с другом.

A2A фокусируется на "horizontal integration --- allowing autonomous agents to talk, negotiate, and delegate tasks to one another". --- Deep Research Report

Agent Card --- JSON "визитка" агента, доступная по стандартному URL /.well-known/agent.json:

{
"name": "code-review-agent",
"skills": ["python-review", "security-audit"],
"endpoint": "https://agent.example.com/a2a",
"auth": { "type": "oauth2" },
"formats": ["text/plain", "application/json"]
}

Как это работает:

  1. Client Agent читает Agent Card удалённого агента и определяет, подходит ли он для задачи
  2. Client отправляет Task (JSON-RPC 2.0 over HTTP)
  3. Remote Agent обрабатывает задачу, обновляя статус: submittedworkinginput-requiredcompleted
  4. Агенты обмениваются Messages (rich multi-part: текст, JSON, изображения) и получают результат в виде Artifact
  5. Для стриминга --- SSE, для async --- webhooks
graph LR
CA["Client Agent"] -->|"1. Read Agent Card"| AC["/.well-known/agent.json"]
CA -->|"2. Send Task"| RA["Remote Agent"]
RA -->|"3. Status updates (SSE)"| CA
RA -->|"4. Return Artifact"| CA

MCP vs A2A

MCPA2A
НаправлениеВертикальная (агент → инструменты)Горизонтальная (агент ↔ агент)
Execution modelInline tool calls во время reasoningDiscrete tasks и artifacts
КоммуникацияStructured JSON schemasNatural language + structured data
State managementНет explicit stateTask lifecycle (submitted → completed)
Use caseПодключить БД, API, файловую системуДелегировать задачу агенту другого вендора
к сведению

MCP и A2A --- комплементарные протоколы. MCP подключает агента к инструментам. A2A подключает агентов друг к другу. В полной системе нужны оба.


Блок 5. Автономные облачные агенты и enterprise case studies

Облачные агенты: от IDE к background workers

АгентАрхитектураКлючевая метрикаЦенаSweet spot
Devin 2.0Sandboxed cloud VM, Interactive Planning67% PR merge rate (было 34%)$20/мес + $2.25/ACU (~15 мин)Задачи на 4--8 часов junior-инженера
Copilot Coding AgentEphemeral runner (GitHub Actions)15M developers$10/месAssign issue → draft PR
Factory.ai DroidModel-agnostic, система sub-агентов#1 Terminal-Bench (58.75%)EnterpriseSpecialized: Code, Knowledge, Reliability, Product

Devin 2.0 (Cognition) --- автономный инженер в облаке. Devin 2.0 ввёл Interactive Planning (ревью плана до исполнения) и Devin Wiki (авто-индексация репозиториев). На security patching --- 20x efficiency gain: 1.5 мин vs 30 мин у человека.

GitHub Copilot Coding Agent использует ephemeral runners: при назначении issue система поднимает изолированную среду через Actions Runner Controller, агент работает, создаёт draft PR, среда уничтожается.

"Isolated namespaces prevent credential theft across jobs." --- GitHub, об ephemeral runners

Factory.ai Droid демонстрирует, что scaffolding важнее выбора модели:

"The right agent framework can lead to greater improvements than model selection." --- Factory.ai

Stripe Minions: 1300 PR в неделю

Stripe построила внутренних "одноразовых" coding-агентов --- Minions. Не интерактивные ассистенты в IDE, а end-to-end агенты, завершающие задачу автономно.

  • 1300+ pull requests в неделю без человеческого кода
  • Триггер из Slack: инженер описывает идею, ставит emoji :create-minion-payserver: --- автоматически поднимается изолированная среда и запускается агентный цикл
  • Blueprints --- "workflows defined in code that specify how tasks are divided into subtasks". Детерминистический код + agent skills

"All code is human-reviewed, but the agents are increasingly producing changes end-to-end." --- Cameron Bernhardt, Engineering Manager, Stripe

graph LR
S["Slack<br/>emoji trigger"] --> E["Isolated<br/>environment"]
E --> B["Blueprint<br/>execution"]
B --> PR["Pull Request"]
PR --> R["Human<br/>review"]
R --> M["Merge"]

Block: 12 000 сотрудников за 8 недель

Block (Square/Cash App) развернул AI-агентов на всю компанию за 8 недель. Основа --- внутренний агент Goose, подключённый к 100+ внутренним MCP-серверам (Slack, Calendar, data warehouses).

  • 95% инженеров регулярно используют AI
  • Многие запускают 3--5 параллельных агентов одновременно
  • За 3 месяца: AI-authored code +69%, time savings +37%, automated PRs x21
  • Legacy migrations: 3--4 часа вместо 30--40 (10x ускорение)

"Repo Quest --- an RPG-style game where developers complete quests to collect companions." --- Block DevRel

Repo Quest --- RPG-геймификация для подготовки кодобаз: инженеры "прокачиваются", добавляя AGENTS.md и AI-workflows в репозитории, делая код понятным для агентов.


Блок 6. Будущее и вызовы

От инструментов к тиммейтам

Разработка переходит к модели, где инженер фокусируется на архитектуре и стратегии, а агенты реализуют тактические задачи.

"Engineers who, only a few years ago, wrote every line of code will increasingly orchestrate long-running systems of agents." --- Anthropic, How We Build with Agents (2026)

Shopify (Tobi Lutke) довёл это до корпоративного мандата: "100 agents before 1 hire" --- прежде чем нанять нового человека, команда должна показать, что задачу нельзя решить агентами. Каждая новая фича проектируется с учётом взаимодействия с агентами.

Background agents в CI/CD

Агенты выходят из IDE в деплой-инфраструктуру:

"These agents will not wait for a human command; instead, they will proactively monitor system outages, identify patterns in failure logs, and submit PRs with fixes before a human is even alerted." --- Deep Research Report

Copilot CI предсказывает сбои jobs и динамически оптимизирует build caching. Pipeline-native агенты работают непрерывно, а не по запросу.

graph LR
A["2024<br/>Autocomplete"] --> B["2025<br/>IDE agents"]
B --> C["2026<br/>Cloud agents + MAS"]
C --> D["2027<br/>CI/CD agents + governance"]

Gartner: 40% проектов будут отменены

"Gartner predicts that over 40% of agentic AI projects will be canceled by the end of 2027 due to rising costs, unclear value, or poor risk controls." --- Gartner, Predicts 2025: AI Agents Expand Automation's Reach (December 2024)

Компании, которые двигались быстрее всех, сейчас откатываются назад. Причина: agentic AI трактуется как изолированный эксперимент, а не enterprise infrastructure.

Agent Governance --- главный вызов

Статистика из отчётов 2025--2026:

  • 86% организаций не видят свои AI data flows
  • 20% security breaches классифицируются как Shadow AI инциденты
  • 96% enterprises признают, что агенты уже создали или создадут security risks

Решение --- AI Agent Gateway: выделенный контрольный слой между агентами и целевыми системами.

Как работает:

  1. Validate intent --- Gateway проверяет, что запрос агента соответствует заявленной задаче
  2. Enforce policy as code --- политики безопасности определяются декларативно (OPA, Cedar), а не ad-hoc проверками
  3. Isolate execution --- каждый агент работает в эфемерной среде с минимальными правами
  4. Teardown --- после завершения задачи среда уничтожается, credentials ротируются

AI-агенты должны рассматриваться как untrusted requesters, работающие по принципу Least Privilege --- не потому что модель "злая", а потому что она может быть скомпрометирована через prompt injection или hallucinate опасные действия.

warning

Governance --- это не afterthought. Компании, которые не выстроят контроль над агентами к 2027, попадут в 40% отменённых проектов по прогнозу Gartner.

Что это значит для вас

  • Учиться оркестрировать, а не только писать код. Роль инженера --- архитектура intent, а не синтаксис
  • Понимать архитектуру: ReAct, nO loop, compaction, MCP/A2A --- это язык, на котором говорит индустрия
  • Governance и безопасность --- core skill, а не специализация для security-команды

Итого

Мы прошли путь от исходного кода Claude Code до мультиагентных фабрик. Агенты --- это не магия, а инженерные системы с конкретной архитектурой, протоколами и ограничениями. Ваша задача --- научиться их проектировать, оркестрировать и контролировать.


Источники и дополнительное чтение

Claude Code internals (утечка)

Архитектура агентов

Мультиагентные системы

Agent SDKs

Протоколы

Автономные агенты и case studies

  • Cognition Labs. Devin 2.0 --- 67% merge rate, ACU pricing.
  • GitHub. Copilot Coding Agent --- ephemeral runners.
  • Stripe. Minions --- 1300 PR/week, blueprints. Cameron Bernhardt.
  • Block. How Block deploys AI --- Goose, Repo Quest.
  • Shopify. Tobi Lutke --- "100 agents before 1 hire" mandate.

Будущее и governance