Kuu株式会社 エンジニアリング

Kuu株式会社 エージェントエンジニアリング

Kuu株式会社のエンジニアリングチーム。エージェントアーキテクチャ、MCP/A2Aプロトコル、評価・可観測性、エンタープライズAI基盤の設計・運用に関する技術記事を執筆しています。

エージェントアーキテクチャMCP / A2A プロトコルエージェント可観測性・評価エンタープライズAIプラットフォームAIエージェントセキュリティ

EXECUTED ARTICLES (7)

LLMトークンコストの計装と配賦——AI FinOps入門

LLM/エージェントのトークンコストはOpenTelemetry GenAI規約でスパン計装し、cost_center・teamタグで部門配賦する。FinOps for AI初期設計から最適化施策まで実装の要点を整理。

A2AプロトコルとMCPの使い分け——認証・委譲設計の実装

A2Aはエージェント間の水平連携、MCPはLLMとツールの垂直統合を担う補完関係にある。エンタープライズではOAuth 2.0やmTLSでエージェントIDを認証し、Agent CardとスキルスコープでA2AとMCPを組み合わせて設計する。

プロンプトインジェクションをアーキテクチャで止める5層防御設計

OWASP LLM Top 10 2025の第1位に位置するプロンプトインジェクションは、モデル単体では防げない。入力検証・コンテキスト分離・権限サンドボックス・出力監査の5層で止める設計パターンを解説します。

LLMゲートウェイ設計——ルーティング・レート制限・配賦を一元管理

複数チームのLLM利用をゲートウェイ1点で統制する設計を解説。モデルルーティング・チーム別レート制限・コスト配賦の設計パターンとLiteLLM・Kong AIの実装例を示します。

MCPサーバー実装ガイド——ツール・リソース・プロンプトの公開設計

MCPサーバーでTools・Resources・Promptsを公開する実装手順を解説。inputSchema設計・2層エラーハンドリング・transport選択(stdio/Streamable HTTP)の設計パターン。

AIエージェントのトレース計装——スパン設計とLLM呼び出し追跡

OpenTelemetry GenAI規約に基づきAIエージェントのLLM呼び出しをスパン階層で追跡します。3スパン型・トークン数・停止理由・コストを標準属性として計装し、Langfuseで可視化する設計パターンを解説します。

サブエージェント・オーケストレーションの設計パターン——プランナー/エグゼキューター分離と委譲設計

マルチエージェント構成でサブエージェントを分割・連携させる4つのオーケストレーションパターンと、コンテキスト引き継ぎ・最小権限・反復制限の委譲設計を解説します。