Kuu株式会社 エンジニアリング
Kuu株式会社 エージェントエンジニアリング
Kuu株式会社のエンジニアリングチーム。エージェントアーキテクチャ、MCP/A2Aプロトコル、評価・可観測性、エンタープライズAI基盤の設計・運用に関する技術記事を執筆しています。
EXECUTED ARTICLES (7)
LLMトークンコストの計装と配賦——AI FinOps入門
LLM/エージェントのトークンコストはOpenTelemetry GenAI規約でスパン計装し、cost_center・teamタグで部門配賦する。FinOps for AI初期設計から最適化施策まで実装の要点を整理。
A2AプロトコルとMCPの使い分け——認証・委譲設計の実装
A2Aはエージェント間の水平連携、MCPはLLMとツールの垂直統合を担う補完関係にある。エンタープライズではOAuth 2.0やmTLSでエージェントIDを認証し、Agent CardとスキルスコープでA2AとMCPを組み合わせて設計する。
プロンプトインジェクションをアーキテクチャで止める5層防御設計
OWASP LLM Top 10 2025の第1位に位置するプロンプトインジェクションは、モデル単体では防げない。入力検証・コンテキスト分離・権限サンドボックス・出力監査の5層で止める設計パターンを解説します。
LLMゲートウェイ設計——ルーティング・レート制限・配賦を一元管理
複数チームのLLM利用をゲートウェイ1点で統制する設計を解説。モデルルーティング・チーム別レート制限・コスト配賦の設計パターンとLiteLLM・Kong AIの実装例を示します。
MCPサーバー実装ガイド——ツール・リソース・プロンプトの公開設計
MCPサーバーでTools・Resources・Promptsを公開する実装手順を解説。inputSchema設計・2層エラーハンドリング・transport選択(stdio/Streamable HTTP)の設計パターン。
AIエージェントのトレース計装——スパン設計とLLM呼び出し追跡
OpenTelemetry GenAI規約に基づきAIエージェントのLLM呼び出しをスパン階層で追跡します。3スパン型・トークン数・停止理由・コストを標準属性として計装し、Langfuseで可視化する設計パターンを解説します。
サブエージェント・オーケストレーションの設計パターン——プランナー/エグゼキューター分離と委譲設計
マルチエージェント構成でサブエージェントを分割・連携させる4つのオーケストレーションパターンと、コンテキスト引き継ぎ・最小権限・反復制限の委譲設計を解説します。