BlogPage 3 / 12
マルチテナント・エージェント分離設計——4層でデータ越境を防ぐ
マルチテナント環境でAIエージェントを稼働させると、RAGの検索・ツール呼び出し・ログの3経路でテナント越えが起きる。データ層・実行環境・ID管理・可観測性の4層分離設計とPool/Bridge/Siloの選択基準を解説する。
Extended Thinking設計指針——adaptive thinkingとeffort制御
Claude推論モデルのextended thinkingをいつ使うべきか、adaptive thinkingへの移行とeffortパラメータによるコスト・レイテンシ最適化を設計判断の観点で整理します。
ポリシーエンジンでエージェントを守る——実行時ガードレールの設計
ポリシーエンジンは、AIエージェントがツールを実行する直前に割り込み、OPA Regoルールで許可/拒否を決定する実行時ガードレールです。SMBはローカルOPA、エンタープライズはMCPゲートウェイ層での集中管理が標準構成です。
LLM-as-a-judgeでエージェント品質を自動採点する評価基盤設計
LLM-as-a-judgeを用いてAIエージェントの品質を自動採点する方法を解説。採点ルーブリック・ゴールデンデータセット・回帰テストパイプラインの設計まで、大規模運用を前提としたエンタープライズ向け評価基盤の実装パターンを示します。
イベント駆動エージェント設計:非同期ワークフローで大規模化する
イベント駆動型エージェントはメッセージブローカーで疎結合化し大規模展開が可能になる。Kafka・EventBridgeの選定基準、Saga補償設計、分散トレーシングの要点をエンタープライズ向けに解説する。
LLMトークンコストの計装と配賦——AI FinOps入門
LLM/エージェントのトークンコストはOpenTelemetry GenAI規約でスパン計装し、cost_center・teamタグで部門配賦する。FinOps for AI初期設計から最適化施策まで実装の要点を整理。
A2AプロトコルとMCPの使い分け——認証・委譲設計の実装
A2Aはエージェント間の水平連携、MCPはLLMとツールの垂直統合を担う補完関係にある。エンタープライズではOAuth 2.0やmTLSでエージェントIDを認証し、Agent CardとスキルスコープでA2AとMCPを組み合わせて設計する。
プロンプトインジェクションをアーキテクチャで止める5層防御設計
OWASP LLM Top 10 2025の第1位に位置するプロンプトインジェクションは、モデル単体では防げない。入力検証・コンテキスト分離・権限サンドボックス・出力監査の5層で止める設計パターンを解説します。
LLMゲートウェイ設計——ルーティング・レート制限・配賦を一元管理
複数チームのLLM利用をゲートウェイ1点で統制する設計を解説。モデルルーティング・チーム別レート制限・コスト配賦の設計パターンとLiteLLM・Kong AIの実装例を示します。
MCPサーバー実装ガイド——ツール・リソース・プロンプトの公開設計
MCPサーバーでTools・Resources・Promptsを公開する実装手順を解説。inputSchema設計・2層エラーハンドリング・transport選択(stdio/Streamable HTTP)の設計パターン。