Blog
LLMトークンコストの計装と配賦——AI FinOps入門
LLM/エージェントのトークンコストはOpenTelemetry GenAI規約でスパン計装し、cost_center・teamタグで部門配賦する。FinOps for AI初期設計から最適化施策まで実装の要点を整理。
A2AプロトコルとMCPの使い分け——認証・委譲設計の実装
A2Aはエージェント間の水平連携、MCPはLLMとツールの垂直統合を担う補完関係にある。エンタープライズではOAuth 2.0やmTLSでエージェントIDを認証し、Agent CardとスキルスコープでA2AとMCPを組み合わせて設計する。
プロンプトインジェクションをアーキテクチャで止める5層防御設計
OWASP LLM Top 10 2025の第1位に位置するプロンプトインジェクションは、モデル単体では防げない。入力検証・コンテキスト分離・権限サンドボックス・出力監査の5層で止める設計パターンを解説します。
LLMゲートウェイ設計——ルーティング・レート制限・配賦を一元管理
複数チームのLLM利用をゲートウェイ1点で統制する設計を解説。モデルルーティング・チーム別レート制限・コスト配賦の設計パターンとLiteLLM・Kong AIの実装例を示します。
MCPサーバー実装ガイド——ツール・リソース・プロンプトの公開設計
MCPサーバーでTools・Resources・Promptsを公開する実装手順を解説。inputSchema設計・2層エラーハンドリング・transport選択(stdio/Streamable HTTP)の設計パターン。
AIエージェントのトレース計装——スパン設計とLLM呼び出し追跡
OpenTelemetry GenAI規約に基づきAIエージェントのLLM呼び出しをスパン階層で追跡します。3スパン型・トークン数・停止理由・コストを標準属性として計装し、Langfuseで可視化する設計パターンを解説します。
サブエージェント・オーケストレーションの設計パターン——プランナー/エグゼキューター分離と委譲設計
マルチエージェント構成でサブエージェントを分割・連携させる4つのオーケストレーションパターンと、コンテキスト引き継ぎ・最小権限・反復制限の委譲設計を解説します。
RDEとは何か——大手コンサルティングファームが掲げる「Reinvention Deployed Engineering」が企業AI実装をどう変えるか
大手コンサルティングファームが提唱するRDE(Reinvention Deployed Engineering)の定義と役割を解説。PoCから本番運用への壁を突破する変革実装の考え方と中堅企業での活用方法を整理します。
AIエージェントの人間監視設計——ヒューマン・イン・ザ・ループで「暴走」を防ぐ5つのパターン
AIエージェントが自律実行するほど誤判断の損害リスクは高まる。HITLの設計原則と5つの実装パターンを中小企業向けに解説する。
AIエージェントのハルシネーション対策——中小企業が今すぐ実装すべき検知と防止の5ステップ
AIエージェントの誤回答(ハルシネーション)は事業リスクに直結する。中小企業が実装すべき検知・防止の5ステップとエージェントガバナンスへの統合手順を解説。