BlogPage 3 / 18

ClaudeストリーミングAPI設計——TTFT最適化と段階応答

Claude APIのSSEストリーミングでTTFT300ms台を実現する設計を解説。eager_input_streamingによるツール引数の段階配信とJSON蓄積パターン、本番での3つの落とし穴も示す。

モデルアップグレード時にAIエージェントの品質が維持されているかをシャドーモードで検証する評価設計を解説する。10〜25%のトラフィック並列採点でタスク完了率・根拠整合性・エラー率を比較し、安全に本番移行を判断する手順を示す。

AIエージェントのPII処理では匿名化・仮名化・マスキングの3手法を使い分けます。AIゲートウェイで自動検出し、可逆トークン化で多ターン文脈を保持しつつ、出力スキャンで漏洩を防ぐ設計パターンを解説します。

LLM APIはレート制限・コンテキスト超過・非決定論的拒否で失敗する。サーキットブレーカーとフォールバックチェーンでエンタープライズエージェントの耐障害性を設計する方法を解説する。

エンタープライズAIエージェント間通信のゼロトラスト設計を解説。SPIFFE/SPIREによる暗号ID、Istio AmbientでのmTLS強制、eBPFカーネル可視化の実装パターンと限界を示す。

AIエージェントのインシデントはP0〜P3の重大度で分類し、検知・封じ込め・根絶・復旧・ポストモーテムの5フェーズで対応する。検知シグナル・キルスイッチ設計・証跡収集の技術手順を解説する。

200,000件超の脆弱なMCPインスタンスが示す通り、AIエージェントのサプライチェーンは主要攻撃経路だ。ABOM設計と多層統制でMCP依存リスクを管理する手順を解説する。

MCPはエージェントとツールを接続する垂直プロトコル、A2Aはエージェント間委譲の水平プロトコルです。2026年のA2A v1.0仕様に基づき、SMBが最初に押さえるべき選択基準を解説します。

LLMジャッジには長さ・位置・ファミリーの3バイアスが混入します。月次ゴールドセット照合でCohen's κを0.6以上に保つキャリブレーション設計と、自己一貫性チェックの実装を解説します。

MCPのToolAnnotationsは4つのbooleanヒントでツールの副作用リスクを宣言するリスク語彙だ。readOnlyHint・destructiveHintなど設計判断と「危険な三つ組み」多層防御パターンを仕様から解説する。