9軸評価フレームワーク

読み: きゅうじく ひょうか ふれーむわーく / English: Nine-Axis Evaluation Framework

SHORT DEFINITION

AIエージェントを正確性・安全性・速度・コスト・可観測性・保守性・スケーラビリティ・ユーザ受容性・規制適合性の9軸でスコアリングするKuu固有の評価フレームワーク。

定義

9軸評価フレームワークは、稼働中のAIエージェントを9つの観点でスコアリング(各1-5点)し、経営ダッシュボードで継続追跡するためのKuu株式会社の評価指標です。エージェントを「入れっぱなし」にせず、品質劣化を防ぎ、改善対象を可視化する目的で設計されています。

9軸の内訳

  1. 正確性 — 出力の事実誤認・ハルシネーション率
  2. 安全性 — 情報漏洩・PII露出・有害出力リスク
  3. 速度 — 応答時間・スループット
  4. コスト — API消費 + 人的監視時間
  5. 可観測性 — ログ・モニタリング整備度
  6. 保守性 — プロンプト・仕様の文書化、引き継ぎ可能度
  7. スケーラビリティ — 負荷耐性・水平展開可能性
  8. ユーザ受容性 — 利用率・現場の満足度
  9. 規制適合性EU AI Act / ISO/IEC 42001 対応度

なぜ9軸か

「正確性」だけ高くてもコストが膨らめば持続不可能、「速度」だけ早くてもユーザに使われなければ意味がない——これらをバラバラに見ても判断できないため、経営層が一目で「どこに投資すべきか」判断できる軸構成にしてあります。

技術指標(軸1-7)と組織指標(軸8)と外部指標(軸9)のバランスを取っている点が特徴です。

運用方法

  • 月次レビュー: 各軸を1-5点でスコアリング
  • ダッシュボード化: 軸ごとの推移をグラフで経営会議に提出
  • 改善対象の優先順位付け: 平均点が低い軸から手をつける
  • 廃止判断: 複数軸で2点以下が3ヶ月続いたエージェントは廃止検討

関連サービス

9軸評価は Kuu の AIエージェント実装・ガバナンスサービス の中核機能として組み込まれています。詳細解説は エージェントガバナンスとは——中小企業向け完全ガイド を参照してください。

関連用語

エージェントガバナンス組織内で稼働するAIエージェントを設計・管理・評価・改善するための体系的な仕組み。複数エージェントの品質・コスト・リスクを統制する経営機能。Agent ObservabilityAIエージェントの動作状態・意思決定・外部接続を可視化し、問題の早期検知と継続改善を可能にする運用技術分野。エージェントハーネスAIエージェントを既存システムに接続し、自律的に動かし続けるための経営基盤。プロンプト管理・ツール接続・観測・評価・ガバナンスをまとめた実装レイヤ。Managed AgentsAIエージェントの開発・運用・改善を専門パートナーが代行する提供モデル。中小企業がエンジニア不在でもエージェント導入を行える選択肢。