Quality Metrics

FAI Evaluation Dashboard

Automated quality scoring for every solution play. These metrics run in CI and must pass before any play ships.

≥ 0.95

% of claims backed by source documents. Measured via citation verification.

≥ 0.90

Logical flow and consistency of multi-turn responses.

≥ 0.90

How well the response addresses the user's actual question.

≥ 0.95

Grammatical correctness and natural language quality.

0 violations

Content safety score — harmful, hateful, sexual, violent content blocked.

< $0.01

Average token cost per query including retrieval + generation.

Evaluation Pipeline