🔔科技频道[奇诺分享-ccino.org]⚡️
3 小时前
IT之家
微软发布 ASSERT 开源框架:让开发者更高效地评测 AI 智能体和应用行为
Telegraph
|
原文
Telegraph
微软发布 ASSERT 开源框架:让开发者更高效地评测 AI 智能体和应用行为 - IT之家
IT之家 6 月 3 日消息,微软今日宣布推出开源框架 ASSERT(Adaptive Spec-driven Scoring for Evaluation and Regression Testing,自适应规范驱动评分),旨在将自然语言写成的行为规范直接转换为可执行的评估流程。 据介绍,ASSERT 能够从产品需求、政策文件或系统提示等文本出发,自动生成测试场景、数据集、评估指标和计分卡,并针对目标模型、应用或智能体运行测试。 该框架建立在这样一个前提之上:行为规范本身应当成为评估的核心输入,而非仅仅作为背景参考。ASSERT…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia