🔔科技频道[奇诺分享-ccino.org]⚡️
3 小时前
IT之家
AI 老板 500 天模拟经营:多数模型亏惨,Claude Fable 5 独占鳌头
Telegraph
|
原文
Telegraph
AI 老板 500 天模拟经营:多数模型亏惨,Claude Fable 5 独占鳌头 - IT之家
IT之家 6 月 30 日消息,普林斯顿大学本月发布基准测试 CEO-Bench,模拟创业公司,评估 AI 模型担任企业首席执行官(CEO)的能力,结果多数模型破产。 CEO-Bench 主要面向企业经营场景,用于评估智能体在长期、多变量环境中的管理能力。该测试模拟创业公司运行 500 天,启动资金为 100 万美元(IT之家注:现汇率约合 680.4 万元人民币),要求模型连续处理定价、预算、竞争分析和战略制定等复杂关联事务。 该基准围绕着 AI 应对长期周期中的不确定性、在噪声环境中获取信息、适应变…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia