AI.news
主页教程研究工具模型AI创业讨论新闻WIKI🚀 创业库★ 投稿
AI+医疗机器人教育金融能源健康娱乐思考

Claude 通过率不到4%,SaaS-Bench撕碎了Computer-Use的「全自动办公」幻想

qbitai.com
分享到

UniPat AI 发布 SaaS-Bench 评测,Claude 等主流大模型在真实办公任务中完全通过率最高仅 3.8%,AI 全自动办公远未落地。

该内容来自 qbitai.com,版权归原作者所有

阅读完整原文 →