🚀 创业库 ★ 投稿

主页教程研究工具模型 AI创业讨论新闻 WIKI│🚀 创业库 ★ 投稿

AI+医疗机器人教育金融能源健康娱乐思考

← 返回首页·💬 讨论·原文链接 ↗

Claude 通过率不到4%，SaaS-Bench撕碎了Computer-Use的「全自动办公」幻想

分享到

UniPat AI 发布 SaaS-Bench 评测，Claude 等主流大模型在真实办公任务中完全通过率最高仅 3.8%，AI 全自动办公远未落地。…

该内容来自 qbitai.com，版权归原作者所有

阅读完整原文 →