1. 首页
  2. 快讯
  3. 正文

OpenClaw代理任务评测:Gemini 3 Flash成功率95.1%,GPT-4o为85.2%

比特家园 3月8日消息,慢雾 CISO 23pads 在 X 平台发文表示,PinchBench 基准测试评估 AI 大语言模型在 OpenClaw 代理任务中的表现,结果显示 Gemini 3 Flash 处理 OpenClaw 任务成功率以 95.1% 领先,minimax-m2.1、kimi-k2.5 则分别以 93.6%、93.4% 分列 2、3 位。Claude Sonnet 4.5 则为 92.7%,GPT-4o 为 85.2%。

本分分类: 快讯

版权声明:本文由比特家园用户上传发布,不代表比特家园立场,转载联系作者并注明出处:https://yiyonghengchang.com/newsflash/67036.html

相关文章