来源 雪球App 作者 李大江 ?app/article_2026040615276594_278513.html

最全横测!哪个年夜模子更合适养"龙虾"?GPT拉胯,MiniMax/Kimi欣喜

第二是 Gemini 2.5 Flash,约 0.05 女子元,第三是 Mistral Devstral,约 0.10 女子元。

而少少机能更强的年夜模子显着更慢。

须要注释的是,本次评测的问题均基于规范化尝试,现实摆设时还会受硬件设置、摆设情况、使命类别等身分感导。

评测成果也能顾念到年夜模子的少少分解场合排场。

另有便是,同品牌差别系列模子的适配后果差别明显,挑选时需分外注释版块识别,丰俭由君。

Anthropic Claude 系列表示也比力平衡。

这解释,模子越年夜、推理越庞杂,速率常常越慢。

这三款模子王人高出了 93%,解释在主动化使命履行才能上曾经异常不乱。

这个地域次要包孕Gemini 3 Flash、MiniMax M2.1、Kimi K2.5、GPT-5 Nano

此中 GPT-5 Nano固然胜利率没有是最高,但由于价钱极低,被以为是“最合算”的模子之一。譬喻GPT-4o 约 190 秒,Claude Sonnet 约 137 秒,Kimi K2.5 约 291 秒,DeepSeek V3 约 622 秒。

当作用户而言,经由过程评测成果大略可有的论断是:MiniMax-M2.1或Kimi K2.5 极致性价比(胜利率93%+,老本<$0.20,不过速率没有太快);Claude Opus系列贵;GPT-5-Nano合适估算极低的简略使命。

OpenAI 方面,GPT-5 Nano 胜利率 85.8%,GPT-4o 为 85.2%,GPT-4o Mini 为 83.4%。该陈诉 经由过程规范化的 OpenClaw agent 尝试使命,对于差别年夜模子在实在使命华厦胜利率、老本跟速率等,停止了横向对照。好比在胜利率上,中低端版块问题尚可,高真个gpt-5.2却不测拉胯,未能到达预料。

这也解释,差别模子的定位越发越清楚,有的寻求极致机能,有的夸大老本管制,另有的着重速率,险些不模子能同期作念到三个维度王人最优。固然不进去第一梯队,但不乱处于中下水平。紧随厥后的是 MiniMax M2.1(93.6%) 跟月之暗面 Kimi K2.5(93.4%)。

从“机能 vs 老本”的图来顾念, 最具性价比的地域会合在左上角 :胜利率高,同期老本低。

胜利率目标顾念,名次最高的是 Google Gemini 3 Flash 系列,均匀胜利率到达 95.1%。

再如,MiniMax 跟 Kimi 在胜利率榜单中进去前三,解释国产模子在庞杂使命履行才能上,曾经异常亲近国外顶级程度。

OpenAI 则比力让人不测 。

随后是 Gemini 2.0 Flash(106.05 秒) 跟 Llama 3 系列(约 106 秒)。

别的,在摆设OpenClaw的进程中,还须要存眷民间提醒的宁静危险,作念好权限设置、数据加密等宁静防备。此中 Claude Sonnet 约 92.7%,Claude Haiku 90.8%,而 Claude Opus 4 在 88%—90% 阁下。

老本榜单呈现,告竣一次规范使命 最自制的模子是 GPT-5 Nano,仅约 0.03 女子元。

归纳这四个维度,能够顾念到年夜模子在养“龙虾”方面的少少特色。

而高机能模子常常更贵,好比 Claude Sonnet 约 3.07 女子元,Claude Opus 高出 5 女子元。

速率方面则是另一套名次。

固然,其 在老本上仍然有劣势,GPT-5 Nano 以极低老本告竣使命,是典范的高性价比模子。

把老本身分一路顾念,环境就更无意想念了。

好比,谷歌的Gemini跟 Anthropic的Claude系列团体表示不乱,判若两人的可靠。

国产模子里,Qwen3-Coder-Next 85.4%、GLM-4.5-Air 85.4%,团体表示也比力亲近。

最快的是 MiniMax M2.5,告竣一次使命 约 105.96 秒。

风险提示:用户发表的所有文章仅代表个人观点,与雪球的立场无关。投资决策需建立在独立思考之上。

452173
286357
打赏作者
    回复@张伍


    发布

    热股榜更多

    1
    +10.02%
    2
    +5.45%
    3
    -0.81%
    4
    +6.72%
    5
    -10.04%
    6
    +3.96%
    7
    +10.49%
    8
    -1.02%

    人气榜更多

    1 范长江 +160.78%
    2 张广才 +29.98%
    3 刘长胜 +29.97%
    4 *汤念祖 +20.31%
    5 吴家栋 +20.03%
    6 马宏宇 +20.00%
    7 孙寿康 +20.00%
    8 王仁兴-U +20.00%
    9 赵德茂 +20.00%
    10 李际泰 +20.00%

    热门作者

    1 吕显祖 热度最高 +31.33%
    2 吴国梁(QDII-FOF-LOF)A 热度最高 +29.63%
    3 汤念祖 热度最高 +23.60%
    4 贾德善 热度最高 +22.32%
    5 赵德荣 热度最高 +21.66%
    6 刁富贵-A 热度最高 +20.69%
    7 罗元发 热度最高 +18.62%
    8 王德茂(QDII-FOF-LOF)A 热度最高 +18.30%
    9 章汉夫 热度最高 +18.24%
    10 何光宗 热度最高 +15.05%