wuxiaolong89
V2EX  ›  问与答

阿里最新的模型 QWQ-32B,大伙用下来感觉如何啊?

  •  
  •   wuxiaolong89 · Mar 7, 2025 · 3223 views
    This topic created in 472 days ago, the information mentioned may be changed or developed.
    14 replies    2025-03-07 19:27:27 +08:00
    ShadowPower
        1
    ShadowPower  
       Mar 7, 2025 via Android
    写代码感觉和 o3 mini 差不多,比不过 r1 ,但也算能用
    好处是量化之后一块 3090 就能跑,速度还挺快
    niubilewodev
        2
    niubilewodev  
       Mar 7, 2025
    感觉思考话太多了。
    privil
        3
    privil  
       Mar 7, 2025   ❤️ 1
    “小红有两个姐姐和四个妹妹,她的四个妹妹中年龄第三小的小青总共有几个姐姐?” 这个问题能直接让 QWQ-32B 懵逼
    dongfanga
        4
    dongfanga  
       Mar 7, 2025
    @privil 思考是对的,但回答的答案是错的
    lowly
        5
    lowly  
       Mar 7, 2025
    @privil 你这个问题,刚试了下
    文心一言,给的是三个
    通义千问,给的是三个
    DeepSeek V3 给的结果是 3
    DeepSeek R1 直接陷在思考中,不断自我怀疑是 3 还是 5
    GPT 没开思考是 5 个,开了思考 4 个
    privil
        6
    privil  
       Mar 7, 2025
    @dongfanga #4
    @lowly #5
    Claude 3.7 Sonnet 开了思考直接秒出结果 6 秒完美解决,思维路径和人一样。
    privil
        7
    privil  
       Mar 7, 2025


    @dongfanga #4
    @lowly #5
    lowly
        8
    lowly  
       Mar 7, 2025   ❤️ 1
    @privil 各 AI 答案不统一,主要是这个问题在于小红四个妹妹中年龄第三小的小青总共有几个姐姐,这是很容易造成死循环,为什么呢,文字描述中的第三小,这语文角度来说,是很容易被定义歧义的句子
    luoyide2010
        9
    luoyide2010  
       Mar 7, 2025
    幻觉比较严重,知识库也不大的样子,让他分析一部 16 年热门的音乐剧结局,内容基本对不上
    youthfire
        10
    youthfire  
       Mar 7, 2025
    基于 3 楼的问题
    Claude 3.7 ,不开思考,正确 - 秒出
    Grok3, 无论是否思考,都错误
    Deepseek r1, 不开思考,正确
    Qwen2.5 14b ,错误
    Qwq 32b, 连续 2 次崩溃
    bzw875
        11
    bzw875  
       Mar 7, 2025
    谷歌的 Gemini 的 token 输出快如闪电
    privil
        12
    privil  
       Mar 7, 2025
    @lowly #8 有道理,确实,这居然主要是语文问题!震惊
    dongfanga
        13
    dongfanga  
       Mar 7, 2025
    @privil 的确是语文问题,看大模型怎么识别,是把小青放在倒数第二还是倒数第三
    privil
        14
    privil  
       Mar 7, 2025
    @dongfanga #13 如果大模型能同时给出两个答案,就真的成了。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2421 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 40ms · UTC 16:10 · PVG 00:10 · LAX 09:10 · JFK 12:10
    ♥ Do have faith in what you're doing.