以及代码生成和 debug 应该看作同样的任务,还是说应该作为不同的任务呢?是否会有不同模型更擅长不同语言的生成这种情况?
还有,考虑到上下文的限制,Gemini 是否依然有最长的上下文?对于长代码的处理,哪个模型更推荐呢?
还有,考虑到上下文的限制,Gemini 是否依然有最长的上下文?对于长代码的处理,哪个模型更推荐呢?
1
FgHh07ObvBiST5po Dec 4, 2024
claude 毋庸置疑
|
2
xuefeng0578 Dec 4, 2024
|
4
xuefeng0578 Dec 4, 2024
上面发了几个 benchmark 链接,可以自己看看
|
5
Wkj1998 Dec 4, 2024
Gemini ,4
|