如果是前端界面,且有设计图,那么 gemini 2.5 pro 比 claude-3.7-sonnet-thinking 强一些。他对于图形界面逻辑的理解比其他大模型优秀。如果是在既有程序上的修改,或者 debug 。claude-3.7-sonnet-thinking 更理性一点,gemini 2.5 pro 有些过于激进。而且管的太多。btw:copilot 的 gemini 2.5 pro 明显有问题,至于说是故意的负优化还是提示词没写好,就不得而知了。
通常情况下简单场景最优的:claude 3.5通常情况下有一定难度的场景最优的:claude 3.7 + 思考模式上下文少,只需要短输出的:gpt o4-mini上下文长度中等,可能需要较长输出,且有一定难度的:claude 3.7 + 思考模式上下文长度长,可能需要较长输出,但不怎么难的:gemini 2.5 pro + 思考模式上下文长度长,需要较长输出,还有难度的:要么拆分处理,要么 gpt o3 ,其他的犯病概率较高