[谷歌] 免费的Gemini3 Flash,谷歌的无解阳谋
最逆天的一集是,真给3 Flash逼急眼了,它狠起来都把Gemini3 Pro也顺手给揍了。
在SWE-bench 验证的编码基准测试中,Gemini3 Flash 得分 78%,仅次于 GPT-5.2,超过了3 Pro。

更让其它大模型厂商们坐立难安的是,这么优秀的Gemini 3 Flash,价格老鼻子便宜了。
数据显示,它的 Token 价格只有输入 0.5 美元/百万 Token,输出 3 美元/百万 Token。
什么水平呢,同一个任务,它的花费能比 2.5 Pro 少三成,而速度反而还能快三倍。。。

所以,谷歌的人也放出话来,3 Flash的发布,能帮助许多公司更好地完成批量任务,按我们的理解,应该是给这些公司们减负(省钱省时间嘛)。
虽然听起来有点炸裂,但在我们在简单玩了一天后发现,速度这方面,3 Flash确实碾压了,但如果说真在处理任务的准确性啊啥的,要和3 Pro掰掰手腕,感觉还是有点吹过了。
比如我们让3 Flash写了一个“WebRTC的纯前端投屏”,结果是有页面但无法使用,而且我们反复让3 Flash修改,最终也没能debug好。

可当我们把代码扔给3 Pro,老大哥分分钟就给找出了问题所在。

[物价飞涨的时候 这样省钱购物很爽]
好新闻没人评论怎么行,我来说几句
在SWE-bench 验证的编码基准测试中,Gemini3 Flash 得分 78%,仅次于 GPT-5.2,超过了3 Pro。

更让其它大模型厂商们坐立难安的是,这么优秀的Gemini 3 Flash,价格老鼻子便宜了。
数据显示,它的 Token 价格只有输入 0.5 美元/百万 Token,输出 3 美元/百万 Token。
什么水平呢,同一个任务,它的花费能比 2.5 Pro 少三成,而速度反而还能快三倍。。。

所以,谷歌的人也放出话来,3 Flash的发布,能帮助许多公司更好地完成批量任务,按我们的理解,应该是给这些公司们减负(省钱省时间嘛)。
虽然听起来有点炸裂,但在我们在简单玩了一天后发现,速度这方面,3 Flash确实碾压了,但如果说真在处理任务的准确性啊啥的,要和3 Pro掰掰手腕,感觉还是有点吹过了。
比如我们让3 Flash写了一个“WebRTC的纯前端投屏”,结果是有页面但无法使用,而且我们反复让3 Flash修改,最终也没能debug好。

可当我们把代码扔给3 Pro,老大哥分分钟就给找出了问题所在。

[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
| 延伸阅读 | 更多... |
推荐: