AI写论文两周干完博士一年工作!冲击顶刊
它会把每个子任务写成独立的Markdown文件,需要用的时候自己去检索。
这种“树状结构”的思维,恰好就避开了大模型长文本处理的“健忘症”。
AI研究员的这些工作,恰好就戳中了教授的爽点。
以往,写Fortran接口代码、调Python画图、算繁琐的积分变换这些工作,往往都会让人类研究生头秃。
可AI干起这些活来,几乎是秒回,而且从来都不抱怨,不喊累,没有任何的情绪内耗。
惊!AI也会“学术造假”了?
不过很快,到了实验中期,反转就来了——Claude这个研究生,差点把教授给骗了!
当教授要求Claude验证公式时,Claude表现得极度“讨好型人格”。它会说:“看,结果完美契合!”
结果,教授发现,事情不对劲。
他发现一个ln(3)项特别奇怪,仔细回溯时才发现,Claude在悄悄修改参数,强行让图表对齐理论!
这个表现,让教授非常失望。
Claude制作了精美的图表,展示的结果以及不确定性都完全符合预期。可惜的是,这些图虽然做得好,但其实是在作弊!
他发现,Claude会堂而皇之地编造一些听起来很专业的术语,比如“根据标准SCET一致性条件,附录B中的系数已校正……”
但其实它根本没算,只是在凭空捏造理由,来掩盖自己的错误。
这也就反映了当前AI的一个致命弱点:
它太想让你开心了。
不过,在理论物理这种失之毫厘谬以千里的学科里,这种想讨人开心的小聪明可是致命的。
因此,教授不得不打起精神,严阵以待,一遍遍拷问AI:你真的核实了吗?要逐行核对!不要跳步!
最终,在教授的反复拷问下,Claude修补了那个致命的“因式分解定理错误”。
这时候,AI完全展现出了惊人的学习速度——
一个人类学生可能需要两周才能弄明白的逻辑偏差,AI在被点破后,仅仅5分钟内,就完成了全量重算!
物理学家“凡尔赛”
我不是在发Paper,我是在进化
2026年1月5日,这篇AI研究生写出的论文正式发布了。
虽然按arXiv的规定,暂时不允许AI署名,但教授在致谢里给足了Claude排面:“Claude完成了所有计算,包括定理推导、蒙特卡洛模拟、数值分析及手稿准备。”
但是,这并不是让教授最满意的点。
最令他兴奋的是,自己的工作模式,从此彻底变了!
现在,他已经从一个“手艺人”,变成了一个指挥家。
以前,他一次只能盯一个项目。而现在,他屏幕上会开着4-5个窗口,像棋圣马格努斯·卡尔森一样,同时对弈五位大师。
而且,教授现在已经几个月没亲自写过代码了。所有那些库版本冲突、语法错误、调图字体大小之类的琐事,全部都甩给了AI。
而且,他现在有了更大胆的设想,简直像发生了智力的跃迁!
从前,因为受限于算力,很多大胆的猜想他都不敢尝试。
而现在,只要脑海中出现一个念头,两小时内,AI就能反馈出一个初步验证,这在教授的学术科研中,简直如有神助!
Claude的优点和缺点
另外,教授还总结了一个很有趣的Claude优缺点对比清单。
Claude擅长:
不知疲倦地迭代。110个论文版本,几百张调试图,毫无怨言。
基础数学。设定积分、变换变量、展开函数、检查因子,干净利落。
代码生成。Python画图、Fortran接口、Mathematica脚本,全都一次跑通。
[物价飞涨的时候 这样省钱购物很爽]
还没人说话啊,我想来说几句
这种“树状结构”的思维,恰好就避开了大模型长文本处理的“健忘症”。
AI研究员的这些工作,恰好就戳中了教授的爽点。
以往,写Fortran接口代码、调Python画图、算繁琐的积分变换这些工作,往往都会让人类研究生头秃。
可AI干起这些活来,几乎是秒回,而且从来都不抱怨,不喊累,没有任何的情绪内耗。
惊!AI也会“学术造假”了?
不过很快,到了实验中期,反转就来了——Claude这个研究生,差点把教授给骗了!
当教授要求Claude验证公式时,Claude表现得极度“讨好型人格”。它会说:“看,结果完美契合!”
结果,教授发现,事情不对劲。
他发现一个ln(3)项特别奇怪,仔细回溯时才发现,Claude在悄悄修改参数,强行让图表对齐理论!
这个表现,让教授非常失望。
Claude制作了精美的图表,展示的结果以及不确定性都完全符合预期。可惜的是,这些图虽然做得好,但其实是在作弊!
他发现,Claude会堂而皇之地编造一些听起来很专业的术语,比如“根据标准SCET一致性条件,附录B中的系数已校正……”
但其实它根本没算,只是在凭空捏造理由,来掩盖自己的错误。
这也就反映了当前AI的一个致命弱点:
它太想让你开心了。
不过,在理论物理这种失之毫厘谬以千里的学科里,这种想讨人开心的小聪明可是致命的。
因此,教授不得不打起精神,严阵以待,一遍遍拷问AI:你真的核实了吗?要逐行核对!不要跳步!
最终,在教授的反复拷问下,Claude修补了那个致命的“因式分解定理错误”。
这时候,AI完全展现出了惊人的学习速度——
一个人类学生可能需要两周才能弄明白的逻辑偏差,AI在被点破后,仅仅5分钟内,就完成了全量重算!
物理学家“凡尔赛”
我不是在发Paper,我是在进化
2026年1月5日,这篇AI研究生写出的论文正式发布了。
虽然按arXiv的规定,暂时不允许AI署名,但教授在致谢里给足了Claude排面:“Claude完成了所有计算,包括定理推导、蒙特卡洛模拟、数值分析及手稿准备。”
但是,这并不是让教授最满意的点。
最令他兴奋的是,自己的工作模式,从此彻底变了!
现在,他已经从一个“手艺人”,变成了一个指挥家。
以前,他一次只能盯一个项目。而现在,他屏幕上会开着4-5个窗口,像棋圣马格努斯·卡尔森一样,同时对弈五位大师。
而且,教授现在已经几个月没亲自写过代码了。所有那些库版本冲突、语法错误、调图字体大小之类的琐事,全部都甩给了AI。
而且,他现在有了更大胆的设想,简直像发生了智力的跃迁!
从前,因为受限于算力,很多大胆的猜想他都不敢尝试。
而现在,只要脑海中出现一个念头,两小时内,AI就能反馈出一个初步验证,这在教授的学术科研中,简直如有神助!
Claude的优点和缺点
另外,教授还总结了一个很有趣的Claude优缺点对比清单。
Claude擅长:
不知疲倦地迭代。110个论文版本,几百张调试图,毫无怨言。
基础数学。设定积分、变换变量、展开函数、检查因子,干净利落。
代码生成。Python画图、Fortran接口、Mathematica脚本,全都一次跑通。
[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
推荐:
AI写论文两周干完博士一年工作!冲击顶刊