AI写论文两周干完博士一年工作!冲击顶刊
AI的解法见链接https://www-cdn.anthropic.com/c993ead637f1a102fe1f5346e89f59e82c579b37.pdf
为什么要给AI这个课题?原因很简单,Schwartz自己很理解这个问题,作为量子场论的权威,他写过这个领域的教科书。
他知道坑在哪,也知道标准答案是什么样。“如果连这种我已知答案、能逐行检查的题目AI都做不了,那更别说那些需要创造力的前沿问题了。”
可以说,这就像一场“带教实验”——教授想知道:AI到底是真懂,还是在装模作样?
两周,110版草稿,3600万Token
实验开始,教授建立了一套严苛的规则——禁止套娃。
过程中,只能通过文本给Claude指令;不直接编辑任何文件;不粘贴自己的计算结果;完全让Claude自己跑代码、改bug、做图、写文章。
接下来,实验开始了。
整个实验的过程,简直就是一场算力的豪赌。
短短两周内,Claude 4.5生成了110个独立版本的草稿,消耗了3600万个Token(相当于读了上百部《红楼梦》),跑了40多小时的本地CPU模拟计算!

三天,Claude就写出20页论文了
具体来说,教授让Claude按以下步骤,干了三件事。
第一件,就是定计划。
他让Claude、GPT和Gemini各自出一个研究方案,然后把三个方案合并、优化,最终拆分成7个阶段、102个任务。
第二,是搭结构。
他用Claude Code建立了一个树状目录,不是塞给AI一个几百页的对话上下文,而是让它自己维护一堆markdown文件,每个阶段一个汇总,每个任务一个详情。
每个任务都有明确目标:比如“任务1.1:回顾BSZ论文”“任务1.2:回顾Catani-Webber论文”。
Claude需要什么就去查什么,而不是死记硬背。
第三,就是逐级推进。
在这个步骤里,Claude需要一个阶段一个阶段地推进下列任务:运动学、NLO结构、SCET分解、异常维度、求和、匹配、文档。每个阶段大约15-35分钟,整个核心计算只用了2.5小时。
在初稿中,Claude进行了模拟(直方图)和分析计算(实线), 发现两者高度吻合。
结果,到了第三天,Claude已经完成了65个任务,写出了第一篇20页的LaTeX论文草稿,有公式,有图表,还有参考文献。
论文草稿地址:https://www-cdn.anthropic.com/f6381ceefdfb6ead62ae185c4bd4b555c8a584fc.pdf
最让人类头秃的工作,AI都干了
最神奇的地方,就在于AI的自我管理能力了。
教授发现,现在的AI竟然已经神奇地学会了“分而治之”。
比如在第二阶段,Claude会自己制定一个包含102个子任务的“作战计划”,横跨运动学、因式分解、数值模拟等七大阶段。
在教授眼里,Claude已经不再是一个简单的对话框,而是一个“首席研究员”!
[物价飞涨的时候 这样省钱购物很爽]
这条新闻还没有人评论喔,等着您的高见呢
为什么要给AI这个课题?原因很简单,Schwartz自己很理解这个问题,作为量子场论的权威,他写过这个领域的教科书。
他知道坑在哪,也知道标准答案是什么样。“如果连这种我已知答案、能逐行检查的题目AI都做不了,那更别说那些需要创造力的前沿问题了。”
可以说,这就像一场“带教实验”——教授想知道:AI到底是真懂,还是在装模作样?
两周,110版草稿,3600万Token
实验开始,教授建立了一套严苛的规则——禁止套娃。
过程中,只能通过文本给Claude指令;不直接编辑任何文件;不粘贴自己的计算结果;完全让Claude自己跑代码、改bug、做图、写文章。
接下来,实验开始了。
整个实验的过程,简直就是一场算力的豪赌。
短短两周内,Claude 4.5生成了110个独立版本的草稿,消耗了3600万个Token(相当于读了上百部《红楼梦》),跑了40多小时的本地CPU模拟计算!

三天,Claude就写出20页论文了
具体来说,教授让Claude按以下步骤,干了三件事。
第一件,就是定计划。
他让Claude、GPT和Gemini各自出一个研究方案,然后把三个方案合并、优化,最终拆分成7个阶段、102个任务。
第二,是搭结构。
他用Claude Code建立了一个树状目录,不是塞给AI一个几百页的对话上下文,而是让它自己维护一堆markdown文件,每个阶段一个汇总,每个任务一个详情。
每个任务都有明确目标:比如“任务1.1:回顾BSZ论文”“任务1.2:回顾Catani-Webber论文”。
Claude需要什么就去查什么,而不是死记硬背。
第三,就是逐级推进。
在这个步骤里,Claude需要一个阶段一个阶段地推进下列任务:运动学、NLO结构、SCET分解、异常维度、求和、匹配、文档。每个阶段大约15-35分钟,整个核心计算只用了2.5小时。
在初稿中,Claude进行了模拟(直方图)和分析计算(实线), 发现两者高度吻合。
结果,到了第三天,Claude已经完成了65个任务,写出了第一篇20页的LaTeX论文草稿,有公式,有图表,还有参考文献。
论文草稿地址:https://www-cdn.anthropic.com/f6381ceefdfb6ead62ae185c4bd4b555c8a584fc.pdf
最让人类头秃的工作,AI都干了
最神奇的地方,就在于AI的自我管理能力了。
教授发现,现在的AI竟然已经神奇地学会了“分而治之”。
比如在第二阶段,Claude会自己制定一个包含102个子任务的“作战计划”,横跨运动学、因式分解、数值模拟等七大阶段。
在教授眼里,Claude已经不再是一个简单的对话框,而是一个“首席研究员”!
[物价飞涨的时候 这样省钱购物很爽]
| 分享: |
| 注: | 在此页阅读全文 |
推荐:
AI写论文两周干完博士一年工作!冲击顶刊