Warning: session_start(): open(/var/www/vhosts/vandaily.com/php_session/sess_6cf5dae0ad9c3c42647b820e3bcb3e36, O_RDWR) failed: No space left on device (28) in /var/www/vhosts/vandaily.com/httpdocs/includes/session_new.php on line 34

Warning: mb_substr(): Unknown encoding "_CHARSET2" in /var/www/vhosts/vandaily.com/httpdocs/includes/classes/news_core.php on line 1908

Warning: mb_strlen(): Unknown encoding "_CHARSET2" in /var/www/vhosts/vandaily.com/httpdocs/includes/classes/news_core.php on line 1909

Warning: mb_strrpos(): Unknown encoding "_CHARSET2" in /var/www/vhosts/vandaily.com/httpdocs/includes/classes/news_core.php on line 1911

Warning: mb_strrpos(): Unknown encoding "_CHARSET2" in /var/www/vhosts/vandaily.com/httpdocs/includes/classes/news_core.php on line 1914
Deepseek是真正的创新还是穿着AI皇帝的新衣? | 温哥华地产中心
   

[皇帝] Deepseek是真正的创新还是穿着AI皇帝的新衣?

昨天看到很多群里转发这条信息:“据彭博新闻周二报道,微软和 OpenAI 正在调查 ChatGPT 技术的数据输出是否被与 DeepSeek 相关的一个团体以未经授权的方式获取。


报道称,微软的安全研究人员观察到,在去年秋季,他们认为与 DeepSeek 有关的个人使用 OpenAI 的应用程序编程接口(API)提取了大量数据。”



许多人根据这条信息做出结论,认为Deepseek是小偷,Deepseek是Deepshit。许多人都在转发这篇题为《deepseek穿上Ai皇帝的新衣,精英集体蜕化为乌合之众》的文章,认为DeepSeek不过是基于OpenAI的GPT企业版API做了一些二次封装和微调,核心技术并未自研。

我认为这个结论是不准确的,把DS的蒸馏技术当作API二次封装显然是对AI的核心技术不够了解。

那么什么是蒸馏技术呢,业内人士一般称为model distillation(模型蒸馏), 也有人称为knowledge distillation(知识蒸馏),简单来说,就是将复杂大模型(教师模型)的知识“压缩”到更轻量的小模型(学生模型)中,通过模仿教师模型的输出(如概率分布),小模型保持了高性能并且减少了计算量。通俗一点讲,就是学生模仿老师的输出或中间特征,从而将老师的知识和方法(如推理能力、模式识别等)迁移到学生手里。

而API二次封装指的是一个App把终端用户的问题直接甩给另外一个App,得到回复后再把答案返回这边的App。

注意这两者最大的不同是在蒸馏技术里,学生模型学会了老师的推理方法,有了自己的模型,用户的问题是在学生模型里生成的,来自学生自己的App,而在后者,答案是来自另外一个App。

而DeepSeek的核心优化手段是知识蒸馏,目的是将大模型的智能推理方法高效迁移到自己的轻量化模型中,而非直接压缩数据,更不是简单的二次包装获取答案。

文章中提到DeepSeek调用OpenAI的核心证据是当问及”what model are you“时,Deepseek回答是chatGPT,或者”GTP-3”,但这其实不过是DS在Post Training Reinforcement learning (RL)的阶段调用了一些OpenAI的API 获取一些数据。而这种调用是允许的,并且是付费的。当然,这里的确有一个潜在的问题,那就是OpenAI的API调用,每一个账号都有一个Limit,不知道DS是不是用code或者多人多账号的方式绕过了这个Limit,这大概就是微软所说的未经授权的方式获取数据。


昨天和谷歌一个负责Gemini构建的技术主管聊了一阵,他说,其实大模型蒸馏是很常见的,业界一般就是调用比较强的大模型,获取几千至上万不等的prompts & responses用来做RL。DS的Thinking Model(推理模型)有很大的创新,业界公认的推理模型第一梯队包括openAI,谷歌和DS,Anthropic还没有自己的thinking model, Meta在这方面是落后的。AI业内人士早在半年前就关注DS了,Deepseek的技术是很靠谱的,梁文峰是业界公认的懂技术细节的领导者,放眼整个AI圈都找不到一把手CEO这么懂技术细节。DS的确是做的非常好,有许多创新,并且是改变了游戏规则,低成本也可以做AI开发,这必然会鼓励更多人加入AI的开发大军。

有人说,DS不过就是蒸馏技术里的佼佼者而已,答案也并非如此。DS的确是有不少自己的创新的, 用我的一位朋友,AI技术大拿张峥的话说,就是站在巨人肩膀上,长出了自己的脑袋。

那么DS到底有哪些创新呢?

首先是模型架构上有创新。

DS是以强化学习(RL)为核心驱动推理能力,传统大模型主要依赖监督微调(SFT),而 DS首次利用RL作为推理能力的核心训练方式。DeepSeek-R1-Zero 甚至完全采用 RL 训练,不依赖 SFT,当然也出现可读性差、语言混乱等问题。但这是首个公开研究证明 LLM 的推理能力可以纯粹通过RL 激励,而不需要 SFT。这个纯粹依赖RL作为训练方式有些像Deepmind的AlphaGo,通过不断地学习,不断地纠错,从一无所知直接练成一个绝世高手。这一突破为未来该领域的研究奠定了基础。

[加西网正招聘多名全职sales 待遇优]
好新闻没人评论怎么行,我来说几句
Prev Page123Next Page
Note:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • _VIEW_NEWS_FULL
     延伸阅读 More...
    一箭斩首"猪头皇帝" 江苏男发视频帐号被封 血腥诅咒?除他之外,东晋其余皇帝全部绝嗣
    逐玉:皇帝设局陷害忠臣,谢征身中迷魂催情香与樊长玉圆房! "皇帝在哪下罪己诏?"郑丽文提问犀利
    波斯皇帝去哪了?聊聊赢麻了的故事 中国史上唯一"选举"产生的皇帝(图
    她,成中国第一个休"皇帝"的女人 事故频发背后的"系统性合谋"与"避责狂欢":皇帝的新装
    苏联档案揭真相 他骗了康雍乾三代皇帝 任剑涛最新火爆演讲:皇帝制度为何卷土重来
     推荐:

    comments

    当前评论目前还没有任何评论,欢迎您发表您的看法。
    发表评论
    您的评论 *: 
    Security Code *:  Please input the number which is shown on the right picture
    The Captcha image  (Please input the number which is shown on the right picture)

    Copyright © 温哥华网, all rights are reserved.

    温哥华网为北美中文网传媒集团旗下网站