也谈DeepSeek!

阳光普照行业应用 2025-02-20 10:42:43 120阅读 举报
来自于公众号: 数字化深度思考者

 理性地聊聊Deepseek,感觉这些日子DeepSeek(以下简称DS)炒的过🔥,其是否会象纳米技术、区块链、中台等一样,热炒之后,黯然匿声,科技发展的步代还是迈得沉稳一点好。

应警惕国内机构借DeepSeek爆火炒作“赶超美国”,科技“大跃进”不可取

     DS之所以爆火,主要原因有:
😄 ①训练成本:DeepSeek R1的训练成本只有ChatGPT的1/10到1/20。

💰 ②API调用费用:DS的成本每百万tokens只要16元,而ChatGPT高达438元!费用更低!

此举打破漂亮国的技术垄断,符合全球利益,刚刚,open AI被迫紧急上线Deep Research。

刚刚,OpenAI上线Deep Research!

    🐯③公开菜谱:人人都能当大厨

    DS主动开源,把所有模型代码和参数免费公开(MIT协议),人人都能玩Al,这几天网上到处是Deep seek的教学视频和评论文章,大到人工智能体将取代人类,小到用DS算命和给鸡娃取名,全民嗨翻!

    降本、免费、开源和普惠,DS想不🔥都难!


    一、起底DS的崛起

    DeepSeek在人工智能领域迅速崛起,其起源最早可以追溯到幻方算法改进,幻方量化基金公司干啥的就不细说。2019 年,DS创始人梁文锋开始投资 2亿元人民币成立一个单独的部门来开发自己的深度学习平台,称为“Fire-Flyer 1”,该基金在 2021 年投入了 10 亿元人民币,配备了 1万个英伟达A100 GPU芯片(英伟达GPU为A800和H800,最新更推出RTX50),对Fire-Flyer进行二次迭代,注意2021年后新型的GPU被禁售!

    2023年7月:DeepSeek正式成立,由幻方量化创始人梁文锋带领团队进军通用人工智能(AGI)领域。

    • 2023 年 11 月,DeepSeek 推出了 DeepSeek LLM,其参数多达 670 亿个,其性能接近 GPT-4。同月发布首个开源代码大模型DeepSeek Coder,支持多种编程语言的代码生成、调试和数据分析任务,完全开源且免费商用。

    • 2024 年 5 月,DeepSeek-V2 正式上线。

    • 2024 年 12 月,DeepSeek-V3 发布,基准测试表明其表现优于 Llama 3.1 和 Qwen 2.5,同时与 GPT-4o 和 Claude 3.5 Sonnet 相当,立即引爆业内关注。

    • 2025 年 1 月,第一代有推理能力的大模型模型DeepSeek-R1发布,以OpenAI o1 1/100不到的价格和卓越的性能,让全世界科技界意识到中国力量。


    • 二、DS的创新

      创新1:MoE技术、GRPO等优化算法

      由于国外GPU的禁售,春节前英伟达在CES展会上发布最新GPU——GeForce RTX 50系列等产品。

      英伟达超强GPU登场!AI PC的时代来了

      了解下国内GPU发展,

      一文了解GPU及国内信创主力军

      大道至简,回归本质!DS因缺乏GPU硬件,DS采用的专家混合 (MoE)技术,对训练要求高,对数据要求高,而传统AI则依赖海量标注数据,而R1通过纯强化学习(RL)自主进化推理能力,其独创的GRPO(组相对策略优化)算法,让模型在训练中涌现出“反思纠错”行为!

      此举揭开老美科技资本收割韭菜的遮羞布,原来Al并不需要多贵的硬件资源!想起一句话:凡是国际高端的技术,通常是中国没有掌握的;

      创新2:冷启动+蒸馏技术,低成本赋能小模型  

      当美国OpenAI等Al巨头还沉迷于“万亿参数竞赛”和耗费巨资血拼算力资源时,DeepSeek选择回归本质,原来玩转Al并不需要巨资,Al亦可普惠大众。

      这使我想到当年微软office办公软件和WPS的故事,WPS最初由求伯君一人一完成开发,当年亦是一段lT传奇故事!

      创新3:采用PTX而非CUDA

      英伟达的并行线程执行(PTX)是英伟达公司专为其图形处理器(GPU)设计的一种中间指令集架构,PTX 处于高级 GPU 编程语言(如 CUDA C/C++ )与低级机器代码(流式汇编,即 SASS)之间。

      Deepseek采用的PTX 是一种直接接近硬件底层的指令集架构,它将 GPU 视为数据并行计算设备,因而能够实现细粒度的优化操作,例如寄存器分配以及线程 / 线程束级别的调整,而这些功能是 CUDA C/C++ 等其他编程语言所无法实现的,一旦将 PTX 转换为 SASS,便会针对特定一代的英伟达 GPU 进行优化处理。

      可以将PTX理解为高级汇编语言,因为GPU资源的匮乏,DS团队必须极致利用算力资源!

      顺便了解下斤PGPU的PTX和计算机语言发展史↓

      GPGPU-sim课程基础|11 PTX:词法解析、语法解析

      计算机语言的发展简史

      第四代面向对象,而第五代为人工智能领域设计的语言,接近自然语言,强Al时代,普通人可以通过自然语言与机器对话,这是好事还是坏事,届时人类是否会被机器奴役,还真不一定!

      看哈看,不要不服!你现在不就正被智能手机奴役着!不信你三天身上不带手机试试!😄😄

      编程语言的五代变迁

      创新4:商业创新

      关于DS的商业创新,看看下面这篇Android如何从一家濒临倒闭的创业公司,发展成为统治全球移动计算设备的平台,就非常容易理解!

      最完整的安卓发展历史记录

      本人前不久写过一篇关于央国企数字化转型核心系统ERP的文章,培养技术生态和开发社区太重要!截止在目前,Al在2B领域依旧肤浅,Al+2B未来大有可为,但是落地相当不容易!恕直言,市面上太多关于Al在企业应用领域的文章十分肤浅!大多没有什么新的创意!

      谁能成功布局央国企高端ERP

           深层原因,中美科技战早已打响,从Z治角度,Deepseek的成功也值得大肆宣扬,普通百姓有几人真正了解什么Al,不过跟风,重在参与耳,打住不宜多说!年前特朗普刚上台即推出星门计划(Al曼哈顿计划),DS让所谓拟耗5000亿$巨资的星门计划情何以堪?

      三、DS的用人观

      从信息化到智能化,尤其是近些年,各种新技术、新理念、新术语、新模式层出不穷,尤其是互联网公司,在巨大技术变革和重大创新面前,有经验往往反而是一种束缚!此乃人性,曾有个笑话,一堆砖家聚在一起,一件大事基本就能搅黄!因为毎个砖家都有自己的一套理论和观点。

      传统AI行业,聘请经验丰富的老将是常态,许多中国本土的AI初创公司更倾向于招聘资深研究人员或拥有海外博士学位的人才。DS招聘凡其道而为之,偏爱没有工作履历但有具大潜力的年轻工程师!据称DS团队目前才一百来人,主要吸纳顶级AI人才,大部分是清华北大等大学在校生,一张白纸更好绘制蓝图!

      反观2B发展,金蝶用友招聘可以学上一学,别互相挖角,多挖些研究国际2B产品的年轻人才对!

四、2C慌了,DS在2B能成功布局吗?

DeepSeek一经发布,感觉2C圈的红衣大叔老周真的有点慌了,近期360疯狂砸广告,头条抖音到处可见其AI纳米搜索的广告,甚至亲自上阵推销AI纳米搜索。百度李彦宏似乎还比较淡定!

美国为什么千方百计对Deepseek痛下杀手?(红衣大叔周鸿祎视本人经常观看)

BAT集体上线DS大模型

重磅!阿里、百度、腾讯等集体上线DeepSeek大模型


本人更关注象Deepseek这种Al工具在2B企业领域的应用!早有砖家预测AI在数据应用、数据治理、预测分析、财务智能化、供应链智能和辅助决策等方面会赋能ERP系统,数字经济转型,央国企等国家队主动引领这场Al变革。

35 家央国企已落地 66 个大模型,国家队引领AI 变革

      有人预测2025年全球AI扩展应用有望迎来Agent元年,Al将从技术研发走向全面应用和普及!2B领域反倒是全球巨头Sap率先宣布集成Deep seek,因为其产品架构设计近乎完美,无论是接入别人产品还是被其他产品调用,非常容易!

高端管理软件-应用架构随笔(二)增强

    反观国内2B软件这方面还有巨大欠缺,国内的用友金蝶等此时应该非常纠结,毕竟已有自己的Al开发团队,估计以两家公司的产品,由于缺乏全球生态级的开放性,估计还不大好接入Deepseek!这就有点尴尬了!😄😄

        不知华为Meta ERP如何?组织好几个问题,有机会可以去现场观摩观摩!🔎🔎

标签: #ERP系统#

版权声明:
作者:阳光普照
链接:https://www.erpcool.com/p/72b4ddfea6d6f.html
来源:行业应用
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以点击 “举报”


登录 后发表评论
0条评论
还没有人评论过~