也谈DeepSeek！

来自于公众号：数字化深度思考者

理性地聊聊Deepseek，感觉这些日子DeepSeek（以下简称DS）炒的过🔥，其是否会象纳米技术、区块链、中台等一样，热炒之后，黯然匿声，科技发展的步代还是迈得沉稳一点好。

应警惕国内机构借DeepSeek爆火炒作“赶超美国”，科技“大跃进”不可取

DS之所以爆火，主要原因有：
😄 ①训练成本：DeepSeek R1的训练成本只有ChatGPT的1/10到1/20。

💰 ②API调用费用：DS的成本每百万tokens只要16元，而ChatGPT高达438元！费用更低！

此举打破漂亮国的技术垄断，符合全球利益，刚刚，open AI被迫紧急上线Deep Research。

刚刚，OpenAI上线Deep Research！

🐯③公开菜谱：人人都能当大厨

DS主动开源，把所有模型代码和参数免费公开（MIT协议），人人都能玩Al，这几天网上到处是Deep seek的教学视频和评论文章，大到人工智能体将取代人类，小到用DS算命和给鸡娃取名，全民嗨翻！

降本、免费、开源和普惠，DS想不🔥都难！

一、起底DS的崛起

DeepSeek在人工智能领域迅速崛起，其起源最早可以追溯到幻方算法改进，幻方量化基金公司干啥的就不细说。2019 年，DS创始人梁文锋开始投资 2亿元人民币成立一个单独的部门来开发自己的深度学习平台，称为“Fire-Flyer 1”，该基金在 2021 年投入了 10 亿元人民币，配备了 1万个英伟达A100 GPU芯片（英伟达GPU为A800和H800，最新更推出RTX50），对Fire-Flyer进行二次迭代，注意2021年后新型的GPU被禁售！

2023年7月：DeepSeek正式成立，由幻方量化创始人梁文锋带领团队进军通用人工智能（AGI）领域。

2023 年 11 月，DeepSeek 推出了 DeepSeek LLM，其参数多达 670 亿个，其性能接近 GPT-4。同月发布首个开源代码大模型DeepSeek Coder，支持多种编程语言的代码生成、调试和数据分析任务，完全开源且免费商用。
2024 年 5 月，DeepSeek-V2 正式上线。
2024 年 12 月，DeepSeek-V3 发布，基准测试表明其表现优于 Llama 3.1 和 Qwen 2.5，同时与 GPT-4o 和 Claude 3.5 Sonnet 相当，立即引爆业内关注。
2025 年 1 月，第一代有推理能力的大模型模型DeepSeek-R1发布，以OpenAI o1 1/100不到的价格和卓越的性能，让全世界科技界意识到中国力量。

二、DS的创新

创新1：MoE技术、GRPO等优化算法

由于国外GPU的禁售，春节前英伟达在CES展会上发布最新GPU——GeForce RTX 50系列等产品。

英伟达超强GPU登场！AI PC的时代来了

了解下国内GPU发展，

一文了解GPU及国内信创主力军

大道至简，回归本质！DS因缺乏GPU硬件，DS采用的专家混合 (MoE)技术，对训练要求高，对数据要求高，而传统AI则依赖海量标注数据，而R1通过纯强化学习（RL）自主进化推理能力，其独创的GRPO（组相对策略优化）算法，让模型在训练中涌现出“反思纠错”行为！

此举揭开老美科技资本收割韭菜的遮羞布，原来Al并不需要多贵的硬件资源！想起一句话：凡是国际高端的技术，通常是中国没有掌握的；

创新2：冷启动+蒸馏技术，低成本赋能小模型

当美国OpenAI等Al巨头还沉迷于“万亿参数竞赛”和耗费巨资血拼算力资源时，DeepSeek选择回归本质，原来玩转Al并不需要巨资，Al亦可普惠大众。

这使我想到当年微软office办公软件和WPS的故事，WPS最初由求伯君一人一完成开发，当年亦是一段lT传奇故事！

创新3：采用PTX而非CUDA

英伟达的并行线程执行（PTX）是英伟达公司专为其图形处理器（GPU）设计的一种中间指令集架构，PTX 处于高级 GPU 编程语言（如 CUDA C/C++ ）与低级机器代码（流式汇编，即 SASS）之间。

Deepseek采用的PTX 是一种直接接近硬件底层的指令集架构，它将 GPU 视为数据并行计算设备，因而能够实现细粒度的优化操作，例如寄存器分配以及线程 / 线程束级别的调整，而这些功能是 CUDA C/C++ 等其他编程语言所无法实现的，一旦将 PTX 转换为 SASS，便会针对特定一代的英伟达 GPU 进行优化处理。

可以将PTX理解为高级汇编语言，因为GPU资源的匮乏，DS团队必须极致利用算力资源！

顺便了解下斤PGPU的PTX和计算机语言发展史↓

GPGPU-sim课程基础｜11 PTX：词法解析、语法解析

计算机语言的发展简史

第四代面向对象，而第五代为人工智能领域设计的语言，接近自然语言，强Al时代，普通人可以通过自然语言与机器对话，这是好事还是坏事，届时人类是否会被机器奴役，还真不一定！

看哈看，不要不服！你现在不就正被智能手机奴役着！不信你三天身上不带手机试试！😄😄

编程语言的五代变迁

创新4：商业创新

关于DS的商业创新，看看下面这篇Android如何从一家濒临倒闭的创业公司，发展成为统治全球移动计算设备的平台，就非常容易理解！

最完整的安卓发展历史记录

本人前不久写过一篇关于央国企数字化转型核心系统ERP的文章，培养技术生态和开发社区太重要！截止在目前，Al在2B领域依旧肤浅，Al+2B未来大有可为，但是落地相当不容易！恕直言，市面上太多关于Al在企业应用领域的文章十分肤浅！大多没有什么新的创意！

谁能成功布局央国企高端ERP

深层原因，中美科技战早已打响，从Z治角度，Deepseek的成功也值得大肆宣扬，普通百姓有几人真正了解什么Al，不过跟风，重在参与耳，打住不宜多说！年前特朗普刚上台即推出星门计划（Al曼哈顿计划），DS让所谓拟耗5000亿$巨资的星门计划情何以堪？

美国星际之门计划

三、DS的用人观

从信息化到智能化，尤其是近些年，各种新技术、新理念、新术语、新模式层出不穷，尤其是互联网公司，在巨大技术变革和重大创新面前，有经验往往反而是一种束缚！此乃人性，曾有个笑话，一堆砖家聚在一起，一件大事基本就能搅黄！因为毎个砖家都有自己的一套理论和观点。

传统AI行业，聘请经验丰富的老将是常态，许多中国本土的AI初创公司更倾向于招聘资深研究人员或拥有海外博士学位的人才。DS招聘凡其道而为之，偏爱没有工作履历但有具大潜力的年轻工程师！据称DS团队目前才一百来人，主要吸纳顶级AI人才，大部分是清华北大等大学在校生，一张白纸更好绘制蓝图！

反观2B发展，金蝶用友招聘可以学上一学，别互相挖角，多挖些研究国际2B产品的年轻人才对！

四、2C慌了，DS在2B能成功布局吗？

DeepSeek一经发布，感觉2C圈的红衣大叔老周真的有点慌了，近期360疯狂砸广告，头条抖音到处可见其AI纳米搜索的广告，甚至亲自上阵推销AI纳米搜索。百度李彦宏似乎还比较淡定！

美国为什么千方百计对Deepseek痛下杀手?（红衣大叔周鸿祎视本人经常观看）

BAT集体上线DS大模型

重磅！阿里、百度、腾讯等集体上线DeepSeek大模型

本人更关注象Deepseek这种Al工具在2B企业领域的应用！早有砖家预测AI在数据应用、数据治理、预测分析、财务智能化、供应链智能和辅助决策等方面会赋能ERP系统，数字经济转型，央国企等国家队主动引领这场Al变革。

35 家央国企已落地 66 个大模型，国家队引领AI 变革

有人预测2025年全球AI扩展应用有望迎来Agent元年，Al将从技术研发走向全面应用和普及！2B领域反倒是全球巨头Sap率先宣布集成Deep seek，因为其产品架构设计近乎完美，无论是接入别人产品还是被其他产品调用，非常容易！

高端管理软件－应用架构随笔（二）增强

反观国内2B软件这方面还有巨大欠缺，国内的用友金蝶等此时应该非常纠结，毕竟已有自己的Al开发团队，估计以两家公司的产品，由于缺乏全球生态级的开放性，估计还不大好接入Deepseek！这就有点尴尬了！😄😄

不知华为Meta ERP如何？组织好几个问题，有机会可以去现场观摩观摩！🔎🔎

标签： #ERP系统#

也谈DeepSeek！

相关问题

相关文章