(图片开端:钛媒体 AGI 裁剪林志佳拍摄)
钛媒体 AGI 2 月 7 日音尘,阛阓外传 DeepSeek 计划以估值 100 亿好意思元进行新一轮融资,阿里有绸缪投资 10 亿好意思元认购 DeepSeek 股权,当今两边团队正在交流具体现实细节,阿里云将四肢第一推理算力遴荐。
受音尘影响,阿里好意思股(NYSE: BABA)大涨 6% 以上。
末端发稿前,阿里、DeepSeek 两边均未对外传作念出复兴,而两家企业皆位于杭州。
钛媒体 AGI 从音尘东说念主士处进一步了解到,其实 DeepSeek 公司估值当今只在数十亿好意思金驾驭。音尘当先是在投资圈和量化群里进行传播,有多家投资机构东说念主士对此相配感酷好。
据腾讯科技,金沙江创投愚弄结伴东说念主朱啸虎早前暗示,一朝 DeepSeek 灵通融资,他笃定会投资。"我笃定会投啊!我笃定会投!这个价钱照旧不太首要了,要道是参与在这内部。简直见证东说念主类 AGI 产生,见证东说念主类 AI 相识产生,这些东西皆很有风趣。"
朱啸虎强调,他以为 DeepSeek 照旧应该灵通融资的,因为再往前走是需要烧钱的,现时主要资源需求照旧算力卡。
据悉,DeepSeek(深度求索,全称杭州深度求索东说念主工智能基础期间扣问有限公司)建造于 2023 年,总部位于杭州,由中资对冲基金幻方量化创立,DeepSeek 独创东说念主、CEO 为梁文锋。
2023 年 10 月 28 日,DeepSeek 发表深度求索的第一个大模子 DeepSeek-Coder,11 月 29 日发布 DeepSeek-LLM。到 2024 年 12 月 13 日,DeepSeek 发布用于高档多模态分解的大家夹杂视觉谈话模子—— DeepSeek-VL2。同月 26 日,DeepSeek 发布并开源了 DeepSeek-V3,激勉顾惜。
DeepSeek 暗示,该大模子的教化系基于 2048 块英伟达 GPU 集群上运转 55 天完成,教化耗资 557.6 万好意思元,而 DeepSeek-V3 的评测收货超过 LLaMA 3.1-405B(Meta 自研大模子)等开源模子,能与 GPT-4o 等闭源模子相抗衡。
2025 年 1 月 20 日, DeepSeek 发布并开源了推理模子 DeepSeek-R1 模子,资本低于预期,但该模子在数学、代码、当然谈话推理等任务上,性能与 OpenAI o1 郑再版极端。到本年 1 月 27 日,DeepSeek 智能助手在好意思区苹果 App Store 下载榜上超过 ChatGPT,并登顶 App Store 免费应用榜榜首。
据报说念,DeepSeek 的职工规模不到 140 东说念主。梁文锋曾暗示,留下年青东说念主才的法子主若是"高薪"和"算力管够"两条路。
"咱们看到的是中国 AI 不成能长久处在陪同的位置。咱们频繁说中国 AI 和好意思国有一两年差距,但确凿的 gap 是原创和师法之差。如果这个不改革,中国长久只然而奴隶者,是以有些探索亦然逃不掉的。"梁文锋称。
(本文首发于钛媒体 App,作家|林志佳)