转自:宁波晚报
由国产大模型公司杭州深度求索开发的Deepseek应用27日登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。
同在昨日,DeepSeek出现了短时闪崩现象。不少网友反映,使用时遇到 “服务器繁忙” 的提示。
去年年底,DeepSeek推出开源模型DeepSeek-V3。当时,聊天竞技场(Chatbot Arena)数据显示,DeepSeek-V3在所有模型中排名第七,在开源模型中排第一,是全球前十中性价比最高的模型。
DeepSeek-V3大模型的核心技术创新是其迅速崛起的关键。该模型融合了Multi-head Latent Attention(MLA)、混合专家架构(MoE)和FP8低精度训练三项技术,显著提升了性能与效率。
而在本月20日,DeepSeek又正式开源R1推理模型。1月24日,DeepSeek-R1在Chatbot Arena综合榜单上排名第三,与OpenAI的顶尖推理模型o1并列。在高难度提示词、代码和数学等技术性极强的领域,DeepSeek-R1拔得头筹;在风格控制以及高难度提示词与风格控制结合的测试中,DeepSeek-R1均与o1 并列第一。
此外,Artificial-Analysis的初始基准测试结果显示,DeepSeek-R1在AI分析质量指数中取得第二高分,但价格却是o1的约三十分之一。
DeepSeek以“低成本训练”和“高性价比”为核心卖点,其API输入价格仅为每百万Token 0.1元人民币,远低于Claude 3.5 Sonnet(3美元/百万Token),吸引了不少中小开发者和企业。这种低成本训练策略也让该公司有了“AI界拼多多”的称号,甚至引发了间接冲击英伟达等硬件厂商的讨论。界面新闻稍早前曾报道,360公司创始人周鸿祎认为,DeepSeek在对抗美国AI技术霸权的 “中国大模型技术复仇者联盟战队” 中,DeepSeek必定占有一席之地。他还特别指出,由于DeepSeek及其创始人非常低调,其技术能力和未来前景被市场严重低估。