DeepSeek是一家成立于2023年7月17日的创新型科技公司,总部位于中国杭州,专注于开发先进的大语言模型(LLM)和相关技术。以下是关于DeepSeek的详细信息:
公司简介
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,是一家专注于大语言模型(LLM)和相关技术开发的创新型科技公司。
主要产品和技术
DeepSeek R1:DeepSeek发布的推理模型R1,在性能上逼近OpenAI的o1正式版,但推理成本仅为后者的几十分之一。该模型通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力,且没有使用业内普遍使用的监督微调(SFT)训练范式。
DeepSeek-V3:DeepSeek的另一款重要产品,采用了新的多头潜在注意力机制(MLA)架构,显存占用降低到过去最常用的MHA架构的5%-13%,计算量也大幅降低。
市场表现和影响
DeepSeek的应用在苹果美国和中国区应用商店的免费APP下载排行榜中均登顶,超越了ChatGPT,显示了其在市场上的强大影响力和用户认可度。
创始人和团队背景
本文地址:http://www.tpjde.com/quote/13391.html 推平第 http://www.tpjde.com/ , 查看更多