新闻动态
你的位置: kaiyun登录官网 > 新闻动态 >

快科技 1 月 12 日音问,据媒体报说念,DeepSeek行动开年 AI 领域的紧要突破,以其"国产之光"的新形象悠扬了海表里科技界。这家 AI 创业企业以其私有的团队组成和不凡的技巧确立,成为了业界原谅的焦点。
从公开尊府来看,DeepSeek 的团队范围虽小,但实力羁系小觑。其首创东说念主梁文锋率领的团队仅有 139 名工程师和筹商东说念主员,比拟之下,OpenAI 领有 1200 名筹商东说念主员,Anthropic 也有 500 多名。
可是,DeepSeek 凭借一系列吸睛的标签,如"未寻求外部融资"、"首创东说念主囤卡财主"、"团队成员均为清北等名校毕业生"等,得手在 AI 创业圈中崭露头角。

2024 年 12 月,DeepSeek 发布了最新的 V3 开源模子,该模子在评测中弘扬出色,不仅卓绝了阿里自研的 Qwen2.5-72B 和 Meta 自研的 Llama 3.1-405B 等顶级开源模子,甚而能与 GPT-4o、Claude 3.5-Sonnet 等顶级闭源模子相比好意思。
值得防护的是,DeepSeek V3 大模子发布后便透顶开源,且其检修本钱远低于同类模子。据 SemiAnalysis 数据解析,OpenAI GPT-4 的检修本钱高达 6300 万好意思元,而 DeepSeek-V3 的本钱仅为其十分之一不到。
此外,DeepSeek V3 模子的检修是在2000 块英伟达 H800 GPU上完成的,这一数目远低于硅谷大厂大王人使用的几十万块更高性能的 GPU。这一确立冲突了算力芯片对国产大模子的截止瓶颈,为创业团队提供了新的解法:即便在算力有限的情况下,使用高质地数据和更好的算法,相似能检修出高性能大模子。
OpenAI 首创团队成员 Andrej Karpathy 发帖奖饰:DeepSeek-V3 性能高过 Llama3 最强模子,且耗尽资源仅十分之一,"过去大要不需要超大范围的 GPU 集群了"。
Meta 科学家田渊栋咋舌说念:" FP8 预检修、MoE、预算至极有限的雄伟性能、从 CoT 中索求以进行指点 …… 哇!这是伟大的责任!"

DeepSeek 的首创东说念主梁文锋对硅谷的咋舌并不感到不测。他以为,这是因为 DeepSeek 行动一个中国公司,正在以鼎新孝敬者的身份加入到内行 AI 技巧的竞争中。他指出,中国需要镇静成为技巧的孝敬者,而不是一直依赖西方的鼎新后果。
梁文锋还强调了中国 AI 发展需要诞生我方的技巧生态,就像西方主导的技巧社区一代代创造出了摩尔定律和 Scaling Law 一样。他以为,好多国产芯片发展不起来,恰是因为清寒配套的技巧社区和前沿技巧的参与。
公开尊府解析开云kaiyun.com,DeepSeek 的母公司幻方量化是一家量化基金起家的企业,与 DeepSeek 的用东说念主格调相似,均珍重原土着才。DeepSeek 在 AI 居品厚爱亮相前,曾万古期里面孵化该居品,并招聘文科东说念主才提供关连学问起首。这一私有的过程使得 DeepSeek 在 AI 领域独树一帜,成为中国 AI 技巧鼎新的杰出人物。
