DeepSeek，突传大音讯！

liukang20243个月前 (05-15)629吃瓜843

热度居高不下！
最近几天，DeepSeek从冷艳到惊吓，从被认可到被质疑，再从被要挟到少许的认可，工作处于不断的演化傍边。今日早上，这款大模型再度迎来大音讯。
微软CEO纳德拉在电话会上着重，DeepSeek R1模型现在已可经过微软的AI渠道Azure AI Foundry和GitHub获取，而且很快就能在Copilot+电脑上运转。纳德拉称，DeepSeek“有一些真的立异”，AI本钱下降是趋势：缩放规律（Scaling Law）在预练习和推理时刻核算中不断堆集。
别的，据@Jukanlosreve引证的Mirae Asset Securities Korea剖析称，DeepSeek的打破是经过施行许多细粒度优化，以及在某些功用中运用Nvidia的汇编式PTX（并行线程履行）编程而不是Nvidia的CUDA来完成的。这是否是昨夜英伟达股价再度杀跌的主因，还有待考证。不过，“算力通缩”好像正在成为盛行词汇。有音讯指出，美国商务部正在评论禁售英伟达H20，这或许也是该股杀跌的原因之一。
巨子最新发声
微软官网最新显现，DeepSeek R1现已在Azure AI Foundry和GitHub上的模型目录中供给，加入了1800多个模型的多样化产品组合，包含前沿、开源、职业特定和根据使命的AI模型。作为Azure AI Foundry的一部分，DeepSeek R1可在值得信任、可扩展且企业级安排妥当的渠道上拜访，使企业能够无缝集成高档AI，一起满意SLA、安全性和担任任的AI许诺——所有这些都由Microsoft的可靠性和立异支撑。
微软CEO纳德拉也在电话会上着重，DeepSeek R1模型现在已可经过微软的AI渠道Azure AI Foundry和GitHub获取，而且很快就能在Copilot+电脑上运转。纳德拉称DeepSeek“有一些真的立异”，AI本钱下降是趋势：“缩放规律（Scaling Law）在预练习和推理时刻核算中不断堆集。多年来，咱们现已看到了AI练习和推理方面的功率明显前进。在推理方面，咱们一般看到每一代硬件的性价比前进2倍以上，每一代模型的性价比前进10倍以上。”
Meta首席履行官马克·扎克伯格周三在公司第四季度财报电话会议上向投资者传达信息。在与华尔街剖析师的电话会议问答环节，扎克伯格答复了多个问题，这些问题触及DeepSeek令人形象深入的AI模型以及对Meta的AI战略的影响。他说，DeepSeek能够以相对较少的资金获得成果“只会加强咱们的信仰，即这是值得重视的正确工作”。
扎克伯格指出，“他们做的许多新奇事咱们仍在消化”，Meta方案将DeepSeek的前进应用到Llama中。DeepSeek导致人工智能股票大幅兜售，由于人们忧虑模型不再需求那么多核算才能。扎克伯格企图消除人们对他在GPU上花费的数十亿美元将白搭的忧虑：“我依然以为，从长远来看，在本钱开销和基础设施方面投入许多资金将是一种战略优势。”
他还对OpenAI、Anthropic和其他没有盈余的草创公司进行了不加粉饰的批判，指出Meta具有“强壮的商业模式”来支撑其今年在人工智能方面投入的约600亿美元，而“其他公司不一定具有可继续的商业模式来支撑它”。
关于蒸馏技术
最近两天，商场对DeepSeek的质疑之声也多了起来，其间评论得最多的或许便是运用蒸馏技术练习模型的事。OpenAI也表明，正在查看DeepSeek运用一种称为“蒸馏”的技术，从OpenAI的东西中提取许多数据以协助开发其技术的痕迹。
但是，据最新音讯，商场对此不合也很大。处于被迫位置的美国政府和OpenAI的反响应该是在预期之内的。但总部坐落旧金山的Databricks的人工智能副总裁Naveen Rao表明，在人工智能职业，向竞赛对手学习是“天经地义的事”。当服务条款制止时，该公司不会运用这种技术。
Rao将此比作轿车制造商购买并查看互相的发动机。“公平地说，这种状况在每种状况下都会产生。竞赛是实在存在的，当它是可提取的信息时，你会提取它并企图获得胜利。”拉奥说。“咱们都企图成为好公民，但咱们一起都在竞赛。”
Thomvest Ventures董事总经理Umesh Padval表明：“当你具有Mistral和Llama等开源模型时，模型提炼是不或许中止的。它们可供所有人运用。他们还能够经过客户在某个当地找到OpenAI的模型。”
DeepSeek在最近的一篇研讨论文中表明，它运用“蒸馏”技术从其最强壮的模型R1中获取输出，以练习表现出相似推理才能的较小模型。
冲击英伟达护城河？
现在，商场上还有一种说法：DeepSeek乃至绕过了CUDA，并因而冲击到了英伟达的护城河。
据外媒——硬件媒体Tom‘s Hardware报导，来自Mirae Asset Securities Research（韩国未来财物证券）的剖析称，V3的硬件功率之所以能比Meta等高出10倍，能够总结为“他们从头开始重建了全部”。在运用英伟达的H800 GPU练习DeepSeek-V3时，他们针对自己的需求把132个流式多处理器（SMs）中的20个修正成担任服务器间的通讯，而不是核算使命。变相绕过了硬件对通讯速度的约束。
这一打破是经过施行许多细粒度优化以及在某些功用中运用Nvidia的汇编式PTX（并行线程履行）编程而不是Nvidia的CUDA来完成的。Nvidia的PTX（并行线程履行）是Nvidia为其GPU规划的中心指令集架构。PTX坐落高档GPU编程言语（如CUDA C/C++或其他言语前端）和初级机器代码（流式汇编或SASS）之间。PTX是一种挨近金属的ISA，它将GPU揭露为数据并行核算设备，因而答应细粒度优化，例如寄存器分配和线程/warp等级调整，这是CUDA C/C++和其他言语无法完成的。一旦PTX进入SASS，它就会针对特定一代的Nvidia GPU进行优化。
这些修正远远超出了规范CUDA级开发的规模，但保护起来却十分困难。因而，这种等级的优化反映了DeepSeek工程师的杰出技术。全球GPU缺少，加上美国的约束，迫使DeepSeek等公司选用立异解决方案，DeepSeek也获得了打破。不过，剖析以为，DeepSeek做了PTX等级的优化不意味着彻底脱离了CUDA生态，但的确代表他们有优化其他GPU的才能。

告发/反应

标签: DeepSeek 突传大音讯

返回列表

界面新闻记者 | 伍洋宇界面新闻修改 | 刘方远李开复最近很忙，不断飞往全国各地，频频往复于深港之间。用他自己的话来讲：忙着见许多“超大客户”。他在61岁这年兴办的AI大模型公司零一万物，前不久阅历了...

友情链接：

FUN吃瓜网

DeepSeek，突传大音讯！