全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

IP归属甄别会员请立即修改密码
查看: 1173|回复: 16
打印 上一主题 下一主题

NVIDIA计算卡被华为取代过程扰乱训练 导致DeepSeek R2模型推迟!!

[复制链接]
跳转到指定楼层
1#
发表于 2025-8-15 14:03:58 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
5毛尴尬!狗咬狗了!
原来连用都不能用,我原本以为只是慢一些呢


=================================================
中国坚持要求企业使用国产AI芯片而非英伟达芯片,这会不会付出一些代价?据一份新报告称,北京方面曾敦促DeepSeek放弃英伟达硬件,转而在其R2型号中使用华为芯片,但训练过程中不断出现技术问题,导致发布推迟,并被迫重新转向NVIDIA进行训练,而推理部分则使用了华为芯片。


今年 1 月,DeepSeek 的 R1 模型发布时震惊了整个人工智能行业。据称,该模型在 2048 块英伟达 H800 上进行了训练,耗资 557.6 万美元,与其他人工智能公司数十亿美元的投入相比只是零头。但后来有消息称,DeepSeek 使用了大约 5 万块 Hopper GPU,其中包括 1 万块 H800 和 1 万块 H100,以及 3 万块 HGX H20 单元。

据《金融时报》援引三位知情人士的话称,对于 R2 的后续型号,中国当局“鼓励”DeepSeek 放弃 NVIDIA 技术,转而使用国产硬件。

DeepSeek 采纳了这一建议(或者说需求),转而使用华为基于昇腾平台进行 R2 版本的训练。然而,这带来了性能不稳定、互联速度变慢以及华为 CANN 软件工具包限制等问题。

华为派出了一个工程师团队前往DeepSeek的数据中心,希望解决这些问题。尽管他们已经到位,但在Ascend平台上进行的训练从未成功过,不过使R2与Ascend兼容推理的工作仍在继续。
推荐
发表于 2025-8-16 11:01:45 | 只看该作者
据三为接头情报,我和你妈有染, 一样
推荐
发表于 2025-8-16 09:09:46 | 只看该作者
无奖投票:
你的浏览器浏览历史,愿意给中国gov看还是美国gov看?
中国gov -> ↑支持
美国gov -> ↓反对
推荐
 楼主| 发表于 2025-8-15 15:18:39 | 只看该作者
linearn 发表于 2025-8-15 15:00
华为有后门吗?即便有也是自己的,英伟达的后门可是美国人的,你是不是不介意美国人的后门啊?斯诺登讲的 ...

你问问警察叔叔有没有?   华伪如果没有后门,某党最先座不住了。

某党也有法院,美国也有法院。
比如你被迫相信一个,你选谁?   我肯定选美国法院
推荐
发表于 2025-8-15 15:00:10 来自手机 | 只看该作者
全球手机交流 发表于 2025-8-15 14:37
华伪更有后门

华为有后门吗?即便有也是自己的,英伟达的后门可是美国人的,你是不是不介意美国人的后门啊?斯诺登讲的故事你不会不知道吧
.
推荐
发表于 2025-8-15 17:36:37 | 只看该作者
DeepSeek 被华卡脖子
推荐
 楼主| 发表于 2025-8-15 17:17:45 | 只看该作者

也祝您多打疫苗,身体健康!
推荐
发表于 2025-8-15 14:26:00 来自手机 | 只看该作者
英伟达有后门
4#
 楼主| 发表于 2025-8-15 14:37:55 | 只看该作者

华伪更有后门
7#
发表于 2025-8-15 15:26:34 来自手机 | 只看该作者
全球手机交流 发表于 2025-8-15 15:18
你问问警察叔叔有没有?   华伪如果没有后门,某党最先座不住了。

某党也有法院,美国也有法院 ...

祝你身体健康
10#
发表于 2025-8-15 17:45:33 来自手机 | 只看该作者
全球手机交流 发表于 2025-8-15 17:17
也祝您多打疫苗,身体健康!

哈哈,我身体健康的很,不会把“华为”两个字错看成“华伪”。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-9-8 16:11 , Processed in 0.062097 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表