全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

IP归属甄别会员请立即修改密码
查看: 2451|回复: 40
打印 上一主题 下一主题

抖音头条这几天都在疯狂的夸deepseek

[复制链接]
跳转到指定楼层
1#
发表于 2025-1-26 15:48:19 来自手机 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
只要你有一个好一点的显卡就能自建一个跟openai差不多
推荐
发表于 2025-1-26 19:42:16 | 只看该作者
DaShi 发表于 2025-1-26 19:38
这个DeepSeek,我问它是谁?它一会说自己是OpenAI公司的ChatGPT3.5,一会说自己是OpenAI公司的ChatGPT4,一 ...

用的DeepSeek官方的DeepSeek-V3接口。我怀疑他就是反代的ChatGPT的api接口,做了一层缓存

点评

早点就医 死马当活马医  发表于 2025-1-27 18:38
TOT
你真是个大聪明  发表于 2025-1-26 20:26
推荐
发表于 2025-1-26 19:38:25 | 只看该作者
这个DeepSeek,我问它是谁?它一会说自己是OpenAI公司的ChatGPT3.5,一会说自己是OpenAI公司的ChatGPT4,一会又说自己是OpenAI公司的ChatGPT3
推荐
发表于 2025-1-26 18:50:08 | 只看该作者
中国人的吹逼传统
推荐
发表于 2025-1-26 20:18:55 | 只看该作者
DaShi 发表于 2025-1-26 19:38
这个DeepSeek,我问它是谁?它一会说自己是OpenAI公司的ChatGPT3.5,一会说自己是OpenAI公司的ChatGPT4,一 ...

蠢得我都不想评论
推荐
发表于 2025-1-27 18:36:10 | 只看该作者
本帖最后由 wwbfred 于 2025-1-27 18:48 编辑
327253236 发表于 2025-1-27 17:55
21号发布的,看今天英伟达的盘前表现,验证结果应该出来了。

不是的,NVIDIA的长期需求不会减弱,只会增加,短期波动根本不重要。至于结果究竟如何,需要别人的复现。这不是一朝一夕的工作量,至少是以月为单位。
这个模型的影响主要集中在短期,各个公司该换赛道的换赛道,该看论文的看论文,理论差距抹平了大家就会继续卷算力。你会站在巨人的肩膀上出成果,但别人也会站在你的肩膀上。ChatAI的水平还远远没有达到上限,到目前为止我们甚至都不知道它的上限在哪里。
至于为什么开源,原因也很简单。你的理论水平再高,也需要算力做支撑。只迭代模型不能更新算力,用不了多久就会被人家一力降十会,模型再完美也会失去进一步发展的可能。
推荐
发表于 2025-1-27 12:30:20 | 只看该作者
本帖最后由 wwbfred 于 2025-1-27 13:26 编辑

既然是开源的,那就先等别人复刻一下,看看训练成本是不是如他们所说。
这个东西最核心的是在低算力条件下的优化,虽然现在看来这条路很成功,但ChatAI迭代速度太快,今天的优秀模型一年后就可能被抛弃,长远来看还不好说。
优化的路越往后越艰难,而单位算力越堆越便宜。虽然它的出现可能会改变一时的游戏规则,但长远来看,大家最终还是要走上拼算力的道路。不过虽说如此,如果他们的训练成本是真实的,那这依然是巨大的突破。一是单位算力能做的事越多,ChatAI就会越成熟;二是对于一个商品,价格和性能同样重要。
推荐
发表于 2025-1-26 22:30:31 来自手机 | 只看该作者
宣传 发表于 2025-1-26 18:50
中国人的吹逼传统

也不算完全吹牛逼,deepseek 是不错。
不过这两天国内疯狂鼓吹的确是有总书记的加成。
平近习前几天又又亲自指导中国 ai 产业发展了。加上国资委也要实施深入 ai。国内自上而下的体制,上面一句话,你下面能不吹?
推荐
发表于 2025-1-26 19:53:29 | 只看该作者
本帖最后由 X​ 于 2025-1-26 19:54 编辑
DaShi 发表于 2025-1-26 19:38
这个DeepSeek,我问它是谁?它一会说自己是OpenAI公司的ChatGPT3.5,一会说自己是OpenAI公司的ChatGPT4,一 ...


估计拿GPT训练了
但每家都这样搞 所以都互相不吱声

我猜一开始GPT推出 谷歌和脸书抄GPT 然后GPT再抄回去
推荐
发表于 2025-1-26 19:39:55 来自手机 | 只看该作者
估计想融资
2#
发表于 2025-1-26 15:55:27 | 只看该作者
想玩,但是我的一体机1650感觉完全跑不动
3#
发表于 2025-1-26 16:18:30 | 只看该作者
跟openai差不多


我真的信了
4#
发表于 2025-1-26 16:19:40 | 只看该作者
一张好点的显卡能跑的不是真正的 deepseek r1/v3 模型
5#
发表于 2025-1-26 16:29:45 | 只看该作者
试了下,确实有点东西。
6#
发表于 2025-1-26 16:33:03 | 只看该作者
推特上也很多,确实有东西
7#
发表于 2025-1-26 16:42:27 来自手机 | 只看该作者
日,用梯子不能注册
8#
发表于 2025-1-26 17:00:54 | 只看该作者
据说确实不错,前几天看纽约时报报道过,说只用OpenAI那些公司1/10的成本,干到性能跟ChatGPT相差极小

点评

我看的说是3%成本  发表于 2025-1-26 17:28
9#
发表于 2025-1-26 17:20:04 | 只看该作者
确实不错,但是也没吹得那么厉害吧
10#
发表于 2025-1-26 17:28:33 | 只看该作者
这玩意儿确实火,我也看到好多人在讨论,感觉显卡不够强跑起来是有点费劲啊,1650确实差点意思。要不你考虑下用云服务器?
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-9-13 09:54 , Processed in 0.084122 second(s), 15 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表