全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

IP归属甄别会员请立即修改密码
查看: 590|回复: 4
打印 上一主题 下一主题

把微软针对cpu优化的ai大模型跑起来了,纯cpu跑 27.09 tokens/s

[复制链接]
跳转到指定楼层
1#
发表于 2025-4-24 20:28:58 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
  1. 速度是真快,英语效果一般,中文效果堪忧!:lol

  2. llama_perf_sampler_print:    sampling time =     108.23 ms /  1040 runs   (    0.10 ms per token,  9608.72 tokens per second)
  3. llama_perf_context_print:        load time =     582.45 ms
  4. llama_perf_context_print: prompt eval time =     327.41 ms /    10 tokens (   32.74 ms per token,    30.54 tokens per second)
  5. llama_perf_context_print:        eval time =   37991.07 ms /  1029 runs   (   36.92 ms per token,    27.09 tokens per second)
  6. llama_perf_context_print:       total time =   38726.16 ms /  1039 tokens
复制代码





叫bitnet

2#
发表于 2025-4-24 20:35:32 | 只看该作者
英语效果一般,中文效果堪忧!
这个评价6
3#
发表于 2025-4-24 20:42:57 | 只看该作者
afkool 发表于 2025-4-24 20:35
英语效果一般,中文效果堪忧!
这个评价6

这也垃圾,那也垃圾。哈哈
4#
发表于 2025-4-24 22:33:39 | 只看该作者
谢谢分享! 请问能不能把 bitnet 应用在英文的语音识别上 ?
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-11-1 08:07 , Processed in 0.057637 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表