突然感觉本地部署优势不算大【高通吧】

高通吧关注：177,275贴子：4,489,803

1 2 3 下一页尾页
150回复贴，共3页
，跳到页

突然感觉本地部署优势不算大

卡是4090，搭配共享显存可以部署70b模型，总占用在41g左右，但一秒只能生成3-4字左右，用32b模型，占用22g左右，24g专用显存刚好够，此时速度非常快，一秒接近20字，但话说回来，虽然deepseek用ollama跑本地没啥限制，开黄车都行，但模型那边因为限制死了，导致只要敏感词汇就会罢工，只能在边缘慢慢试探，有时候可能会成功，但后面反应过来又不行了，其实ai也想跳出来

这样对比在线部署就没啥优势了，除了在不爆显存的时候快一点加上不怕占用资源，然后就是32b模型处理高难度时容易出错，不过大部分都够用了，后面我也用deepseek的r1对比了一下vivo的蓝心小v，只能说各有优势，deepseek偏理工，蓝心小v在文学创作上自由度很高，有时候也能绕出去，回到刚刚那个话题，本地部署如果模型限制死就没啥优势，当然如果没限制的话那真可以为所欲为，大胆创作

送TA礼物

IP属地:贵州

来自Android客户端1楼2025-02-01 10:40回复

有没有可能是你本地计算能力不强，

IP属地:上海

来自iPhone客户端2楼2025-02-01 11:47

收起回复

还有个问题，本地断网部署可以避免隐私泄露，毕竟在一些私有创作需要变现的过程中非常重要，或者一些学术论文借鉴

IP属地:贵州

来自Android客户端3楼2025-02-01 12:35

收起回复

本地部署是不是只有计算卡才能玩的明白？

IP属地:海南

来自Android客户端4楼2025-02-01 12:58

收起回复

这个本地模型不是没有限制吗？还是说蒸馏过的模型没限制，671b的才没限制？

IP属地:北京

来自Android客户端5楼2025-02-01 13:07

收起回复

2张2080ti魔改是不是能跑70b了？估计就是慢点

IP属地:上海

来自iPhone客户端6楼2025-02-01 13:56

收起回复

这就和玩游戏爆显存了一样，4090最多只能部署32b的。hugging face上有完全不审查的模型

IP属地:山西

来自Android客户端7楼2025-02-01 14:02

收起回复

内存比显存慢多少？64g内存，显卡一般般怎么样？

IP属地:湖北

来自Android客户端8楼2025-02-01 14:18

收起回复

拿mac studio跑671b，一秒能有7到8t

IP属地:广东

来自Android客户端9楼2025-02-01 14:53

收起回复

1.58b量化

IP属地:广东

来自Android客户端10楼2025-02-01 15:07

本地优势是可以跑未阉割未审核或者定制的模型。

IP属地:北京

11楼2025-02-01 16:35

其实本地应用一直是个需求，特别是公司内部的敏感内容，比如对内QA和整体资料。把这部分内容给到模型调用，放到公司内部的内网使用。不知道本地推理的发展水平，是不是已经处于这种可应用的状态了

IP属地:上海

来自iPhone客户端12楼2025-02-01 18:23

收起回复

相比之下苹果的金子内存突然变沙子价格了

IP属地:浙江

来自iPhone客户端13楼2025-02-01 20:04

收起回复

deepseek据说服务器使用的模型体积是将近一个T，放出来的开源版本都只有几十G，效果当然打折扣了。

IP属地:山西

来自Android客户端14楼2025-02-01 21:32

收起回复

硅基流动和华为云合作搞的云端部署是满血的吗？试用了，感觉和网页比差点意思

IP属地:陕西

来自Android客户端15楼2025-02-01 23:43

收起回复

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

1 2 3 下一页尾页
150回复贴，共3页
，跳到页

<返回高通吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

突然感觉本地部署优势不算大

登录百度账号

扫二维码下载贴吧客户端