高通吧 关注:177,275贴子:4,489,803

突然感觉本地部署优势不算大

只看楼主收藏回复

卡是4090,搭配共享显存可以部署70b模型,总占用在41g左右,但一秒只能生成3-4字左右,用32b模型,占用22g左右,24g专用显存刚好够,此时速度非常快,一秒接近20字,但话说回来,虽然deepseek用ollama跑本地没啥限制,开黄车都行,但模型那边因为限制死了,导致只要敏感词汇就会罢工,只能在边缘慢慢试探,有时候可能会成功,但后面反应过来又不行了,其实ai也想跳出来这样对比在线部署就没啥优势了,除了在不爆显存的时候快一点加上不怕占用资源,然后就是32b模型处理高难度时容易出错,不过大部分都够用了,后面我也用deepseek的r1对比了一下vivo的蓝心小v,只能说各有优势,deepseek偏理工,蓝心小v在文学创作上自由度很高,有时候也能绕出去,回到刚刚那个话题,本地部署如果模型限制死就没啥优势,当然如果没限制的话那真可以为所欲为,大胆创作


IP属地:贵州来自Android客户端1楼2025-02-01 10:40回复
    有没有可能是你本地计算能力不强,


    IP属地:上海来自iPhone客户端2楼2025-02-01 11:47
    收起回复
      还有个问题,本地断网部署可以避免隐私泄露,毕竟在一些私有创作需要变现的过程中非常重要,或者一些学术论文借鉴


      IP属地:贵州来自Android客户端3楼2025-02-01 12:35
      收起回复
        本地部署是不是只有计算卡才能玩的明白?


        IP属地:海南来自Android客户端4楼2025-02-01 12:58
        收起回复
          这个本地模型不是没有限制吗?还是说蒸馏过的模型没限制,671b的才没限制?


          IP属地:北京来自Android客户端5楼2025-02-01 13:07
          收起回复
            2张2080ti魔改是不是能跑70b了?估计就是慢点


            IP属地:上海来自iPhone客户端6楼2025-02-01 13:56
            收起回复
              这就和玩游戏爆显存了一样,4090最多只能部署32b的。hugging face上有完全不审查的模型


              IP属地:山西来自Android客户端7楼2025-02-01 14:02
              收起回复
                内存比显存慢多少?64g内存,显卡一般般怎么样?


                IP属地:湖北来自Android客户端8楼2025-02-01 14:18
                收起回复
                  拿mac studio跑671b,一秒能有7到8t


                  IP属地:广东来自Android客户端9楼2025-02-01 14:53
                  收起回复
                    1.58b量化


                    IP属地:广东来自Android客户端10楼2025-02-01 15:07
                    回复
                      本地优势是可以跑未阉割未审核或者定制的模型。


                      IP属地:北京11楼2025-02-01 16:35
                      回复
                        其实本地应用一直是个需求,特别是公司内部的敏感内容,比如对内QA和整体资料。把这部分内容给到模型调用,放到公司内部的内网使用。不知道本地推理的发展水平,是不是已经处于这种可应用的状态了


                        IP属地:上海来自iPhone客户端12楼2025-02-01 18:23
                        收起回复
                          相比之下 苹果的金子内存突然变沙子价格了


                          IP属地:浙江来自iPhone客户端13楼2025-02-01 20:04
                          收起回复
                            deepseek据说服务器使用的模型体积是将近一个T,放出来的开源版本都只有几十G,效果当然打折扣了。


                            IP属地:山西来自Android客户端14楼2025-02-01 21:32
                            收起回复
                              硅基流动和华为云合作搞的云端部署是满血的吗?试用了,感觉和网页比差点意思


                              IP属地:陕西来自Android客户端15楼2025-02-01 23:43
                              收起回复