chatgpt吧 关注:140,273贴子:436,373
  • 15回复贴,共1

Meta对标GPT3的LLaMA模型权重文件已泄漏, 本地无限制运行

只看楼主收藏回复

RT


IP属地:山西1楼2023-03-05 11:58回复


    IP属地:山西2楼2023-03-05 12:01
    回复


      IP属地:山西3楼2023-03-05 12:02
      回复
        模型下载链接可以在 facebookresearch/llama/pull/73 这个pr下找到
        运行环境使用oobabooga/text-generation-webui
        启用int8量化后 7b参数大小的模型只需要10GB显存, 13B参数大小的模型只需要17G显存, 30B参数大小的模型只需要35G显存即可运行


        IP属地:山西4楼2023-03-05 12:06
        回复
          整体智商比较低, 截图使用的模型只有13B参数(且为int8), 且训练数据集不包括中文, 效果一定比不过175b参数的GPT3.5. 但可以完全本地运行


          IP属地:山西5楼2023-03-05 12:09
          收起回复
            能变猫娘吗?


            IP属地:广东来自Android客户端6楼2023-03-05 12:34
            回复
              GPT3.0是20年的了,差远了


              IP属地:山东7楼2023-03-05 12:42
              回复
                不是开源的吗 为什么说泄露?


                IP属地:湖南来自iPhone客户端8楼2023-03-05 13:30
                收起回复
                  别搞了,还是买成品吧!便宜还省事!https://gi0.cn/0UI


                  来自Android客户端9楼2023-03-05 14:08
                  回复
                    fb讲过,这个模型没有经过RLHF等步骤,处于纯胡说八道状态。
                    训练数据仅包含拉丁字母和西里尔字母。


                    IP属地:上海来自Android客户端10楼2023-03-06 00:44
                    回复
                      llm需要的算力目前本地化没什么用


                      IP属地:上海来自Android客户端11楼2023-03-06 08:53
                      回复
                        泄露出来的最高版本是 llama-65b模型 比起chatgpt的模型还是落后很多
                        不过国内的大厂肯定是狂欢了 相信用不了多久就能推出中国特色版了


                        IP属地:上海12楼2023-03-07 18:29
                        回复