标签「本地模型部署」下的文章,共找到 1 篇文章
清华 ChatGLM-6B 中文对话模型本地部署
一、硬件需求量化等级最低 GPU 显存(推理)最低 GPU 显存(高效参数微调)FP16(无量化)13 GB14 GBINT88 GB9 GBINT46 GB7 GB二、博主本机配置:显卡:40...