Skip to content

来源:微信公众号「黑虾」
原文链接:https://mp.weixin.qq.com/s/qK0e5aWwXfWvbLuytAFxLA

Qwen3.6-35B-A3B 破解版:配置与部署指南

模型概况

Qwen3.6-35B 的去审查破解版,破解之后内容审查全部拆掉,几乎不拒绝回答任何问题。

  • 架构: MoE(Mixture of Experts),每次推理只激活 3B 参数
  • 综合能力: 号称超过 Claude 4.5 Sonnet
  • 输出速度: 比 Qwen3.6-27B 快很多(得益于 MoE 架构)
  • 量化版大小: Q4_K_M 约 22GB
  • 最低门槛: 16G 显卡即可运行

硬件配置方案

方案一:台式机 16G 显卡 + 32G 内存(入门)

部分卸载到内存,预算约 ¥8,677

硬件推荐型号参考价格
CPUAMD Ryzen 5 5600¥789
主板B550M¥689
内存32GB DDR4(16G×2)¥1,200
显卡RTX 5060 Ti 16G¥4,299
存储1TB NVMe SSD¥1,000
电源750W 80Plus 金牌¥400
机箱散热¥300

方案二:台式机 24G 显卡 RTX 5090D V2(高端)

全放显存,预算约 ¥31,149

硬件推荐型号参考价格
CPUAMD Ryzen 7 9700X¥1,949
主板B850M¥1,300
内存64GB DDR5(32G×2)¥5,000
显卡RTX 5090D V2 24G¥19,000
存储2TB NVMe SSD¥1,600
电源1200W 金牌全模¥1,300
机箱+散热360水冷+机箱¥1,000

方案三:苹果 Mac(统一内存)

苹果统一内存 CPU/GPU 共用,32GB 装 22GB 的 Q4 量化版完全没问题。MoE 每次推理只激活 3B 权重,对内存带宽压力小,Mac 跑这个模型比同参数量密集模型流畅得多。

推荐机型:

  • Mac mini M4 32GB: 约 ¥8,999(需另配显示器),价格最低,适合当本地服务器
  • MacBook Air M5 32GB: 约 ¥12,926,便携 + 性能兼顾
  • MacBook Pro M5 32GB: 约 ¥14,916,散热更好,长时间高负载更稳

⚠️ 24GB 统一内存的 Mac 不够用,22GB 模型加上系统占用,空间不够。至少 32GB。

方案怎么选?

  • 预算低于 1 万,想兼顾 3A 游戏 → 5060Ti 台式机
  • 已在苹果生态、预算 1.5 万以内、追求安静省电 → Mac
  • 需要极致推理速度、同时跑多个任务 → 5090D 台式机

部署方式:LM Studio(推荐,纯图形界面)

  1. 去 lmstudio.ai 下载安装(Windows / Mac 都有)
  2. 搜索栏输入:HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive,找到 Q4_K_M 量化版下载
  3. 加载模型后,直接在内置对话界面使用

踩坑提醒

  • 模型文件约 22GB,下载前硬盘至少留 40GB 余量
  • 第一次加载模型较慢(十几秒到一分多钟),不是卡死,等就行
  • Windows 系统确保显卡驱动是最新版,否则可能识别不到显存