来源:微信公众号「黑虾」
原文链接:https://mp.weixin.qq.com/s/qK0e5aWwXfWvbLuytAFxLA
Qwen3.6-35B-A3B 破解版:配置与部署指南
模型概况
Qwen3.6-35B 的去审查破解版,破解之后内容审查全部拆掉,几乎不拒绝回答任何问题。
- 架构: MoE(Mixture of Experts),每次推理只激活 3B 参数
- 综合能力: 号称超过 Claude 4.5 Sonnet
- 输出速度: 比 Qwen3.6-27B 快很多(得益于 MoE 架构)
- 量化版大小: Q4_K_M 约 22GB
- 最低门槛: 16G 显卡即可运行
硬件配置方案
方案一:台式机 16G 显卡 + 32G 内存(入门)
部分卸载到内存,预算约 ¥8,677
| 硬件 | 推荐型号 | 参考价格 |
|---|---|---|
| CPU | AMD Ryzen 5 5600 | ¥789 |
| 主板 | B550M | ¥689 |
| 内存 | 32GB DDR4(16G×2) | ¥1,200 |
| 显卡 | RTX 5060 Ti 16G | ¥4,299 |
| 存储 | 1TB NVMe SSD | ¥1,000 |
| 电源 | 750W 80Plus 金牌 | ¥400 |
| 机箱散热 | — | ¥300 |
方案二:台式机 24G 显卡 RTX 5090D V2(高端)
全放显存,预算约 ¥31,149
| 硬件 | 推荐型号 | 参考价格 |
|---|---|---|
| CPU | AMD Ryzen 7 9700X | ¥1,949 |
| 主板 | B850M | ¥1,300 |
| 内存 | 64GB DDR5(32G×2) | ¥5,000 |
| 显卡 | RTX 5090D V2 24G | ¥19,000 |
| 存储 | 2TB NVMe SSD | ¥1,600 |
| 电源 | 1200W 金牌全模 | ¥1,300 |
| 机箱+散热 | 360水冷+机箱 | ¥1,000 |
方案三:苹果 Mac(统一内存)
苹果统一内存 CPU/GPU 共用,32GB 装 22GB 的 Q4 量化版完全没问题。MoE 每次推理只激活 3B 权重,对内存带宽压力小,Mac 跑这个模型比同参数量密集模型流畅得多。
推荐机型:
- Mac mini M4 32GB: 约 ¥8,999(需另配显示器),价格最低,适合当本地服务器
- MacBook Air M5 32GB: 约 ¥12,926,便携 + 性能兼顾
- MacBook Pro M5 32GB: 约 ¥14,916,散热更好,长时间高负载更稳
⚠️ 24GB 统一内存的 Mac 不够用,22GB 模型加上系统占用,空间不够。至少 32GB。
方案怎么选?
- 预算低于 1 万,想兼顾 3A 游戏 → 5060Ti 台式机
- 已在苹果生态、预算 1.5 万以内、追求安静省电 → Mac
- 需要极致推理速度、同时跑多个任务 → 5090D 台式机
部署方式:LM Studio(推荐,纯图形界面)
- 去 lmstudio.ai 下载安装(Windows / Mac 都有)
- 搜索栏输入:HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive,找到 Q4_K_M 量化版下载
- 加载模型后,直接在内置对话界面使用
踩坑提醒
- 模型文件约 22GB,下载前硬盘至少留 40GB 余量
- 第一次加载模型较慢(十几秒到一分多钟),不是卡死,等就行
- Windows 系统确保显卡驱动是最新版,否则可能识别不到显存