Z ai 更新的 GLM 4.6(推理)是最智能的开放权重模型之一,接近 DeepSeek V3.1(推理)和 Qwen3 235B 2507(推理)级别的智能 🧠 关键智能基准测试要点: ➤ 推理模型性能:GLM 4.6(推理)在人工分析智能指数上得分 56,较 GLM 4.5 在推理模式下的 51 分有所上升 ➤ 非推理模型性能:在非推理模式下,GLM 4.6 的得分为 45,领先 GPT-5(最小的非推理)2 分 ➤ 令牌效率:Z ai 在减少输出令牌的同时提高了 GLM 的评估分数。对于 GLM 4.6(推理),我们看到人工分析智能指数的令牌使用量减少了 14%,从 100M 降至 86M,相较于 GLM 4.5(推理)。这与我们看到的其他模型升级不同,其他模型的智能提升通常与输出令牌使用量的增加相关。在非推理模式下,GLM 4.6 使用 12M 输出令牌来运行人工分析智能指数 其他模型细节: ➤🪙 上下文窗口:200K 令牌上下文。这比 GLM 4.5 的 128K 令牌上下文更大 ➤📏 大小:GLM 4.6 具有 355B 总参数和 32B 活跃参数 - 这与 GLM 4.5 相同。对于自我部署,GLM 4.6 需要约 710GB 的内存来存储以原生 BF16 精度的权重,无法在单个 NVIDIA 8xH100 节点(约 640GB 内存)上部署 ➤©️ 许可:GLM 4.6 在 MIT 许可下可用 ➤🌐 可用性:GLM 4.6 可在 Z ai 的第一方 API 和多个第三方 API 上使用,如 DeepInfra(FP8)、Novita(BF16)、GMI Cloud(BF16)和 Parasail(FP8)
GLM 4.6(推理)提高了令牌效率,与 GLM 4.5(推理)相比,减少了 1400 万个输出令牌,适用于人工分析智能指数
由人工智能分析独立运行的完整评估
比较 GLM 4.6 相对于您正在使用或考虑的模型的表现:
查看原文
9,478
142
本页面内容由第三方提供。除非另有说明,欧易不是所引用文章的作者,也不对此类材料主张任何版权。该内容仅供参考,并不代表欧易观点,不作为任何形式的认可,也不应被视为投资建议或购买或出售数字资产的招揽。在使用生成式人工智能提供摘要或其他信息的情况下,此类人工智能生成的内容可能不准确或不一致。请阅读链接文章,了解更多详情和信息。欧易不对第三方网站上的内容负责。包含稳定币、NFTs 等在内的数字资产涉及较高程度的风险,其价值可能会产生较大波动。请根据自身财务状况,仔细考虑交易或持有数字资产是否适合您。