每日經濟新聞 2025-09-30 15:41:24
每經記者|可楊 每經編輯|陳俊杰
9月30日,《每日經濟新聞》記者獲悉,國內大模型企業(yè)智譜正式發(fā)布并開源新一代大模型GLM-4.6,在Agentic Coding (代理式編碼)等核心能力上實現(xiàn)大幅躍升。
智譜官方宣布,GLM-4.6已在寒武紀AI芯片上實現(xiàn)FP8+Int4(一種混合精度計算技術)混合量化推理部署,這也是首次在國產芯片上投產的FP8+Int4模型—芯片一體化解決方案。在保持模型精度不變的前提下,該方案大幅降低了推理成本,為國產芯片本地化運行大模型提供了可行路徑和示范意義。
與此同時,摩爾線程基于vLLM推理框架完成了對GLM-4.6的適配,新一代GPU可在原生FP8精度下穩(wěn)定運行模型,充分驗證了 MUSA((Meta-computing Unified System Architecture,元計算統(tǒng)一系統(tǒng)架構)架構及全功能GPU在生態(tài)兼容性和快速適配能力方面的優(yōu)勢。
寒武紀與摩爾線程完成對GLM-4.6的適配,標志著國產GPU已具備與前沿大模型協(xié)同迭代的能力,加速構建自主可控的AI技術生態(tài)。GLM-4.6搭配國產芯片的組合將率先通過智譜MaaS平臺面向企業(yè)與公眾提供服務。
如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP