开云体育(中国)官方网站这次升级表咫尺公开基准与着实编程任务中-开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口
新闻资讯
发布日期:2025-11-03 06:05 点击次数:131


9月30日,国产大模子初创公司智谱发布GLM-4.6新模子。行为GLM系列最新版块,GLM-4.6在着实编程、长险阻文处理、推明智商、信息搜索、写稿智商与智能体诓骗等多个方面智商有所普及。
官方信息走漏,这次升级表咫尺公开基准与着实编程任务中,GLM-4.6代码智商对皆Claude Sonnet 4;险阻文窗口由128K普及至200K,相宜更长的代码和智能体任务;新模子普及推明智商,并因循在推理历程中调用器用;搜索方面增强模子的器用调用和搜索智能体。
另外,“模芯联动”是这次新模子发布的重心,GLM-4.6已在寒武纪国产芯片上竣事FP8+Int4羼杂量化部署,这亦然行业初度在国产芯片上投产的FP8+Int4模子芯片一体处罚决议,在保抓精度不变的前提下,裁汰推理本钱,为国产芯片在大模子土产货化驱动上探索可行旅途。
FP8是8 位浮点数(Floating-Point 8)数据类型,动态限度广、精度亏空小;Int4是4 位整数(Integer 4)数据类型,压缩比极高,内存占用最少,适配低算力硬件但精度亏空相对明显。这次尝试的“FP8+Int4 羼杂” 模式,并非简便将两种风景类似,而是把柄大模子的“模块功能相反”,针对性分派量化风景,让该省内存的所在用Int4压到极致,该保精度的所在用FP8守住底线,竣事合理资源分派。
具体到模子适配历程中,占总内存的60%-80%的大模子中枢参数通过Int4量化后,可将权重体积径直压缩为FP16的1/4,大幅裁汰芯片显存的占用压力;推理风景积存的临时对话数据不错通过Int4压缩内存的同期,将精度亏空放手在 “隐微”限度。而FP8可重心针对模子中“数值敏锐、影响推理准确性”的模块,裁汰精度亏空、保留素雅语义信息。
除了寒武纪,据记者了解,摩尔线程已基于vLLM推理框架完成对GLM-4.6 的适配,新一代GPU可在原生FP8精度下默契驱动模子,考据MUSA架构及全功能GPU在生态兼容性和快速适配智商方面的上风。
寒武纪与摩尔线程此番完成对GLM-4.6的适配,标记着国产GPU已具备与前沿大模子协同迭代的智商,加快构建自主可控的 AI 时间生态。接下来,GLM-4.6搭配国产芯片的组合将当先通过智谱MaaS平台面向企业与公众提供管事。
举报 第一财经告白合营,请点击这里此本色为第一财经原创,著述权归第一财经通盘。未经第一财经籍面授权,不得以任何风景加以使用,包括转载、摘编、复制或建造镜像。第一财经保留讲求侵权者法律连累的权力。如需得回授权请酌量第一财经版权部:banquan@yicai.com 文章作家
吕倩
相关阅读
改动更新丨A股三大股指均跌逾1%,两市成交额再破3万亿元盘面上个股普跌,全商场超4300只个股着落。
7 364 09-18 09:36
寒武纪再融资39.85亿元获批,高位增发会否影响股价?这次募投名堂试验有何遑急性?
5 467 09-10 07:36
寒武纪定增央求获证监会得意注册批复本批复自得意注册之日起12个月内灵验。
120 09-09 21:10
Anthropic停服,智谱修起推出“Claude API 用户尽头搬家计算”Anthropic停服,智谱修起推出“Claude API 用户尽头搬家计算”
129 09-05 18:50
寒武纪大跌近15%,跟这个原因相关?寒武纪在科创50指数中的权重为14.88%,已卓越科创板系列指数建设10%的个股权重上限开云体育(中国)官方网站,9月12日收市后或将靠近被迫下调权重。
780 09-04 18:35 一财最热 点击关闭Powered by 开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口 @2013-2022 RSS地图 HTML地图