2025全球AI芯片峰会 | 北极雄芯徐涛:前沿架构支持大模型应用的实践及展望

9月17日,2025全球AI芯片峰会在上海举行,来自AI芯片领域的42位产学研专家及创业先锋代表,畅谈对大模型下半场中国AI芯片创新、落地、生存、破局的最新观察与思考。本届峰会以“AI大基建 智芯新世界”为主题,覆盖大模型AI芯片、架构创新、存算一体、超节点与智算集群技术等前沿议题。北极雄芯联创、副总裁徐涛应邀出席,并作主题演讲。
在下午的大模型AI芯片专题论坛上,北极雄芯与多家企业共同探讨创新的技术路径与最新进展。北极雄芯联创、副总裁徐涛以《前沿架构支持大模型应用的实践及展望》为主题进行分享。
大模型推理落地有效降本迫在眉睫。截至2025年6月,中国日均tokens消耗量突破30万亿,比2024年增长300+倍,且依然处于高速增长期。而大模型应用商业化闭环任重道远,一方面C段订阅付费较难,B端API调用收费与美国相比有数量级的差距,另一方面国内算力成本并不优于美国。北极雄芯联创、副总裁徐涛谈道,当前中国大模型应用落地商业化,解决成本问题至关重要。而受制于各类制裁,面对高速增长的算力、存储容量、内存带宽的“不可兼得三角”,国内上下游企业亟需共同开展架构创新。
在云端推理场景,北极雄芯将在近期推出面向Decode环节的专用加速方案,通过Chiplet+PIM/PNM的近存计算技术大幅降低推理成本至少一个数量级,相比主流GPU芯片提升10倍以上性价比。在端侧AI领域,北极雄芯的启明935系列芯粒通过Chiplet灵活组合应用,为主机厂提供AI Box、舱驾一体、高阶智驾等不同挡次应用的解决方案。

北极雄芯联创、副总裁徐涛
关于北极雄芯
北极雄芯致力于成为基于Chiplet的定制化高性能计算解决方案领航者,目前公司积累了CPU、NPU和GPU三款芯粒、面向多种工艺的D2D互连IP,可以向市场提供基于Chiplet技术的定制化高性能芯片开发解决方案。
▲北极雄芯再获西安财金和沃格光电投资
版权声明
本文仅作者转发或者创作,不代表旺旺头条立场。
如有侵权请联系站长删除
旺旺头条





发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。