芯原股份 (芯原 ,芯原股票代码 :688521.SH) 日前宣告其 。可扩高功能 、高性可扩展的芯原GP 。GPU。可扩- 。高性AI。芯原核算IP的可扩最新进展,这些IP现已为新一代。高性轿车电子。芯原和边际服务器使用供给微弱赋能 。可扩 。高性经过将可。芯原编程。可扩并行核算才能与。高性人工智能。(AI) 加快器相交融,这些IP在热和功耗受限的环境下,可以高效支撑大言语模型 (LLM) 推理 、多模态感知以及实时决议计划等杂乱的AI作业负载。
芯原的GPGPU-AI核算IP根据高功能通用图形。处理器 。(GPGPU) 架构 ,并集成专用AI加快器,可为AI使用供给杰出的核算才能 。其可编程AI加快器与稀少感知核算引擎经过先进的调度技能 ,可加快Transformer等矩阵密集型模型的运转 。此外,这些IP支撑用于混合精度核算的多种数据格式,包含INT4/8 、FP4/8、BF16、FP16/32/64和。TF 。32 ,并支撑多种高带宽。接口 。,包含3D堆叠内存、LP 。DDR。5X 、HBM 、PCIe Gen5/Gen6和CXL 。该IP还支撑多芯片、多卡扩展布置,具有体系级可扩展性 ,满意大规模AI使用的布置需求。
芯原的GPGPU-AI核算IP原生支撑PyTorch、 。TensorFlow。 、ONNX和TVM等干流AI结构,掩盖练习与推理流程。此外,它还支撑与干流的GPGPU编程言语兼容的通用核算言语 (GPCL),以及干流的编译器 。这些才能高度符合当时大言语模型在算力和可扩展性方面的需求 ,包含DeepSeek等代表性模型。
“边际服务器在推理与增量练习等场景下对AI算力的需求正呈指数级增加 。这一趋势不只要求极高的核算功率 ,也对架构的可编程性提出了更高要求。芯原的GPGPU-AI核算处理器在架构规划上完成了GPGPU通用核算与AI加快器的深度交融,可在极细粒度层面完成高效协同,相关优势已在多个高功能AI核算体系中得到验证。”芯原首席战略官 、履行副总裁、IP事业部总经理戴伟进表明