作者:电子创新网张国斌
6月15日,上海燧原科技股份有限公司(简称:燧原科技)通过上交所科创板上市委会议。IPO保荐人为中信证券,拟募资60亿元。招股书显示,燧原科技成立 8 年来,公司自研迭代了四代架构 5 款云端 AI 芯片,构建了 AI 芯片、AI 加速卡及模组、智算系统及集群和 AI 计算及编程软件平台的完整产品体系,目前已成为我国云端 AI芯片领军企业之一。
截至 2025 年末,燧原科技已获得境内发明专利 313 项,已承担 12 项国家及地 方科技攻关项目,参与了58项AI芯片与智算系统的关键国家及行业标准的制定, 获得世界人工智能大会“SAIL 之星”、中国算力大会“年度突破成果”、三次“中国芯”最高奖“年度重大创新突破产品”“吴文俊人工智能科学技术专项一等奖”、全球“未来产业之星”大赛未来产业超能奖等重要奖项。
财务方面,于2023年度、2024年度及2025年度,公司实现营业收入分别约为3.01亿元、7.22亿元、9.90亿元;同期,净亏损分别约为16.65亿元、15.10亿元、11.64亿元。
燧原科技是一家专注于云端AI芯片的领军企业,其核心策略是构建一个覆盖硬件到软件的完整、自主可控的产品体系。
它的主要产品和架构特点可以概括为以下几点:
核心产品体系
燧原科技的产品覆盖了从底层芯片到上层应用的全栈,具体包括:AI芯片与加速卡/模组:这是其核心收入来源,占2025年总营收的86.83%。代表性产品包括第一代云端训练芯片“邃思1.0”、第二代训练芯片“邃思2.0”、推理芯片“邃思2.5”,以及基于这些芯片的云燧系列AI加速卡(如训练卡T系列、推理卡i系列)。
智算系统及集群:以“云燧智算机”为代表,提供面向AI训练和推理场景的单机柜或算力节点设备,并可进一步构建千卡、万卡级的高速互联集群。
软件平台:独立自主研发了“驭算TopsRider”全栈软件平台,包含驱动、编译器、算子库等,旨在充分释放其硬件性能。
核心架构特点
与英伟达通用的GPGPU架构不同,燧原科技选择了自主可控的DSA架构(专用领域架构),其技术核心有两大自研技术:
GCU-CARE加速计算单元:这是一种将计算、互联与存储的优化特性以硬件方式固化的计算引擎,专门针对AI计算的超高并行度进行深度优化,同时兼具一定的硬件通用性。该架构已迭代四代,最新一代可原生支持FP8等精度。
GCU-LARE片间高速互联技术:这是构建大规模算力集群的关键技术,为燧原科技打造万卡级AI算力集群提供了底层支撑。
燧原科技的AI加速卡已实现数万张级别的出货,但同时也存在对大客户腾讯高度依赖的特点。2025年,来自腾讯及其指定客户的销售收入占其总营收的83.79%。公司最新一代的“训推一体”产品L600也已流片回片,正在推进量产。
DSA架构在推理时代的优势
DSA(Domain Specific Architecture,特定领域架构)确实是由图灵奖得主 David Patterson(大卫·帕特森)与他的长期合作伙伴 John Hennessy(约翰·轩尼诗)两位计算机体系结构泰斗在2017年提出的,它宣告了通用处理器性能提升的摩尔定律放缓,计算机体系结构迎来了新的“黄金十年”。这个概念已经提出了近十年,但是国内做DSA 算力芯片的公司还寥寥无几,主要原因是其开发和应用难度较大,随着燧原科技的IPO过会,国内DSA应用将开启,目前隼瞻科技、时擎科技、昆仑芯等都在做DSA架构的芯片。
DSA核心理念是放弃对所有应用都“通用”但效率一般的传统芯片,转而为特定领域的应用(如人工智能的深度学习、图形图像处理等)量身定制专用的处理器架构。典型代表就是以谷歌的 TPU(张量处理单元)为代表的 AI 芯片,在特定任务上实现了极高的性能功耗。
DSA在“推理为王”的阶段,确实正在获得结构性机会,但它不会取代GPGPU,而是形成“分层分工”的新算力格局。
GPGPU(通用GPU):
面向:高灵活性计算(训练、多模型、多任务)
优势:生态成熟(CUDA)、开发门槛低
问题:能效比不极致、推理成本偏高
DSA(专用架构,如燧原)
面向:特定计算模式(Transformer推理、推荐系统、视频编解码等)
优势:性能/功耗比(Perf/Watt)和性能/成本(Perf/$)显著更优
问题:灵活性差、依赖软件栈适配
一句话总结:训练要“泛化能力”,推理要“极致性价比”——这正是DSA的主场。几个DSA典型案例是谷歌TPU、Amazon Inferentia、Tesla FSD Chip等。
当前大模型推理正在发生三个变化:
(1)从“算力密集” → “带宽+延迟敏感”、小batch、高并发、实时响应、KV Cache、Attention成为瓶颈,而DSA可以做Attention硬件特化、优化内存访问路径(SRAM/片上缓存)
(2)从“FP16/FP32” → “低精度(INT8/FP8/甚至INT4)”--推理不再追求数值极致精度,DSA可以原生支持低比特计算,去掉通用浮点单元的冗余(从“模型通用” → “场景专用”:推荐系统、搜索、视频理解、Agent推理。
DSA本质上是用"专用性"换"效率",用"生态独立性"换"自主可控"。在推理市场爆发的当下,这一策略已经验证了其商业价值——S60的10万片出货、庆阳万卡集群的落地都是证明。
但DSA的长期空间取决于软件生态完善度、与GPGPU的融合速度,以及燧原能否从"腾讯依赖"走向"多点开花"。
DSA的商业优势非常直接,如下表所示:
维度 | GPGPU | DSA |
|---|---|---|
初始投入 | 高(通用芯片) | 高(定制设计) |
单次推理成本 | 较高 | 显著更低 |
ROI | 不稳定 | 一旦规模化→极强 |
本质是DSA是“规模化生意”,不是“通用工具生意”。

未来的格局可能会是:
GPU:训练 + 通用推理(灵活)DSA:规模化推理(赚钱)CPU:调度 + 轻量计算(控制)
AI上半场,拼的是谁能训练出最强模型。AI下半场,拼的是谁能把每一次调用,做到最便宜。而从这个角度看:
GPU赢了技术,但DSA正在赢生意。
燧原的IPO过会(2026年6月15日)标志着"国产GPU四小龙"首次在资本市场聚齐。 其60亿募资计划中,约15亿用于第五代AI芯片、约12亿用于第六代AI芯片,显示出公司对未来技术迭代的长期投入。在算力自主可控的国家战略下,DSA路线至少在未来3-5年内拥有明确的商业化窗口期。
注:本文为原创文章,未经作者授权严禁转载或部分摘录切割使用,否则我们将保留侵权追诉的权利