【原创】燧原科技科创板IPO过会预示DSA时代开启！

由 winniewei 提交于周二, 16 六月 2026 - 14:13

作者：电子创新网张国斌

6月15日，上海燧原科技股份有限公司(简称：燧原科技)通过上交所科创板上市委会议。IPO保荐人为中信证券，拟募资60亿元。招股书显示，燧原科技成立 8 年来，公司自研迭代了四代架构 5 款云端 AI 芯片，构建了 AI 芯片、AI 加速卡及模组、智算系统及集群和 AI 计算及编程软件平台的完整产品体系，目前已成为我国云端 AI芯片领军企业之一。

截至 2025 年末，燧原科技已获得境内发明专利 313 项，已承担 12 项国家及地方科技攻关项目，参与了58项AI芯片与智算系统的关键国家及行业标准的制定，获得世界人工智能大会“SAIL 之星”、中国算力大会“年度突破成果”、三次“中国芯”最高奖“年度重大创新突破产品”“吴文俊人工智能科学技术专项一等奖”、全球“未来产业之星”大赛未来产业超能奖等重要奖项。

财务方面，于2023年度、2024年度及2025年度，公司实现营业收入分别约为3.01亿元、7.22亿元、9.90亿元；同期，净亏损分别约为16.65亿元、15.10亿元、11.64亿元。

燧原科技是一家专注于云端AI芯片的领军企业，其核心策略是构建一个覆盖硬件到软件的完整、自主可控的产品体系。

它的主要产品和架构特点可以概括为以下几点：

核心产品体系

燧原科技的产品覆盖了从底层芯片到上层应用的全栈，具体包括：AI芯片与加速卡/模组：这是其核心收入来源，占2025年总营收的86.83%。代表性产品包括第一代云端训练芯片“邃思1.0”、第二代训练芯片“邃思2.0”、推理芯片“邃思2.5”，以及基于这些芯片的云燧系列AI加速卡（如训练卡T系列、推理卡i系列）。

智算系统及集群：以“云燧智算机”为代表，提供面向AI训练和推理场景的单机柜或算力节点设备，并可进一步构建千卡、万卡级的高速互联集群。

软件平台：独立自主研发了“驭算TopsRider”全栈软件平台，包含驱动、编译器、算子库等，旨在充分释放其硬件性能。

核心架构特点

与英伟达通用的GPGPU架构不同，燧原科技选择了自主可控的DSA架构（专用领域架构），其技术核心有两大自研技术：

GCU-CARE加速计算单元：这是一种将计算、互联与存储的优化特性以硬件方式固化的计算引擎，专门针对AI计算的超高并行度进行深度优化，同时兼具一定的硬件通用性。该架构已迭代四代，最新一代可原生支持FP8等精度。

GCU-LARE片间高速互联技术：这是构建大规模算力集群的关键技术，为燧原科技打造万卡级AI算力集群提供了底层支撑。

燧原科技的AI加速卡已实现数万张级别的出货，但同时也存在对大客户腾讯高度依赖的特点。2025年，来自腾讯及其指定客户的销售收入占其总营收的83.79%。公司最新一代的“训推一体”产品L600也已流片回片，正在推进量产。

DSA架构在推理时代的优势

DSA（Domain Specific Architecture，特定领域架构）确实是由图灵奖得主 David Patterson（大卫·帕特森）与他的长期合作伙伴 John Hennessy（约翰·轩尼诗）两位计算机体系结构泰斗在2017年提出的，它宣告了通用处理器性能提升的摩尔定律放缓，计算机体系结构迎来了新的“黄金十年”。这个概念已经提出了近十年，但是国内做DSA 算力芯片的公司还寥寥无几，主要原因是其开发和应用难度较大，随着燧原科技的IPO过会，国内DSA应用将开启，目前隼瞻科技、时擎科技、昆仑芯等都在做DSA架构的芯片。

DSA核心理念是放弃对所有应用都“通用”但效率一般的传统芯片，转而为特定领域的应用（如人工智能的深度学习、图形图像处理等）量身定制专用的处理器架构。典型代表就是以谷歌的 TPU（张量处理单元）为代表的 AI 芯片，在特定任务上实现了极高的性能功耗。

DSA在“推理为王”的阶段，确实正在获得结构性机会，但它不会取代GPGPU，而是形成“分层分工”的新算力格局。

GPGPU（通用GPU）：

面向：高灵活性计算（训练、多模型、多任务）

优势：生态成熟（CUDA）、开发门槛低

问题：能效比不极致、推理成本偏高

DSA（专用架构，如燧原）

面向：特定计算模式（Transformer推理、推荐系统、视频编解码等）

优势：性能/功耗比（Perf/Watt）和性能/成本（Perf/$）显著更优

问题：灵活性差、依赖软件栈适配

一句话总结：训练要“泛化能力”，推理要“极致性价比”——这正是DSA的主场。几个DSA典型案例是谷歌TPU、Amazon Inferentia、Tesla FSD Chip等。

当前大模型推理正在发生三个变化：

（1）从“算力密集” → “带宽+延迟敏感”、小batch、高并发、实时响应、KV Cache、Attention成为瓶颈，而DSA可以做Attention硬件特化、优化内存访问路径（SRAM/片上缓存）

（2）从“FP16/FP32” → “低精度（INT8/FP8/甚至INT4）”--推理不再追求数值极致精度，DSA可以原生支持低比特计算，去掉通用浮点单元的冗余（从“模型通用” → “场景专用”：推荐系统、搜索、视频理解、Agent推理。

DSA本质上是用"专用性"换"效率"，用"生态独立性"换"自主可控"。在推理市场爆发的当下，这一策略已经验证了其商业价值——S60的10万片出货、庆阳万卡集群的落地都是证明。

但DSA的长期空间取决于软件生态完善度、与GPGPU的融合速度，以及燧原能否从"腾讯依赖"走向"多点开花"。

DSA的商业优势非常直接，如下表所示：

维度	GPGPU	DSA
初始投入	高（通用芯片）	高（定制设计）
单次推理成本	较高	显著更低
ROI	不稳定	一旦规模化→极强

本质是DSA是“规模化生意”，不是“通用工具生意”。

未来的格局可能会是：

GPU：训练 + 通用推理（灵活）DSA：规模化推理（赚钱）CPU：调度 + 轻量计算（控制）

AI上半场，拼的是谁能训练出最强模型。AI下半场，拼的是谁能把每一次调用，做到最便宜。而从这个角度看：

GPU赢了技术，但DSA正在赢生意。

燧原的IPO过会（2026年6月15日）标志着"国产GPU四小龙"首次在资本市场聚齐。其60亿募资计划中，约15亿用于第五代AI芯片、约12亿用于第六代AI芯片，显示出公司对未来技术迭代的长期投入。在算力自主可控的国家战略下，DSA路线至少在未来3-5年内拥有明确的商业化窗口期。

注：本文为原创文章，未经作者授权严禁转载或部分摘录切割使用，否则我们将保留侵权追诉的权利