美股 AI 量化分析工具,大家好,我们是美股投资网,用大数据驱动你的交易决策
英伟达的护城河,可能正在被撕开一道真正的裂口。
本周四,一家AI算力公司Cerebras,代码CBRS,将在美股上市。
它做的芯片,连英伟达自己都不敢想。英伟达是把成千上万颗GPU连在一起,拼算力集群;Cerebras更激进——直接把一整片晶圆做成一颗超级芯片。打个比方:英伟达在拼乐高,Cerebras想直接造出一整面算力墙。
现在IPO路演已经把市场情绪点着了。这周一,因为订单需求直接超出发行量20倍,Cerebras自己把发行价从115-125美元提到了150-160美元,发行量也加了200万股。按上限算,估值冲到350亿美元。在这个行情下还敢主动提价,提了还被抢光——你就知道机构有多看好它。
它手里还握着两个最强背书:OpenAI和亚马逊。Cerebras跟OpenAI签了超过200亿美元的照付不议合同,一签签到2028年;另一边,AWS宣布把Cerebras芯片搬进自家数据中心,跟自研的Trainium芯片一起干活。
一家没上市的公司,同时拿下AI巨头和云巨头的订单——这个信号不需要我再多解释了。
今天这期视频,我会讲清楚四件事:
第一,Cerebras到底是什么,它凭什么敢挑战英伟达?
第二,它的WSE芯片和英伟达GPU,本质区别在哪?
第三,它的商业模式——靠什么赚钱,财务数据、增长速度、估值逻辑,又该怎么看?
第四,散户怎么看待这次IPO,上市首日能不能追?背后最大的机会和风险分别是什么?
这可能是今年AI硬件赛道最受关注的一只新股。但越火的股票,越不能只看故事。视频最后,我会把机会、风险、估值和参与策略一次性讲透。千万别走开。
Cerebras 是一家什么公司?
Cerebras 到底是干嘛的?一句话就可以讲清楚:别人是把晶圆切成很多小芯片,Cerebras 是直接把整片晶圆当成一颗超级芯片来用。
什么是晶圆?就是那块圆圆的、亮晶晶的硅片,直径300毫米。
正常的芯片厂是怎么做的?先在晶圆上做出几百颗芯片,然后像切披萨一样,咔咔咔切成一小块一小块。每一小块,就是一颗芯片。我们平时用的手机芯片、电脑 CPU、英伟达 GPU,大体都是这个逻辑。
那英伟达的 AI 算力为什么强?
因为它不只卖芯片。它卖的是整套系统——GPU、显存、NVLink、交换机、光模块、服务器,再加上CUDA软件生态,几乎全给你打包好了。客户买到的不是一颗芯片,而是一座可以直接开工的AI工厂。
但是这个模式有一个逃不掉的代价。
GPU越多,数据就越需要在芯片之间来回传输。你可以想象一个超级工厂,每个车间都非常先进,但原材料要在几百个车间之间来回运。最后卡住你的是什么?不是机器不够快,而是物流太慢。AI也一样——数据搬来搬去,延迟就上来了,耗电也上来了,带宽压力也跟着爆了。
Cerebras的创始人叫Andrew Feldman。这人早年做过一家服务器公司,后来卖给了AMD。他太清楚问题的本质了——算力系统的瓶颈,从来不在单颗芯片跑多快,而在数据怎么流动。
于是他想了一个特别极端的办法。既然跨芯片传数据这么麻烦,那我干脆不切了。一整片晶圆,直接做成一颗芯片。
这就是WSE,晶圆级引擎。第三代叫WSE-3,装在CS-3系统里。核心思路一句话:把所有东西尽量塞在一块硅片上,让数据少往外跑。
Feldman自己说过一句话,我印象特别深:“我们发明了过去75年计算机行业里被认为最不可能实现的技术——把处理器做到餐盘那么大,而传统处理器只有邮票大小。”
数据对比:它不是靠峰值算力赢的
从数据看,这条路线还不错。
CS-3的峰值算力是125 PFLOPs。单颗英伟达B200是4.5 PFLOPs,所以CS-3一颗顶28颗B200。但英伟达不是只卖单颗芯片,它卖的是整柜系统。如果你拿CS-3和英伟达的整柜GB200 NVL72比——后者峰值算力是360 PFLOPs,比CS-3还要高。
所以你不能简单说Cerebras算力比英伟达强。真正让Cerebras与众不同的,是另外两个东西:内存带宽和架构设计。
我们先了解推理是怎么工作的?
为了生成下一个词,所有模型权重都需要从内存传输到计算单元。这个过程是逐词顺序进行的。一个700亿参数的模型,权重数据量相当于大约100部高清电影。生成每一个词,都需要把这么多数据从内存搬到计算单元。一个1000词的回答,相当于传输了10万部高清电影的数据量。
在传统GPU上,从HBM传输数据到计算单元的速度大约是8TB/秒。而在Cerebras的晶圆上,这个速度超过21,000TB/秒——快了2600多倍。
为什么能做到?因为Cerebras用的是SRAM,不是HBM。SRAM本身速度就快,但传统上它的问题是每平方毫米能做的容量有限。Cerebras的解法很简单粗暴:我芯片做得足够大,就能放足够多的SRAM。这就是整片晶圆不切割的核心价值所在。
再看另一个数据:CS-3的内存带宽是26,750 Tb/s,而GB200 NVL72只有130 Tb/s,差了200多倍。
Cerebras自己总结得很直接:“我们的处理器比最大的GPU大58倍,内存带宽高出2500倍以上。这正是高速推理的基础。”
好,那实际跑任务呢?
Cerebras官方公布过一个数据:CS-3跑Llama 3.170B推理,比英伟达的DGX B200快21倍,成本低32%,功耗也低三分之一。第三方测试也有:跑Llama 3.1 8B,每秒1800个token,是常规GPU方案的20倍。
还有一个更夸张的——碳捕获模拟,比H100快了200多倍。
但是注意,这些数字都是在特定任务下跑出来的。你要是换成复杂的混合计算,或者重度依赖CUDA生态的活儿,英伟达依然稳如泰山。
这时候你可能会问:那GPU为什么不也跑快一点?
Cerebras揭示了一个值得注意的现象,叫做“GPU的速度陷阱”。
GPU在低速运行时效率极高。比如每秒35个token的慢速下,一台GB200 NVL72可以同时支持数万名用户,成本极低。但当用户要求提速——比如每秒270个token——这台机器只能服务一名用户,成本瞬间飙升到天上去。
Cerebras自己的说法是:“从每秒100到150个token开始,GPU变得极其昂贵且功耗效率低下,而我们的成本与功耗仅为其极小一部分。没有任何数量的GPU能达到我们的速度,GPU根本不可能实现这种性能。在这种速度下,我们毫无竞争对手。”
为什么速度是战略武器?以及谁在为它买单
那问题来了:为什么一定要追求这种极端速度?
对普通用户来说,虽然每秒 35 个 token 的阅读速度其实已经够了,但现实很残酷:哪怕只慢一点点,用户就会流失。就像 YC 创始人 Paul Graham 说的,如果 ChatGPT 反应变慢,他回过头去用谷歌的AI就会多出一倍。
这揭示了一个残酷的商业真相:快,就是最硬的护城河。Sam Altman 追求的极端速度,本质上是在消除用户切换平台的任何微小念头。
但这只是硬币的一面。另一面更重要:整个AI产业的算力命脉,几乎都攥在英伟达手里。这不是任何一个大模型公司愿意看到的。
所以OpenAI花这个钱,是两个原因叠加的结果:
第一,Cerebras确实快。在“极致速度”这条赛道上,GPU根本跑不过Cerebras。
第二,必须降低对英伟达的依赖。把鸡蛋从英伟达一个篮子里,分一部分到Cerebras这个篮子里。
两个原因,一个追求性能,一个追求安全。这就是200多亿美元合同签下来的底层逻辑。
第二个大客户是亚马逊。
2026年3月,AWS宣布将Cerebras CS-3部署到自家数据中心,通过Amazon Bedrock提供服务。
方案是:用自研Trainium芯片处理“预填充”阶段,用Cerebras处理“解码”阶段,各干最擅长的事。
AWS计算副总裁David Brown的原话:“这套组合的推理速度,将比现有方案快一个数量级。”
一家没上市的公司,同时拿下OpenAI和AWS的订单,背后还有甲骨文、Meta等客户的关注可见还是有实力的。
如果你觉得本视频对你有帮助,老规矩先点赞再收藏,关键时刻能帮忙美国热线 626 378 3637
财务与供应链已经跑通了
接下来我们看 Cerebras 的财务。
这家公司最大的亮点,是增长速度非常快。它的营收从 2022 年的 2460 万美元,增长到 2023 年的 7870 万美元,2024 年达到 2.9 亿美元,2025 年进一步增长到 5.1 亿美元。三年时间,营收增长了接近 20 倍,这个速度在半导体公司里非常少见。
但问题是:增长快,不代表已经真正赚钱。
表面上看,Cerebras 在 2025 年实现了 2.378 亿美元 GAAP 净利润,看起来已经扭亏为盈。但这笔利润里,有很大一部分来自会计调整,不是卖芯片、卖算力赚出来的钱。公开资料显示,Cerebras 2025 年有一笔约 3.63 亿美元的远期合同负债公允价值变动收益;如果剔除这些因素,公司 2025 年仍然录得 1.459 亿美元经营亏损,non-GAAP 净亏损约 7570 万美元。
所以这里不能简单说它“已经盈利”。更准确的说法是:财报上看到了盈利,但核心经营还在亏钱。
再看毛利率。Cerebras 的毛利率从 2022 年的 12%,提升到 2025 年的 39%,进步很明显。说明随着收入扩大、产品交付增加,它的成本结构确实在改善。
但 39% 的毛利率,和英伟达相比还有很大差距。原因也不难理解:Cerebras 做的是晶圆级芯片,制造难度高、系统复杂度高,而且现在规模还没有完全跑起来。它要达到更高毛利率,必须靠后续交付规模扩大、制造效率提升,以及云服务模式跑通。
真正让市场兴奋的,是它手里的订单。
截至 2025 年底,Cerebras 披露的待确认订单,达到 246 亿美元。其中包括与 OpenAI 相关的约 200 亿美元合作,也包括 Amazon 等客户订单。
这个数字非常大,说明市场对它的算力确实有需求。
但投资者一定要冷静看两个问题。
第一,这些订单不是马上变成收入。
公司预计,到 2027 年底,大约只能确认其中 15% 的收入;之后 25 到 48 个月再确认约 43%,剩下的还要更久。也就是说,订单很大,但钱要分几年慢慢落袋。
第二,交付这些订单之前,公司还要先花很多钱。
它要提前采购晶圆、建设系统、部署数据中心,还要解决电力、供应链和客户交付问题。Cerebras 自己也提示,订单能不能变成收入,取决于制造产能、基础设施部署和电力供应。
上市之后我们的核心操盘思路是什么呢?先说我的判断。
第一阶段,大概率是炒情绪。
炒它是今年最稀缺的AI硬科技IPO;炒OpenAI那200多亿美元的照付不议合同;炒跟AWS的合作;炒一个故事——AI算力不一定只有英伟达这一条路。
这个阶段,情绪主导,资金涌入,首日涨100%都有可能。
但情绪炒完之后,第二阶段会非常现实。
上面讲的那些风险点,市场会一条一条拿出来对账。订单能不能变成收入?750兆瓦的部署能不能按时交付?毛利率能不能从50%爬到60%?客户集中度会不会出问题?你到底是在补充英伟达,还是有本事抢走它的份额?
这些问题,上市后第一个财报季就会被摆到台面上。
因为现在市场给Cerebras的,已经不是普通半导体公司的估值了,而是“AI基础设施新路线”的估值。这个估值的前提是,你代表了一条路,而不只是卖了一个产品。
如果后面收入兑现跟不上,或者交付能力出问题,股价回撤会非常快。
最后我们来说风险
第一,客户高度集中。
这不是秘密。2024年上半年,Cerebras 87%的收入都来自一家公司——阿联酋的G42。到了2025年,G42占比虽然降到了24%,但别急着松口气。MBZUAI,也就是穆罕默德·本·扎耶德人工智能大学,跟G42关系极深,它一家就占了62%的收入。算下来,Cerebras对中东这几个大客户的依赖,仍然接近90%。
而且OpenAI那张200亿美元的大单也不是白给的。合同对交付进度要求非常严格——首批250兆瓦算力,如果交付延迟,Cerebras面临的就不是少赚点钱的问题,而是违约和信誉双重打击。
第二,供应链压力不小。
Cerebras 的晶圆级芯片制造难度非常高,关键制造环节高度依赖台积电。它用的是 5nm,不需要最紧张的 HBM 和 CoWoS,这确实是一个优势;但晶圆级芯片本身良率、成本、交付节奏都很敏感。只要制造或者产能出现波动,都会直接影响毛利率和订单交付。
第三,软件生态还远远不如英伟达。
Cerebras 可以对接 PyTorch、TensorFlow 等主流框架,但要把性能完全榨出来,还是需要适配它自己的软件栈。相比英伟达 CUDA 几十年积累下来的开发者生态、工具链和客户习惯,Cerebras 短期内很难追上。
第四,成本和可靠性还需要验证。
晶圆级芯片很强,但也意味着供电、散热、封装、长期稳定性要求都非常高。大规模部署到数据中心之后,能不能长期稳定运行,能不能把成本压下来,还需要时间证明。
第五,竞争不会停下来。
英伟达不会坐着等人挑战。Blackwell、Rubin 后面一代接一代升级,GPU 集群的性能和能效还会继续提高。更重要的是,OpenAI 自己也在做芯片。如果未来自研芯片推进顺利,今天的大客户,未来也可能变成潜在竞争者。
所以你看,Cerebras 不是没有风险。
客户集中、交付压力、供应链、软件生态、散热成本、竞争升级,这些问题一个都不小。它绝对不是一上市就能取代英伟达,也不是没有短板的完美公司。
但重点在于,市场现在看的不是“Cerebras 明天能不能打败英伟达”,而是一个更大的信号:AI 巨头们正在认真寻找英伟达之外的第二套算力方案。
这才是英伟达接下来财报最敏感的地方。
因为英伟达真正的风险,不是这个季度 GPU 卖不卖得动。短期来看,AI 芯片需求依然很强。市场真正担心的是:英伟达最大的客户,正在一边买它的 GPU,一边加速自研芯片,甚至扶持新的替代路线。
过去两年,微软、谷歌、亚马逊、Meta 这些云巨头疯狂采购英伟达 GPU,把英伟达推上了 AI 时代的王座。但现在,谷歌在推 TPU,亚马逊在推 Trainium,微软和 OpenAI 也在布局自己的 AI 芯片。与此同时,Cerebras、Groq、Tenstorrent 这些新架构公司,也在从推理市场寻找突破口。
换句话说,英伟达最大的客户,正在慢慢变成它潜在的竞争对手。
中国市场也是一个变量。受出口限制影响,英伟达高端 AI 芯片在中国的销售空间被压缩,华为 Ascend 正在承接更多国产替代需求。如果中国大厂更多转向国产芯片,英伟达在中国市场的增长空间也会受到影响。
所以,英伟达财报真正要看的,不只是营收和利润有没有超预期,而是三个问题:
大客户的采购节奏有没有变化?
自研芯片和替代方案有没有开始影响市场预期?
英伟达还能不能继续维持现在这种高增长、高毛利和高估值?
这也是为什么 CBRS 上市值得关注。它表面上是一只 AI 新股,背后却代表着整个行业正在寻找“后英伟达时代”的可能性。
好了,今天的视频到这里就结束了。CBRS上市,如果一开盘180美元,你还会不会冲进去?是快进快出赚一点就跑还是等回调再进还是隔山看好戏?你又对英伟达财报怎么看?评论区聊聊你的看法。我们一起讨论。












