美股真正的变盘点,就在本周三(4月2日)!
这一天,川普将正式公布新一轮全球关税的规模与细节。而美股近期的暴跌,很大程度上就是在提前为这场不确定性定价。
周三之后,美股到底是反弹,还是继续跌,就看这三种情况最后怎么落地:
第一种:如果4月2日的公告提供高清晰度,且关税增加幅度小,并没有进一步扩大关税计划,那么对经济前景的额外打击可能相对较小。不过,已经实施的关税预计将对经济施加压力,即使4月2日没有新的重大关税,预计今年美国经济增长仍将显著放缓。
第二种:如果公告缺乏具体性,但承诺大幅增加关税,这不会明确恶化已经低于共识的经济增长预期。缺乏具体性可能暗示通过谈判来缓解关税增加的可能性。
第三种:如果投资者在4月2日获得关于大幅增加关税的明确信息,可能包括超出关税差异的关税增加,与外国贸易伙伴谈判的门槛很高。美国经济增长将低于预期,美股可能会下跌。
听起来是不是4月2日凶多吉少,但高盛刚刚发布的“4月2日交易计划”当中,已明确表明做多科技七巨头。原因就是,这批龙头的估值溢价已降至近十年低位,当前重新布局的性价比正在上升。
现在,我们最值得思考的问题是这一轮美股的下跌,到底已经消化了多少关税的利空?后市有什么因素能支撑美股走出下跌?
为此,我们美股投资网花了整整几十个小时,研究了几十份最新数据、图表和历史案例,只为带你彻底弄清楚:
1. 美股长期上涨的核心因素是什么?
2. 美国的家庭净资产创历史新高,美国经济是否有韧性?
3. 美债收益率揭示市场情绪?美国真的符合衰退的条件吗?
4. 当前AI科技股估值水平?
如果你觉得本视频对你有帮助,老规矩先点赞再收藏,关键时刻能帮忙
大家好,这里是美股投资网,2008年成立于美国硅谷,由前纽约证券交易所资深分析师Ken创立,专注AI,挖掘美股投资机会,旗下 AI量化美股分析工具- 美股大数据 StockWe.com 每天追踪机构主力资金买卖情况,多空情绪。
美股的长期影响因素
纵观过去几十年,美股长期向上的核心驱动力其实非常清楚,那就是企业的盈利能力。只要企业能够持续赚钱股价也会随之上涨。
我们仔细看这张图。蓝色的线代表美国整体企业的真实利润,黄色的是标普500指数企业的每股收益(EPS)。你会发现,这两条线大部分时候走势都很一致,这就说明美股长期趋势与企业利润息息相关。
当然,在一些特殊阶段,这两条线也会出现明显的偏离,形成一个“利润缺口”。比如2000年前后的互联网泡沫时期,美股炒作非常厉害,股价远远超过了企业真正赚到的钱。再比如最近几年,以美股七巨头为代表的大型科技股大涨的阶段,市场的热度也明显超过了企业利润的增长速度,造成了短期的偏离。
但是这些背离最终都能得到修复,市场始终会回归基本面。换句话说,长期来看美股的走势一定会和企业的盈利能力保持一致。短期市场可能因为炒作情绪、资金推动或者各种利空消息出现大幅震荡,但只有企业利润不断增长,基本面持续改善,才能真正支撑美股长期稳定上涨。
那现在的企业基本面表现如何?
根据美国商务部经济分析局(BEA)最新发布的报告,美国企业的整体利润在第四季度环比增长了5.9%,达到了3.312万亿美元,成功扭转了第三季度小幅下滑的趋势。尤其值得注意的是企业的未分配利润,这个指标直接体现了企业手中的现金流和盈利实力,第四季度增长幅度更是高达15.1%,说明企业的盈利能力明显增强,财务状况更加稳健。另外,企业支付给股东的净股息也重新回升,环比增长了0.5%,企业敢于分红,就说明管理层对未来的信心正在恢复。
再进一步,我们看,经过库存估值和资本消耗调整后的生产利润,这个指标更精准地反映了企业真实的赚钱能力。在2024年第四季度,美国生产利润大幅增加了2047亿美元,增长率达到5.4%,整体规模达到了创纪录的4万亿美元。其中金融企业利润增加了694亿美元,而非金融企业利润增长了531亿美元,这说明不管是金融领域还是实体经济领域,美国企业都在持续创造利润。
我们再把视野放宽一点,从更宏观的角度看一个关键指标:2024年第四季度,美国企业利润占GDP的比重达到了13.5%,创下历史新高。这说明美国企业的整体盈利状况非常健康,也为2025年新一轮关税政策可能带来的冲击,提供了坚实的基本面支撑。
根据FactSet的数据,标普500成分股公司预计第一季度每股收益会同比增长7.1%。虽然和去年底分析师预测的11.1%相比,这个预期调低了4个百分点,看上去确实没那么理想。但换个角度想,7.1%的盈利增长仍然代表着企业整体是在赚钱的,并且已经连续七个季度都实现了盈利增长。这至少说明了一个事实,就是美股公司整体的盈利基本面还在持续扩张。
当然,我们也得承认,标普500的11个板块中,有不少确实没能达到之前的预期,特别是航空业、耐克这样的鞋类制造商,还有联邦快递这样的物流巨头,最近都调低了对自己业务的预测。出现这种情况,一部分原因可能和关税带来的政策不确定性有关。毕竟政策一旦出现不确定,企业和消费者都会变得比较谨慎,这是短期很正常的反应。
美债收益率揭示市场情绪真相
那么,有人可能会问,既然企业盈利这么好,为什么还有那么多人担心经济衰退呢?
我们先来回顾,去年8月美股暴跌的时候,市场特别恐慌。那次暴跌有几个原因,当时比较出名的一个说法是日元套息交易拆仓,再加上美国就业数据触发了所谓的“萨姆法则”(一个衰退的指标),导致市场短期恐慌情绪一下就爆发了。
当时市场怎么给美国衰退定价的呢?我们来看10年期美债收益率,像10年期美债这样的债券,是大资金对未来经济基本面的定价。这就像市场在给未来经济走势打分。现在,10年期美债的收益率大约在4.2%到4.3%之间。如果我们对比去年8月,这个收益率当时才3.6%-3.8%左右。所以,从这个角度来看,市场的情绪已经比去年8月要乐观很多,
如果市场真的觉得美国要马上陷入经济衰退,几乎可以肯定的是,现在10年期美债的收益率肯定早就跌到4%以下了。但事实并没有,我们看到每次10年期美债收益率靠近4.1%的时候,美股就开始企稳甚至反弹,接近4.2%以后,市场通常就不会再进一步下跌了。这种表现怎么看,都不像是市场在给衰退定价。
所以,如果你现在担心美国经济即将衰退,其实更多是心理上的担忧,是你主观上觉得它会衰退。但债券市场,至少从目前来看,并没有表现出这种强烈的担心。当然,债市也不是完全没压力,现在债券市场更多担忧的是特朗普最新贸易政策带来的短期通胀,以及长期通胀预期的问题。再加上美国财政赤字扩大,政府融资需求增加,债券市场暂时还在消化这些不确定性因素。
过去几十年里,真正严重的“硬着陆”式衰退其实只有两次:一次是2008年金融危机,另一次是2020年新冠疫情。这两次衰退都对美国经济的需求端造成了巨大而持续的打击。然而,目前的情况与当时截然不同。
美国经济与市场的结构性韧性
根据美联储最新数据,截至2025年初,美国的家庭净资产已升至历史新高。图中绿色的是总资产,红色是负债,黑线就是净财富。从2020年疫情后一路涨,负债没怎么变,净资产反而飙升,说明美国老百姓的账面实力现在是非常健康的。
这点很关键,因为美国是一个以消费驱动的经济体。如果家庭缺乏消费能力、不敢花,那经济才真的危险。但现在的问题并不是没有能力消费,而是政策不确定性让企业和消费者都变得更谨慎,不太敢做出长线决策。“不敢”并不等于“不能”,更不是“不愿意”。
企业方面也是一样的情况。美国企业的资产负债表整体非常健康,尤其是在现在AI革命刚刚起步的大环境下,企业的投资需求其实非常强烈。但眼下特朗普政策的不确定性还没有完全消除,特别是贸易和关税问题,很可能要等到4月份或者下周才会有明确结果,所以企业都选择了暂时观望。一旦这些不确定性逐步明朗,情绪释放完毕后,市场就像被压紧的弹簧,随时可能反弹。
所以整体来看,当前美国经济和市场的结构性因素并不支持一场严重衰退的出现。尽管短期内可能因政策变数而出现波动,但从根本上看,无论是家庭消费能力还是企业投资实力,都远未到衰退的临界点。
从政策层面来看,美联储手里还有很多工具。比如目前联邦基金利率还有大约400个基点的降息空间,也就是说,如果经济真的掉头,美联储完全有能力迅速出手,释放流动性,稳住局面。
至于特朗普,他表面上说不在意股市,但别忘了,他本质上是个商人。他上一次执政期间,就是靠减税、放松监管、政策刺激来推动股市上涨的。所以即便现在他打出的是“强硬”牌,一旦市场真的承压,他也很可能会换招,稳经济,提振市场信心。
这一次的川普政策和他第一次上台时不同。上次市场是一边倒的乐观,因为他带来的是减税、放松监管。而这次是“先紧后松”——先出硬招,稳定基本面,等节奏控制住,再慢慢释放利好。从这个角度来看,美国手里还有很多工具没用,市场也还有不少后招没出。所以,短期谨慎没错,但不必过度悲观,更没必要陷入末日论。
我们看一下美股的情况,比如标普500,这一轮下跌其实最多也就是10%左右。放在历史维度上看,这种级别的调整其实非常常见,几乎每年都会出现一到两次,更多被视为正常的技术性修正,而不是系统性风险的前兆。
此外在全球主流指数中,比如 MSCI 全球指数,美国的权重高达 66%;在全球债券指数中,美国的占比也超过了 55%。这意味着,在全球金融体系当中,美国在股票和债券两个维度都拥有极强的话语权。
也正因为如此,一旦美股出现剧烈的 risk-off(降风险)行为,或是一轮非技术性的深度回调,所引发的将不仅仅是本土市场的震荡,而是全球风险资产的全面调整。几乎没有哪个国家和地区能独善其身。
但这同样意味着,美股本身也具备一种“结构性的稳定性”。它是全球资产定价的锚,一旦自身出现剧烈动荡,不仅市场机制会自动寻求平衡,政策层面也往往会迅速出手干预。无论是美联储的货币政策,还是财政端的调节工具,都会在关键时刻形成托底。
从这个角度来看,美股并不具备“无底线下跌”的基础。只要不是系统性风险集中爆发,目前的这轮调整,更可能是一场情绪和估值的阶段性修正,而不是趋势性的崩塌。换句话说,市场正在接近一个情绪和估值相对合理的位置,底部虽未完全确认,但已经具备逐步企稳的条件。
本轮AI行情走到哪了?
可能大家最近的持仓大部分都集中在AI股上,现在回调,肯定很迫切地想知道:现在AI科技股估值水平是什么?还能不能继续持有或者加仓?接下来,我们就用数据来仔细分析一下当前的市场状况,给大家吃颗定心丸。
此轮AI科技行情,很多人都拿它和1997年到1998年互联网泡沫初期做对比,当时市场也是对新科技充满了期待,股价快速上涨,但还没到2000年那种极端疯狂的地步。现在的情况虽然没有那么夸张,但确实有些类似的信号值得注意。
首先来看市场表现,从2023年初到现在,纳指的年化收益率差不多在30%左右,这个速度和1995到1998年那段互联网刚兴起时32%的年化收益非常接近。当然,这还远没有达到1999年到2000年144%的疯狂涨幅。更重要的是,这一轮市场上涨中,有46%的推动力来自于企业的盈利增长,估值提升贡献了大概32%。
再来看市场集中度,科技龙头股的市值占比已经升至28%,尽管最近回落到26%,这个占比水平其实已经超过了1998年泡沫破裂前的22%,不过光看市值占比高还不能算是泡沫,关键得看这些公司的盈利贡献。现在科技龙头股的净利润占整个美股净利润的21%,而1998年底的时候只有9%。换句话说,现在这些科技巨头虽然市值占比很高,但赚钱的能力更强了,基本面也更稳了。
然后是盈利增速,科技龙头股现在的营收增长稳定在13%左右,几乎和1998年持平,虽然净利润的增速稍有回落,但仍保持在26%左右,净利润占比也从1998年的9%上升到了21%。更值得一提的是经营性现金流,虽然增长速度有所放缓,但仍然保持在24%左右的增长水平,目前占美股的比例更是达到了28%,远高于1999年底5.7%的水平。
说到市场情绪,现在虽然热度很高,但市场整体的情绪远比2000年时理性得多。看多/看空期权比例和个人投资者的情绪指标都还算比较稳健。不过,需要稍微留意的是,现在市场杠杆水平以及机构抱团程度确实达到了历史新高,融资余额和期权未平仓量的数据也创了纪录,这可能在短期内加剧市场波动。
最后我们从估值上看,当前标普500的动态市盈率大概在20.15倍,差不多和1998年底持平,虽然还高于历史平均值,但比2000年泡沫破裂前已经回落不少了。科技龙头股本身的估值也和1998年差不多,目前静态市盈率大约在37倍,动态则在31倍左右,相比2000年的“疯狂定价”,目前的估值虽然不算便宜,但显然更为理性和稳健。
高盛的美股仓位情绪指标本周降至 -1.2,为自 2023 年 4 月以来的最低水平。这表明,高盛在其模型中的美股持仓已经显著下降,当前处于一个相对谨慎、观望的状态。不过,这一数值仍未触及真正的“恐慌区”——历史上在2011年欧债危机、2018年底美联储加息过猛,或2022年通胀高企等阶段,情绪指标曾跌至 -2.5 至 -3。换句话说,高盛虽然已经压低仓位,但仍保留了相当的流动性,说明他们并不是全面看空市场,而是在等待一个更清晰的信号。
好了,今天的视频就到这里了。你对这一轮美股回调有什么看法?你还坚定地看好AI科技股吗?你手上都持有哪些美股呢?欢迎在留言区告诉我,大家一起讨论交流。喜欢今天的内容,记得点赞、收藏,分享!我们下期再见!
马斯克于上周四宣布,他将在5月底卸任特朗普政府中的“特别政府雇员”职务,并明确表示不考虑延期。
这意味着,这段为期130天、以“削减1万亿美元联邦赤字”为目标的短期“执政实验”,将画上句号。
对特斯拉投资者而言,马斯克离开白宫的意义,远不止一段政治插曲的结束。更重要的是:这是否意味着他将重新把重心放回公司运营,进而缓解美股市场对他“精力分散”的长期担忧?
一场“制度外”的政治实验
在过去的几个月中,马斯克以“政府效率部”(Department of Government Efficiency,简称DOGE)负责人的身份,主导了一系列高强度改革措施:大规模裁员、压缩非核心预算、审查联邦信用卡使用等,试图在130天内实现1万亿美元的财政削减目标。
DOGE 在其网站上声称,截至 3 月 27 日,它已为美国人节省了 1300 亿美元,约合每个纳税人 807 美元。
虽然他在政府中的身份只是“特别政府雇员”——一种临时顾问机制,按规定一年内最多服务130天——但从其实际操作手法来看,他的影响力远超传统意义上的顾问角色。
多家媒体报道称,马斯克绕过白宫正常流程、甚至在未经国会授权的情况下主导了部分预算调整,显示出他在政府内部所拥有的“超规格”权限。
换句话说,这更像是一场“制度外”的权力试验,也是马斯克将硅谷风格带入联邦行政系统的一次短期演练。
从一个宏观财政视角来说,马斯克这130天的确做到了让“赤字削减”这个长期被政治回避的议题重新成为舆论焦点。即便最终数字未能完全兑现,光是“如何花钱”这个问题能被强行拉进联邦议程,本身就是一次不小的制度激活。
但从治理结构的角度来看,这场改革也揭示了技术派入侵政治空间时的种种不适配——没有足够授权和监管机制时,效率很容易异化为专断;而当改革太过依赖个人意志,制度留下的就可能只是短暂的余波。
马斯克会在5月底离开白宫,但这130天,值得整个政府系统去回看、反思与吸收。
总统态度 vs 白宫耐性
值得注意的是,尽管白宫核心班底已对马斯克产生明显“厌烦感”,但特朗普本人似乎仍对他保持支持。特朗普在被问及是否希望马斯克长期留任时说:“他很了不起,但他也得回去管自己的公司。只要我能留住他,我就会留。”
白宫高层对马斯克最不满的一点,是他的决策风格太随性、太独断。
最近的一件事让人特别恼火:马斯克突然给各大政府机构发了一封邮件,要求他们尽快提交“5件最重要的工作事项”,否则可能会面临后果。这封邮件在政府内部引起了不小的震动,但包括白宫办公厅主任苏茜·威尔斯在内的核心幕僚对此事完全不知情。
一位知情人士透露,马斯克在没有提前沟通的情况下就发出了这封“最后通牒”,而且这已经不是他第一次这么做了。马斯克回应称,这些行动他都事先得到了总统的同意。
据知情人士介绍,威尔斯一向强调团队协作,讲究流程和沟通,而马斯克更倾向于“自己拍板、直接执行”,两者的风格明显存在冲突。
需要说明的是,马斯克现在的身份是“特别政府雇员”,这种身份本来是为了让政府可以临时聘请外部专家来提供建议。比如在奥巴马政府时期,胡玛·阿贝丁曾被任命为国务院的特别顾问,但因为任期可能超出130天而受到国会调查;在特朗普第一任期内,斯科特·阿特拉斯也以这个身份为政府提供疫情相关建议。
不过,有学者指出,马斯克现在的做法已经远远超出了“提供建议”的范畴。哥伦比亚大学法学院教授、政府伦理研究专家理查德·布里福特表示:“‘特别政府雇员’的初衷是来帮忙出主意的。但如果他真的对政府官员说,‘把你的五条要点发给我,不然你就走人’,那就已经不是顾问,而是直接在行使权力了。”
回归硅谷,意味着什么?
这一“执政实验”即将结束,马斯克是否会将这种高效但强势的管理风格带回到特斯拉?这是市场普遍关注的焦点。
从投资角度来看,影响不容忽视:
• 利好方面,马斯克若重新聚焦特斯拉,或将提升项目推进效率,特别是在FSD(完全自动驾驶)、AI模型训练平台Dojo、电池产能、储能系统等领域;
• 风险方面,则在于过度干预或激进决策所带来的不确定性,尤其是在当下电动车市场竞争愈发激烈的背景下,特斯拉需要的是稳定清晰的战略推进。
过去两年,马斯克的“多线作战”一直是特斯拉估值波动的重要原因。自收购推特(现更名为X)以来,市场对他“分心主业”的担忧不断加剧。而这段时间,SpaceX、X、AI、甚至政坛参与,再次加深了这种不确定性。
在特朗普回归白宫后,特斯拉股价已经从高位几乎腰斩。这其中固然有电动车行业竞争结构变化的因素,但马斯克个人精力分散,也是投资者难以忽视的变量。
更现实的是,当公司面临产品周期过渡与销量压力时,市场尤其需要CEO稳定战略预期、聚焦核心业务,给出清晰可执行的增长路径。然而,这恰恰是马斯克在过去一段时间里,给市场留下空白的地方。
从这个角度来看,马斯克结束“政治插曲”、重新回归硅谷,并非只是象征意义上的“回归”,而是决定市场信心能否重建的临界点。
接下来,市场将关注的不仅仅是他的归位动作,更是他是否重新建立起对特斯拉未来发展方向的控制力与说服力。这将直接影响资本市场对公司长期增长逻辑的再定价。
本周三(4月2日),特朗普政府此前宣告的一系列关税政策即将正式生效。他甚至把这一天称为“解放日”——显然,这位特朗普对自己的贸易政策相当满意。
而且,这还不是全部。特朗普表示,他将在本周推出一项新的“对等关税”措施,重点不再只是之前那些对美贸易逆差最大的10到15个国家,而是——所有国家。
此外,特朗普上周一直在敦促顾问们在关税问题上“更激进一点”。甚至在周六接受采访时,他还补了一刀:如果外国汽车制造商因为关税上调了售价?“我一点都不在乎。”
周一美股开盘,三大指数就遭到重击。纳指带头跳水,早盘一度大跌2.3%;道指跌0.8%;标普500跌1.3%。
不过,市场也不是没抵抗力。虽然“软数据”方面表现乏力,但“硬数据”依旧撑得住场面。美股投资网获悉,芝加哥采购经理人指数(PMI)数据超预期,为美股提供了短暂的支撑。
政策层面也释放出一定的缓和信号。特朗普在今天公开表示,关税细节可能会在4月1日晚上或4月2日正式对外公布。他还补充称,与其他国家相比,美国在执行关税方面将“表现得非常友好”,在某些情况下甚至可能“大幅降低”关税水平。
值得注意的是,特朗普的言论在当天并非一次性提出,而是在谈及多个议题之后,又重新回到关税话题,并明确表示:“关税计划已经制定。”虽然措辞依旧带有不确定性,但语气中隐含的灵活性被市场解读为政策可能不会如预期般强硬,从而在一定程度上缓解了投资者的紧张情绪。
这两点分析认为可能是美股午后自日低反弹的原因。
截至收盘,道指涨幅为1.00%;纳指跌幅为0.14%;标普500涨幅为0.55%。
特斯拉为何大跌?
周一美股盘初,特斯拉股价大跌近7.7%,自去年大选以来的最高价已经腰斩,随后持续拉升,最终收跌1.67%。
根据美股大数据StockWe.com特斯拉的分析师评级,今天Stifel分析师Stephen Gengaro将特斯拉的目标价从474美元下调至455美元。
他指出,公司近期受到多方面不利情绪影响,其中包括公众(尤其是民主党支持者)对马斯克的负面情绪上升,以及新版Model Y(内部代号“Juniper”)推出所引发的阶段性销售波动。
此外特斯拉长期看多的分析师也开始转向谨慎。Wedbush的Dan Ives在最新评论中指出,近期贸易环境的变化,尤其是潜在的关税风险,将对特斯拉造成实质性影响。他表示:“此次关税政策并无赢家,就连特斯拉也可能因此被迫上调终端售价。”
本周三,特斯拉将公布最新交付数据,根据美股投资网了解到15位分析师在过去30天内更新的预测,特斯拉在第一季度交付约373,000辆汽车,同比下降3.6%。
特斯拉股东Globalt Investments的高级投资组合经理Thomas Martin表示:“我认为数字会低于400,000辆,甚至可能低至350,000辆。”德意志银行预计交付量在340,000至350,000辆之间。
在这种不确定中,特斯拉自己也在加速“救场”。根据美股投资网的消息,特斯拉在周一官宣了一项利好:为了刺激销量,将在中国市场为新版Model Y推出3年期免息贷款,优惠截止至4月30日。同时,Model 3的后轮驱动版本和长续航全轮驱动版本也会享受5年期免息贷款,时间节点同样是4月30日之前。
这类促销策略有望缓解短期交付压力,但同时也被市场解读为需求疲软的信号。在交付数据即将公布、市场估值面临重估的时间窗口期内,特斯拉的每一项动作都被高度放大。
“4月2日”美股交易手册
花旗的最新报告指出,如果4月2日的关税政策在覆盖范围或关税幅度上高于市场预期,不排除出现以下连锁反应:
目前,市场的主流预期仍较为温和:大约10%的加权平均关税涨幅,并采用较具针对性的豁免机制。不过,如果最终公布的幅度突破这一预期区间,情绪层面的反应可能加剧。
花旗的模型测算显示,若加权平均关税上调10%,欧洲斯托克600指数的每股收益(EPS)或下降12%,标普500的EPS也可能缩水5%至6%。
更为关键的是,全球资金正在大规模超配美国资产。根据花旗研究,目前全球投资者对美股的配置比例处于历史高位。这一“流动性追逐+相对表现领先”的组合,使美股市场可能出现持续下跌时尤为脆弱,因为美股市场支撑了美国双赤字的很大部分,并占家庭财富的30%。
为了帮助投资者理清当日应关注的核心变量,花旗将其概括为四个维度:
(1)政策规模:涨幅高低直接影响市场解读
花旗认为,加权平均关税增幅在10%-15%之间基本符合市场预期;如果远高于这一水平,将被解读为“鹰派”,加剧市场动荡;而如果低于这一区间,则可能提振风险资产情绪。
(2)国家与行业维度:区域风险与板块轮动
新关税涉及的国家和行业,将直接影响汇率、利率预期以及股市的行业结构轮动。例如,若引入基于增值税(VAT)的互惠关税机制,对欧洲出口型企业的影响将尤为显著。
虽然特朗普近期表态“可能会比VAT互惠机制更宽松”,但具体条款仍存在不确定性,市场需谨慎评估。
(3)执行路径:法律依据决定节奏快慢
实施关税所依赖的法律路径,将影响政策生效的速度与市场的应对节奏:
此外,美国贸易代表办公室(USTR)目前人手紧张,政策推进过程中也可能面临实际操作瓶颈。参考此前de minimis小额免税调整的推迟,执行滞后的可能性不容忽视。
(4)报复风险:全球经济链条将被重塑
最具潜在破坏力的是贸易报复风险。如果美国主要贸易伙伴——如欧盟、中国等——也对等提高10%的报复性关税,花旗的经济模型显示:
在这种情境下,美国相对全球的经济优势可能被进一步削弱。
美股代号NMAX今天暴涨735%的原因是 Newsmax今天在纽约证券交易所IPO上市,受到散户的高度关注,主要原因在于当前市场缺乏强有力的新热点,而 AI 和科技板块估值已高,涨幅空间有限。相比之下,NMAX 作为发行价低、体量小的小盘新股,市值相对较小,更容易吸引短线资金炒作,推动股价快速拉升。
Newsmax是一家总部位于美国佛罗里达州博卡拉顿的保守派有线电视新闻频道及数字媒体公司,由克里斯托弗·鲁迪(Christopher Ruddy)于 1998 年创立。
公司最初以数字品牌起家,专注于在线新闻和内容发布。2014 年,Newsmax 扩展业务,推出了有线电视新闻频道 Newsmax TV,正式进入主流电视媒体市场。
截至 2024 年,Newsmax 通过电视、流媒体、在线和印刷平台,已触达超过 4000 万美国观众。
公司以每股 10 美元的价格发行了 750 万股 B 类普通股,共募集资金 7500 万美元。财务数据显示,毛利润不均衡,经营亏损不断增加,自由现金流为负值,持续的诉讼带来了巨大的责任风险。市场机会很大,但增长缓慢,公司的高估值预期和创始人的控制也增加了投资风险。
此外,NMAX 所处的媒体行业具备高度话题性,对部分投资者来说,它不仅是一只普通的媒体股,更象征着“正直立场 + 流量”的结合,天然带有情绪加成,容易吸引眼球和投机资金。尤其值得注意的是,Newsmax 是特朗普支持者广泛收看的媒体平台之一,不少投资者因政治立场或情感共鸣参与买入。这种“理念 + 投机”双重动因,在美国市场具有一定特殊性。
再叠加散户追涨情绪(FOMO心理)推动,NMAX 在首个交易日表现异常强势,股价一度飙涨高达800%(近8 倍)。
Tesla特斯拉Q1交付量预计将创下2022年Q4以来最差表现,因电动汽车市场竞争白热化、欧美市场掀起DOGE引发的“反特斯拉”浪潮,
根据Visible Alpha 15位分析师在过去30天内更新的预测,特斯拉在第一季度交付约373,000辆汽车,同比下降3.6%。当地时间周三,特斯拉将公布最新交付数据。
一些投资者和分析师认为,即使是这一更新后的平均估计也可能过于乐观,特斯拉股东Globalt Investments的高级投资组合经理Thomas Martin表示:“我认为数字会低于400,000辆,甚至可能低至350,000辆。”德意志银行预计交付量在340,000至350,000辆之间。
目前,来自汽车协会和分析师估计的数据显示,今年前两个月特斯拉在美国、欧洲和中国市场的销售大幅下降。
周一美股盘初,特斯拉股价大跌7%,自去年大选以来的最高价已经腰斩。
销量低迷之际,马斯克坦言,他在DOGE中的角色,给他带来了巨大的代价,尤其是在特斯拉的业绩上。尽管面临股价下跌,马斯克依然保持乐观。他表示:
“从长远来看,我认为特斯拉的股票会做得很好,或许现在正是一个买入机会。”
政治对立与品牌价值崩塌
分析指出,马斯克作为特朗普顾问协助削减联邦支出的角色,激怒了特斯拉大量自由派消费者基础。数据显示,特斯拉车主以创纪录的水平换掉了他们的车辆。
情况甚至恶化到暴力程度:在拉斯维加斯,特斯拉汽车被点燃;特斯拉门店的破坏事件激增。特朗普已表示,对特斯拉经销店实施暴力行为将被标记为国内恐怖主义。
对此,Mahoney Asset Management的CEO Ken Mahoney表示:
我们已经看到特斯拉的品牌在全球范围内严重恶化。这个品牌已经变得比任何公共公司的品牌都要政治化。
中国竞争加剧与欧洲销量下滑
在关键的中国市场,特斯拉制造的汽车销量下降。比亚迪在过去一年中推出了至少六款车型与Model Y竞争。
而在欧洲,销量在今年前两个月下降,人们对马斯克支持右翼政治感到反感。“特斯拉垮台”抗议活动在包括德国和芬兰在内的国家扩大了对马斯克在美国的批评,马斯克在推动削减联邦工作人员和终止人道主义计划方面发挥了重要作用。
尽管特斯拉受特朗普最新25%进口汽车和零部件关税的影响可能比竞争对手小(特斯拉在美国销售的所有汽车都在国内生产,从美国境外进口的零部件也比其他汽车制造商少),但马斯克表示,关税的成本影响不会微不足道。特斯拉还警告称,公司面临可能针对特朗普关税而征收的报复性关税风险。
老旧产品线与激烈竞争
除了经济低迷抑制了人们购买大宗商品的欲望外,特斯拉汽车的需求也受到了部分潜在客户等待Model Y更新版本的影响。
特斯拉上个月在中国开始销售更新版的Model Y,本月在美国和欧洲推出。新款Model Y配备了全幅前后灯、后排触摸屏和改进的内饰。
Aptus Capital Advisors的股票和投资组合经理David Wagner表示:
更新的Model Y可能会提振需求,但这可能会延长一段时间,因为许多客户可能在等待更经济实惠车型的推出。
特斯拉表示,将于今年推出基于现有平台的更实惠车型,但尚未提供详细信息。
此外,2023年底推出的Cybertruck皮卡的需求也很平淡,其两极化的梯形设计和高于承诺的价格标签让买家望而却步。质量问题一直困扰着这款车型,本月特斯拉在美国召回了几乎所有的Cybertruck,以修复行驶时可能脱落的外部面板。
近年来,全球碳化硅(SiC)技术的领导者Wolfspeed 美股代号 WOLF 股价在周五暴跌50%,宣布采取措施改善其资本结构,由于对其资产负债表和融资前景的担忧日益加剧。
公司经历了从行业巅峰到深陷困境的剧烈转变。曾几何时,Wolfspeed以其在碳化硅领域的领先地位备受瞩目,然而,近期的业绩亏损、管理层动荡以及股价暴跌等问题,使这家半导体巨头面临前所未有的挑战。
业绩持续亏损,财务状况堪忧
根据美股投资网,Wolfspeed的财务状况近年来持续恶化。2025财年第一财季,公司营收同比下滑1.37%至1.95亿美元,净亏损达2.82亿美元。为应对业绩压力,Wolfspeed启动了一项耗资4.5亿美元的设施关闭和整合计划,计划关闭位于北卡罗来纳州达勒姆的150毫米碳化硅工厂,并裁员约20%,涉及约1000个工作岗位。截至2025年3月29日,Wolfspeed股价大跌50%至2.5美元/股,较2021年高点142.33美元/股暴跌约99%。
管理层动荡,新任CEO上任
在业绩压力和投资者不满的背景下,Wolfspeed的管理层也出现重大变动。2024年11月18日,CEO Gregg Lowe辞职,董事会主席Thomas Werner接任执行董事长一职。Lowe自2017年起担任CEO,期间将公司从LED照明业务转型为专注于碳化硅芯片的企业。然而,近期公司业绩不佳,股价大幅下跌,导致董事会决定进行领导层更替。
随后,2025年3月27日,Wolfspeed宣布资深芯片行业人士Robert Feurle将于5月1日起担任公司首席执行官。Feurle拥有德国和美国双重国籍,曾在德国芯片制造商ams-OSRAM和美国芯片制造商美光科技担任高管,具备丰富的工厂运营和管理经验。公司希望通过任命Feurle,利用其专业知识和经验,优化工厂运营,提升生产效率,扭转当前困境。
美国政府资助悬而未决,债务重组迫在眉睫
Wolfspeed一直寄希望于获得美国《芯片与科学法案》(CHIPS Act)提供的7.5亿美元联邦资助,用于在北卡罗来纳州和纽约州的新建工厂项目。然而,近期美国政界对该法案的支持出现动摇,前总统特朗普呼吁废除该法案,引发市场对Wolfspeed能否获得资助的担忧。分析人士指出,如果无法获得该笔资助,Wolfspeed可能需要进行大规模重组以保留现金。
根据美股大数据 StockWe.com获悉,与此同时,Wolfspeed正面临明年到期的5.75亿美元可转换债券的偿付压力。由于当前股价远低于债券转换价格,债转股几乎无望。公司正在与摩根大通合作推进重组工作,希望与投资者达成协议,以应对债务危机。
未来展望:挑战与机遇并存
面对内外部挑战,Wolfspeed需要在新任CEO的领导下,制定切实可行的战略,提升运营效率,稳定财务状况。同时,公司需积极与政府和投资者沟通,争取必要的支持和资助。作为碳化硅领域的领军企业,Wolfspeed仍具备技术优势和市场潜力,但要重回巅峰,需在动荡中寻找新的发展机遇,但已经为时已晚。
在即将到来的4月2日“关税大日”以及4月5日的非农就业报告发布之前,市场对未来的不确定性情绪加剧,尤其是在通胀上升和滞胀担忧的双重压力下,风险资产遭到大规模抛售,资金纷纷转向避险资产,美股经历了“黑色星期五”。
美股投资网分析认为,重大事件临近时,市场通常会放大最坏情景的可能性,这种普遍的避险行为直接推动了抛售的加速,不过当事件本身最终落地,不确定性被消除后,市场往往会出现一波技术性反弹。
美联储最关注的核心通胀指标显示,剔除食品和能源的价格波动后,2月核心通胀率环比增长0.4%,同比上涨2.8%。这两项数据均高于市场预期,进一步强化了投资者对通胀压力的警惕情绪。
消费者信心的疲软也令市场雪上加霜。根据密歇根大学的最新调查,整体消费者信心指数跌至57点,这是自2022年以来的最低水平。调查结果反映出人们对未来经济前景的担忧情绪愈发浓厚。
受多重利空因素影响,截至收盘,科技股占比较高的纳指下跌 2.7%,标普500指数下跌近 2%,标普11个板块中有 10 个周五收盘下跌。道指下跌超 700 点,跌幅 1.7%,创 3 月 10 日以来的最大跌幅。
七大科技股的市值蒸发约 5050 亿美元,谷歌A收跌4.88%,Meta和亚马逊跌4.29%,特斯拉跌3.51%,微软跌3.02%,苹果跌2.66%,英伟达跌1.58%。
回顾一周表现,英伟达全周累跌6.82%,Meta下跌3.27%,微软下跌3.18%,亚马逊下跌1.78%,苹果小幅下跌0.17%。谷歌A更是创下2月7日以来最差的单周表现,下跌5.89%。特斯拉则表现突出,本周累计上涨5.97%,结束了此前连续九周下跌的颓势。
美股下跌别都怪特朗普
随着标普500进入回调区间,华尔街“衰退”一词此起彼伏,许多人自然地将股市的困境与特朗普的贸易战联系起来。然而,我们需要意识到,风险的根源并非只有这一处。
本周市场在不同信号之间摇摆。起初,有报道暗示4月2日即将实施的关税可能比最初提议更有针对性,标普500一度出现反弹。但随后又传出消息,汽车制造商仍可能面临较高的进口税,市场因此再次转跌。这样的消息反复进一步加剧了投资者的不安情绪。
美联储以及其他经济学家已经多次警告,贸易壁垒可能在未来数个季度中拖累经济增速。关税带来的成本上升不仅影响企业的盈利能力,还进一步抑制了投资意愿和消费者支出。
最明显的例子是非必需消费品行业,作为最依赖进口的一部分,该行业今年迄今下跌了约11%。从汽车制造商到零售企业,这一板块的整体表现明显低于市场预期。
不过关税并非唯一的压力来源。企业盈利增长的放缓和估值的重新调整也是导致市场波动的重要因素。
根据FactSet的数据,标普500成分股公司预计第一季度每股收益同比增长7.1%。虽然这仍意味着连续七个季度的增长,但相比去年底分析师预测的11.1%,该预期已经下调了4%,且降幅高于历史平均水平。
标普500的11个板块中,大部分都未能达到此前的盈利增长预期。尤其是航空业、耐克等鞋类制造商和联邦快递这样的物流巨头,最近都纷纷下调了业务前景。部分原因可能与关税相关,这并非全然没有道理。尽管第一季度的盈利数据尚未完全体现关税的影响,但这种政策上的不确定性确实对企业和消费者的信心造成了打击。
非必需消费品行业的每股收益增长放缓,早在2024年美国总统大选前就已开始显现。酒店和餐饮业的下滑甚至比这一时间点提前了一年。工业领域面临的压力也并不新鲜。以联邦快递为例,这家供应链巨头自2023年起就连续下调其业绩预期。
科技板块的表现进一步佐证了这一趋势。作为今年表现第二差的板块,科技行业的利润增长已经在2024年达到顶峰。高估值的科技股经历了一轮重新评估。今年2月,“七巨头”——苹果、微软、谷歌、亚马逊、英伟达、特斯拉和Meta的市盈率接近45倍,但如今已回落到35倍,合计下跌了11.3%。
这些公司的市值占标普500总市值的比重较大,因而成为指数下跌的主因。今年标普500总市值加权指数下跌了2.9%,而等权重指数保持稳定,这进一步说明调整主要集中在少数高权重的股票上。
波动率指数(VIX)的涨幅有限,这表明市场情绪并未全面失控。通常来说,利润增速放缓并不一定会引发经济衰退,当前的情况也许就是这样。如果市场逐渐适应了盈利增长放缓的现实,那么较低的估值水平可能会吸引那些专注于长期投资的资金入场。
然而,即使经济没有陷入全面衰退,这轮市场调整仍可能演变为熊市——即股价下跌幅度超过20%。历史数据显示,这种情况发生过三次:1962年的“肯尼迪滑坡”、1987年的黑色星期一,以及最近的2022年货币紧缩时期,这些都与科技股的高估值有关。不过,在每次调整之后,市场都迅速反弹。
需要注意的是,有54%的调整确实发生在经济衰退之前,在这种情况下,投资者的回报往往会受到长期的负面影响。
目前来看,许多疲弱数据仍集中在“软”指标上。例如消费者信心和企业信心调查。这些调查结果显示,收入、商业环境和就业市场预期已降至12年来的最低点。然而,一些“硬”数据表现仍然稳健或正在改善。例如,1月零售销售数据疲软后,2月的销售额已经出现回升。
尽管如此,疫情后的经济快速复苏已经结束,增长势头减弱的迹象已经显现了一段时间。消费者支出更加谨慎,高抵押贷款利率限制了房屋建设,就业市场也出现了趋缓的趋势,周期性行业的招聘活动有所减少。整体经济的增长很大程度上依赖于人工智能公司推动的资本支出浪潮。然而,在盈利和估值水平较低的情况下,这种趋势能否持续,仍需进一步观察。
总的来说,关税和财政政策的调整可能会降低经济衰退的可能性,但它们并不能完全消除经济衰退的风险。
今天美股指数下跌的原因是美联储最关注的通胀指标继续以顽固速度上升,而个人支出却不及预期,家庭需求弱于预期,这表明在对财务状况的担忧日益加剧的情况下,消费者变得更加谨慎。
3月28日周五,美国商务部公布数据显示,美联储最爱的通胀指标——核心PCE物价指数在2月同比上涨2.79%,为2024年12月以来新高,超过预期的2.7%和前值2.6%;核心PCE物价指数环比上涨0.4%,超出预期和前值0.3%,创2024年1月以来新高。
美国2月PCE物价指数同比上涨2.5%,持平预期和前值;PCE物价指数环比上涨0.3%,同样持平预期和前值。
美国PCE等数据公布后,美股三大股指期货进一步下跌,美国国债收益率维持低位,而美元小幅上涨。掉期交易员继续预计今年将有两次25个基点降息,第一次降息将在7月。
“超级核心通胀指标”大幅反弹,服务成本推动PCE上涨
值得注意的是,美联储密切关注的“超级核心通胀指标”——不包括住房和能源的核心服务成本大幅反弹。
服务成本是推动PCE经济重新加速的主要因素,服务业对核心个人消费支出 (PCE) 增长的贡献率升至一年来最高水平,但这并非由关税驱动。
消费支出放缓,储蓄率进一步上涨
2月个人消费支出(PCE)环比上涨0.4%,经通胀调整后的个人消费支出环比小幅上涨 0.1%,而此前1月份下降0.5,为近四年来最大降幅,经济学家将此归咎于恶劣天气。
随着价格上涨,个人收入也随之上涨,环比增长0.8%,为 2024 年 1 月以来的最大增幅,超过个人支出0.4%的增幅。
收入与支出之间的差距使储蓄率达到2024年6月以来的最高水平,表明消费者对财务状况更加谨慎。其他迹象表明,美国人面临更大的财务压力,包括拖欠汽车付款和难以筹集应急资金。
滞胀担忧加剧
该报告指出,通胀顽固难消,而特朗普总统计划征收的关税则有可能进一步加剧价格压力。特朗普激进的贸易政策已经打击了企业和消费者的信心,再加上家庭财务压力的迹象日益增加,引发了人们对经济可能陷入滞胀甚至衰退的担忧。
美联储自己的预测也强调了这些担忧,决策者在上周的政策会议上发布的最新预测中暗示经济增长放缓、通胀加快。美联储主席鲍威尔淡化了这些担忧,甚至重新使用了“暂时”这个词来描述他对关税驱动通胀的预期,他的一些同事则表示更加谨慎。
在特朗普下周推出大规模关税措施之前,官员们将维持利率不变,直到他们更好地了解特朗普的政策——尤其是关税。关税对价格的影响大部分将通过商品来体现。2月份,不包括食品和能源的商品通胀指标连续第二个月上涨0.4%,为2022年以来连续两个月的最大涨幅,核心服务价格也以类似的速度上涨。
TradeStation全球市场策略主管David Russell表示:
核心PCE高于预期,而且由于收入很高,关税即将到来,因此今后可能很难再下降。
在通胀预期永久上调之前,我们可能正在看到旧经济的最后残余,这可能与金发姑娘的情况相反,收入和通胀过高,美联储无法大幅降低利率,与此同时增长和利润率的前景正在黯淡。
NVDA 在DeepSeek引发科技圈震动后,国内公司开始排队购买服务器,本地部署DeepSeekAI模型,导致英伟达特供大陆的H20 GPU直接“爆单”。根据记者从一位与新华三有合作的GPU模组渠道商处了解到,今年开年因为DeepSeek带动了国内算力需求短期内飙升,腾讯、阿里在内的几家头部互联网大厂客户年后追加了H20服务器的大单,将市场需求直接“拉爆了”。
DeepSeek引发科技圈震动后,导致英伟达特供大陆的H20 GPU直接“爆单”,中国服务器龙头新华三集团拉响库存警报。【美股大数据 https://StockWe.com/】
据报道,中国金融科技巨头蚂蚁集团在人工智能领域取得了重大突破。有知情人士透露,蚂蚁集团使用由阿里巴巴和华为制造的国产芯片,开发出了将人工智能训练成本降低 20% 的方法。相关美股BABA
据称,蚂蚁集团在训练“专家混合”(Mixture of Experts,以下简称 MoE)模型时运用了多种优化方法,在国产芯片的基础上取得了与使用英伟达 H800 等芯片差不多的训练效果:计算成本从 635 万元人民币 / 万亿 Token 降低至 508 万元人民币,但模型性能却能与 Qwen2.5-72B-Instruct 和 DeepSeek-V2.5-1210-Chat 相媲美。
这一消息引发了广泛关注,蚂蚁所带来的成果令海外的网友感到震惊。许多人纷纷发出感叹:“中国变化太快”、“美国禁止向中国供应芯片,只会让中国芯片制造业更快发展”、“这释放出一个强有力的信号:人工智能领域的主导地位并非英伟达 NVDA一家独揽”。
而蚂蚁的相关成果早在 3 月 11 日就已公开发表,蚂蚁集团 Ling 团队在其技术报告论文中,介绍了这一系列“不使用高级 GPU 来扩展模型性能”的创新策略。此外,蚂蚁还指出了他们在过程中遇到的挑战和教训。“即使是硬件或模型结构的微小改动,也可能引发问题,比如导致模型的错误率突然上升。”
具体做了哪些优化?
随着企业在人工智能领域投入大量资金,MoE 模型已成为一种热门选择。这种技术将任务划分为较小的数据组,就像组建了一支专家团队,每个成员专注于一项工作的某个部分,从而提高了工作效率。然而,虽然 DeepSeek、阿里 Qwen、MiniMax 等系列的 MoE 模型在特定任务中已展现出优越性能,但这类模型的训练通常依赖高性能计算资源,如英伟达 H100/H800 等先进 GPU,其高昂的成本让许多小公司望而却步,也限制了该技术的更广泛应用。
在技术报告中,蚂蚁首先就探讨了训练 MoE 模型所面临的这些挑战,重点是要克服此类系统中普遍存在的成本效率低下和资源限制问题。为此,他们提出了一系列系统优化策略,以便在有限的资源和预算约束下实现高效的 LLM 训练,平衡资源成本和模型性能,包括优化模型架构和训练策略、改进训练异常处理、提高模型评估效率和工具使用能力。
在优化模型方面,他们从架构、训练框架和存储三方面进行了优化。
模型架构优化:基于对密集模型和 MoE 模型缩放规律的综合分析,选择与可用计算资源最匹配的架构。
训练框架优化:针对异构计算平台,将多个训练框架整合为一个统一的分布式深度学习框架,即开源项目 DLRover DLRover 。其开发了一种轻量级调试工具 XPUTimer,它有助于快速、经济高效地分析任务性能,同时减少了 90% 的内存使用量。此外,还实施了一种与平台无关的异步训练策略 EDiT(弹性分布式训练),它提高了训练效率,训练时间在各种配置下最多可缩短 66.1%。
存储优化:采用设备多租户和用户空间文件系统(FUSE)等技术,实现大规模训练的高性能和多集群适应性。存储和训练流程的协同设计提高了 MoE 场景中的 I/O 效率,将时间开销减少了 50%。
针对大规模训练中的硬件错误和损耗异常,蚂蚁开发了一套稳健的异常处理机制,包括一套实时监控整个训练过程异常的多层次异常检测系统和为减少异常情况对训练进度影响而实施的一种自动恢复机制。
同时,为了优化对跨集群模型训练的监测,他们尝试改进了以下评估基准和框架:
综合评估数据集:为减少模型初始表现不佳并提高稳定性,构建了一些特定领域的评估数据集,并优化了相应的预测策略和提示模板。
高效评估系统:基于自主创新的离线推理框架(即 Flood),开发了一套可扩展的跨集群评估系统,其结果稳定,平均偏差小于 0.5%。
自动分析系统:为了提供实时反馈以调整训练策略,开发了一个自动系统,将评估结果与模型性能和数据集相关联。
在提高大型模型的工具使用能力上,蚂蚁重点关注高质量数据合成和自适应工具学习两个关键方面。
为了有效生成高质量、可扩展和多样化的工具使用数据,蚂蚁团队利用知识图谱技术和广义调用指令来提取多样化和复杂的函数链,从而增强凌模型在各种实际场景中的适用性。团队利用拒绝采样和纠错等学习策略开发了自省式多机器人交互对话,以增强模型的自适应工具使用能力。
据蚂蚁介绍,他们开发并开源的 Ling 系列 MoE 模型,就是一个基于上述技术优化成功平衡资源成本与模型性能的示例。
其中,Ling-Lite 包含 168 亿个参数和 27.5 亿个激活参数,Ling-Plus 则拥有 2900 亿个参数和 288 亿个激活参数。知情人士称,该公司计划利用其开发的大语言模型 Ling-Plus 和 Ling-Lite 的最新突破,为包括医疗保健和金融在内的行业提供人工智能解决方案。
根据一系列综合评估基准,参数大小相似的情况下,在有限的资源和预算约束下训练的 Ling-Lite 模型,英语理解能力与 Qwen2.5-7B-Instruct 相当,同时优于 Llama3.1-8B-Instruct 和 Mistral-7B-v0.3-Instruct;在数学和代码基准测试中,Ling-Lite 的性能与 Qwen2.57B 相当,优于 Llama3.1-8B 和 Mistral-7B v0.3。
同样的前提条件下,Ling-Plus 模型与 DeepSeek 等前沿开源模型性能不相上下。Ling-Plus 的英语理解能力与 DeepSeek-V2.5-Chat 和 Qwen2.5-72B-Instruct 相当,在 GPQA 数据集上的得分还高于 DeepSeekV2.5,在事实知识基准 SimpleQA 上与 DeepSeek-V2.5 的表现相似。在数学和中文的测试上,Ling-Plus 的总体性能与 Qwen2.5-72B 相近,较高于 DeepSeek-V2.5 和 Llama3.1-70B 的基准得分。代码测试中,Ling-Plus 的得分与 Qwen2.5-72B 相当、整体略低于 DeepSeek-V2.5 。
不过,蚂蚁强调,Ling-Plus 模型不如 DeepSeek V3。
此外,Ling-Plus 在五种不同的硬件配置对 9 万亿个 token 进行了预训练,使用高性能硬件配置(设备 D)训练 1 万亿个 token 估计需要花费约 635 万人民币;相比之下,使用较低规格的硬件系统可将成本降至约 508 万人民币,节省了近 20% 的成本。
微小差异都会改变训练结果
LLM 训练是一个具有挑战性和资源密集型的过程,往往伴随着各种技术困难。错误和异常情况很常见,有些问题相对容易解决,有些问题则需要花费大量时间和精力。
“在超大规模模型的训练过程中,与硬件相关的因素和对网络结构看似微小的修改都会对模型的稳定性和收敛性产生重大影响。”蚂蚁团队在报告中提到。具体来说,蚂蚁在整个过程中遇到了损失发散、损失尖峰和专家负载不平衡等挑战。
其中,保持均衡的专家利用率对于 MoE 模型的有效性至关重要。大范围的损失峰值会导致突然的梯度激增,从而破坏路由平衡,严重破坏专家负载平衡。一旦专家失衡,问题就会升级,导致整个模型普遍不稳定。通过将尖峰缓解技术与平衡损失和上述路由器 zloss 相结合,蚂蚁才成功地实现了包含数千亿个参数的 MoE 模型的稳定训练。这种方法带来了稳定的损失轨迹,没有观察到损失发散、大范围损失尖峰或专家路由平衡中断的情况。
同时,LLM 在不同平台间迁移训练面临多方面挑战,这主要是因为基础操作的实现方式和框架层面存在差异,可能会导致训练结果不同,凸显了严格的对齐策略的必要性。为推动 Ling 在多个平台上的迁移,蚂蚁开展了大量预备实验,旨在确保跨平台基本操作和通信算法的一致性,并考虑到数值计算中固有的微小精度误差。在验证这些基础组件后,他们才进行大规模大语言模型的训练。
然而,事实证明,仅验证基本操作不足以实现无缝的跨平台迁移。在后续训练阶段,他们又观察到迁移后不同平台之间的损失收敛情况存在显著差异。为解决这一问题,其将对齐工作从基本操作扩展到框架本身。这个过程需要消除所有潜在的差异源;否则,就无法确定错误的根本原因。因此,他们实现了两个平台上包括矩阵乘法(matmul)和线性变换在内的基本操作的完全对齐。
在框架层面,其处理了诸如注意力机制、多层感知器(MLPs)和路由组件等模块在实现过程中的差异,以避免浮点运算导致的精度误差,通过这些努力实现了跨平台前向传递计算的完全对齐。此过程中,他们解决了张量并行(TP)变化和辅助损失计算引发的问题,并纠正了某些通信操作中的错误。在反向传递计算时,借助前向传递对齐过程中获得的经验,他们能够高效识别并纠正梯度传播中的错误,尤其是路由组件中的错误。
虽然这些问题在单独出现或单元测试时可能看似微不足道,但在整个训练过程中,它们的累积效应会对大语言模型的收敛结果产生重大影响。即使是微小的差异,经过多次迭代叠加,也可能导致最终损失收敛出现巨大偏差。
结语
据一位知情人士称,蚂蚁集团现在虽仍在使用英伟达的产品进行人工智能开发,但在其最新模型的训练中,目前主要依赖来自 AMD 以及国产厂商的替代芯片产品。
如果这些国产芯片流行起来,可能会影响英伟达目前作为受欢迎人工智能芯片生产商所享有的地位。尽管现在英伟达的芯片仍然非常抢手,性能也较为强劲,但一直存在严格的出口管制。今年早些时候,自 DeepSeek 展示了如何以远低于 OpenAI 和谷歌母公司 Alphabet 数十亿美元的投入训练出高性能模型后,英伟达的股价就一度短暂下跌。