AI 大转型:为何在推理时代 NVIDIA 正在成为 Beta,而 AMD 正在成为 Alpha

Written by Romeo Kuok

人工智能硬件市场正在经历一场结构性变革,这将重新定义未来十年的半导体格局。在过去的三年里,市场完全聚焦于“训练”阶段——即构建 GPT-4 等基础模型所需的海量算力。然而,随着行业的成熟,经济重心正迅速向“推理”转移——即用户和 AI 智能体查询这些模型的日常持续过程。这一转变代表了算力消耗的几何级飞跃,更重要的是,它带来了硬件瓶颈的根本性改变。对于投资者而言,这种转变要求对两家最杰出的 GPU 厂商进行关键的重新评估:NVIDIA (NVDA) 和 Advanced Micro Devices (AMD)。理解谁能从这一结构性变化中受益以及受益程度,或许是当今科技投资领域最具影响力的课题。

推理经济的爆发式增长

要理解这一转变的规模,必须审视推理需求的巨大体量。从训练到推理的过渡不仅仅是线性进展,而是一种指数级的爆发。仅 ChatGPT 就拥有 9 亿周活跃用户,产生了前所未有的查询量。这种使用强度正以令最乐观的分析师都感到惊讶的速度加速。在 2025 年 10 月至 2026 年 4 月的短短六个月内,OpenAI 平台上的企业级 Token 消耗量增长了 2.5 倍。在中国,日均 Token 调用量在 2024 年初至 2026 年间爆发式增长了 1,400 倍,从 1,000 亿次增加到 140 万亿次。

这种需求因模型本身的演进而进一步复合。我们正从简单的聊天机器人转向复杂的“推理”模型(如 OpenAI 的 o1、DeepSeek R1 和 Claude 的思考模型)以及自主 AI 智能体。这些系统在提供答案之前会在内部“思考”数千个 Token,与传统的直接回答模型相比,单次查询所需的算力增加了多达 100 倍。此外,AI 智能体每个任务会执行 10 到 100 次推理调用,消耗的算力比标准聊天机器人交互高出 10 倍。

其财务影响是惊人的。预计排名前八的云服务提供商在 2026 年的资本支出将超过 7,100 亿美元,同比增长 61%。这一大规模建设源于人们意识到推理将占 AI 模型生命周期成本的 80% 到 90%。能源需求同样巨大,国际能源署预计全球数据中心耗电量到 2030 年将翻一番,达到 945 太瓦时——大致相当于日本全国的能源消耗量。Anthropic 的年度经常性收入(ARR)从 2024 年底的 10 亿美元增长到 2026 年初的 300 亿美元——在短短 14 个月内增长了 30 倍,这说明了推理经济变现的速度之快。

硬件瓶颈:内存重于算力

对于半导体投资者来说,最关键的洞察是推理工作负载对硬件施加压力的方式与训练不同。在训练中,原始处理能力(算力)和快速的芯片间通信至关重要。NVIDIA 凭借其无与伦比的 CUDA 软件生态系统和 NVLink 互连技术,以 90% 以上的垄断地位主导了这一阶段。

然而,推理的根本瓶颈在于内存容量和内存带宽,而不仅仅是原始算力。生成的每一个 Token 都需要将整个模型的参数从高带宽内存 (HBM) 移动到处理器。如果一个模型无法装入单个 GPU 的内存,或者数据移动速度不够快,芯片的原始算力就会处于闲置状态。这是一个决定性的结构性转变:对于推理成本效益而言,最重要的指标是每美元对应的 HBM GB 数,而非每美元对应的 TFLOPS(每秒万亿次浮点运算)。

这一结构性现实削弱了 NVIDIA 的绝对优势。在推理市场,NVIDIA 的份额据估计已降至 48.2%,尽管一些来源认为其份额更接近 60–75%。无论如何,这与其在训练领域的近乎垄断相比都是大幅下降。发展趋势是明确的,这为定位良好的竞争对手夺取有意义的市场份额打开了大门。

NVIDIA:行业 Beta

目前 NVIDIA 股价约为 208.27 美元,市值达到惊人的 5.12 万亿美元,是 AI 革命中无可争议的王者。公司继续刷新纪录,2026 财年营收达到 2,159.4 亿美元,仅第四季度数据中心营收就达 623 亿美元。公司目前正加大下一代 Blackwell GPU 的产量以满足激增的需求,预计 2027 财年第一季度营收将达到 780 亿美元,同比增长 77%。

然而,NVIDIA 的投资逻辑正在发生变化,需要引起密切关注。它不再是超高增长的“Alpha”股,而是成为了行业的“Beta”。凭借 42.25 倍的滚动市盈率和 25.58 倍的远期市盈率,NVIDIA 代表了该行业最低的风险,但也是最低的弹性。其估值已经计入了持续的主导地位,留给估值倍数扩张的空间有限。

由于 NVIDIA 已经占据了整体市场的巨大份额,其未来的回报几乎完全取决于 AI 市场的整体扩张。它根本无法在现有地位基础上进一步大幅提升市场份额。事实上,随着市场转向推理,其份额注定会从训练阶段的巅峰结构性下降。NVIDIA 维持主导地位的策略依赖于 Blackwell 等架构的持续创新、NIM 微服务软件平台的推出,以及对 CUDA 软件生态系统的铁腕掌控。这些都是强大的防御护城河。但轻松获得超额市场份额增长的日子已经结束。NVIDIA 就是市场;持有 NVIDIA 就是持有 AI 行业的 Beta 敞口。

AMD:高弹性挑战者

这让我们转向 Advanced Micro Devices (AMD),它是最能从向推理的结构性转变中获益的公司。AMD 股价约为 347.80 美元,市值 5,670 亿美元,提供了截然不同的投资属性。它代表了中等风险,但在主要 GPU 厂商中具有最高的弹性。其地位的不对称性——低基数份额、高增长轨迹——正是其吸引力所在。

AMD 的战略与推理的结构性需求完美契合。其 MI300X 及即将推出的 MI355X 芯片在设计上具有巨大的内存优势,提供高达 288GB 的 HBM3E 内存。与 NVIDIA 的同类产品相比,这种显著更大的内存容量使得 AMD 芯片在受内存限制的推理任务中极具成本效益。当超大规模云服务商每小时运行数百万次推理查询时,将更大模型装入单个芯片(而不是分布在多个更昂贵的 NVIDIA GPU 上)的经济性就变得至关重要。

市场正通过实际的资本投入验证这一路径。主要的超大规模云服务商正积极实现硬件供应链多元化,以减少对 NVIDIA 的依赖并降低每个 Token 的推理成本。AMD 已与 OpenAI 和 Meta 签署了大规模的 6 吉瓦部署协议。此外,有报告指出 OpenAI 已与 AMD 就其预计于 2026 年底发货的下一代 MI450 GPU 达成了重大供应协议,同时甲骨文 (Oracle) 也订购了 50,000 颗 MI450 芯片。这些不是试点项目,而是生产规模的承诺,验证了 AMD 作为一个可靠的一线推理平台地位。

AMD 目前持有不到 10% 的 AI GPU 市场份额。然而,这种低基数正是提供巨大上行空间的原因。随着公司在推理领域积极从 NVIDIA 手中夺取市场份额,从 10% 的份额增长到 20% 或 30% 将带来爆发性的营收增长。分析师预计 2026 年第一季度营收约为 98.4 亿美元,平均目标价在 296 美元左右,最高估值达到 375 美元。133 倍的滚动市盈率反映了增长溢价,但 51.81 倍的远期市盈率则讲述了一个更务实的故事:随着数据中心 GPU 营收规模的扩大,该公司的盈利预计将显著加速。

竞争动态:软件护城河 vs. 内存优势

NVIDIA 与 AMD 在推理市场的对决将定义 AI 硬件周期的下一阶段,这并非一场简单的竞赛。NVIDIA 凭借其根深蒂固的软件护城河捍卫领土——CUDA 仍然是主导的编程框架,而为 AMD 的替代方案 ROCm 重新设计工作负载的成本不容小觑。Blackwell 架构的原始性能在许多工作负载中也保持着顶尖水平,特别是那些受算力限制而非内存限制的任务。

然而,推理的经济现实——即内存容量决定了大规模成本效益——为 AMD 提供了一个结构性切入点,NVIDIA 若不从根本上重新设计其内存架构,将很难弥补这一差距。超大规模云服务商是成熟的买家,他们会不遗余力地优化总拥有成本。当 AMD 能够证明其可以降低每个推理 Token 的成本时,采购决策自然会随之而来。

对于投资者而言,两者之间的选择取决于风险承受能力和投资组合构建。NVIDIA 仍是核心持仓,是对 AI 市场整体扩张的相对稳妥的押注。它是 Beta。另一方面,AMD 则是 Alpha 之选。其巨大的内存优势和积极的市场份额获取策略提供了显著更高的弹性。随着 AI 市场从资本密集型的训练阶段过渡到高业务量的运营推理阶段,AMD 具有独特的优势,能为愿意接受挑战者品牌波动性的投资者提供超额回报,尤其是在一个仍由根深蒂固的现有巨头主导的市场中。

本文仅供参考和教育目的,不构成财务、投资或交易建议。EquitiesOrbis.com 及其撰稿人对因依赖所提供信息而导致的任何财务损失或损害不承担责任。强烈建议读者在做出任何投资决定之前,进行独立的尽职调查,咨询合格的财务顾问,并仔细考虑自己的风险承受能力。过往业绩不代表未来结果,投资价值可能会大幅波动。

观点
Romeo Kuok

Romeo Kuok

Romeo Kuok is a seasoned executive and investor with deep roots in the crypto and technology sectors. He is the Chairman of the Board for OT Inc. and also a partner at a leading Asian multi-family office. He held leadership roles at two global top-tier cryptocurrency exchanges. With over a decade of experience in go-to-market strategy and early-stage investing, Romeo's portfolio spans AI, robotics, and cryptocurrency. He has been an LP in top funds across North America and Asia, accessing unicorns such as SpaceX and TikTok. He is notably the largest personal angel investor in several high-return projects, including DeAgentAI and Sonic, which achieved returns of dozens of times post-TGE. His direct investments also include Puffer Finance and Solv Protocol.