登录 | 注册
我要路演
瑞银全球科技与人工智能大会
文章语言:
EN
分享
纪要
原文
会议摘要
对话围绕在人工智能市场转变中展开,强调了Grace Blackwell配置和CUDA在保持竞争优势中的作用。同时还强调了保持高利润和战略投资的信心,以及与领先的人工智能公司合作、库存管理和资本配置策略的讨论。
会议速览
打破人工智能泡沫担忧:强调加速计算和数据中心转变
讨论了数据中心向加速计算和人工智能的转变,强调了从中央处理器转向图形处理器的必要性,重点放在2030年3-4万亿美元市场机遇上,强调增长和更替需求。
NVIDIA在AI模型训练和数据中心规模解决方面的竞争优势
讨论了NVIDIA在Grace Blackwell配置方面的进展,强调了他们在人工智能模型训练和数据中心可扩展性方面的竞争优势,同时解决了市场领先地位侵蚀的担忧。
增强企业软件和硬件以支持模型构建和人工智能工作负载
该对话强调了公司专注于增强模型构建者和企业的软件平台,同时保持与现有基础设施的兼容性,同时推进到新的架构。它突显了推断工作负载的盈利能力以及对旧的GPU型号持续需求,展示了客户的适应能力和投资回报的好处。
论据模型和用户需求对计算和收入增长的影响
这段对话讨论了推理模型的进步和用户需求的增加是驱动需求更多计算能力的因素,这导致了更大的模型规模、更多的令牌生成以及一种促使增加收入潜力的飞轮效应。模型构建者正在专注于开发更复杂的推理能力,结合不断增长的用户群,正在创造一个市场,额外的计算资源直接转化为增加的收入机会。
在人工智能生态系统中平衡计算需求与模型构建者的财务现实。
讨论了由于高计算需求而对模型构建者造成的财务压力风险,强调了需要盈利能力,资本筹集和战略规划,以确保可持续的计算能力和资本可用性。
英伦半导体与 OpenAI 和 Anthropic 的计算基础设施战略合作
NVIDIA讨论了与OpenAI长期合作伙伴关系,重点关注未来针对计算需求的直接合作,独立于当前的CSP安排。还突出了与Anthropic进行的持续合作,强调战略性计算基础设施支持。
战略合作伙伴关系和在人工智能模型发展中的计算需求
关于与人工智能模型制造商战略合作的讨论,重点是计算支持和平台集成。对话突显了正在进行的合作伙伴关系,特别是与需要大量计算资源的实体,同时还对这些合作伙伴关系带来的直接和间接收入来源的可持续性进行了保证。演讲者强调持续的工程支持和云服务提供商在满足资本需求方面的作用,确认了在人工智能模型开发者日益增长的需求下业务模型的强大和稳定性。
韦拉·鲁宾的性能飞跃和人工智能计算的系统优势
维拉·鲁宾有望在超级计算机上实现重大性能飞跃,预计过渡将会无缝进行。该系统的全面设计,包括训练、推理和功率效率,胜过固定功能的替代方案,使其成为复杂人工智能工作量的首选。
探索Cpx和软件方法用于人工智能工作负载
对话突出了Cpx在管理人工智能工作负载方面的重要性,通过将其分解为更小的任务,类似于ASIC设计。它强调了使用单一的完整系统来进行模型专家工作的效率,而不是使用多个基础设施。此外,它挑战了AI编程本身,如CUDA,是否能够取代开发人员的手动优化工作。
CUDA性能提升:跨代GPU计算效率的演变
讨论CUDA持续的库更新以及它们对GPU性能的影响,强调软件增强带来的显著改进,Blackwell功效提高高达15倍,展示了该平台随着时间的发展,逐渐提高的适应性和效率。
在不断上涨的成本和HBM价格的背景下,保持中70%的利润率。
战略讨论强调了保持中70%的利润率的承诺,尽管成本不断上升和HBM价格。团队在周期时间、产量和成本管理方面的高效率得到了强调,确保在生产规模扩大的同时保持强劲的利润率。
存货增长和采购承诺表明强劲的未来需求和收入潜力
这段对话突显了增加库存和采购承诺的战略重要性,表明未来需求和收入增长强劲。它解释了这些增加是为了满足预期市场需求而采取的积极措施,并得到了复杂系统组件长周期的支持。讨论还涉及到了额外的增长机会,如合作伙伴关系和区域扩张,可以进一步超越最初的预测,增强收入。
战略资本配置以促进增长和生态系统扩张
讨论优先考虑内部需求、股东回报和生态系统中的战略投资,强调人工智能的未来潜力和合作增长。
在平台工程中平衡生态系统投资和并购重点。
对话强调了在投资生态系统增长和寻求并购之间的战略平衡,强调了工程团队对平台发展的重要性。它承认了在确保重大并购机会方面面临的挑战,并建议将重点放在并购作为生态系统投资的补充。
时间到了:对支持表示深深的感激
对于某人的帮助表示由衷的感激,强调了他们的支持价值尽管情况紧急。
要点回答
Q:目前人工智能行业中存在的两个辩论是什么?
A:AI行业目前存在的两个争论是AI泡沫是否存在以及领域内的竞争水平。
Q:市场中正在发生的转变是什么,这种转变的意义是什么?
A:市场正在向加速计算过渡,重点放在GPU上。这种过渡是必要的,因为预计在数据中心工作负载中CPU使用不会有所改善。这种过渡被看作是未来数据中心基础设施的必要性,预计到本十年末AI相关基础设施价值将达到3到4万亿美元。
Q:超级扩展商在向加速计算的过渡中扮演什么角色?
A:超大规模数据中心运营商,或云服务提供商,是与加速计算转型相关工作中的重要组成部分。他们参与修改搜索、推荐引擎以及社交媒体平台作为这一转型的一部分。
Q:演讲者对人工智能市场的增长和加速计算的需求暗示了什么?
A:演讲者暗示,人工智能和加速计算市场不仅仅是一次性的转变,而将在未来十年持续增长。随着市场的扩大,将需要用加速计算替换现有的数据中心基础设施,并增加更多的加速计算。
Q:演讲者声称他们的公司有什么竞争优势?
A:演讲者声称由于他们在市场上推出的Grace Blackwell配置,特别是200系列、Ultra系列和300系列,他们的公司拥有竞争优势。他们强调完整数据中心规模的重要性,以及为加速计算和新的人工智能模型进行多芯片的共同设计。
Q:他们平台的功能重点是什么?
A:他们平台的功能焦点是协助模型构建者和企业,提供一整套的解决方案,包括硬件和软件,包括CUDA和新库。该平台设计为可持续使用并随着时间推进,为当前和未来的人工智能模型提供大量支持。
Q:新建筑与替换现有GPU的比例是多少,这意味着对新技术的需求如何?
A:新建显卡与替换现有显卡的比例大多有利于新建显卡,大部分已安装的基础仍然存在。这表明对最新技术的需求很高,并表明对新显卡的需求非常大,因为大多数客户选择全新构建。
Q:顾客如何使用旧的GPU(如霍普)?这反映了市场需求的什么情况?
A:客户们仍在使用像霍普这样的旧GPU进行内部研究和模型微调,这是因为它们与软件的向前和向后兼容性。这表明即使是旧技术,仍然存在强烈的需求,因为它仍然满足市场上的某些需求。
Q:关于推理工作负载对客户盈利能力的评论?
A:推荐客户推断工作负载的盈利能力是一个感兴趣的话题,但没有提供具体的投资回报率细节。演讲者指出,重点是工作负载及其进展,这意味着客户正在考虑盈利能力这一因素。
Q:当前人工智能架构中的推理模型的重要性是什么?
A:推理模型是正在构建的AI模型的必要组成部分,强调不仅需要单一回应;它们涉及长期、深思熟虑的推理,这是当前模型架构的重要组成部分。
Q:增加计算能力需求如何影响模型构建者和市场?
A:更大的计算容量需求来增强代币生成并支持更多用户正在市场上产生一个飞轮效应。这推动了对更先进模型和代币生成量的需求增加,导致了一个情况,即更多的生成和更多的用户正在推动对推理类模型推断的需求。
Q:建模者面临什么财务挑战,这些挑战可能被视为风险?
A:建模者面临挑战,因为对计算能力的高需求推高了成本,而目前没有即时收入来覆盖这些费用。这就带来了财务风险,因为他们可能没有足够的收入来维持他们对计算能力和供应链投资的承诺。
Q:超大规模运算商的期望和策略如何影响模型制造商?
A:超大规模计算用户对内部使用的持续购买和过渡到加速计算正在影响模型制造商。模型制造商需要评估他们是否已经获得足够的盈利能力,是否可以筹集更多资金,并确定额外的计算需求。重点主要集中在当前和近期计算能力的可用性。
Q:与OpenAI的合作的财务范围是什么,它的结构是怎样的?
A:与OpenAI的合作意义重大,拟定的交易规模为10 GW,潜在价值可能达到合同期内的4000亿美元。然而,协议尚未完全敲定;目前的框架协议只包含其中的一部分,允许采取一种投资方法而非确定的承诺。重点主要是未来直接与OpenAI合作。
Q:从Vera Rubin到Blackwell Altra的转变如何影响绩效,有哪些期望?
A:黑韦尔Altra的过渡预计将是无缝的,就像从维拉·鲁宾的过渡一样。人们期待着维拉·鲁宾在明年下半年给市场带来显著的性能提升,预计性能将出现“X因素”增加。
Q:市场发生了什么变化,可能会影响演讲者公司的销售策略?
A:市场正在增长,这意味着风险对冲可能是竞争对手无法达到与发言人公司同等规模的一个原因,尽管他们提供的产品是免费的。
Q:为什么演讲者认为他们的产品不能被免费竞争对手简单替代呢?
A:演讲者认为,他们的产品有独特的能力创建完整系统,能够处理任何工作负载和模型,这是固定功能类型的产品无法匹敌的,即使是免费提供的也无法。
Q:演讲者声称他们的产品相对于简单的固定功能芯片有什么优势?
A:演讲者声称他们的产品在多个方面都能进行扩展,并包含了对推理和功耗效率至关重要的共同设计特性,这使得简单的固定功能芯片难以复制它们的功能。
Q:演讲者如何描述了Cpx在工作量分解背景下的重要性?
A:演讲者将Cpx描述为一个游戏改变者,通过分解工作负载将其提升到不同的阶段,从而允许通过同一基础架构处理多种类型的推理请求。这标志着在单一基础架构中使用混合专家方法的重要性,这对模型构建者至关重要。
Q:演讲者如何回应AI可能取代CUDA的说法?
A:演讲者通过强调人工智能的快速发展和维持其领先地位所需的不断更新来驳斥AI可以轻松取代CUDA的说法。他们认为,在人工智能不断进步的情况下,复制CUDA的成功并不是一件容易的任务。
Q:与以前和未来版本的GPU兼容有什么优势?
A:向后和向前兼容不同的GPU的优势是,客户可以购买计算资源,这些资源很可能会随着时间的推移而改进,而无需立即升级。这种兼容性有助于确保客户在硬件上所做的投资在软件不断演变的同时保持强大。
Q:演讲者能否量化他们的GPU在上一代产品上的性能提升?
A:演讲者可以量化,从上一代GPU到当前一代GPU的性能总增加可达10到15倍,而仅在GPU进入市场后的软件更新中就有额外的2倍改进。
Q:演讲者的计划是如何维持他们的利润率,尤其是考虑到HBM的成本逐渐上升?
A:演讲者自信地表示,即使他们加速产品生产,仍能保持中70%的利润率。他们计划应对与HBM成本和HBM内容有关的潜在挑战,尽管在记录中并未提供关于此计划的具体细节。
Q:团队在生产效率方面取得了哪些显著的改进?
A:团队对周期时间、产量和成本进行了精心调整,使得效率方面取得了显著成就,达到了中7的水平。
Q:为什么库存和采购承诺的增加被认为是有益的?
A:库存和采购承诺的增加被视为有益的,因为它表明公司已经为未来需求增长确保了供应,并且符合未来几个季度显着收入增长的预期。
Q:存货和采购承诺的大幅增长对未来收入意味着什么?
A:库存和采购承诺的大幅增长达到250亿美元,预示着未来两三年内有显著的收入增长。
Q:库存和采购承诺对未来的供应和需求有何重要性?
A:库存和采购承诺对确保供应满足未来需求至关重要。公司已经仔细规划了其供应链,包括订购系统所需的关键物料和零部件,以管理复杂性,并确保对其业务至关重要的物品获得较长的交货时间。
Q:购买义务如何影响公司的战略规划和增长预期?
A:采购承诺是公司战略规划中的重要组成部分,反映了为持续增长所需的资本、产能和计算规划。它们也表明了超出初始预测的增收潜力。
Q:5000亿美元的收入预测对未来一年有何暗示?
A:5000亿美元的营收预测显示,该公司可能会产生大量现金,这将在资本配置和战略投资中起到作用。
Q:公司打算如何在即将进行的战略投资中分配现金和管理资本?
A:公司计划分配现金以满足内部需求,包括建设产品的供应和产能要求,通过股票回购和股息保证股东回报,并在生态系统中进行战略投资,重点扩大合作伙伴关系并借鉴他们的工作。
Q:公司在投资策略方面如何转变焦点?
A:这家公司正在将重心转向生态系统投资,而不是并购。尽管他们继续专注于工程团队和与他们平台相符的潜在并购机会,但重点是扩大生态系统并在那里进行战略投资。
play
English
English
进入会议
1.0
0.5
0.75
1.0
1.5
2.0