范式智能 (06682.HK) 2026智通财经夏季路演大会
文章语言:
简
繁
EN
分享
纪要
原文
会议摘要
范式智能2023年营收71亿,实现全年盈利,手握90亿订单。API业务一季度营收同比增长35%,毛利率达35.1%。公司凭借哈密VGPU和信创魔盒等核心技术,形成全球影响力。透明工厂业务自建算力,提供增值服务,目标成为AI全面解决方案提供商。员工减少,人均创收提升,业务模式优化,管理层对市场充满信心。
会议速览
范式智能公司回顾去年业绩,总营收71亿,首次全年盈利,在手订单90亿,机器学习平台市场份额连续八年第一。业务按收费模式分类,AI平台营收65亿,同比增长32%;按结果付费的agenda I营收5亿;API业务营收8000万,同比增长120%。
公司一季度营收同比增长35%,毛利率达35.1%,AI平台业务增速最快,毛利率回升,调用量同比增长600%,与欢喜传媒签订2亿美金框架性协议,展现通用工厂业务商业化场景落地。
中国算力部署面临利用率不足与碎片化问题,尤其GPU利用率低,国产芯片更甚。为应对挑战,一种云原生算力虚拟化技术应运而生,通过GPU虚拟化提升利用率,实现算力池化与高效调度,显著降低硬件成本,提升国产AI芯片效能,成为全球算力利用率提升领域的标准制定者。
开源社区吸引了众多企业和贡献者参与技术发展,同时保留了商业版的核心技术,如虚拟显存(v RAM)和算力隔离,显著提升国产芯片性能,降低成本,被国内多家大型企业采用。VM well等国际公司也采纳了该技术用于虚拟化VGPU业务,显示了其广泛的应用价值。
讨论了通过独特生态位和技术积累,实现国产GPU统一管理的重要性,强调了开源社区在技术聚集和创新中的作用,以及面对国产化需求时,如何通过合作解决芯片厂商间的信息壁垒,提升芯片利用率,降低成本,符合国产信创合规供应链安全,从而在行业形成赢家通吃的局面。
介绍了信创魔盒在推动国产芯片与模型适配方面的作用,旨在构建一个可与Hugging Face媲美的开源模型生态系统。通过开源社区的努力,已提前达成今年10万模型适配的目标,并计划明年达到100万,实现国产芯片与模型的高效适配与优化。
讨论了AI操作系统为企业客户提供的全站解决方案,包括私有模型训练、本地化部署及算力资源优化,以及公有云与混合云架构的结合应用,旨在帮助企业构建和优化私有模型,提升决策效率和数据安全性。
通过fancy cloud的帮助,利通电子实现了从电子元器件厂商到算力IDC的转变,解决了GPU裸金属的管理与调度难题,提升了算力利用效率。随着token需求的指数级增长,公司评估后决定加大对算力的投入,构建透明工厂,将物理算力转化为虚拟模型推理服务,旨在实现从算力自建到token生成的端到端服务,以应对市场新需求和解决行业卡脖子问题。
讨论了算力瓶颈问题及供应链优势,强调与国产芯片厂商的良好关系和技术创新,如哈密VGPU,以降低成本、提高效率。介绍了即时定价模式,如与欢喜传媒的合作案例,展示了技术迭代对算力利用效率的提升,以及对毛利率的正面影响。
公司2023年至2025年期间,通过产品标准化和数字员工应用,显著减少了员工数量,同时提升了人均创收。2025年末员工数降至619人,人均创收达1100多万。经营层面实现盈利,现金及现金等价物增加,确保了算力扩张和债务资金的充足,手头订单量的增长保障了收入的持续性。
对话深入探讨了AI企业的市场地位、竞争优势及Token工厂的业务模式。重点介绍了API业务的客户类别,包括传统中大型客户、第三方聚合平台用户及直接签约企业。同时,讨论了AI技术如何创造经济效益,如通过龙虾农场产品提升工作效率,以及视频生成模型在影视创作中的应用。最后,强调了AI技术的快速发展及其在不同领域的潜在价值。
要点回答
Q:范式智能公司路演及投资者交流的时长是多少?张明潇在此次路演中的角色是什么?
A:范式智能公司的路演及投资者交流总时长为35到40分钟。我是范石智能的投资者关系张明潇,负责今天的路演交流活动。
Q:公司最近路演交流的情况如何?张明潇对于自己在路演中的表现有何感受?
A:最近路演交流很多,股价表现不佳,受到的关注和压力也较大。我感觉压力很大,但也会紧张,不过我们做了精心准备,希望能分享公司最新的业务、技术和商业模式进展。
Q:范式智能公司去年的业绩情况如何?公司的营收是如何分类的?
A:去年公司总营收达到71亿,首次实现全年盈利,在手订单90亿。同时,连续八年在机器学习平台市场份额保持第一。目前按收费模式分类,主要有三个部分:AI platform(营收65亿,同比增长32%)、按结果付费业务(营收5亿)以及API业务(营收8000万,同比增长120%)。
Q:今年一季度公司的营收增长及毛利率情况如何?
A:一季度总营收同比增长35%,毛利率为35.1%,超过去年的34.8%。并且,算力资源有所提升,自持算力加大,并且在脱困工厂业务上取得重大突破,与欢喜传媒签订了2亿美金三年的框架性协议。
Q:AI平台业务、按结果付费业务和API业务各自的状况怎样?
A:AI平台业务保持较快增长并带动整体增速,毛利率回升;按结果付费业务订单增长显著;API业务增长最强劲,同比增长120%,且预计今年增速将达到十倍。
Q:公司当前在技术和产品方面有哪些变化?范式智能的技术如何解决这些挑战?
A:范式智能正在通过标准化平台解决企业部署AI的痛点难点,尤其是提升算力利用率和资源调度效率,致力于打造异构算力智能管家系统。公司长期研发的技术作为异构算力智能管家,通过云原生算力虚拟化中间层提升GPU利用率,目前已成为CNCF官方沙箱项目,成为全球组织的标准制定者之一。
Q:中国在部署算力时面临的主要挑战是什么?
A:中国部署算力面临的两大挑战是算力利用率不足和算力碎片化,普遍存在GPU利用率低的问题,而异构算力环境更是加大了这一挑战难度。
Q:GPU虚拟化技术(VGPU)具体是做什么的?
A:GPU虚拟化技术(VGPU)主要用于精细地将GPU算力进行切分,精度可达1%,比如可以将一张卡的算力切成100份。通过这种技术,原本多个任务占用多张卡的情况得以优化,只需用较少的卡资源完成任务,从而提高效率、降低成本,节省一半的成本或实现成本降低。
Q:这种技术在国产AI芯片上有什么表现?
A:该技术不仅提升了国产AI芯片的效能,还显著提高了资源利用率,可达5到10倍,并大幅降低了硬件成本。同时,由于其云原生特性,能够降低运维成本,实现云人工运维。
Q:你们开源的版本和商业版的区别是什么?开源社区对技术影响力有何作用?
A:开源版本主要在社区中推广和发展技术,而商业版则包含了如vRAM管理和算力隔离等独家技术。其中vRAM技术可以无中生有地提升显存虚拟化,增强算力,尤其对于国产芯片在运行高效模型时填补性能差距,减少对多张卡的需求,降低成本。开源社区聚集了众多企业和开发者,形成强大的生态,使得哈密VGPU在硬件管理领域成为全球最具影响力的企业之一。通过开源方式吸引更多参与者,技术形成优势后,我们将成为该行业的唯一赢家。
Q:有哪些客户在使用你们的商业版产品?
A:已经有国内一两百家大型企业采用我们的商业版产品,包括百度、华为等知名企业,他们可能因自身技术需求或合规要求,需要使用或调整我们提供的商业版本技术。
Q:华为在采用你们的技术后,解决了什么问题?
A:华为采用我们的技术后,成功实现了对国产GPU的统一纳管,降低了平台成本,提高了利用率,同时也满足了国产信创合规供应链安全的要求。华为无法解决多家厂商设备的统一管理问题,而我们通过独特的生态位置和技术优势实现了这一目标。
Q:这个技术是如何发展起来的?
A:这个技术最初是为了提升企业现有GPU利用率而研发的,逐步发展成为行业痛点解决方案,并通过不断的技术研发和开源等方式,最终达到了当前市场地位和能力。
Q:这些模型是否可以直接用于英伟达的卡上,以及国产芯片上的适配情况如何?目前信创魔盒的模型适配量完成情况如何?
A:英伟达的模型在编码时就已经适配,但国产芯片并不直接兼容。国产芯片厂商在尝试自行或通过社区做一些适配,但目前可用的适配模型数量较少,相比英伟达的数百个模型,国产芯片的适配模型数量还很有限,我们做这个工作是为了适配更多模型。目前第二季度已经接近10万的适配量,提前达成了今年的目标,并有信心在明年达成同样目标。
Q:开源社区的目标是什么?
A:我们开源社区的目标是今年达到10万个适配模型,明年达到100万个,以匹配heavy face的生态,使国产芯片得到更好的适配。
Q:简要解释一下哈密VGPU技术的作用是什么?
A:哈密VGPU技术可以将算力统一管理并切割,就像一个原本只能住一个人的房子现在可以分配给更多用户或任务,从而提高效率。
Q:信创磨合解决了哪些问题?信创魔盒具体帮助客户解决了哪些问题?
A:信创磨合主要解决了两方面的问题:一是解决了国产芯片与各类模型之间的适配问题,即能否使用;二是解决了如何更好地利用芯片,使其跑得更快的问题。信创魔盒帮助客户适配外部开源模型、搭建私有模型、部署算力以及提升算力资源利用率,构建了客户的私有云;同时,公有云提供服务给中小客户和有需要的公司,支持他们调用或部署智能体,满足不同场景下的AI能力需求。
Q:先知模型在企业客户中的定位是什么?
A:先知模型是公司提供给企业客户的整套AI操作系统中的一个环节或模块,它的作用是帮助企业开发和训练自己的私有模型,而非直接提供垂类模型。
Q:为什么企业需要拥有自己的私有模型并进行本地化部署?
A:企业拥有私有模型并进行本地化部署是为了满足数据安全、合规风控等需求,并为自身的业务流、应用场景搭建专属模型,通过运行自有数据优化和迭代模型以辅助决策。
Q:是否有案例能够体现这一技术方案的实际应用效果?
A:利通电子通过使用我们的fancy cloud产品,成功从一个电子元器件厂商转型为IDC业务,并解决了其购买回来的裸金属卡只能堆砌无法有效利用的问题。
Q:在当前算力极度供不应求的环境下,你们是如何帮助客户获取和优化算力资源的?
A:我们通过提供fancy cloud能力,为客户进行GPU的统一纳管编排、调度调优,并针对模型进行优化以提升运行速度。这样,客户能够借助我们的技术能力,将其转化为UI cloud角色,有效解决算力获取与优化的问题。
Q:为什么公司决定加大对算力的投入,并且认为自己具备建设透明工厂的能力?
A:这是因为随着龙虾智能体生态模式的兴起,对token的需求呈现指数级增长,这使得市场天花板被完全打开。经过几个月的评估,管理层认为公司有能力把握这个机遇,通过自建算力和利用自身基础设施能力,实现从源头到最终产生token的端到端打通。
Q:透明工厂具体是如何运作的?有哪些不同的业务形态?
A:透明工厂业务是将物理世界的算力设备转化为虚拟形态,通过附加模型等技术转化成虚拟世界中的模型推理调用服务。目前主要有三种业务形态:一是大模型公司通过租借或自建算力输出token;二是传统云厂商与模型厂商合作,嫁接或接入模型后转化为token;三是open API中转站,虽不直接拥有算力和模型,但通过聚合API模式进行分发并从中收取渠道抽成。
Q:公司在算力供应链方面有何优势?
A:公司拥有强大的供应链能力,与华为、国产芯片厂商以及其他创业公司保持良好的合作关系。例如,董事长戴博士曾与华为共事,对华为升腾系列有深入了解;同时,公司通过哈密VGPU及形状磨合技术降低了成本、提高了效率,并能适配更多模型,从而服务于公有云和私有云两端,帮助企业和开发者提升效率和整合工作流。
Q:投影工厂业务与AWS等公司的区别是什么?
A:投影工厂业务类似于Nebula等公司在持有算力基础上叠加各种增值服务,以解决百行千业的生产经营问题。与仅提供纯粹算力堆砌的AWS不同,我们不仅提供算力,还通过自研和收购方式丰富自身能力,直接为客户提供托管服务,满足不同类型的客户需求,包括长期合约、即时定价以及to B和to C等多种收费模式。
Q:在算力租赁模式中,你们与欢喜传媒的合作是如何定价的,以及这种模式对毛利率提升有何影响?
A:我们与欢喜传媒的合作采用即时定价模式,通过使用我们的fancy movie产品进行影视剧创作,客户预付费并根据流量token进行扣费。这种模式下,我们没有锁定特定数量的服务器,随着技术迭代,即使未来只需要800台服务器,剩余的200台服务器可以提供给其他客户,从而有助于提高未来毛利率。
Q:公司的员工人数为何大幅下降,以及这是如何实现的?
A:员工人数大幅下降主要源于公司产品体系向标准化平台模式转变,减少了前端驻厂工程师等外包人员,并运用数字员工提升研发效率,使得代码产出效率提升十倍以上。现在研发人员更倾向于调整结构,通过领导项目、掌握算法建模等方面的工程师带领团队工作,降低基础的代码编写人员比例。
Q:公司的财务状况如何,尤其是收入增长和净利润方面?
A:近年来,公司收入保持较高增长,首次实现扭亏为盈,在经营层面上实现盈利。现金及现金等价物增加,保证了债务资金和流动资金用于扩张算力。同时,手订单相较于去年营收有所增长,确保了今年收入增长的可见性。
Q:公司的管理团队有哪些重要荣誉和社会地位?
A:公司创始人戴博士担任全国工商联人工智能委员会主席兼秘书长,并获得全国非公有制经济人士优秀中国特色社会主义建设者这一国家级别重要奖项。这一奖项由国家统战部联合五部委每五年评选一次,是对民营企业家在社会主义建设中做出贡献的高度认可。
Q:关于token工厂(API)业务,客户类别有哪些?
A:token工厂业务客户类别主要包括三类:第一类是公司之前的大中型客户;第二类是在第三方聚合平台如open node上销售,主要是小型开发者群体;第三类是公司直接与企业签约,输出token的新模式,例如欢喜传媒。
Q:当前token是否能产生社会效益,能否举个例子说明?
A:在测试中,公司发现用户在使用龙虾农场等产品时,能够帮助小工作室、自媒体或艺人公司更高效地创造经济效益。例如,通过自动收集热门素材、撰写小说并发布、互动,甚至视频生成模型的应用,这些都能为用户带来实际收益。此外,公司还与其他环节的模型结合,为大型电影制作提供一站式服务,这都体现了token在社会经济活动中的价值。

范式智能
关注





