百果园CIO王筱东：如何用小模型做决策、大模型提效率

消费联商网 2026-04-24 16:17

近日，在“CCFA新消费论坛”上，深圳百果园实业（集团）股份有限公司副总裁兼首席信息官王筱东分享了百果园AI应用实践，解读百果园用AI实现决策引擎与效率引擎“双擎驱动”的数智化转型发展路径。

以下为王筱东演讲内容（经联商网编辑）：

感谢组委会给我们机会来做百果园AI应用的实践分享，百果园是国内最大的水果零售平台，在全国有几千家水果零售店，我们对科技的投入也很大，有一个几百人的研发团队，其中在AI领域也有多年的研发基础，现在跟AI相关的团队大概有五、六十人，分成两个主要团队。

做AI应用的叫数据科学团队，另外要支持AI应用，后台数据的质量是必须要过关的，所以我们还有一个专门的数据团队，也就是数据工程和数据治理的团队。

今天主要给大家分享一下，百果园究竟在哪些地方用了AI以及AI建设过程，主要是实践分享。整体上来说，百果园定位的AI，我们叫双擎驱动，用AI做两件事情，首先是构建自己的决策引擎，所谓的决策引擎就是帮助我们提升决策的精准度。

我们应该怎么去订货？怎么去定价？怎么去做物流规划？主要是做这些事情，而这些方面其实是以传统的AI小模型为主，就是以机器学习、求解器这些方面去训练自己企业专用的小模型。这几年大模型的发展迅速，而大模型也不是万能的，大模型更擅长的是帮我们做跟语言相关、跟多模态相关的，比如写一些调研报告、做一些SWOT分析，这都是大模型擅长的。

但要让大模型来做数据和企业的经营决策，不经过其他手段处理是不可靠的，因为它不知道企业的经营逻辑，也没有企业真实的数据训练。所以要做决策，还是要以机器学习和求解器这种传统的模型为主，因为成本低，迭代速度快，我们甚至可以做到每天一个迭代。

但提升效率层面必须以大模型为主，这里包括我们的知识检索、自动化研发、测试、营销等。另外，科技团队的代码编程，必须要以大模型为主，这一块我们专注的就是与多智能体协同应用的研发，接下来分两个部分给大家介绍一下。首先是决策引擎，我们用AI来做决策的最主要目标是什么？或者最主要的目的是什么？从我们的理解来说很简单，就是木桶原理，核心AI决策就是我们要提升企业决策的底线。

其实AI应用的好不好？或者经营的决策准不准？其实是相对来说的，因为没有哪个AI能做到100分，甚至90分都做不到，可能只做到80分，但它到底好不好，取决于用AI的人的水平，只要用的人的水平是低于80分的，这个AI就是好的。如果其水平是高于80分的AI，就会觉得不可靠，没有什么用。

作为一个大企业来说，不可能保证每一个人员水平都很高，这时用AI做决策就很重要了，如果店长普遍的经营决策、订货水平大概处于50分，AI只要做到60分，那就是有用的。但如果说大家水平已经很高了，都是80分、90分，AI做到70分、80分大家就会觉得没有用。所以我们在判断AI的经营决策，做精准决策的时候，核心就是木桶原理，它决定了我们做的效果有多大。

举个例子，所有的零售行业都有门店订货问题，都在提自动化补货、智能订货，百果园的门店也是一样，卖水果属于生鲜的一种，跟传统的卖标品、零食有很大的区别。第一、水果随着鲜度的不断变化，销量会受影响；第二、在订货、补货时，不是想补哪个品类就能补哪个品类的，特别是像蓝莓这种好品质的水果，不是想要多少就有多少的，可能就只有那么多货，有些人能订到，有些人就订不到。

我们的订货场景相比传统标品会更复杂，如何提升店长的订货精准率呢？我们就做了智能订货系统，店长每天通过这个系统来订货，有一个AI一键添加的功能，只需要点一键添加，AI推荐的订货数量和品类会直接加入购物车，可以修改、查看。我们有详细的计算思路，会告诉店长订这些货，是因为预测今天的销量有多少、明天的销量有多少，以及考量几十个综合的因素，最终有了智能订货最终的呈现。

那我们最终是怎么做的呢？通过三个步骤来做这个事情，一般说到智能订货、智能补货，大家都会提到对销售的预测，不过我们只是将销售预测作为订货的一个决策条件，还有很多其他条件，比如安全库存、配送时长、分货考虑，所以我们会有决策的过程，也就是说预测的销量只是作为一个因素，输入到决策过程中，再经过更全面的考虑，最终产生订货建议。

而订货建议靠不靠谱？准不准确呢？我们还有一套完整的监控指标，给出建议之后，店长有没有按照执行？按照建议订货后经营好不好？我们会有一个完整的监控体系，整体上是按照这三步来做的。

我们会根据过去12个月的销量，对模型进行训练，都是小模型，可以随时自主来可控，然后用最近30天的数据来做验证，这个模型每天都在重新训练，保证数据是最新的，并用双指标来做评估。

后续再通过一些工程化处理，基本上可做到大概60%左右的预测准确率，这听起来不算很高，但实际上已经是不错的成绩了。然后在决策这个环节，我们是用六个维度来进行同时决策。

而对于新品来说，我们没有太多的历史数据可以参考，我们要找到类似的商品，类似的门店，给店长小批量进货的建议，避免囤货。而偏好品是根据用户的复购、好评来定，最终是要确保顾客的满意度。

我们还有一个比较典型的AI应用系统，叫基因诊断，简单的说就像体检一样，如果体检时心率过高、血压过高，只是一个表象，这背后代表的是你太累了或是有心脏问题等，是一个表象到深层次原因的过程。

零售企业每天都会有各种各样的报表，涵盖销售、毛利、销量等各类数据。但我们的决策者、门店店长，他们能看懂这些报表吗？或者从报表里能看到深层次的经营问题吗？我觉得这是很难的，所以我们希望用AI来做一套完善的经营诊断系统，会有几十个经营诊断的维度，包括线上经营、会员运营费用、商品等各个方面，在单纯的经营数据表格中，通过这些维度真正看到经营存在的问题。

现在通过AI经营诊断系统，我们每周会给全国几千家门店的店长都生成一份报告，店长可以看到详细的经营报告，这个好像听起来也不是很难？将财务报表给到大模型，大模型就可以生成一个看起来还可以的报告，但是实际上真正用过的人都知道，用大模型来做这种经营数据分析，做出来的东西不一定靠谱。

首先我们的指标包含几十个维度，维度之间存在相当复杂的关联和层级依赖，且有很强的专业度，分析难度很大。而大模型善于做些调研报告、SWOT 分析，但在做数学和统计学分析的时候，容易出错，甚至一些简单的计算都容易出错。如果直接将报表给大模型分析，错误率很高，并不可靠。

其次，建立标杆体系，全国数千家门店分布在不同城市、不同商圈，经营水平、客群不同，一定要把不同门店分成不同类别，然后在类别里面选出标杆，是一个动态聚类的过程。这个需求大模型是做不到的，因为它是静态训练好的，没有办法根据多维特征去动态构建聚类基线。

此外，整个根因溯源的链路长，销售、利润低的原因是什么？表层原因可能是销售额不足、损耗过高或费用超标；进一步拆分，则是线上线下表现、商品品类结构、价格带布局、高毛利商品占比等多层因素。从异常指标穿透定位到核心根因，需要层层数据拆解，大模型的推理逻辑不可控、链路不严谨，结果没有说服力。

所以我们用了双融合模式架构，先通过几十个统计学小模型来做小模型分析，包括聚类、异常检测、根因推理，最终小模型生成的结果再通过语义生成层，用大模型来行文，并且大模型行文有严格要求，简单地说就是小模型负责算得准、找得对，大模型负责说得清、听得懂，这样才能确保每一次生成的报告是可信的、一致的，能够符合经营决策需求。

效率提升是以大模型为主，我们用AI提交目的而不是取代员工，希望AI能够帮助员工更轻松工作，更好实现事业好、家庭好、身体好的“三好人生”目标。

首先，我们做了整套的agent应用研发框架，各个部门可以把需求提出来，科技中心会根据完整的开发框架，快速搭建适用的agent应用。规避用户自己去搭建带来风险，如涉及到权限问题、数据外流问题、数据违反合规问题等。

其次，所有内部核心业务系统我们都已经完成MCP，都有专门的MCP接口，可以直接对接企业内部系统，它不是孤立AI，可以做到订货、经营、管理等业务场景的落地。我们专门成立了AI研究的编程小组，找到能落地的场景，一个一个去做到。

最后做一个总结，结合达尔文适者生存的理念，每次环境变化时，真正生存下来的不是最强的生物，而是最能适应的生物。从百果园的实践经验来说，AI是非常好的工具，但不必盲目追求最新、最时髦，关键核心还是能够用得上、用得起、用得好，以上是我们对AI实践的分享，谢谢大家。

【以上内容转自“联商网”，不代表本网站观点。如需转载请取得联商网许可，如有侵权请联系删除。】