首页 > 消费 > 正文
Qzone
微博
微信

百果园CIO王筱东:如何用小模型做决策、大模型提效率

消费 联商网 2026-04-24 16:17
百果园CIO王筱东:如何用小模型做决策、大模型提效率

 

近日,在“CCFA新消费论坛”上,深圳百果园实业(集团)股份有限公司副总裁兼首席信息官王筱东分享了百果园AI应用实践,解读百果园用AI实现决策引擎与效率引擎“双擎驱动”的数智化转型发展路径。

 

以下为王筱东演讲内容(经联商网编辑):

感谢组委会给我们机会来做百果园AI应用的实践分享,百果园是国内最大的水果零售平台,在全国有几千家水果零售店,我们对科技的投入也很大,有一个几百人的研发团队,其中在AI领域也有多年的研发基础,现在跟AI相关的团队大概有五、六十人,分成两个主要团队。

做AI应用的叫数据科学团队,另外要支持AI应用,后台数据的质量是必须要过关的,所以我们还有一个专门的数据团队,也就是数据工程和数据治理的团队。

今天主要给大家分享一下,百果园究竟在哪些地方用了AI以及AI建设过程,主要是实践分享。整体上来说,百果园定位的AI,我们叫双擎驱动,用AI做两件事情,首先是构建自己的决策引擎,所谓的决策引擎就是帮助我们提升决策的精准度。

我们应该怎么去订货?怎么去定价?怎么去做物流规划?主要是做这些事情,而这些方面其实是以传统的AI小模型为主,就是以机器学习、求解器这些方面去训练自己企业专用的小模型。这几年大模型的发展迅速,而大模型也不是万能的,大模型更擅长的是帮我们做跟语言相关、跟多模态相关的,比如写一些调研报告、做一些SWOT分析,这都是大模型擅长的。

但要让大模型来做数据和企业的经营决策,不经过其他手段处理是不可靠的,因为它不知道企业的经营逻辑,也没有企业真实的数据训练。所以要做决策,还是要以机器学习和求解器这种传统的模型为主,因为成本低,迭代速度快,我们甚至可以做到每天一个迭代。

但提升效率层面必须以大模型为主,这里包括我们的知识检索、自动化研发、测试、营销等。另外,科技团队的代码编程,必须要以大模型为主,这一块我们专注的就是与多智能体协同应用的研发,接下来分两个部分给大家介绍一下。首先是决策引擎,我们用AI来做决策的最主要目标是什么?或者最主要的目的是什么?从我们的理解来说很简单,就是木桶原理,核心AI决策就是我们要提升企业决策的底线。

其实AI应用的好不好?或者经营的决策准不准?其实是相对来说的,因为没有哪个AI能做到100分,甚至90分都做不到,可能只做到80分,但它到底好不好,取决于用AI的人的水平,只要用的人的水平是低于80分的,这个AI就是好的。如果其水平是高于80分的AI,就会觉得不可靠,没有什么用。

作为一个大企业来说,不可能保证每一个人员水平都很高,这时用AI做决策就很重要了,如果店长普遍的经营决策、订货水平大概处于50分,AI只要做到60分,那就是有用的。但如果说大家水平已经很高了,都是80分、90分,AI做到70分、80分大家就会觉得没有用。所以我们在判断AI的经营决策,做精准决策的时候,核心就是木桶原理,它决定了我们做的效果有多大。

举个例子,所有的零售行业都有门店订货问题,都在提自动化补货、智能订货,百果园的门店也是一样,卖水果属于生鲜的一种,跟传统的卖标品、零食有很大的区别。第一、水果随着鲜度的不断变化,销量会受影响;第二、在订货、补货时,不是想补哪个品类就能补哪个品类的,特别是像蓝莓这种好品质的水果,不是想要多少就有多少的,可能就只有那么多货,有些人能订到,有些人就订不到。

我们的订货场景相比传统标品会更复杂,如何提升店长的订货精准率呢?我们就做了智能订货系统,店长每天通过这个系统来订货,有一个AI一键添加的功能,只需要点一键添加,AI推荐的订货数量和品类会直接加入购物车,可以修改、查看。我们有详细的计算思路,会告诉店长订这些货,是因为预测今天的销量有多少、明天的销量有多少,以及考量几十个综合的因素,最终有了智能订货最终的呈现。

那我们最终是怎么做的呢?通过三个步骤来做这个事情,一般说到智能订货、智能补货,大家都会提到对销售的预测,不过我们只是将销售预测作为订货的一个决策条件,还有很多其他条件,比如安全库存、配送时长、分货考虑,所以我们会有决策的过程,也就是说预测的销量只是作为一个因素,输入到决策过程中,再经过更全面的考虑,最终产生订货建议。

而订货建议靠不靠谱?准不准确呢?我们还有一套完整的监控指标,给出建议之后,店长有没有按照执行?按照建议订货后经营好不好?我们会有一个完整的监控体系,整体上是按照这三步来做的。

我们会根据过去12个月的销量,对模型进行训练,都是小模型,可以随时自主来可控,然后用最近30天的数据来做验证,这个模型每天都在重新训练,保证数据是最新的,并用双指标来做评估。

后续再通过一些工程化处理,基本上可做到大概60%左右的预测准确率,这听起来不算很高,但实际上已经是不错的成绩了。然后在决策这个环节,我们是用六个维度来进行同时决策。

而对于新品来说,我们没有太多的历史数据可以参考,我们要找到类似的商品,类似的门店,给店长小批量进货的建议,避免囤货。而偏好品是根据用户的复购、好评来定,最终是要确保顾客的满意度。

我们还有一个比较典型的AI应用系统,叫基因诊断,简单的说就像体检一样,如果体检时心率过高、血压过高,只是一个表象,这背后代表的是你太累了或是有心脏问题等,是一个表象到深层次原因的过程。

零售企业每天都会有各种各样的报表,涵盖销售、毛利、销量等各类数据。但我们的决策者、门店店长,他们能看懂这些报表吗?或者从报表里能看到深层次的经营问题吗?我觉得这是很难的,所以我们希望用AI来做一套完善的经营诊断系统,会有几十个经营诊断的维度,包括线上经营、会员运营费用、商品等各个方面,在单纯的经营数据表格中,通过这些维度真正看到经营存在的问题。

现在通过AI经营诊断系统,我们每周会给全国几千家门店的店长都生成一份报告,店长可以看到详细的经营报告,这个好像听起来也不是很难?将财务报表给到大模型,大模型就可以生成一个看起来还可以的报告,但是实际上真正用过的人都知道,用大模型来做这种经营数据分析,做出来的东西不一定靠谱。

首先我们的指标包含几十个维度,维度之间存在相当复杂的关联和层级依赖,且有很强的专业度,分析难度很大。而大模型善于做些调研报告、SWOT 分析,但在做数学和统计学分析的时候,容易出错,甚至一些简单的计算都容易出错。如果直接将报表给大模型分析,错误率很高,并不可靠。

其次,建立标杆体系,全国数千家门店分布在不同城市、不同商圈,经营水平、客群不同,一定要把不同门店分成不同类别,然后在类别里面选出标杆,是一个动态聚类的过程。这个需求大模型是做不到的,因为它是静态训练好的,没有办法根据多维特征去动态构建聚类基线。

此外,整个根因溯源的链路长,销售、利润低的原因是什么?表层原因可能是销售额不足、损耗过高或费用超标;进一步拆分,则是线上线下表现、商品品类结构、价格带布局、高毛利商品占比等多层因素。从异常指标穿透定位到核心根因,需要层层数据拆解,大模型的推理逻辑不可控、链路不严谨,结果没有说服力。

所以我们用了双融合模式架构,先通过几十个统计学小模型来做小模型分析,包括聚类、异常检测、根因推理,最终小模型生成的结果再通过语义生成层,用大模型来行文,并且大模型行文有严格要求,简单地说就是小模型负责算得准、找得对,大模型负责说得清、听得懂,这样才能确保每一次生成的报告是可信的、一致的,能够符合经营决策需求。

效率提升是以大模型为主,我们用AI提交目的而不是取代员工,希望AI能够帮助员工更轻松工作,更好实现事业好、家庭好、身体好的“三好人生”目标。

首先,我们做了整套的agent应用研发框架,各个部门可以把需求提出来,科技中心会根据完整的开发框架,快速搭建适用的agent应用。规避用户自己去搭建带来风险,如涉及到权限问题、数据外流问题、数据违反合规问题等。

其次,所有内部核心业务系统我们都已经完成MCP,都有专门的MCP接口,可以直接对接企业内部系统,它不是孤立AI,可以做到订货、经营、管理等业务场景的落地。我们专门成立了AI研究的编程小组,找到能落地的场景,一个一个去做到。

最后做一个总结,结合达尔文适者生存的理念,每次环境变化时,真正生存下来的不是最强的生物,而是最能适应的生物。从百果园的实践经验来说,AI是非常好的工具,但不必盲目追求最新、最时髦,关键核心还是能够用得上、用得起、用得好,以上是我们对AI实践的分享,谢谢大家。

【以上内容转自“联商网”,不代表本网站观点。如需转载请取得联商网许可,如有侵权请联系删除。】

 

延伸阅读:

 

 

责任编辑: fjq4191

责任编辑: fjq4191
人家也是有底线的啦~
广告
Copyright © 2018 TOM.COM Corporation, All Rights Reserved 新飞网版权所有