摘要:“民者,国之根也,诚宜重其食,爱其命。”

业务背景

“民者,国之根也,诚宜重其食,爱其命。”食品安全既是重大的民生问题,也是重大的政治问题。在市场经济大潮和社会发展转型期背景下,食品药品安全问题依然频发,安全形势依然严峻。食品药品监管频现行业监管对象愈加复杂,食药安全面临多重风险考验,新技术、新业态考验监管智慧,社会诚信环境有待进一步优化等诸多问题。

痛点需求

目前,我国市面上流通的食品种类繁多,根据食品生产许可分类目录,我国食品有三十二个大类,三百多个小类,使得食品安全监管和风险分析工作量巨大,相关数据不易获得;而在实际食品安全监 管工作中,往往存在监管区域大而监管人员较少的情况,对区、县、镇甚至是行政村级别的区域进行监管时,监管任务繁重。监管人员有时会感觉力不从心,在各区域风险程度不明确的前提下,依旧只能凭借经验或其他随机条件选择部分品类或区域进行选择性监管,容易造成风险失控和有限监管力量的无效使用。在有限的监管资源下,如何能够通过监督性抽检,发现更多的不合格食品,是一个巨大的挑战。不合格高风险食品在地域上、品类上分布高度不均匀;在不同的季节和不同的气候条件下,容易出现安全问题的食品也不相同。除此之外,生产商地址、包装方式、储存方式、保质期、历史上是否出现过食品安全或其他企业失信问题等等因素,都可能影响待检品不合格的可能。

解决方案

数之联食品安全大数据解决方案整合检验业务、工商信用、天气环境等数据,获得产品原始特征,再通过非线性变换和粗粒度调整,以及特征与特征两两三三的组合获得大量的衍生特征。在此基础上,利用支持向量机、神经网络、决策树、回归分析等手段,建立集成学习模型,可以预测不合格品的品类分布情况和地域分布情况,为靶向抽检提供辅助决策依据。

品类风险趋势预警

品类风险趋势预警,可以定期(月、季度、半年、全年)整合各部门样品采集信息、日常监管信息,分析各部门或各单位抽检任务完成情况、问题食品发现情况和溯源情况、食品安全分布特征、存在的主要问题等,在进行定量描述的基础上辅以定性判断,从宏观角度反映食品安全动态变化趋势,为安排来年食品抽检任务提供重点抽查抽检品种指南。品类风险趋势预警实现以下功能:大数据+食品安全 : 靶向抽检,高效使用监管资源-数据分析网
图1 品类安全趋势预警系统

区域风险趋势预警

通过区域风险趋势系统,可以融合多源数据,如本地检测数据、各行政区域检测数据、日常监管数据、稽查办案数据等,实现机器预警+专家经验结合,进而实现区域风险情况指示,基于地图形式展示区域风险分析预警结果,划定可能的高危风险区域,为抽检区域的选择提供依据。大数据+食品安全 : 靶向抽检,高效使用监管资源-数据分析网
图2 区域风险趋势预警
在抽检领域,基于时间序列的趋势方程预测是食品安全指数分析的主要技术手段。食品安全指数要落实到对于抽检不合格率的预测与计算。抽检不合格率是一种介于0和1之间的连续数值型随机变量,当加入时间因素后,一系列在连续时间轴上的抽检不合格率即为一个时间序列。考虑到一个时间戳内不同品类的食品合格率排序并不能反应他们的实际风险顺序,所以通过对各个品类进行了横向对比,得出当前时间戳内品类的拟合合格率在整个时间段中的表现情况,再对它进行评价得出安全指数,这样做的好处是安全指数排序更加接近于实际情况。鉴于抽检不合格率的概率与统计性质,我们可以根据不同情况选择采用基于时间序列的趋势方程预测模型在频率学派背景下,假设Yt表示t时刻的抽检不合格率,Xt表示t时刻实际抽检的不合格样本数,Nt表示t时刻实际抽检的总样本数则利用历史抽检不合格率Yt-1, Yt-2, … 来预测Yt的趋势方程模型可以表示成如下形式:
大数据+食品安全 : 靶向抽检,高效使用监管资源-数据分析网
其中α是0到1之间的一个常数,其具体取值可根据实际情况进行调整。通常认为最近一次抽检结果对t时刻的抽检结果影响较大时,可以选择较大的α,反之则取较小的α。出于方便操作的目的,也可以选择α=0.5。当各个时间抽检总样本数Nt不平衡(差别较大时),可采用另一种形式的趋势方程模型:
大数据+食品安全 : 靶向抽检,高效使用监管资源-数据分析网
这样得到的结果相对更稳定,具有更好的鲁棒性(Robustness)。其中α也是0到1之间的一个常数,其具体取值可根据实际情况进行调整。通常认为最近一次抽检结果对t时刻的抽检结果影响较大时,可以选择较大的α,反之则取较小的α。出于方便操作的目的,也可以选择α=0.5。

应用价值

通过引入机器学习的方法,实现了针对高风险品的靶向抽检,最终实现监管人力(监管人员)、财力(抽检资金等)、物力(设备资源)等资源合理分配的合理调度。