APP下载

数据思维在进口产品质量预测中的应用

2021-09-10谢俊杰谢颖梁照文

科技研究 2021年20期
关键词:数据思维

谢俊杰 谢颖 梁照文

摘要:数据是数字时代“信息石油”,足以说明数据对于生活在互联网时代人们的重要性。数据,就是人们在日常生活、社会发展等过程中计算、观察到的信息。数据思维则是利用数学作为工具,对具体的问题开展数据分析的思考过程。在计算机高速发展的现代,利用海量的数据来模拟多元化场景下的实际问题,从而选择最佳的解决方案,可以运用到各行各业,本文的应用场景则是对进口产品质量做趋势预测。

关键词:数据  思维  趋势预测

1.什么是数据思维

我们古人有云:“早晨下雨当日晴,晚上下雨到天明”、“蜻蜓千百绕,不日雨来到”,这些都是古代劳动人民在日常生活中观察自然气象并加以总结得出的朴素结论,而本文所谈的数据思维就是人们基于数学思想解决实际问题的一种思路。

在上文例举的自然现象,需要人们用眼睛观察后记录总结。在信息化高度发达的现代,这些数据可以交由计算机来完成。但其实无论是人类还是电脑,都是通过观察、分析数据从而得到某种规律,区别在于后者在前者的基础上使用固式化的数学模式和算法来进行分析。例如围棋自古有之,经过人们不断总结完善,世代传承下已经积累很多的“棋谱”。但人的大脑思维和记忆能力毕竟有限,虽然可以计算出非常多场景下对手的“套路”,但对于应对极限数量等场景,计算机计算能力就被放大,甚至可以击败世界上最顶尖的棋手。

2.数据思维的应用场景

得益于计算机对海量数据的处理能力,人们在社会发展和工业生产过程中也有可能实现精准预测和有效管理。例如市场流通产品质量风险检查布控管理。在最原始的风险布控阶段,由于缺乏真实数据,管理者只能按照产品本身属性特点来进行安全环保卫生等要素来检验布控。随着后续监管中发现的问题数据源源不断地充盈数据库,管理层注意到不同的产品在检查列表中体现的质量趋势也不尽相同,于是就将不同产品的检查行为分成了不同的表单(检查频次、检查内容等)给到了一线执法人员。进而,管理成会将表单划分后的产品质量数据信息收集起来,利用计算机的分析能力来预测产品质量趋势从而可以做到有针对性地对市场流通产品质量风险布控,这就是最基本的各管理部门使用的风险布控系统的原型框架

3.如何使用数据思维对产品质量趋势进行预测

同样的,在学科管理领域也可以使用数据思维来解决各类问题。比如,地级市的某类进口产品的质量趋势一般是无法直接应用到整个此类进口产品上的,这个质量趋势仅适用于某个地域、某个时间段的情形,这是由于数据丰度的局限。但从数据思维的角度来考虑,可能预测者的数学模型和算法并非有问题,而只是缺乏其他地区产品的数据而已。由于海关总署本身的统计职责,可以通过系统收集进口产品使用前的质量数据。但对于产品其他生命周期中的质量反馈,就需要依靠其他渠道。监管部门可以通过线上反馈、爬虫等手段收集和分析大量的产品使用中、多次返修使用、产品失效等阶段的产品质量数据。首先,这些海量数据会被全部保留在数据库;然后,我们可以根据不同的质量问题类别进行划分;最后,即使采集的数据中存在不同级别的误差,但也可以利用数据库中大量数据的“投票”功能来选择一个误差较小的“质量趋势”1。在当前阶段,计算机理论上是可以基于数据来预测产品质量问题的趋势。

特别需要注意的是,我们在这里强调的是抓住产品质量问题的相关性就能做出预测,并不意味着可以用相关性来推导因果关系,因为相关性和因果性之间并没有必然关系。假设原因A和原因B都是问题C的结果,当问题C出现时,原因A和B都会发生,所以看起来原因A和B是具有相关性的,但是这并不能说明原因A和B具有因果联系。例如,某产品A进口数量越多,则某进口产品B标签不全的问题越多,从数据上看,这两者是相关的,但是从常识来看,两者之间的因果关系结论是极其不符合逻辑的。实际上,产品A进口数量增多是因为国家降低了入境税率,而进口关税降低同样也使得产品B的数量增加而导致标签问题增多。但是,这个质疑是否成立其实取决于我们的应用。如果我们的应用只是做预测,而不是探寻因果关系,那么可能不会有太大的问题:即我们不会为了对外通过发布警示通报、加大查验率同时要求企业提高产品B的质量,而去限制A的进口。我们只是通过观察得到,今年A的进口数量比往年有所增加,那么如果其他因素没有改变的话,那么可以预测出今年B的标签质量会比往年要高。把上述两个问题N次方化,如果用

xi=(i=0,1,2…,n)表示问题i出现的次数,用y来表示等式的值,假设

y=k0*x0+k1*x1+…+kn*xn,(1)

其中,k0,k1,k2…kn是待定系数,需要通过已知等式来确定。当ki=(i=0,1,2…,n)得到之后,对于任意给出的n个数,代入方程(1)即可求出其值。

值得注意的是,人的判断和计算机的唯一的区别在于,人可以得到i并且分析“ki”这种质量趋势产生的原因,但是计算机虽然也能得到i值却无法解释ki这条“趋势线”和外部因素之间的因果关系。

4.提高数据思维场景应用的成功率

人们是根据一些相对少量的数据和参数较少的模式识别来记忆和搜索,而计算机则是通过大规模的数据、储存和计算来处理的。计算机的优势之处在于有更强大的储存和计算能力。所以在某些领域中,计算机能够做得和人类差不多甚至超过人类的前提条件是,使用更加大量的数据和更高维的参数空间(式子1中的ki),来弥补计算机“智商”上的不足。因此,为了更好地利用计算机进行数据分析和预测,有两个特别重要的因素:尽可能使用多的数据,而不是抽样数据,同时使用更高维的参数空间。为什么要尽可能多的使用数据?虽然利用抽样可以通过较少的数据和计算资源去获取更多的信息,但采取随机抽样必然会存在信息损失,尤其是一些小概率事件在抽样的过程中会被遗漏。随着计算机计数的迅猛发展,计算处理能力已经不是制约人们的瓶颈时,就可以使用全量数据,这样不仅可以很好的预测大概率事件,還能精确地预测小概率事件,从整体上提高决策的精准度。

参考文献:

[1]张平文.大数据建模方法[M].北京:高等教育出版社,2019,1:33

猜你喜欢

数据思维
思维总动员(三十)
巧设提问,让思维多走一步
思维总动员(二十五)
思维总动员
公路工程试验检测存在的问题及措施
一种借助数据处理构建的智能食堂管理系统
浅谈计量自动化系统实现预购电管理应用
善问让思维走向深刻