APP下载

宗福季:从加速数字化转型,到建设质量强国(PartII机遇)

2022-12-13

上海质量 2022年9期
关键词:描述性可视化建模

编者按

《从加速数字化转型,到建设质量强国》一文为宗福季教授2022年5月至7月发表于香港科大内地办“教授专栏”上的文章。经作者授权,本刊分三期刊载,本期为该文第二部分。

在质量4.0发展下,工业大数据隐含着众多机遇。我们可以基于数字化转型趋势对许多旧方法进行改良。六西格玛(6 Sigma)是上世纪80年代末进行质量管理的一个常用工具,里面有很多统计方法。虽然它是三四十年前发展出来的工具,但即使在今天仍然非常有效,只是其中有一些方法需要加以更新。

比如,DMAIC方法是六西格玛管理中流程改善的工具,其中有很多步骤可以根据现代技术的发展加以更新。DMAIC方法主要包含五个阶段。

1.定义阶段(Define):在该阶段定义所需要解决的问题。有时候找出、厘清、确认真正的问题,比如何解决更为重要。

2.测量阶段(Measure):在该阶段对数据进行收集。在数据收集阶段,并不是一开始就直接收集数据,而是需要花费大量精力决定收集什么数据。在大数据时代,我们有很多方法获得海量且各式各样的数据,如传感器数据、不同数据库的数据等。但是,我们并不是盲目收集所有可以获得的数据,而是收集那些与目标密切相关的数据。

3.分析阶段(Analyze):通过数据分析方法找到影响产品质量的关键参数。在质量4.0时代,工具可以随着机器学习技术的发展而不断改善升级,比如使用愈发强大的Python和R 软件。我们可以各取所长,从而使建模方法更加多样。

4.改善阶段(Improvement):寻找优化生产的方法,使得流程缺陷降低到最小程度。在质量4.0下,除了对以前的一些工具进行改善之外,流程的智能化是重点。我们的目标并不在于解决某一个问题,而是当再遇到类似问题时可以做到某种程度的智能化,以减少人的反复参与。这也是目前的一个研究方向。

5.控制阶段(Control):使改进后的流程程序化,并通过有效的监测手段(如控制图等),确保流程改进的结果可持续进行。在质量4.0下,可以在该阶段利用许多改进的可视化工具。

采集数据、分析数据并不意味着问题的完全解决,帮助客户完成决策才是最终目的,为了实现数据的实际应用需要拥有提升质量的创新工具。

一为突破式创新,运用创意解决问题,要求具有同理心、以人为本的设计,通过观察、采访等,发现用户深层次的需求,对问题重新进行深入的定义。同时需要通过发散性思维,提出众多解决方案,将一个好的创意点子用具体的原型来呈现,将原型通过情景模拟来测试可用性。

二为渐进式创新,运用统计思维解决问题不是从无到有,而是从好到更好;不是从零开始,而是以数据为基础来创新。根据定义、测量、分析、改善、控制这个流程,以客户为中心,用严谨的数据驱动、系统方法提高绩效并减少对客户而言至关重要的缺陷。

在工业大数据的框架下,依据数据的运用程度可以将工业大数据分析与应用分成9个层次。

· Level 1:不用数据,只依赖经验,比如制衣行业早期;

· Level 2:收集数据,但只研究数据本身;

· Level 3:将收集的数据用图表进行展示;

· Level 4:收集普查数据并进行描述性统计分析;

· Level 5:收集抽样数据并进行描述性统计分析;

· Level 6:收集抽样数据并进行推断性统计分析;

· Level 7:收集实时异构传感器数据并进行描述性统计分析与可视化;

· Level 8:收集实时异构传感器数据并进行推断性统计分析,给出决策建议;

· Level 9:使用工业人工智能的自主过程控制,将数据分析阶段智能化,减少人为参与。

以上九个层次,需要补充说明几点。

首先,并不是按照从差到好的顺序进行排序的。比如日本的一些百年老店,完全不用数据,而是靠自己的手艺打败全世界。当然他们不使用数据也有一些缺陷,比如因为没有数据支撑很难去别的城市开分店。从Level 2到Level 3涉及到数据的可视化,这是一个很大的进步。大家可能觉得单看数据与单看图是一回事,但其实很不一样。人的眼睛通常较难接受数据,而较易接受色彩跟图案。因此,人直接看数字和看一幅图的记忆点是完全不一样的。目前数据的可视化已经形成一门学科。由于人只能看到2D的图表,所以早期的可视化只是画一些简单的图。而大数据时代的数据维度非常高,如何将高维实时数据进行可视化是非常重要的一个课题。

其次,在质量4.0框架下(Level 7~9),可以获得海量实时异构传感器数据。这些工业数据往往是基于传感器的高频率采样获得的,并且形式多样,不仅包括连续型数据,还包含文字、图像、声音等多种类型数据。如何应用实时异构传感器数据进行统计分析、机器学习、建立模型,并最终给出决策建议,是质量4.0绕不开的一个重要议题。

第三,真正的工业大数据分析,必须要做到统计推断和统计预测,要建立模型,要能够预测未来的情况或是进行描述推断,其中的确定性、不确定性,都要进行分析,因此,描述性统计和推断性统计处于不同的层面。

第四,随着大数据时代的到来,采集数据的传感器价格越来越便宜,快速采集数据不成难事,难的是如何使用实时传感器数据并进行描述性的总结、可视化,也就是工业大数据的Level 7。目前,大部分企业还停留在Level 7。Level 8是使用实时传感器数据并建立统计模型,进行推断、预测并用于决策,这是目前大部分人都希望实现的。对数据运用的最终目的是达到Level 9,即使用工业人工智能的自主过程控制。也就是说,在之前的例子中使用数据分析帮助商业决策还不是终点,而如何在下次进行同样决策时、在无人力介入的情况下,自动给出智能决策建议才是我们想要达成的目标。

从以上内容中可以发现,在质量4.0时代,我们面临许多机遇。而工业大数据隐含的机遇具有两面性:一方面,很多工具已经存在并得到了广泛应用,由于在数据不复杂时并不需要使用机器学习以及统计建模这些工具,大家对他们并不是很重视。例如,神经网络虽然很早就被提出,但当时没有适用的数据。因此,单有方法没有数据是没有意义的。另一方面,只有数据没有方法也不行。现在,我们可以收集到大量实时传感器数据,但如果没有方法依然无法分析建模,这些数据仍然不能被完全应用。例如,在前面提到的实例中(见上期“PartⅠ源起”),目前采集到的数据只能做到可视化,并没有发挥数据的全部作用。当前,我们处于数字化转型阶段,数据能够被轻易采集,用于分析预测数据的工具也很多。在DMAIC方法中的测量、分析、改善、控制阶段,我们可以在如下方面将机器学习与统计建模相结合,对质量数据进行分析建模。

测量阶段:利用分布式传感器系统进行实时数据收集,也包括对机器运行和数据进行维护、环境数据等类型数据的收集、异构数据融合与可视化;基于物联网的质量数据整合、分析与监控。

分析阶段:对数据进行描述、诊断与预测;使用机器学习构建过程变量与产品质量之间的关系;强化隐形因素、关联性和因果性的挖掘。

改善阶段:根据分析结果提出过程实时优化方案;过程变量的智能动态调整;自适应检测。

控制阶段:基于大数据流的实时过程监测、跟踪、预警;基于人工智能的异常检测,实现智能决策辅助及反馈闭环。

工业大数据是信息量丰富的资源,同时,分析数据才能指导人们更好地决策。因此,运用数据分析技术统计学习与机器学习很有必要,采集数据并建模,分析哪些特定的预测因子(X)实际影响了回应(Y)、属于正相关还是负相关关系、简单的线性关系还是复杂关系等。如今,大数据发展迅猛,传感器数据到位,系统整合成为可能。系统整合之后才能进行分析,而这些分析又可以借助机器学习。以前做不到数据实时地收集,现在做得到。在数据分析、质量提升、质量控制等方面现在都有提升,以前可能只是停留在学术论文层面,现在技术到位了,以前的学术研究到实践应用时间周期比较长,而现在这个时间变得比较短了,一些学术研究将可以很快在质量4.0中得到应用。

(部分内容已刊登 Tsung,F.,"The Application of Industrial Big Data in Quality Innovation in the Context of Digital Transformation",Journal of Macro-Quality Research,Vol.9,No.3,2021.)

猜你喜欢

描述性可视化建模
基于CiteSpace的足三里穴研究可视化分析
自然资源可视化决策系统
思维可视化
基于FLUENT的下击暴流三维风场建模
虚构人名的内涵意义分析*——描述性理论面临的挑战和反驳
自然资源可视化决策系统
《符号建模论》评介
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
求距求值方程建模
浅析独立主格结构在大学英语四六级段落翻译中的运用