制造自动化

特征工业4.0与智能制造的意见
数据是什么?

在断章取义、牢记特定意图的情况下,可以利用数据的隐含可信度和“真实性”得出预期结论


照片:Michail_Petrov-96/Getty Images

数据是会说谎,还是总是会揭示真相?这是一个有趣的问题,在世界历史上一个非常有趣的时期。

本专栏的读者可能会回忆起我经常分享的观点,即“语境很重要”,叙述是收集和考虑经验数据的重要因素。这一点从未像现在这样重要,因为收集、分析和分享了关于新冠病毒19的所有数据。

数据本身可能是经验性的和无偏见的,但对其进行的收集和分析却不是。

为此,我们必须理解确认偏差——一种我们在某种程度上都存在的人类状况。

广告

人们倾向于过滤掉他们不同意的信息,并坚持他们所做的,不断强化他们已经相信的东西。一旦一种观点或偏见被确立,就很难让外界的影响改变它。

过滤过程通常应用于数据分析,方法是只选择数据的特定子集,并调整分析以得出所需的结论。断章取义,并牢记特定意图,可以利用数据的隐含可信度和“真实性”得出预期结论。

关于意图,人们分析数据时带有固有的确认偏差。即使是“科学方法”也始于一个假设——人们假设他们怀疑的东西是正确的,然后设计一系列测试来证明或反驳这个假设。总的来说,科学家在他们的方法上是非常严格的,并且对任何一种可能性都保持开放的态度,真正受到新发现的纯粹意图的驱使。

一旦一种观点或偏见形成,外界的影响就很难改变它。

对于任何试图在任何话题上影响群众意见的人来说,情况并非如此——社会、政治,或者现在最显著的是新冠病毒-19。每天都有源源不断的头条新闻披露新的“事实”和基于数据的隐含真相,但数据很少在完整准确的背景下呈现——因为它不再需要;新闻头条和因素已经形成了根深蒂固的确认偏见。

例如,安大略省9月中旬的消息是“病例数量(约)增加了50%”,因此正在采取新的更严格的措施。没有人会争论,也没有人会问关于数据的明显问题,比如“检测的数量是否也增加了?”,或者“现在检测的针对性是否比之前的时期好得多,现在你知道在哪里最有可能发现新冠病毒了吗?”。

仅仅说病例数量在增加,而不考虑所进行的测试数量的增加,或者现在如何更准确地确定目标测试,这不是一个科学或基于数据的结论。没有上下文或明确的中立意图,它只是使用选定的数据集确认现有的偏见。

有些人可能认为,要进行真正的无偏见的实证分析,需要消除人类的影响,也许可以通过使用人工智能(AI)和机器学习(ML)技术来实现。然而,这里的问题是,这些技术已经被广泛应用于社会,原因恰恰相反——通过先学习,然后找到影响方式来影响我们的行为。

社交媒体为人工智能系统提供信息,这些系统可以了解你的行为、观点和预测你的倾向,然后向你发送一系列稳定的小信息,旨在影响你的下一次购买决策或下一次投票。在互联网和社交媒体出现之前,这些事情通过报纸、电视新闻和广播电台广泛发生。

我们对订阅的报纸、收看或收听的新闻频道的选择,助长了我们的确认偏见。保护社会的法规和监督已经到位。

社交媒体作为我们生活中的I/O设备,人工智能和ML技术的力量作为处理引擎,经验数据的收集、分析和报告可以以更强大的力量和影响力,以及科学中立的观念进行设计——更少的监督、问责或对社会的保护。

数据在很多方面都很有用,数据驱动的决策也很有价值。但背景和意图是关键。

在制造企业中,采购团队使用数据作为经验证据,证明他们降低了模具成本。然而,工程部使用数据表明,新工具的失效间隔时间显著降低。质量部门使用数据证明废品率已经上升,保修成本将在较长时间内上升。

他们都使用数据,但大多数情况下,采购部门获胜是因为其数据和指标最容易理解,导致了需要克服的强烈确认偏见。

短期影响比长期成本更重。购买之所以获得批准,是因为他们实现了近期目标,而影响只会在明年某个时候或四年后的财务报表中间接显现。

数据在很多方面都很有用,数据驱动的决策也很有价值。但背景和意图是关键。

其他的声音要想影响公司最终做出正确的决定,需要经历一个漫长而艰难的过程,给公司造成的损失要比他们通过短期决策所节省的成本高得多。

COVID也是如此。无论是左翼还是右翼,政客们的支持率都达到了有史以来的最高水平,而且6点新闻已经很久没有这么多每天固定收看的观众了。对于持反对意见的人来说,这是一场艰苦的战斗。

数据不会说谎,但这并不意味着数据总是在说真话。为此,我们必须愿意深入挖掘,理解背景,并在必要时检查意图。

技术可以为我们提供越来越多的数据,越来越强大的分析工具,但没有捷径或选择退出。真正理解数据告诉我们什么仍然取决于我们自己。

_____

保罗·霍根多恩(Paul Hogendorn)与人共同创立了FreePoint Technologies,目的是让制造商受益于信息技术,从而为其最关键的资产——员工——提供信息、授权和激励。

这篇文章的精简版发表在2020年10月属于生产自动化。