大数据可以解决一切问题?

大数据可以解决一切问题?

大数据的意义体现在哪里?

有一句非常流行的管理名言:“除上帝外,任何人都必须用数据说话。”通常认为,这句名言出自质量管理大师爱德华兹·戴明(W Edwards Deming)。这是一个充满“后真相政治”、“虚假新闻”和“失控的社交媒体狂潮”的时代,因此坚持实事求是,就是为打造理性社会贡献力量。道听途说和谣言并不是数据;复杂、难断的决定应以证据为基础,而不仅仅依靠你的偏见或是异想天开。

在某种意义上,关于数据唯一有争议的地方就是,“数据”这个词应该被当作单数名词,还是复数名词(本节可能会稍微模糊这一区别)。我们真正需要的是事实真相,而且刻不容缓。

当然,在管理领域,没有什么会一直如此简单。那些不可避免的管理潮流中也掺杂着许多看似没有争议的数据(见陷阱37),这就是“大数据陷阱”应运而生的原因,也为本节内容提供了依据。

大数据的意义

计算机可以解决一切问题

托马斯·沃森(Thomas Watson Snr)是IBM的前任总裁,他曾说过(据说是在1943年):“我认为全世界只需要差不多五台计算机。”因这一论断,人们总爱拿他开玩笑。他可能低估了民众对大型数据机器的需求,或者夸大了这些机器潜在的数据处理能力。但这句预言(虚构却可能说明真相)提醒人们,一些关于IT行业的预测,即使是出自业内核心人士的预测,也并不一定能够成为现实。

所以,数据也是如此,更确切地说,大数据更是如此——“大”表示它深受时尚主义的影响。当然,大数据也有可取之处:它处理问题的能力不断提高,使人们有可能建立大量数据集成;回归分析(确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法)可以发现人类肉眼看不到的模式和联系;“大”可以给人留下印象深刻,还有人说,数量本身就是质量。

如果你遇到任何问题都去数据里找答案,那你得出的结论可能五花八门,这句话有一定的道理。如果人们过于依赖大数据集成,而不加以判断,那么事情就可能出错。

玛格丽特·霍夫曼表示:“我参加过无数的董事会,每次会议上,董事们都会认真分析各种数据。我认为没有人明白这些数据的含义,但他们必须自圆其说,他们因此具有了一种奇妙的能力。我们现在可以生成如此多的数据,但大多数情况下我们对此一片茫然。”

大数据的意义

误差幅度

有些人过度崇拜大数据,但过去几年的政局动荡,却证实了有时看似可靠的数据可能会让你失望。据投票意向数据,2015年英国大选中,保守党“不可能”赢得多数席位,但结果截然相反。一年后,一些信誉度较高的研究公司宣称,在英国的脱欧公投中,留欧阵营明显领先,一些公司表示它们领先10个百分点,但最终,脱欧阵营以4个百分点的优势胜出。然后在2016年11月,最引人注目的是被誉为“战无不胜”的希拉里·克林顿的落选,这几乎与所有专家的意见(由高成本的数据支撑)相反。没错,她将赢得多数选票的预测被证明是正确的。但大数据集未能表明,在重要的地方,唐纳德·特朗普做得更好。同样,在英国2017年大选中,多数民调专家的预测也严重错误。

民意调查旨在发现人们投票意图,但它并不科学。投票是一个高度个人化的问题,很难揭示民众真正的投票意图,也很难找到不愿透露投票方式、难以联系到的人。当然,人们在接受调查后可能会改变主意。选举学家长期以来一直都认同民意调查中的数据存在“误差幅度”,在使用了范围足够大的选民样本前提下,每一项调查结果可能有正负三个百分点的误差。

民意调查可以被用来证明大数据不一定总是完全可靠,这种做法很合理。实际上,做调查的公司基本上都是市场研究公司,他们的大部分收入都来自消费者和产品研究(政治民意调查盈利不多,因为民意调查公司的营销模式往往不佳)。因此,管理者不应该过于依赖、信任市场调查数据。你凭什么确信顾客把自己的真实想法告诉了你?在亨利·福特生产出大众买得起的汽车、索尼公司生产出立体声磁带之前,人们根本没想过自己会需要这些产品。


大数据的意义

大数据和直觉

人类学家约翰·卡兰(John Curran)常说:“虽然大数据很重要,人的直觉也很重要。”他代表自己的客户去跟其顾客沟通,采用一种他称之为“深度交流”的方式,研究顾客的行为,并向他们提问。这种方式不会产生大数据,但是它能让我们了解真正有价值的信息,也就是那些我们之前不了解,并且不可能通过大数据调查得知的信息。

如果我们利用的是没有价值的信息,最终也得不出有价值的结论。研究大数据得出的结论应该经受查证。算法也是有漏洞的。一个算法会按照程序员的指示工作,然而程序员有他们自己的偏见,也会犯错。如果不结合人的判断,数据本身没有多大意义。有一句流传很久的话,人们通常认为这句话出自爱因斯坦,然而实际上很可能出自社会学家威廉·布鲁斯·卡梅伦(William Bruce Cameron):“并非所有可以量化的东西都有价值,也并非所有有价值的东西都能量化。”

1965年,诺曼·杰威森(Norman Jewison)的电影《辛辛那提少年》(The Cincinnati Kid)中,爱德华·罗宾逊(Edward Robinson)和史蒂夫·麦奎因(Steve McQueen)饰演的主角凭借他们的判断力和冒险精神,胜过了其他所有牌手。当时有一位牌手很擅长分析概率等数据,最终输了钱,愤愤不平地离开赌场,同时震惊于两位主角孤注一掷的冒险行为。但是两位主角清楚地知道自己在做什么,他们知道大数据有其局限性,也知道何时应该相信并坚持自己的判断。

知道这些以后,对于我们日益依赖大数据这件事你有没有新的思考?我们应该牢记哪些原则?其一,如果善加利用非量化研究方法,它至少能揭示和大数据一样多的事实。但是,最重要的是,我们必须借助经验、才智、想象力以及直觉,把数据和自己的思考判断结合起来。

分享扩散:

改版

反馈