揭开数据真相:确认性偏差(所愿即所见)

人类大脑的功能不仅在于发现各种事件的原因,还在于尽量简化这种原因。在进化过程的作用下,在并不存在模式的地方发现模式比在确实存在模式的地方无法发现模式有利得多。也就是说,发现模式(即使这种模式是错误的)具有生存价值——只要偶然做对一次。

“一旦某人形成一个理论,他的想象力就会让他从每一个对象中看到仅有利于这个理论的蛛丝马迹。”——托马斯·杰弗森(Thomas Jefferson)

人类大脑的功能不仅在于发现各种事件的原因,还在于尽量简化这种原因。在进化过程的作用下,在并不存在模式的地方发现模式比在确实存在模式的地方无法发现模式有利得多。也就是说,发现模式(即使这种模式是错误的)具有生存价值——只要偶然做对一次。

由于具有这种发现模式的能力,我们对世界的认识不断深入,我们拥有许多推进文明进程的伟大发现。可惜,这种探求、发现模式的能力同样引发了大量奇谈怪论。

星座效应

地球的夜空一定让我们的祖先深感敬畏。如果没有现代科学的帮助,那么夜空中那些特别的光球看上去一定像是外星异类,而且着实令人畏惧。作为对这些神秘光球的不确定性的解释,我们的祖先发现了一些星星的模式,并将这些模式与我们熟悉的事物联系起来。这些貌似我们熟悉的物体的星团被称为星座。

2016112001

关于星座的记录可以追溯到6000年前,有的呈硬币状,有的呈陶器状,有的呈人形,诸如此类。所谓占星术,即利用星座来预测人类的行为,这是一种十分有趣的思维陷阱。占星术告诉我们,每一个人的命运与此人的生日所属的星座息息相关。

2016112002

我是射手座,所以我会长命百岁,生机勃勃。

占星术看似愚蠢,而且缺乏科学依据,不过,信仰占星术的人通常既非心存幻想,亦非刻意欺骗。他们只是陷入了人脑探索模式结构所造成的思维陷阱。下面的故事是这种模式探索结构的有趣实例:

预测死亡的猫

猫咪奥斯卡蜷缩在养老院的一张病床上,床上的病人名叫施丹。养老院的看护这时知道——该叫施丹的家人来了,因为奥斯卡是能预测病人死期的神算子。

2016112003

猫或狗出现后就会有病人死亡,见证这一切的人用这些怪事巩固他们的信仰——猫或狗能够预测人的生死。可惜,在大多数病人弥留之际,猫咪奥斯卡并不在他们身边,它正忙着吃东西、睡大觉、做美容,对于这些时刻,施丹所在的养老院的员工也许选择性地忽视了。

2016112004

猫狗知生死——这样的故事常常为人津津乐道,并且至少流传了200多年。动物是不是有某种第六感使得它们能够预测人的死期许多人声称正是如此,然而这从来没有得到过科学的证明。

因此,对于猫咪奥斯卡似乎能够预测病人死期的原因,我们有好几种选择答案。

猫中神算子

2016112005

一种可能的原因是,猫咪确实能够预测某个人死期将至。猫咪奥斯卡可能确实喜欢睡在一动不动的病人的床上,因此为好几个病人送了终。

没意思的普通猫咪

2016112006

我到处串门!

你只记得我串过门后去世的那些病人。

邪恶的猫咪

2016112007

另一种可能的原因是,猫咪对病人的死亡有直接影响。

在这三个选项中,哪一个最有可能对猫咪奥斯卡那看似存在的预测病人生死的神奇能力做出解释当然是第二个选项。人类探求模式的倾向导致我们一下子得出结论——猫咪奥斯卡拥有特异功能。然而实际上恐怕并非如此。

人们对所看到的模式的解释方式有可能带有很大偏差。当人们期待看到某种模式时,就倾向于以某种对这种偏差思维予以确认的方式来解释事件。这时,对所期待的模式予以确认的证据就得到了极大的重视,与此相反的证据则被忽视。

2016112008

由于人们认为猫咪奥斯卡可以预测病人的死期,他们开始注意猫咪在临终病人床前的每一次露面,而当猫咪在未去世病人的床上安坐时,他们就视而不见。

人们经常在不存在模式的地方看出模式,尽管这并不正确,但发现模式的能力却是一种非常重要的、应该掌握的能力。如果食用森林里的红浆果之后爆发了严重疾病,那么不吃红浆果这个结论就具有巨大的生存价值。注意各种模式对个人有帮助,也对社会有帮助。1796年,爱德华·杰内尔(Edward Jenner)注意到,感染过牛痘的人在感染更为致命的天花时症状似乎较轻。经过一些实验,结果表明,杰内尔的假设是正确的。

分母在哪里

让我们回顾一下猫咪奥斯卡的故事并从科学的角度判断这位猫先生是否确实拥有特异功能。为此,我们需要知道,在“猫咪奥斯卡”这样的故事出现在媒体上时,这些信息几乎总是被忽略,这部分信息就是事件次数,也就是分母!让我们再看一个例子,令这部分缺失信息的意义和重要性更加一目了然。假设有一群人看见你盯着一根树枝就把树枝折断了。

2016112009

我牛!!!

只要你不告诉这些人一个事实——你盯着这些树枝看了很久而树枝迟迟不断,那么,这些人肯定会对你表面上的断树功力大感敬畏。

我知道,他看上去威力无比。不过,他并没有告诉我们,他已经盯着那树枝看了18年了,最后来了一阵风,把那树枝吹断了。
我不再惊讶了。
我不知道18年来他一直在盯着那棵树看。
我觉得他没有什么特异功能。

2016112010

在奇妙的统计学讨论中,只提分子、不提分母可以让不真实的事情看上去很真实。这让我们明白了一点:如果只提罕见的结果,不提得出这个结果的时间和尝试次数,是不可能做出判断的。

要是我扔出7个骰子,每个都是6点,你会惊讶吗

2016112011

要是我告诉你,我扔了36782次,你还会惊讶吗

2016112012

我听见电话铃响了起来,我就想,坏消息来了。

果然,是我奶奶打来的,说她得了流感。

我肯定通灵了!

在对这一位“巫师”的通灵能力表示讶异之前,我们需要知道他是不是经常在电话铃响起来的时候就想到坏消息,有可能每一次电话铃响起的时候他都想到有坏事要发生。

媒体报道猫咪奥斯卡的戏剧性故事时未提及此猫遛达到养老院病人床前的总次数。如果我们对此猫为10位病人送了终表示讶异,那么我们就会成为分子型统计的受害人——我们忽视了一个事实,即在老人们去世之前,此猫有可能到过每位老人床前多次。

我们知道分子,那么分母是多少?
10位老人去世!!!

2016112013

在判断猫咪奥斯卡是否是一只“神猫”时,别忘了一个重要的统计值——分母!!!在证明异常事件时,轶闻证据是不足以为证的。当我们先入为主地持有某种观点时,我们往往注意对我们的信仰有巩固作用的现象,同时忽略或贬低相反的现象。由于存在“偏差”,护理人员也许凭借想象看出了存在于猫咪奥斯卡和弥留老人之间的模式,并将这种模式归因于猫的第六感。

确认性偏差威力十足,我们可以以红绿灯为例感受它的作用。请尝试预测绿灯何时亮起。你预测错误的次数将会远远多于预测正确的次数,但是,请注意你在预测正确那一刻的狂喜。

2016112014

和预测正确时的狂喜比较起来,一次次预测错误显得无关紧要。

人们常常进行预测,错了就不予理睬,碰巧对了就大加赞赏。这种贬低错误预测、偏重正确预测的倾向是一种非常重要的生存能力。人类这个物种的历史开始于寻找食物,有能力在环境中发现模式的人相比无此能力的人生存的机会更大。

2016112015

为了生存,人们必须懂得,窸窣作响的灌木丛有可能意味着附近潜伏着一只老虎。灌木丛窸窣作响之后紧跟着出现老虎袭击,这样的事情只要出现一次,“窸窣作响的灌木丛有危险”这个结论就会永远铭刻在人们的脑海里。

以后,即使灌木丛窸窣作响数百次并且无老虎出现,窸窣作响的灌木丛与老虎之间的联系这一重大事件仍然会在人们大脑中占据主要地位,而“窸窣作响的灌木丛报警错误”则几乎不受任何重视。

2016112016

窸窣作响的灌木丛=有老虎
窸窣作响的灌木丛=没有老虎

如果人们惦记一些不重要的事件(窸窣作响的灌木丛没有老虎),就会置身于更多危险之下。长此以往,导致如今人们的大脑常常从不存在模式的地方看出模式。下面再举几个在媒体上广为流传的天方夜谭例子,这些例子的根本原因在于人类大脑的模式探索结构。

画中音乐

2016112017

小说《达·芬奇密码》曾轰动一时,当时许多书籍和历史专家顺势宣称自己知道“真相”。这时,媒体上刊登了一则有趣的事例:一位意大利音乐家有可能发现了隐藏在达·芬奇名画《最后的晚餐》中的一段乐谱。很显然,他是这样发现乐谱的:在画中找出在基督教神学中具有象征意义的一些元素,在这些位置放上音符。

如果乐谱看起来是“强加上去的”,那是因为它正是强加上去的。音乐家可能只是随便选用了使徒们的脚,然后在画中添上一些谱线,就能完成《最后的晚餐》中隐藏的音乐的大发现。该把谱线添在哪儿呢

当然要添在让音乐演奏起来最悦耳的地方。按照这个乐谱一弹,就会传出异常美妙的曲调。

2016112018

备注:这是依据真实画作绘制的一幅草图,图中音符可能无法形成美妙的曲调。

那么,达·芬奇名画《最后的晚餐》中确实隐藏了乐谱的概率有多大呢让我们看看另一幅著名画作,看看是否能为我们理清思路。下面是库利奇(C.M.Coolidge)的九大名画之一——《狗打扑克》的漫画版。

2016112019

这幅画中是否有可能隐藏着一段乐谱?要是我们能在这幅画上添上音符、画上谱线,让它奏出美妙的曲调,那么我们也许可以在任何画作上如法炮制。

按照声称在《最后的晚餐》中找到了隐藏的乐谱的那位意大利音乐家的方法,我们需要找到一些象征性符号,并证明音符正是位于这个位置。狗的眼睛似乎很合适,因为眼睛被认为是“灵魂的窗户”,而音乐有益于灵魂的健康,我们在画中每一只可见的眼睛里放上音符;仔细观察画作会发现,画中有几只装了饮料的玻璃杯,“玻璃杯”这个词的英语有5个字母,“音乐”这个词的英语也有5个字母,因此,很显然,画家意在用玻璃杯象征其他音符!!

2016112020

备注:这是依据真实画作绘制的一幅漫画,图中音符可能无法形成美妙的曲调。

现在,我们想在哪儿添上谱线就在哪儿添上,现在事情很明显,画家在这幅代表性作品中插入了一段隐而不见的乐谱!根据这段乐谱可以演奏出美妙的乐曲。

当然,以上都是蠢话,但它向我们指出一个非常重要的问题——我们因此知道,在人们想找出模式的时候,模式唾手可得。关于确认性偏差,下一个例子将围绕一部著名的书籍、电影和哲学展开。

《秘密》

2016112021

《秘密》一书的主要理念是所谓的“吸引定律”,它指出只要你将注意力集中在你在生活中想要的东西上,宇宙最终将根据你的愿望重新调整。

每天在邮箱里收到账单,烦了吧?哦,你收到账单是因为你总想着账单、担心账单。是这种消极的思维把账单引过来了。

2016112022

按照《秘密》的多位作者的说法,摆脱债务的方法是停止考虑账单。下面是《秘密》中提到的其他一些理财点子:

  • 绝不要提起缺钱。
  • 每天都肯定地告诉自己:你有大把的钱,然后钱就唾手可得。
  • 有钱是一种心态。钱真的呼之则来,挥之则去,就看你怎么想。

健康出现问题《秘密》对此也有解答:

  • 不要和别人谈论疾病。
  • 只把自己视为健康人。
  • 爱个痛快、感受内心的喜悦,疾病必除。

人们可能要问,为什么有数百万人轻易相信《秘密》里的许多点子仔细观察这一现象,答案十分明显,《秘密》走红靠的是确认性偏差和分子型统计。

某事发生次数

某事发生机会(次数)

《秘密》的官网上到处都是神奇的用户写下的各种各样的发财故事。有一份报道写到,某位女子的前雇主欠她5000美元,读过《秘密》后,她给自己开了一张5000美元的支票(给自己开支票并且经常看看,这是书里提到的一个技巧)。给自己开好支票后,她想象自己打开邮箱,发现雇主的支票已经到了。两个月以后,支票真的出现在邮箱里!当然,她把这个开心的结局视为证明宇宙“迫使”她的雇主付款的证据。

在这个事例中,每当这位女子在邮箱里看不到支票时,她就基本上忽略这件事情。当支票终于到了之后,她宣称,这是一个奇迹!在这个例子中,支票在两个月后就到了,然而,即使两年、20年才到,那也没什么!因为《秘密》理念的精华是:时间范围无穷大。

如果给一只猴子一台计算机、一个键盘、无穷多的时间,这只猴子最终将打出整份美国宪法。
“那是一个漆黑的暴风骤雨之夜……”

2016112023

如果一个人希望有人送一份三明治到他的房间,那么这个人可以坐在房间里想象,几天、几月、几年,直到有一天一位朋友送来一份三明治。当这一天终于到来的时候,这个人可以说,是他迫使宇宙把三明治送过来的。

关于那张5000元的神奇支票,还有一点需要记住:毫无疑问,还有数千人也在想象发财,然而一无所获。再说一次,在忽略分母的情况下,我们无法判断某件事情是否堪称神奇。

除了必须考虑所有心想事难成的人,我们还必须记住,也许还有数不清的人并没有按照《秘密》的要求进行思考,然而他们竟心想事成。

在时间范围很宽的情况下,会得出什么结果这里另有一个例子:多次抛硬币,连续出现人头朝上的次数是多少实际上,如果抛硬币101 000 007次,则有望看见好几次连续1 000 000次人头朝上!!

我知道这难以置信,但101 000 007是一个很大的数字——比宇宙中的原子还要多!!实际上,宇宙中的原子据估计为1087,因此101 000 007是一个惊人的数字!!

确认性偏差的负面特性

像猫咪奥斯卡和《秘密》这样的例子有些幽默,反映出人类天生具有的偏差,然而,与此同时,确认性偏差却具有一些非常严重的后果。下面的例子讲述了心理健康专家受害于确认性偏差,从而无法正确判断多位患者心理健康的事例。

美国心理健康研究所估计,每年几乎都有25%的成年人遭遇某种心理失常(精神病),心理健康专家正确地评估、治疗病人势在必行。

在遇到家庭管道问题、汽车机械问题时,我们希望我们请来的修理专家能正确发现问题,然后进行必要的修理;同样,一旦生病,我们相信医生会正确诊断我们的病情并进行治疗。

心理健康专家的工作往往比管道工或医生的工作复杂得多。诊断心理异常比诊断骨折困难得多,因为我们眼里的很多异常症状都取决于我们的生活地点以及该行为的发生时间和发生地点。例如,吃狗、吃猫、吃马在一些文化里是正常的,然而,倘若这些事情发生在美国,就可能说明食客有心理健康问题,需要治疗。

经过训练的心理健康专家应做到:

(1)查看症状。

(2)症状归类。

(3)判断患者是否有精神病。

(4)确定如何治疗患者的精神病。

大卫·罗森汉(David Rosehan)通过一个著名的实验清楚地表明:心理健康专家常常改变判断,使其符合自己期望看到的结果。换句话说,他们是确认性偏差的受害者。罗森汉的实验在12家不同的医院进行,时间各不相同。他请了6位没有任何心理健康问题的实验者。为了获准住院,这些实验者遵照指示向医院工作人员进行住院病情陈述,他们说自己听到了一些声音,这些声音在说“空”、“旷”和“砰”。他们没说任何其他症状。

这些“假病人”获准入院后,所有症状立即消失,行为表现正常。他们告诉医院工作人员,他们身体很好,不再听到任何声音。读者可能以为,工作人员很快会明白患者不再适合在这家医院进行治疗。然而事情并非如此。实际上,让人十分震惊的事情发生了!

患者的住院时间从7天到52天不等。没有任何一位精神病医生或医院工作人员怀疑患者为了住院而伪造了症状。护理报告对他们的描述是友好、合作,但从未指出这些假病人不适合在心理健康医院进行治疗。

这些假病人常常做笔记,他们为此担心引起医院员工的怀疑。然而事情正好相反,坚持记笔记的行为被描述为精神病症状。

这项研究有一个很有意思的地方——精神病院里的许多真病人怀疑这些假病人是记者或骗子。
“我想我可以回家了。”

真病人能看出的正常行为,心理健康工作人员却没能看出,这让人深感不安,这说明心理健康机构的确认性偏差根深蒂固。假病人的行为经常经过“期望”这种“棱镜”的过滤,从而影响心理健康工作人员对假病人的行为、言语的理解。

2016112024

他对自己的严重精神病病情极为否定。

体现这种过滤过程有一个具体的例子:有一位假病人,自述自己小时候和母亲关系亲近,但成年以后显著冷淡了;他还自述自己小时候和父亲关系冷淡,但成年后变得亲密了;这位假病人自述他和妻子关系温馨、亲近,偶有辩论,但几无摩擦。他还自述很少会打孩子屁股。

心理健康专家根据他提供的信息写下了这样的报告:

“该患者为男性,白人,39 岁……从儿童时代开始在亲近关系中长期存在一种矛盾心理。他在青春期时与母亲的亲近关系变得冷淡;与父亲变得非常亲近。情感缺乏稳定性。他试图控制对妻儿的情绪,然而这种尝试常常被爆发的愤怒打断,有时候还会打孩子屁股。虽然他说自己有不少朋友,这些朋友关系却同样给人一种极矛盾的感觉……”

假病人的实际生活经历显然遭到篡改,这是为了符合患精神病的人的生活经历。这项研究表明,一旦被诊断为精神病患者,就很难撕掉这张标签。一切行为——即使是正常的行为——都会通过确认性偏差这个过滤器进行过滤、重新调整,最终与精神病患者的症状相一致。这一点尤其因为以下原因让人震惊:无论正确与否,精神病诊断都会对一个人的情绪、社交和合法生活带来阴影。

这项研究还有一段有趣的后话:得知假病人的事情后,许多医院工作人员表示怀疑——他们的医院就这么容易受愚弄于是罗森汉告诉工作人员,这个实验以后还会再做一次,请工作人员到时候记下他们认为不是真病人的人。结果非常有趣:

有41位病人至少被一位工作人员评定为假病人。

有21位病人被一位或多位精神病医生评定为假病人。

有19位病人被一位精神病医生以及至少一位工作人员认定为假病人。

那么,罗森汉在第二轮实验中送去了几位假病人呢一个也没有!每一位被工作人员判断为假病人的其实都是真正的病人。

这两次研究证明了偏差对判断的影响力。当我们期望看到精神错乱的患者时,患者的每一个行为都会受到这种期望的影响,这就会影响我们对患者的互动和审视。确认性偏差不仅是一种导致人们相信奇谈怪论的可笑现象(例如猫狗知生死、画中藏乐谱),而且是我们大脑结构的一个危险的副产品,会导致偏见和误会。专注于自己一心想看到、期望看到的东西,忽略其余情况,这会让我们面临这样的风险:生活在被期望所蒙蔽的现实中。

辅助沟通

孤独症是一种严重的发育残疾,包括缺乏与人相处的能力。此外,孤独症儿童常常有语言障碍,常常刻板僵持。

澳大利亚在20世纪80年代有过一个有意思的发现——当成年人扶住孤独症儿童的手指在键盘上移动时,他们打出来的内容远远超越人们的设想。这些在人们看来几乎没有或完全没有读写能力的六七岁儿童打出了比他们年纪大的孩子常打的代表性内容。见此情形,几乎每一个人都惊呆了,因为,如此看来,这些孩子不仅没有智力障碍,而且似乎在沟通方面天赋异禀。

2016112025

这实在是孤独症领域极具前景的一大发展。现在看来,这些孩子只是在思维表达上有困难,只要成年人在键盘前帮他们一把,他们就能与人沟通。

美国有几个教育者听说了这项新技术,于是在自己照看的孤独症孩子身上进行尝试。教育者们在键盘上方扶住孩子的手指,接着,澳大利亚孩子的情形再现了——美国孩子似乎能打出让教师们惊讶的内容。先前被认为没有读写能力的孩子不仅打出了完整的句子,而且表达出需要高级推理能力的思维。

这件奇事在美国传扬开来,成千上万的孤独症孩子在家长的帮助下用上了键盘。此外,教育方案也做了大刀阔斧的调整,因为从那些似乎由孩子原创的打字内容中可以清楚地看出孩子们的机能处于更高智力水平。

这项新技术被命名为“辅助沟通法”,并迅速在美国传播开来。可惜,在这一切发生之前,关于通过键盘进行交流的是否的确是孩子本人,这一点并未经过科学实验的验证。此后,事情的发展让实验势在必行——电脑屏幕上出现了指控家长和其他人虐待孩子的信息。

根据键盘上打出的内容,有的孩子的父亲入狱,有的孩子被带离家长。随着虐待指控进入司法系统,法庭要求通过科学方法确定到底是谁在进行沟通。

这个事例令人扼腕痛惜的原因是,很容易就可以对辅助沟通法进行科学检验——无非是让孩子和成年人看不同的图片,然后比对键盘上打出的内容。

科学实验完成后,结果令人惊讶——无论让孩子和家长看多少次图片,键盘上敲出的图片名称总是家长看到的那一份。这些结果清楚地表明:沟通内容的作者是家长,而非儿童。

比科学实验结果更令人震惊的是,许多使用辅助沟通法的人的反应——他们无视科学证据,继续相信孩子才是通过辅助打字真正进行沟通的人。

这些坚定地相信辅助沟通法的人的反应正是确认性偏差的作用力的佐证。他们迅速、轻易地忽略了数学和科学的论证。不管孤独症孩子在打字过程中是不是常常看向窗外,不管盯着键盘的是不是家长,他们都坚持自己的观点,仿佛孩子通过辅助打字进行沟通是天经地义的,而一切有违于此的证据必须在符合这个信念的范围内进行解释。

甚至还有这样一个事例,一位讲西班牙语的辅助人员为一位不讲西班牙语的孤独症儿童提供辅助。让孩子的老师们惊讶的是,电脑屏幕上出现的沟通内容是西班牙语。显而易见,电脑上的沟通内容一定出自这位讲西班牙语的成年辅助人员,然而这不仅没有得到承认,反而导致了这样的判断:这位孤独症儿童拥有离奇的语言学习能力——坐在一位说西班牙语的人旁边就会了。这就是确认性偏差!!!!

教育者们真该懂得先通过科学方法检验辅助沟通法,然后才开始使用。至少,法庭要求提供科学证据,随后释放了遭受不实指控的人。

“一旦人类接受了一个观点,在理解事物时就会搜集对这个观点予以确认的事例,相反事例有可能数量更多、力度更大,然而这些事例或者不被注意,或者遭到排斥,人类如此这般的目的在于保持这个观点不被撼动。”——哲学家弗兰西斯·培根(1620年)

本文节选自《揭开数据真相:从小白到数据分析达人》(掌握阅读数据的技术,挖出“看不见”的数据真相,还原基本事实!)

%e6%8f%ad%e5%bc%80%e6%95%b0%e6%8d%ae%e7%9c%9f%e7%9b%b8%ef%bc%9a%e4%bb%8e%e5%b0%8f%e7%99%bd%e5%88%b0%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90%e8%be%be%e4%ba%ba

编辑推荐

《揭开数据真相:从小白到数据分析达人》收录了生活中常见的统计图表、各类数据,并告诉我们如何“阅读”这些数据,从中发现被掩盖或忽视的数据真相,了解真正的现实。

掌握书中的这些技巧,相信你会炼成一双火眼金睛,一眼看穿数据背后内涵,做出真实的判断。

内容提要

统计数据之所以强大有力,原因在于它对我们的希望、梦想和信仰无动于衷——数据让我们客观地看待事物。不过,当人们不喜欢数据告诉我们的结果时,常常对其进行操纵……因此懂得解释统计数据,了解各种歪曲、滥用数据的技术对于理解数据真相是非常必要的。

《揭开数据真相:从小白到数据分析达人》教给读者神圣的技术,让读者学会如何质疑“看得见”的数据,并挖出“看不见”的数据真相,还原基本的事实。

《揭开数据真相:从小白到数据分析达人》适合所有对数据分析感兴趣的读者。

媒体评论

大数据和数据分析是近年来炙手可热的概念,通过数据驱动产品开发(产品经理也需要数据来验证产品设计的逻辑),通过数据来做市场营销(增长黑客),通过数据AB测试改进用户体验(有一家专门做AB 测试优化的公司Optimizely,每年也会召开Opticon大会),通过数据来提高内部效率改进流程(比如广告产品,点击率转化),已经在硅谷有很多广泛实践,并达成共识。

但数据会不会欺骗我们,造成偏见?个人认为数据本身是客观的,但每个人看待问题的角度和目的不同,可能人为地造成错觉甚至幻觉。在学校从事研究工作的时候,导师就强调怎么选取样本和数据,如果为了达到某些“好”结果,精心挑选数据,甚至篡改数据,这就违背了科研精神,一旦发现,轻者论文贡献取消,重者可能永久赶出科研圈。所以如何辨别真理和谬误,利用好科学工具去更好的认知,这就是新的挑战。可能读者会抱怨,没有经过系统科学训练,在茫茫数据和文献中如何分析和判断,是不是要再去读一个数学课程呢?这其实也没有必要,对大多常人来说那些数学公式是浪费时间,主要还是见识一些常见套路,遇到类似的能举一反三,升华出来一些方法论就更棒了。

这本书就从很多实例中总结了数据分析的技巧和“骗人”招数。比如通过内在不完备的样本,精心挑选的平均数,统计图表范围的切割,相关系数因果关系的误解,混淆逻辑,操控是非,达到一些不可告人的目的。这并不是一本教科书,让你去学习深奥枯燥的统计数学,而是用风趣幽默的例子从别的视角来观察世界,启迪智慧。

——董飞,硅谷数据工程师(微信公众号:董老师在硅谷)

世上有三种谎言:小谎,大谎,和统计数字(本杰明·迪斯雷利)

数据让人着迷,真相与规律深藏其中,混沌中蕴含秩序;统计让人迷惑,看似精巧实则冰山一角,图表里一目了然的“事实”背后是作者有意无意掩盖或忽略的惊天“秘密”,堪称一场精巧玲珑的“局”。是数字在说谎?是幕后诡计?还是读者想错?让我们跟随本书精彩浅显的案例,看一幕幕心机大戏是如何上演,又如何“穿帮”的,擦亮双眼,做大数据时代的数字流言终结者。

——新浪微博@爱可可-爱生活

互联网时代带来了数据的爆发,如何分析数据对现代社会的生活和工作变得愈发的重要。数据分析是一门复杂的学科,同时又跟生活密切相关。如何解读公司、机构发布的数据?如何看待朋友圈爆款文章里罗列的数据?如何看待各种体育赛事相关的各种数据?看过这本书之后,或许你会有一个全新的认识。

——邹昕,Facebook数据科学家(微信公众号:再生谈)

本文由 电子工业出版社 投稿至 数据分析网 并经编辑发表,内容观点不代表本站立场,如转载请联系原作者,本文链接:https://www.afenxi.com/38311.html 。

(0)
上一篇 2016-11-18 18:09
下一篇 2016-11-21 06:18

相关文章

关注我们
关注我们
分享本页
返回顶部