1. 数据分析网首页
  2. 大数据
  3. 统计学

25年后的统计系会是什么样?

摘要:本文是统计学家Leo Breiman1994年在加州伯克利统计系毕业典礼上的讲话。

Leo Breiman简介:加州伯克利统计系教授,美国国家科学院院士,20世纪伟大的统计学家,囊括多项统计领域大奖。机器学习先驱者,分类回归树作者之一,Bagging方法发明者,对模式识别领域有巨大贡献。于2005年逝世。

5年后的统计系会是什么样?"

很久以前,Peter Bickel 请我做一个毕业典礼致辞。Peter 是聪明的。他知道,如果你提前很久请人在似乎很遥远的将来发言,他们可能会答应。我答应了。但随着时间的到来,现实紧凑起来。朋友说,“讲一些很长的笑话”。除了我不擅长讲笑话的事实外,讲笑话似乎也不恰当。相反,我决定谈谈我们共同的东西 – 这个我们都是其中一部分的,古怪和有趣的领域。

试想一下你已经离开这里,与这里隔绝25年了。也许你已经在撒哈拉中部的石油勘探公司,或在巴塔哥尼亚做调查,或在一个广阔的狩猎保留地中计算珍稀鸟类。

但现在你决定去度假和访问伯克利,并看望在统计系的老教授和朋友。当然,你预期的一些变化。你的老教授将是更老,年轻的也已经变秃的。还有什么呢

好,这里是一个水晶球,这是我所看到的。

如果我问在其他领域,比如物理,数学,或工程的毕业生,25年后事情会如何,答案是简单 — 一切照旧。毕竟,阿基米德2000年前就做演算,工程和物理,那么25年算什么呢 。但统计是在迅速变化的领域 – 在未来25年会发生什么是一个很难了解的,部分原因是因为统计是一个奇怪的领域。如果你想想看,你很可能对自己说:“我在什么样的一个奇怪领域”。真是很令人奇怪的。正是这种奇怪感,这种错觉,将成为它的走向及促使其变化的力量的一个重要组成部分。因此,让我谈一谈,为什么我觉得很奇怪…

有一个很大群体的人都叫自己统计人员。数以千计工作在政府和工业界的所有缝隙中。他们设计并监督调查,工业试验,质量控制,数据分析,和无数其他实际工作。

统计的用途遍布于我们的社会。它在社会科学和卫生等领域被广泛应用和误用 。统计表明 A和B之间有关联或X导致Y。从几个星期前我开始在一个简单的统计项目中收集 “纽约时报” 中涉及统计的文章, 现在我的书桌上已经排满了。

每天总是有至少两三篇文章 — 另一个胆固醇的研究,一个对犯罪的民意调查,在核电厂工作的人有较高的癌症发病率的研究,等等。令人惊讶的是,我们周围世界的多少取决于使用统计。

但你可曾尝试这个实验 – 问一个非技术的朋友,“医生做什么,或工程师,化学家或物理学家”。答案通常是合理的。接着问,“那么你认为统计学家做”奇怪的答案就出来了。也许,最常见的答案是统计学家是类似于精算师。他们坐在发霉的旧办公室,并收集大的表格中公布的数字。

更奇怪的是,即使在报纸上涉及统计的文章远远多于其他比如物理或化学的,但一般人却很少了解我们如何做什么。当然,我们也可能很少知道大多数统计人员做什么。

由于其性质不明确,人们通过各种不同的经历变成统计人员。谁进入统计界谁成为统计学家当然了,所有你们,但有趣的问题是 – 你是怎么到这里的我的印象是,大多数统计人员是偶然的过客。

例如,像我的情况,我厌倦了做概率论,退出了大学,并试图以做顾问来为生。原来,结果是在概率论领域没有很多顾问的职位,但在统计中有更多的,我逐渐转换,而且最后还是非常有趣。

虽然我以前从来没有承认过,但是事情的真相是在我的生命我从来没有学过一门统计课程。我的朋友和同事, 刚刚做完了三年斯坦福大学统计系的主任的Jerry Friedman, 也没有。他是一个实验物理学家,他开始做统计时是在分析斯坦福线性加速器的高能粒子碰撞的轨道。John Tukey是纯数学家,George Box是化学家。其他许多杰出的统计学家都是不知何故漂流到船上的。

其他等领域有专门的旅客。有时可以听到这样的说法:自从我14岁那年,我想成为一名数学家,或者一个物理学家或医生。我从来没有听说过的人说,“自从我14岁那年,我想成为统计学家。”

另一个奇怪的事实是,再没有其他领域的理论和实践是如此的分离。例如,在这个过去十年出版的文章中有可能是上千篇关于一维密度估计的渐近分析。这就像是“物理评论”杂志每月发表10篇左右像关于牛顿两体问题的文章 。很大一部分的统计理论和统计实际工作人员处理的问题存在于世界的不同维度。

问题的根源在于统计领域正在经历本质性的身份变革。通常统计系是作为数学系的一个组成部分开始的。因为实用的原因,在二战后有天赋年轻数学家被安排来做统计工作。他们在短期内把上统计建立在了坚定的基础上,提出了决策理论,并开始了统计定理和证明。

当统计从数学系分离出来时,他们移去了统计是纯数学的概念和悄悄加入了使用数据的主张 。现在统计在一个迁移的状态,它没有找到自己的轨道,但强大的力量正在推动着它。

钱是一个很大的力量。钱对我们学科的影响有两方面 。首先是国家科学基金会已经开始说,他们将投入大量的基金到应用统计方面 。希望得到资金的教员将不得不离开纯数学领域。其次是大学已经填满了而不能提供更多的工作。我们的毕业生将会更多的在像政府和工业界对有关定理和证明的漠不关心的地方找到工作。

但同样强大的推动力量是统计人员在有趣的应用问题中找到的真正的乐趣。利用隐马尔可夫模型找出一些关于DNA测序是非常有趣味的,或者参与设立一个大型的艾滋病实验,或在做图像重建。

实际问题变得更大也更有趣。庞大而复杂的问题,如语音识别,写汉字识别,机器人控制,数据和困难。这可能是我们的问题。提出方法来用机器人传感器的传来的信息来识别障碍或抓住物体是一个统计问题。从一个麦克风收集的电流来识别单词和句子也是使用数据的问题。目前大多在这些领域的工作的是计算机科学家,工程师和物理学家,但统计人员也开始蚕食周围的边缘。

要知道我们要去的地方,我们必须决定什么是我们真正擅长的。在统计的核心是什么我们是一流的数学家吗很难说是。然后呢我们最多是搞清楚如何收集信息,分析信息,并得出结论的魔术师。这是我们所擅长的。我觉得这是我们我们的身份危机得到解决时所在的位置。

这是否意味着将不会有任何理论或数学呢计算机科学系是我们的一个很好的模式。他们也往往开始作为一个数学系的组成部分,然后分开。他们是不同的部门。他们有芯片和网络设计工程师。他们也有专门的理论家 – 考虑在NP完整性和概率分析算法的最新发展。但理论家和芯片设计师生活在同一个世界。

嗯,现在你来看看, 25年后步行到伯克利的校园,看到发生了什么事。第一件事,从欧几里得校门进来你会意识到埃文斯大楼不再存在。你停下来问一个年轻的学生:“埃文斯大楼发生了什么事”。他想了一会儿说:“这是我记得的, 他们在2000年初一些学生骚乱,他们认为埃文斯大楼有碍观瞻而要求拆除,当局妥协。”

5年后的统计系会是什么样?"

那么统计系呢统计系吗我不知道任何统计系,但尝试那边的建筑。你进入一个外面覆盖着紫色的瓷砖和门上方看到写着“信息科学”的可爱小建筑 。当你在内闲逛,事情似乎有点熟悉 – 是不是Nolan教授刚经过吗即使通过25年后少数的面孔似乎还很熟悉的,但是他们做的事情却很不同。

当你从房间到另一个房间漫步和每个打开的门外倾听(对,门都是敞开,很开放和舒适的大厅),一个房间里的人正在寻找固定在墙壁上的语音的傅立叶转换和讨论的英文句子的语法结构。在另一个房间里,三个医学博士和两个年青的统计学家在讨论历时超过了10年的脑癌治疗研究的细节。另外,一些天文学家和Stark教授争论数据为宇宙大爆炸起源的提供多么强烈的证据。哎呦,埃文斯教授和两个计算机科学家正在追赶在大厅里巡航的一个小机器人。

所以,这是我唯一有幸和你一起看到的。打电话给我,让我知道在25年后到底如何。确定享受其中你所得到乐趣。愿原力与你同在。

来源:施涛博客

原文链接:http://blog.cos.name/taoshi/2012/02/18/leo-breiman-speech-in-chinese/

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

分享本页
返回顶部