《错觉:AI如何通过数据挖掘误导我们》(美)【加里·史密斯 著 钟欣奕 译】【文字版_PDF电子书_下载】
内容简介:
在人工智能异常火热的今天,很多人认为我们生活在一个不可思议的历史时期,人工智能和大数据可能比工业革命更能改变人的一生。然而这种说法未免言过其实,我们的生活确实可能有所改变,但并非是朝好的方面发展。我们过于武断地认为计算机搜索和处理堆积如山的数据时不会出差错,但计算机只是擅长收集、储存和搜索数据,它们没有常识或智慧,不知道数字和词语的意思,无法评估数据库中内容的相关性和有效性,它们没有区分真数据、假数据和坏数据所需的人类判断力,没有分辨有理有据和虚假伪造的统计学模型所需的人类智能。
计算机挖掘大数据风行一时,但数据挖掘是人为而非智能,也是非常艰巨、危险的人工智能形式。数据挖掘先是通过大量的数据走势、相关关系来发现让我们内心愉悦却无实践价值的模型,然后创造理论来解释这些模型。作者通过“史密斯测试”和“得州神枪手谬误”等实例说明,如果你挖掘和拷问数据的时间够长、数量够大,你总能得到自己想要的结果,然而这是相关关系却并不是因果关系,只是自我选择偏好,并没有理论基础也没有实用价值。
在人工智能时代,我们对计算机的热爱不应该掩盖我们对其局限性的思考,真正的危险不是计算机比我们更聪明,而是我们认为计算机具有人类的智慧和常识,数据挖掘就是“知识发现”,从而信任计算机为我们做出重要决定。更多的计算能力和更多的数据并不意味着更多的智能,我们需要对人类的智慧有更多的信心。
作者简介:
加里·史密斯是波莫纳学院的经济学教授。他在耶鲁大学获得经济学博士学位。他曾两次获得教学奖,并撰写(或与他人合著)80多篇学术论文和12本书。他的研究曾被彭博广播网、CNBC、Brian Lehrer、福布斯、纽约时报、华尔街日报、《新闻周刊》和《商业周刊》等媒体报道。
目 录:
引 言 / 007
第 1 章 智能还是服从
井字游戏 / 008
国际跳棋 / 011
第 2 章 盲 从
思考之源和思维之火 / 024
计算机是超人吗? / 031
将时间考虑在内 / 036
识别像素与产生情绪 / 037
批判性思维 / 039
图灵测试 / 041
第 3 章 无语境的符号
翻译软件与理解语言 / 052
威诺格拉德模式挑战赛 / 057
计算机能阅读吗? / 058
计算机能写作吗? / 061
在语境中理解事物 / 066
猫与花瓶 / 071
第 4 章 坏数据
自我选择偏好 / 077
相关系数并非因果关系 / 084
时间的力量 / 087
幸存者偏差 / 088
假数据 / 090
识别“坏数据” / 092
第 5 章 随机性模式
数据挖掘 / 102
黑匣子 / 107
大数据、大电脑、大麻烦 / 109
利益冲突 / 111
天生就会被骗 / 113
为模型所惑 / 114
第 6 章 如果你拷问数据的时间足够长
孟德尔的豌豆研究 / 128
得州神枪手谬误 / 130
数据挖掘者 / 132
拷问数据 / 135
倒摄回忆 / 137
金钱启动效应 / 139
寻找就会发现 / 143
微笑曲线 / 149
从卓越降为优秀 / 154
攻击性和吸引力 / 157
达特茅斯三文鱼研究 / 159
骗子,骗子 / 161
第 7 章 无所不包的“厨房水槽法”
预测总统大选 / 168
非线性模型 / 180
第 8 章 新瓶装旧酒
逐步回归法 / 187
岭回归法 / 189
数据规约 / 193
神经网络算法 / 196
被数学蒙蔽双眼 / 199
第 9 章 先吃两片阿司匹林
明早再给我打电话 / 204
我要再喝一杯咖啡 / 207
远程治疗 / 208
癌症群 / 211
最有理有据的疗法失效了 / 214
疾病诊断和治疗中的数据挖掘 / 217
糟糠过多,精粹不足 / 220
第 10 章 完胜股市(上)
噪 声 / 224
滑稽的理论 / 226
技术分析 / 230
抛硬币 / 235
《每周华尔街》的十项技术指标 / 237
推特,推特 / 242
技术大师 / 243
为乐趣和盈利投资的黑匣子 / 247
第 11 章 完胜股市(下)
股市与天气 / 252
预留方案 / 259
真正的数据挖掘 / 264
趋同交易 / 265
高频交易 / 276
底 线 / 281
第 12 章 我们都在监视着你
妊娠预测指标 / 289
谷歌流感 / 291
机器人测试仪 / 293
就业申请 / 295
招聘广告 / 298
贷款申请 / 300
汽车保险 / 303
社会信用评分 / 305
黑匣子式歧视 / 306
不合理的搜查 / 307
看看你的手环 / 310
你需要整容吗? / 312
摆弄系统 / 316
共同毁灭原则 / 319
结 语 / 323
参考文献 / 329