《暗数据》(英国科学院院士、统计学家汉德教授洞见之作 风险往往来源于未知,15种暗数据,看清信息世界的真相)戴维 · 汉德【文字版_PDF电子书_下载】
内容简介:
在大数据时代,我们常常以为自己拥有做出正确决策所需的所有信息。但事实上,我们拥有的信息从来都不完整,可能只是冰山一角。正如宇宙大部分是由暗物质组成的,尽管我们看不见,但它们仍然存在。在信息世界,如果我们忽视暗数据,则可能面临各种风险。
汉德教授以一个引人入胜、充满启迪和智慧的统计学视角总结了15种暗数据类型,并逐一阐释它们的发生机制和可能带来的风险。书中引用大量翔实的案例,这些案例来源于社会生活的方方面面,富含鲜活细节,包括人口普查、火箭发射、总统选举、飓风灾难、地方治安、历史考古、分数膨胀、学术造假、金融诈骗、财务管理等专业领域里的各种案例。汉德教授不仅揭示了深深埋藏在数据背后世界本来的样貌,还提醒要我们警惕未知事物带来的风险,并阐述了如何利用暗数据并从中获益,从而做出理智的决策。
暗数据无处不在。在我们知道的、不知道的每一处角落,暗数据如同一道发自暗处的光,终将照亮人类认知的盲区。
本书将带领我们开启一段奇妙而富有启蒙性的旅程,进入我们看不到的数据世界。
作者简介:
戴维·汉德(David Hand),伦敦帝国学院数学荣誉教授、资深研究员,英国皇家统计学会前主席,英国科学院院士。汉德教授学术成就非凡,曾出版著作7部。
目 录:
前 言 / V
第一部分 暗数据:原因与结果
第1 章 暗数据:塑造世界的无形力量 / 003
幽灵数据 / 003
你真的拥有全部数据吗? / 012
被忽略的“无事发生” / 016
暗数据的力量 / 020
就在我们身边 / 022
第2 章 探索暗数据:收集到的与没收集到的 / 026
来自各方的暗数据 / 026
数据废气、选择和自我选择 / 028
以小见大 / 039
实验数据 / 051
注意人性的弱点 / 060
第3 章 定义与暗数据:你想知道什么? / 064
定义差异与错误测量 / 064
你不能测量所有事物 / 071
筛查 / 080
基于过往表现的选择 / 083
第4 章 非故意的暗数据:说一套,做一套 / 087
大视界 / 087
汇总 / 091
人为差错 / 092
仪器限制 / 097
连接数据集 / 099
第5 章 方略性暗数据:博弈、反馈和信息不对称 / 102
博弈 / 102
反馈 / 109
信息不对称 / 115
逆向选择和算法 / 116
第6 章 故意的暗数据:欺诈与欺骗 / 126
欺诈 / 125
身份盗用与网络诈骗 / 129
个人财务诈骗 / 133
金融市场欺诈与内幕交易 / 136
保险诈骗 / 141
其他欺诈形式 / 145
第7 章 科学与暗数据:科学发现的本质 / 149
科学的本质 / 149
早知道就好了 / 154
暗数据碰出新世界 / 162
暗数据打开大视野 / 164
隐瞒事实 / 177
撤回 / 192
出处和可信度:谁告诉你的? / 194
第二部分 阐明和使用暗数据
第8 章 处理暗数据:让光照进来 / 201
希望 / 201
在已观测数据与缺失的数据之间建立关联 / 202
识别数据缺失机制 / 211
利用已有数据开展工作 / 212
超越数据:如果你先死怎么办? / 218
超越数据:插补 / 221
迭代 / 227
错误数据 / 230
第9 章 从暗数据中获益:重构问题 / 236
隐藏数据 / 236
对自己隐藏数据:随机对照试验 / 237
可能发生的事 / 239
复制的数据 / 243
想象的数据:贝叶斯先验性 / 249
隐私与机密保护 / 251
从暗处收集数据 / 259
第10 章 暗数据分类:走出迷宫之路 / 263
暗数据分类法 / 263
启示 / 270
译者后记 发自暗处的光 / 279
参考文献 / 285