《拆穿数据胡扯》(薛兆丰力推,三位诺奖得主高赞_培养批判性思维,拒绝被数据忽悠_6大实用工具,教你有效分析海量数据和观点,做算法时代游刃有余的明白人)卡尔·伯格斯特龙 & 杰文·韦斯特【文字版_PDF电子书_下载】
书名:拆穿数据胡扯 作者:[美]卡尔·伯格斯特龙/[美]杰文·韦斯特 出版社:中信出版社 译者:胡小锐 出版日期:2022-3 页数:400 ISBN:9787521738797 |
8.3 豆瓣评分 |
前往下载 |
当当正版 |
知乎搜索 |
点击喜欢 |
全网资源 |
内容简介:
“用数据说话”是互联网时代的通用思维方式,有人说数据不会骗人,真的是这样吗?
X 让人看不懂的数据分析和神奇算法
X 莫名奇妙的数学方程
X 强行联系因果的统计学论文
X 某些新闻报道或PPT中花里胡哨的图表
……
我们都曾经或正在被这些东西蒙蔽,却往往毫无察觉,甚至乐在其中!
一些貌似可靠的数据来源,也可能藏着一本正经的胡说八道。比如TED演讲中的统计数字、《纽约时报》等媒体报道的大数据分析新算法、甚至是医学期刊中的诊断数据……虚假信息都有可能鱼目混珠,而你能分辨其中哪些是真正有用的信息,哪些只是胡扯吗?
对此,华盛顿大学专门开发了一门尚未开课即爆满的公开课,而这本书正是源自这门引发热议的课程。
两位作者花了多年时间研究打着数学和统计学幌子的胡扯,犀利幽默地对它们分门别类一一剖析,帮助我们培养批判性思维,有效分析海量数据和观点,拆穿无用数据的精致伪装,在信息时代做个游刃有余的明白人。
话说回来,除了教会你如何识别数据胡扯,当你迫不得已需要胡扯时,它也会成为一本实操性强的工具书呢!
作者简介:
美国华盛顿大学生物学系教授。他研究流行病如何在人群中传播,以及信息如何大规模地在生物和社会系统中流动——从细胞内对基因表达的控制到社交媒体上错误信息的传播。他广为人知的是跨界整合自然科学和社会科学思想的能力,特别是在信息研究领域造诣很深。他发表了多篇前瞻性的文章,涉及信息科学、计算机科学、控制论、进化生物学、信息论、科学哲学、物理学等方面,其中有很多发表在《自然》《科学》《美国国家科学院院刊》上。 美国华盛顿大学信息学院副教授、公众知情中心主任。
目 录:
推荐序1 科学地对抗科学的胡扯的“胡扯” / V
推荐序2 拨开扯淡的迷雾 / IX
推荐序3 闲得没事也别胡扯 / XIII
前 言 / XVII
第1 章 胡扯无处不在
惯于欺骗的甲壳类动物和狡猾的乌鸦 / 003
狡辩之词和律师的语言 / 008
谎言传千里,真相难出门 / 012
第2 章 媒体、信息和错误信息
印刷厂就是妓院 / 022
不加渲染的事实宛若凤毛麟角 / 025
偏见性、个人化和对立 / 029
错误信息和虚假信息 / 033
新型造假者 / 037
第3 章 胡扯的本质
胡扯与黑箱 / 048
刑事机器学习 / 051
第4 章 因果关系
夜晚天空红艳艳,水手脸上笑容现 / 060
关于因果关系的思考 / 064
相关性不会增加报纸销量 / 068
延迟享乐与共同原因 / 076
伪相关性 / 078
吸烟不会导致死亡? / 083
如果其他方法都行不通,那就人为操控吧 / 084
第5 章 数字与胡扯
提取数字 / 095
有害的百分比 / 098
古德哈特定律 / 106
数学滥用 / 110
僵尸统计数据 / 115
第6 章 选择偏倚
你看到什么取决于你看的是哪儿 / 126
隐藏在墨菲定律背后的原因 / 129
帅哥和程序员 / 137
音乐才华的致命危险 / 143
消除选择偏倚 / 148
第7 章 数据可视化
数据可视化的发端 / 158
鸭子! / 162
水晶鞋和丑陋的继姐 / 166
邪恶的轴 / 177
比例油墨原理 / 192
第8 章 大数据与胡扯
机器是怎么看到东西的 / 213
废料进,废品出 / 219
同性恋雷达和胡扯的结论 / 221
机器是怎么思考的 / 226
机器为什么失败 / 230
第9 章 科学的易感性
检察官谬误 / 242
p 值操纵和发表偏倚 / 251
点击诱饵科学 / 260
胡扯科学的市场 / 265
科学为什么有用 / 271
第10 章 辨别胡扯
1. 质疑信息来源 / 278
2. 小心不公平的比较 / 281
3.如果好得或糟糕得不像是真的…… / 284
4. 从数量级考虑 / 287
5. 避免证真偏差 / 292
6. 考虑多个假设 / 295
辨别网上的胡扯 / 296
第11 章 驳斥胡扯
使用归谬法 / 306
要让人难以忘记 / 308
寻找反例 / 311
使用类比 / 312
重新绘制图表 / 314
使用零模型 / 316
揭穿者心理 / 319
致 谢 / 329
注 释 / 333
参考文献 / 349