App 下载
注册
登录
|
搜索
正在搜索中...
首页
我的书架
我的主页
我的收藏
我的书评
《深入浅出数据分析》以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、
……
[ 展开全部 ]
主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。 本书构思跌宕起伏,行文妙趣横生,无论读者是职场老手,还是业界新人;无论是字斟句酌,还是信手翻阅,都能跟着文字在职场中走上几回,体味数据分析领域的乐趣与挑战。
[ 收起 ]
作者:迈克尔•米尔顿 (Michael Milton)
出版社:电子工业出版社
定价:88.00元
ISBN:712118477X
给个评价
做个书摘
书摘 (21 )
评价 (1 )
查看所有书摘
按目录显示书摘
只显示目录
总目录
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
序言 I
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
1 数据分析引言:分解数据 1
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
2 实验:检验你的理论 37
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
3 最优化:寻找最大值 75
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
4 数据图形化:图形让你更精明 111
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
5 假设检验:假设并非如此 139
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
6 贝叶斯统计:穿越第一关 169
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
7 主观概率:信念数字化 191
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
8 启发法:凭人类的天性作分析 225
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
9 直方图:数字的形状 251
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
10 回归:预测 279
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
11 误差:合理误差 315
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
12 相关数据库:你能关联吗? 359
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
13 整理数据:井然有序 385
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
附录A 尾声:正文未及的十大要诀 417
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
附录B 安装R:启动R! 427
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
附录C 安装Excel分析工具:ToolPak 431
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
细分目录及各章引子
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
序言
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
大脑对待数据分析的态度。一边是你努力想学会一些知识,一边是你
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
的大脑忙着开小差。你的大脑在想:“最好把位置留给更重要的事,
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
像该离哪些野生动物远点啊,像光着身子滑雪是不是个坏点子啊。”
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
既然如此,你该如何引诱你的大脑意识到,懂得数据分析是你安身立
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
命的根本?
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
谁适合阅读本书? II
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
我们了解你在想什么 III
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
元认知 V
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
征服大脑 VII
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
自述 VIII
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
技术顾问组 X
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
致谢 XI
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
1.分解数据数据分析引言
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Acme化妆品公司需要你出力 2
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
首席执行官希望数据分析师帮他提高销量 3
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
数据分析就是仔细推敲证据 4
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
确定问题 5
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
客户将帮助你确定问题 6
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Acme公司首席执行官给了你一些反馈 8
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
把问题和数据分解为更小的组块 9
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
现在再来看看了解到的情况 10
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
评估组块 13
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
分析从你介入的那一刻开始 14
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
提出建议 15
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
报告写好了 16
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
首席执行官欣赏你的工作 17
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
一则新闻 18
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
首席执行官确信的观点让你误入歧途 20
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你对外界的假设和你确信的观点就是你的心智模型 21
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
统计模型取决于心智模型 22
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
心智模型应当包括你不了解的因素 25
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
首席执行官承认自己有所不知 26
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Acme给你发来了一长串原始数据 28
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
深入挖掘数据 31
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
泛美批发公司确认了你的印象 32
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
回顾你的工作 35
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你的分析让客户作出了英明的决策 36
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
2.实验
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
检验你的理论
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你能向别人揭示自己坚信的信念吗?正在进行实证检验?做个好实验吧,再
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
没有什么办法能像一个好实验那样,既能解决问题又能揭示事物的真正运行
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
规律。一个好实验往往能让你摆脱对观察数据的无限依赖,能帮助你理清因
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
果联系;可靠的实证数据将让你的分析判断更有说服力。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
咖啡业的寒冬到了! 38
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
星巴仕董事会将在三个月内召开 39
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
星巴仕调查表 41
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
务必使用比较法 42
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
比较是破解观察数据的法宝 43
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
价值感是导致销售收入下滑的原因吗? 44
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
一位典型客户的想法 46
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
观察分析法充满混杂因素 47
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
店址可能对分析结果有哪些影响 48
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
拆分数据块,管理混杂因素 50
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
情况比预料的更糟! 53
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你需要做一个实验,指出哪种策略最有效 54
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
星巴仕首席执行官已经急不可待 55
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
星巴仕降价了 56
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
一个月后…… 57
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
以控制组为基准 58
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
避免解雇123 61
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
让我们重新做一次实验 62
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
一个月后… 63
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
实验照样会毁于混杂因素 64
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
精心选择分组,避免混杂因素 65
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
随机选择相似组 67
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
随机访谈 68
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
准备就绪,开始实验 71
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
结果在此 72
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
星巴仕找到了与经验吻合的销售策略 73
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
3.寻找最大值最优化
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
有些东西人人都想多多益善。为此我们上下求索。要是能用数字表示我
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
们不断追求的东西——利润、钱、效率、速度等,实现更高目标的机会
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
就在眼前。有一种数据分析工具能够帮助我们调整决策变量,找出解决
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
方案和优化点,使我们最大限度地达到目标。本章将使用这样一种工具,
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
并通过强大的电子表格软件包Solver来实现这个工具。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
现在是浴盆玩具游戏时间 76
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你能控制的变量受到约束条件的限制 79
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
决策变量是你能控制的因素 79
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你碰到了一个最优化问题 80
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
借助目标函数发现目标 81
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你的目标函数 82
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
列出有其他约束条件的产品组合 83
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
在同一张图形里绘制多种约束条件 84
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
合理的选择都出现在可行区域里 85
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
新约束条件改变了可行区域 87
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
用电子表格实现最优化 90
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Solver一气呵成解决最优化问题 94
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
利润跌穿地板 97
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你的模型只是描述了你规定的情况 98
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
按照分析目标校正假设 99
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
提防负相关变量 103
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
新方案立竿见影 108
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你的假设立足于不断变化的实际情况 109
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
4.数据图形化
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
图形让你更精明
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
数据表远非你所需。你的数据庞杂晦涩,各种变量让你目不暇接,应付堆积
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
如山的电子表格不只令人厌倦不堪,而且确实浪费时间。相反,与仅仅使用
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
电子表格不同,一幅用纸不多、栩栩如生的清晰图像,却能让你摆脱“一叶
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
障目,不见泰山”的烦恼。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
新军队需要优化网站 112
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
结果面世,信息设计师出局 113
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
前一位信息设计师提交的三份信息图 114
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
这些图形隐含哪些数据? 115
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
体现数据! 116
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
这是前一位设计师主动提供的意见 117
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
数据太多绝不会成为你的问题 118
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
让数据变美观也不是你要解决的问题 119
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
数据图形化的根本在于正确比较 120
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你的图形已经比打入冷宫的图形更有用 123
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用散点图探索原因 124
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
最优秀的图形都是多元图形 125
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
同时展示多张图形,体现更多变量 126
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
图形很棒,但网站掌门人仍不满意 130
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
优秀的图形设计有助于思考的原因 131
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
实验设计师出声了 132
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
实验设计师们有自己的假设 135
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
客户欣赏你的工作 136
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
订单从四面八方滚滚而来! 137
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
5.假设并非如此假设检验
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
世事纷纭,真假难辨。人们需要用庞杂多变的数据预测未来,然而免不了
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
剪不断,理还乱。正因如此,分析师不会简单听信浮于表面的解释,也不
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
会想当然地认可这些解释的真实性:通过数据分析的仔细推理,分析师能
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
够异常细致地评估大量备选答案,然后将手头的一切信息整合到各种模
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
型中。接下来要学的证伪法即是一种切实有效的非直觉方法。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
给我来块“皮肤”…… 140
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
我们何时开始生产新手机皮肤? 141
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
PodPhone不希望别人看透他们的下一步行动 142
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
我们得知的全部信息 143
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
电肤的分析与数据相符吗? 144
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
电肤得到了机密《战略备忘录》 145
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
变量之间可以正相关,也可以负相关 146
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
现实世界中的各种原因呈网络关系,而非线性关系 149
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
假设几个PodPhone备选方案 150
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
用手头的资料进行假设检验 151
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
假设检验的核心是证伪 152
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
借助诊断性找出否定性最小的假设 160
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
无法一一剔除所有假设,但可以判定哪个假设最强 163
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你刚刚收到一条图片短信…… 164
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
即将上市! 167
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
6.贝叶斯统计
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
穿越第一关
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
数据收集工作永不停息。必须确保每一个分析过程都充分利用所搜集到的与
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
问题有关的数据。虽说你已学会了证伪法,处理异质数据源不在话下,可要
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
是碰到直接概率问题该怎么办?这就要讲到一个极其方便的分析工具,叫做
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
贝叶斯规则,这个规则能帮助你利用基础概率和波动数据做到明察秋毫。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
医生带来恼人的消息 170
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
让我们逐条细读正确性分析 173
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
蜥蜴流感到底有多普遍? 174
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你计算的是假阳性 175
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
这些术语说的都是条件概率 176
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你需要算算 177
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
1%的人患蜥蜴流感 178
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你患蜥蜴流感的几率仍然非常低 181
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
用简单的整数思考复杂的概率 182
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
搜集到新数据后,用贝叶斯规则处理基础概率 182
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
贝叶斯规则可以反复使用 183
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
第二次试验结果:阴性 184
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
新试验的正确性统计值有变化 185
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
新信息会改变你的基础概率 186
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
放心多了! 189
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
7. 信念数字化
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
主观概率
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
虚拟数据未尝不可。真的。不过,这些数字必须描述你的心智状态,表
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
明你的信念。主观概率就是这样一种将严谨融入直觉的简便办法,具体
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
做法马上介绍。随着讲解的进行,你将学会如何利用标准偏差评估数据
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
分布,前面学过的一个更强大的分析工具也会再次登台亮相。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
背水投资公司需要你效力 192
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
分析师们相互叫阵 193
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
主观概率体现专家信念 198
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
主观概率可能表明:根本不存在真正的分歧 199
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
分析师们答复的主观概率 201
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
首席执行官不明白你在忙些什么 202
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
首席执行官欣赏你的工作 207
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
标准偏差量度分析点与平均值的偏差 208
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
这条新闻让你措手不及 213
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
贝叶斯规则是修正主观概率的好办法 217
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
首席执行官完全知道该怎么处理这条新信息了 223
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
俄罗斯股民欢欣鼓舞! 224
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
8.启发法
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
凭人类的天性做分析
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
现实世界的风云变幻让分析师难以料事如神。总有一些数据可望不可及,即
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使有所能及,最优化方法也往往艰深耗时。所幸,生活中的大部分实际思维
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
活动并非以最理性的方式展开,而是利用既不齐全也不确定的信息,凭经验
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
进行处理,迅速做出决策。奇就奇在这些经验确实能够奏效,因此也是进行
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
数据分析的重要而必要的工具。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
邋遢集向市议会提交了报告 226
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
邋遢集确实把镇上打扫得干干净净 227
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
邋遢集已经计量了自己的工作效果 228
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
他们的任务是减少散乱垃圾量 229
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
计量垃圾量不可行 230
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
问题刁钻,回答简单 231
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
数据邦市的散乱垃圾结构复杂 232
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
无法建立和运用统一的散乱垃圾计量模型 233
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
启发法是从直觉走向最优化的桥梁 236
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用快省树 239
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
是否有更简单的方法评估邋遢集的成就? 240
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
固定模式都具有启发性 244
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
分析完毕,准备提交 246
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
看来你的分析打动了市议会的议员们 249
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
9. 数字的形状直方图
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
直方图能说明什么?数据的图形表示方法不计其数,直方图是其中出类
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
拔萃的一种。直方图与柱状图有些相似,能迅速而有效地汇总数据。接
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
下来你将用这种小巧而实用的图形量度数据的分布、差异、集中趋势等。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
无论数据集多么庞大,只要画一张直方图,就能“看出”数据中的奥妙。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
让我们在本章中用一个新颖、免费、无所不能的软件工具绘制直方图。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
员工年度考评即将到来 252
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
伸手要钱形式多样 254
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
这是历年加薪记录 255
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
直方图体现每组数据的发生频数 262
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
直方图不同区间之间的缺口即数据点之间的缺口 263
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
安装并运行R 264
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
将数据加载到R程序 265
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
R创建了美观的直方图 266
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
用数据的子集绘制直方图 271
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
加薪谈判有回报 276
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
谈判要求加薪对你意味着什么? 277
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
10.回归
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
预测
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
洞悉一切,未卜先知。回归分析法力无边,只要使用得法,就能帮助你预测
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
某些结果值。若与控制实验同时使用,回归分析还能预测未来。商家狂热地
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
运用回归分析帮助自己建立模型,预测客户行为。本章即将让你看到,明智
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
地使用回归分析,确实能够带来巨大效益。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你打算怎么花这些钱? 280
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
以获取大幅度加薪为目的进行分析 283
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
稍等片刻……加薪计算器! 284
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
这个算法的玄机在于预测加薪幅度 286
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
用散点图比较两种变量 292
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
直线能为客户指明目标 294
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
使用平均值图形预测每个区间内的数值 297
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
回归线预测出人们的实际加薪幅度 298
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
回归线对于具有线性相关特点的数据很有用 300
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你需要用一个等式进行精确预测 304
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
让R创建一个回归对象 306
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
回归方程与散点图密切相关 309
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
加薪计算器的算法正是回归方程 310
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你的加薪计算器没有照计划行事…… 313
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
11. 合理误差误差
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
世界错综复杂。预测有失精准并不稀奇。不过,如果在进行预测的时候
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
指出误差范围,你和你的客户就不仅能知道平均预测值,还能知道该误
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
差造成的典型偏差,指出误差可以让预测和信念更全面。通过本章讲授
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
的工具,你还会懂得如何控制误差及如何尽量降低误差,从而提高预测
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
可信度。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
客户大为恼火 316
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你的加薪预测算法做了什么? 317
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
客户组成 318
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
要求加薪25%的家伙不在模型范围内 321
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
如何对待想对数据范围以外的情况进行预测的客户 322
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
由于使用外插法而惨遭解雇的家伙冷静下来了 327
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你只解决了部分问题 328
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
扭曲的加薪结果数据看起来是什么样子? 329
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
机会误差=实际结果与模型预测结果之间的偏差 330
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
误差对你和客户都有好处 334
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
机会误差访谈 335
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
定量地指定误差 336
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
用均方根误差定量表示残差分布 337
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
R模型知道存在均方根误差 338
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
R的线性模型汇总展示了均方根误差 340
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
分割的根本目的是管理误差 346
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
优秀的回归分析兼具解释功能和预测功能 350
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
相比原来的模型,分区模型能更好地处理误差 352
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你的客户纷纷回头 357
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
12.你能关联吗? 关系数据库
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
如何组织变化多端的多变量数据?一张电子数据表只有两维数据:行和
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
列。如果你的数据包括许多方面,则表格格式很快就会过时。在本章,
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你会看出电子表格很难管理多变量数据,还能看到关系数据库管理系统
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
让多变量数据的存储和检索变得极其简单。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
《数据邦新闻》希望分析销量 360
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
这是他们保存的运营跟踪数据 361
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你需要知道数据表之间的相互关系 362
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
数据库就是一系列相互有特定关系的数据 365
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
找到一条贯穿各种关系的路线,以便进行必要的比较 366
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
创建一份穿过这条路径的电子表格 366
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
通过汇总将文章数目和销量关联起来 371
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
看来你的散点图确实画得很好 374
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
复制并粘贴所有这些数据是件痛苦的事 375
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
用关系数据库管理关系 376
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
《数据邦新闻》利用你的关系图建立了一个RDBMS 377
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
《数据邦新闻》用SQL提取数据 379
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
RDBMS数据可以进行无穷无尽的比较 382
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你上了封面 383
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
13.井然有序整理数据
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
乱糟糟的数据毫无用处。许多数据搜集者需要花大量时间整理数据。不
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
整齐的数据无法进行分割、无法套用公式,甚至无法阅读,被人们视而
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
不见也是常事,对不对?其实,你可以做得更好。只要眼前清楚地浮现
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
出希望看到的数据外观,再用上一些文本处理工具,就能抽丝剥茧地整
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
理数据,化腐朽为神奇。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
刚从停业的竞争对手那儿搞到一份客户名单 386
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
数据分析不可告人的秘密 387
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Head First猎头公司想为自己的销售团队搞到这份名单 388
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
清理混乱数据的根本在于准备 392
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
一旦组织好数据,就能修复数据 393
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
将#号作为分隔符 394
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Excel通过分隔符将数据分成多个列 395
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
用SUBSTITUTE替换“^”字符 399
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
所有的“姓”都整理好了 400
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
用SUBSTITUTE替换名字模式太麻烦了 402
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
用嵌套文本公式处理复杂的模式 403
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
R能用正则表达式处理复杂的数据模式 404
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
用sub指令整理“名” 406
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
现在可以向客户交货了 407
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
可能尚未大功告成…… 408
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
为数据排序,让重复数值集中出现 409
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
这些数据有可能来源于某个关系数据库 412
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
删除重复名字 413
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你创建了美观、整洁、具有唯一性的记录 414
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Head First猎头公司正在一网打尽各种人才! 415
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
再见…… 416
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
附录A 尾声
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
正文未及的十大要诀
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
你已颇有收获。但数据分析这门技术不断变迁,学之不尽。由于本书篇幅有
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
限,尚有一些密切相关的知识未予介绍,我们将在本附录中浏览十大知识点。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
其一:统计知识大全 418
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
其二:Excel技巧 419
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
其三:耶鲁大学教授Edward Tufte(爱德华•塔夫特)的图形原则 420
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
其四:数据透视表 421
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
其五:R社区 422
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
其六:非线性与多元回归 423
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
其七:原假设-备择假设检验 424
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
其八:随机性 424
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
其九:Google Docs 425
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
其十:你的专业技能 426
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
启动R! 附录B 安装R
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
强大的数据分析功能靠的是复杂的内部机制。好在只需几分钟就能安装
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
和启动R,本附录将介绍如何不费吹灰之力安装R。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
附录C 安装Excel分析工具
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
ToolPak
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
Excel有一些最好的功能在默认情况下并不安装。为了执行第3章的优化和第
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
9章的直方图,需要激活Solver和Analysis ToolPak,Excel在默认情况下安
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
装了这两种扩展插件,但若非用户主动操作,这些插件不会被激活。
还没有人在此章节添加过书摘,赶紧来抢第一吧!
在此章节添加书摘
导购链接
×
做书摘
文字书摘
读图识字
至少还需要输入
10
字
保存原图片为书摘
上传图片
识别
最多输入
500
个字
上传图片
重新上传
写点笔记吧
至少还需要输入
10
字
章节(选填)
总目录
序言 I
1 数据分析引言:分解数据 1
2 实验:检验你的理论 37
3 最优化:寻找最大值 75
4 数据图形化:图形让你更精明 111
5 假设检验:假设并非如此 139
6 贝叶斯统计:穿越第一关 169
7 主观概率:信念数字化 191
8 启发法:凭人类的天性作分析 225
9 直方图:数字的形状 251
10 回归:预测 279
11 误差:合理误差 315
12 相关数据库:你能关联吗? 359
13 整理数据:井然有序 385
附录A 尾声:正文未及的十大要诀 417
附录B 安装R:启动R! 427
附录C 安装Excel分析工具:ToolPak 431
细分目录及各章引子
序言
大脑对待数据分析的态度。一边是你努力想学会一些知识,一边是你
的大脑忙着开小差。你的大脑在想:“最好把位置留给更重要的事,
像该离哪些野生动物远点啊,像光着身子滑雪是不是个坏点子啊。”
既然如此,你该如何引诱你的大脑意识到,懂得数据分析是你安身立
命的根本?
谁适合阅读本书? II
我们了解你在想什么 III
元认知 V
征服大脑 VII
自述 VIII
技术顾问组 X
致谢 XI
1.分解数据数据分析引言
Acme化妆品公司需要你出力 2
首席执行官希望数据分析师帮他提高销量 3
数据分析就是仔细推敲证据 4
确定问题 5
客户将帮助你确定问题 6
Acme公司首席执行官给了你一些反馈 8
把问题和数据分解为更小的组块 9
现在再来看看了解到的情况 10
评估组块 13
分析从你介入的那一刻开始 14
提出建议 15
报告写好了 16
首席执行官欣赏你的工作 17
一则新闻 18
首席执行官确信的观点让你误入歧途 20
你对外界的假设和你确信的观点就是你的心智模型 21
统计模型取决于心智模型 22
心智模型应当包括你不了解的因素 25
首席执行官承认自己有所不知 26
Acme给你发来了一长串原始数据 28
深入挖掘数据 31
泛美批发公司确认了你的印象 32
回顾你的工作 35
你的分析让客户作出了英明的决策 36
2.实验
检验你的理论
你能向别人揭示自己坚信的信念吗?正在进行实证检验?做个好实验吧,再
没有什么办法能像一个好实验那样,既能解决问题又能揭示事物的真正运行
规律。一个好实验往往能让你摆脱对观察数据的无限依赖,能帮助你理清因
果联系;可靠的实证数据将让你的分析判断更有说服力。
咖啡业的寒冬到了! 38
星巴仕董事会将在三个月内召开 39
星巴仕调查表 41
务必使用比较法 42
比较是破解观察数据的法宝 43
价值感是导致销售收入下滑的原因吗? 44
一位典型客户的想法 46
观察分析法充满混杂因素 47
店址可能对分析结果有哪些影响 48
拆分数据块,管理混杂因素 50
情况比预料的更糟! 53
你需要做一个实验,指出哪种策略最有效 54
星巴仕首席执行官已经急不可待 55
星巴仕降价了 56
一个月后…… 57
以控制组为基准 58
避免解雇123 61
让我们重新做一次实验 62
一个月后… 63
实验照样会毁于混杂因素 64
精心选择分组,避免混杂因素 65
随机选择相似组 67
随机访谈 68
准备就绪,开始实验 71
结果在此 72
星巴仕找到了与经验吻合的销售策略 73
3.寻找最大值最优化
有些东西人人都想多多益善。为此我们上下求索。要是能用数字表示我
们不断追求的东西——利润、钱、效率、速度等,实现更高目标的机会
就在眼前。有一种数据分析工具能够帮助我们调整决策变量,找出解决
方案和优化点,使我们最大限度地达到目标。本章将使用这样一种工具,
并通过强大的电子表格软件包Solver来实现这个工具。
现在是浴盆玩具游戏时间 76
你能控制的变量受到约束条件的限制 79
决策变量是你能控制的因素 79
你碰到了一个最优化问题 80
借助目标函数发现目标 81
你的目标函数 82
列出有其他约束条件的产品组合 83
在同一张图形里绘制多种约束条件 84
合理的选择都出现在可行区域里 85
新约束条件改变了可行区域 87
用电子表格实现最优化 90
Solver一气呵成解决最优化问题 94
利润跌穿地板 97
你的模型只是描述了你规定的情况 98
按照分析目标校正假设 99
提防负相关变量 103
新方案立竿见影 108
你的假设立足于不断变化的实际情况 109
4.数据图形化
图形让你更精明
数据表远非你所需。你的数据庞杂晦涩,各种变量让你目不暇接,应付堆积
如山的电子表格不只令人厌倦不堪,而且确实浪费时间。相反,与仅仅使用
电子表格不同,一幅用纸不多、栩栩如生的清晰图像,却能让你摆脱“一叶
障目,不见泰山”的烦恼。
新军队需要优化网站 112
结果面世,信息设计师出局 113
前一位信息设计师提交的三份信息图 114
这些图形隐含哪些数据? 115
体现数据! 116
这是前一位设计师主动提供的意见 117
数据太多绝不会成为你的问题 118
让数据变美观也不是你要解决的问题 119
数据图形化的根本在于正确比较 120
你的图形已经比打入冷宫的图形更有用 123
使用散点图探索原因 124
最优秀的图形都是多元图形 125
同时展示多张图形,体现更多变量 126
图形很棒,但网站掌门人仍不满意 130
优秀的图形设计有助于思考的原因 131
实验设计师出声了 132
实验设计师们有自己的假设 135
客户欣赏你的工作 136
订单从四面八方滚滚而来! 137
5.假设并非如此假设检验
世事纷纭,真假难辨。人们需要用庞杂多变的数据预测未来,然而免不了
剪不断,理还乱。正因如此,分析师不会简单听信浮于表面的解释,也不
会想当然地认可这些解释的真实性:通过数据分析的仔细推理,分析师能
够异常细致地评估大量备选答案,然后将手头的一切信息整合到各种模
型中。接下来要学的证伪法即是一种切实有效的非直觉方法。
给我来块“皮肤”…… 140
我们何时开始生产新手机皮肤? 141
PodPhone不希望别人看透他们的下一步行动 142
我们得知的全部信息 143
电肤的分析与数据相符吗? 144
电肤得到了机密《战略备忘录》 145
变量之间可以正相关,也可以负相关 146
现实世界中的各种原因呈网络关系,而非线性关系 149
假设几个PodPhone备选方案 150
用手头的资料进行假设检验 151
假设检验的核心是证伪 152
借助诊断性找出否定性最小的假设 160
无法一一剔除所有假设,但可以判定哪个假设最强 163
你刚刚收到一条图片短信…… 164
即将上市! 167
6.贝叶斯统计
穿越第一关
数据收集工作永不停息。必须确保每一个分析过程都充分利用所搜集到的与
问题有关的数据。虽说你已学会了证伪法,处理异质数据源不在话下,可要
是碰到直接概率问题该怎么办?这就要讲到一个极其方便的分析工具,叫做
贝叶斯规则,这个规则能帮助你利用基础概率和波动数据做到明察秋毫。
医生带来恼人的消息 170
让我们逐条细读正确性分析 173
蜥蜴流感到底有多普遍? 174
你计算的是假阳性 175
这些术语说的都是条件概率 176
你需要算算 177
1%的人患蜥蜴流感 178
你患蜥蜴流感的几率仍然非常低 181
用简单的整数思考复杂的概率 182
搜集到新数据后,用贝叶斯规则处理基础概率 182
贝叶斯规则可以反复使用 183
第二次试验结果:阴性 184
新试验的正确性统计值有变化 185
新信息会改变你的基础概率 186
放心多了! 189
7. 信念数字化
主观概率
虚拟数据未尝不可。真的。不过,这些数字必须描述你的心智状态,表
明你的信念。主观概率就是这样一种将严谨融入直觉的简便办法,具体
做法马上介绍。随着讲解的进行,你将学会如何利用标准偏差评估数据
分布,前面学过的一个更强大的分析工具也会再次登台亮相。
背水投资公司需要你效力 192
分析师们相互叫阵 193
主观概率体现专家信念 198
主观概率可能表明:根本不存在真正的分歧 199
分析师们答复的主观概率 201
首席执行官不明白你在忙些什么 202
首席执行官欣赏你的工作 207
标准偏差量度分析点与平均值的偏差 208
这条新闻让你措手不及 213
贝叶斯规则是修正主观概率的好办法 217
首席执行官完全知道该怎么处理这条新信息了 223
俄罗斯股民欢欣鼓舞! 224
8.启发法
凭人类的天性做分析
现实世界的风云变幻让分析师难以料事如神。总有一些数据可望不可及,即
使有所能及,最优化方法也往往艰深耗时。所幸,生活中的大部分实际思维
活动并非以最理性的方式展开,而是利用既不齐全也不确定的信息,凭经验
进行处理,迅速做出决策。奇就奇在这些经验确实能够奏效,因此也是进行
数据分析的重要而必要的工具。
邋遢集向市议会提交了报告 226
邋遢集确实把镇上打扫得干干净净 227
邋遢集已经计量了自己的工作效果 228
他们的任务是减少散乱垃圾量 229
计量垃圾量不可行 230
问题刁钻,回答简单 231
数据邦市的散乱垃圾结构复杂 232
无法建立和运用统一的散乱垃圾计量模型 233
启发法是从直觉走向最优化的桥梁 236
使用快省树 239
是否有更简单的方法评估邋遢集的成就? 240
固定模式都具有启发性 244
分析完毕,准备提交 246
看来你的分析打动了市议会的议员们 249
9. 数字的形状直方图
直方图能说明什么?数据的图形表示方法不计其数,直方图是其中出类
拔萃的一种。直方图与柱状图有些相似,能迅速而有效地汇总数据。接
下来你将用这种小巧而实用的图形量度数据的分布、差异、集中趋势等。
无论数据集多么庞大,只要画一张直方图,就能“看出”数据中的奥妙。
让我们在本章中用一个新颖、免费、无所不能的软件工具绘制直方图。
员工年度考评即将到来 252
伸手要钱形式多样 254
这是历年加薪记录 255
直方图体现每组数据的发生频数 262
直方图不同区间之间的缺口即数据点之间的缺口 263
安装并运行R 264
将数据加载到R程序 265
R创建了美观的直方图 266
用数据的子集绘制直方图 271
加薪谈判有回报 276
谈判要求加薪对你意味着什么? 277
10.回归
预测
洞悉一切,未卜先知。回归分析法力无边,只要使用得法,就能帮助你预测
某些结果值。若与控制实验同时使用,回归分析还能预测未来。商家狂热地
运用回归分析帮助自己建立模型,预测客户行为。本章即将让你看到,明智
地使用回归分析,确实能够带来巨大效益。
你打算怎么花这些钱? 280
以获取大幅度加薪为目的进行分析 283
稍等片刻……加薪计算器! 284
这个算法的玄机在于预测加薪幅度 286
用散点图比较两种变量 292
直线能为客户指明目标 294
使用平均值图形预测每个区间内的数值 297
回归线预测出人们的实际加薪幅度 298
回归线对于具有线性相关特点的数据很有用 300
你需要用一个等式进行精确预测 304
让R创建一个回归对象 306
回归方程与散点图密切相关 309
加薪计算器的算法正是回归方程 310
你的加薪计算器没有照计划行事…… 313
11. 合理误差误差
世界错综复杂。预测有失精准并不稀奇。不过,如果在进行预测的时候
指出误差范围,你和你的客户就不仅能知道平均预测值,还能知道该误
差造成的典型偏差,指出误差可以让预测和信念更全面。通过本章讲授
的工具,你还会懂得如何控制误差及如何尽量降低误差,从而提高预测
可信度。
客户大为恼火 316
你的加薪预测算法做了什么? 317
客户组成 318
要求加薪25%的家伙不在模型范围内 321
如何对待想对数据范围以外的情况进行预测的客户 322
由于使用外插法而惨遭解雇的家伙冷静下来了 327
你只解决了部分问题 328
扭曲的加薪结果数据看起来是什么样子? 329
机会误差=实际结果与模型预测结果之间的偏差 330
误差对你和客户都有好处 334
机会误差访谈 335
定量地指定误差 336
用均方根误差定量表示残差分布 337
R模型知道存在均方根误差 338
R的线性模型汇总展示了均方根误差 340
分割的根本目的是管理误差 346
优秀的回归分析兼具解释功能和预测功能 350
相比原来的模型,分区模型能更好地处理误差 352
你的客户纷纷回头 357
12.你能关联吗? 关系数据库
如何组织变化多端的多变量数据?一张电子数据表只有两维数据:行和
列。如果你的数据包括许多方面,则表格格式很快就会过时。在本章,
你会看出电子表格很难管理多变量数据,还能看到关系数据库管理系统
让多变量数据的存储和检索变得极其简单。
《数据邦新闻》希望分析销量 360
这是他们保存的运营跟踪数据 361
你需要知道数据表之间的相互关系 362
数据库就是一系列相互有特定关系的数据 365
找到一条贯穿各种关系的路线,以便进行必要的比较 366
创建一份穿过这条路径的电子表格 366
通过汇总将文章数目和销量关联起来 371
看来你的散点图确实画得很好 374
复制并粘贴所有这些数据是件痛苦的事 375
用关系数据库管理关系 376
《数据邦新闻》利用你的关系图建立了一个RDBMS 377
《数据邦新闻》用SQL提取数据 379
RDBMS数据可以进行无穷无尽的比较 382
你上了封面 383
13.井然有序整理数据
乱糟糟的数据毫无用处。许多数据搜集者需要花大量时间整理数据。不
整齐的数据无法进行分割、无法套用公式,甚至无法阅读,被人们视而
不见也是常事,对不对?其实,你可以做得更好。只要眼前清楚地浮现
出希望看到的数据外观,再用上一些文本处理工具,就能抽丝剥茧地整
理数据,化腐朽为神奇。
刚从停业的竞争对手那儿搞到一份客户名单 386
数据分析不可告人的秘密 387
Head First猎头公司想为自己的销售团队搞到这份名单 388
清理混乱数据的根本在于准备 392
一旦组织好数据,就能修复数据 393
将#号作为分隔符 394
Excel通过分隔符将数据分成多个列 395
用SUBSTITUTE替换“^”字符 399
所有的“姓”都整理好了 400
用SUBSTITUTE替换名字模式太麻烦了 402
用嵌套文本公式处理复杂的模式 403
R能用正则表达式处理复杂的数据模式 404
用sub指令整理“名” 406
现在可以向客户交货了 407
可能尚未大功告成…… 408
为数据排序,让重复数值集中出现 409
这些数据有可能来源于某个关系数据库 412
删除重复名字 413
你创建了美观、整洁、具有唯一性的记录 414
Head First猎头公司正在一网打尽各种人才! 415
再见…… 416
附录A 尾声
正文未及的十大要诀
你已颇有收获。但数据分析这门技术不断变迁,学之不尽。由于本书篇幅有
限,尚有一些密切相关的知识未予介绍,我们将在本附录中浏览十大知识点。
其一:统计知识大全 418
其二:Excel技巧 419
其三:耶鲁大学教授Edward Tufte(爱德华•塔夫特)的图形原则 420
其四:数据透视表 421
其五:R社区 422
其六:非线性与多元回归 423
其七:原假设-备择假设检验 424
其八:随机性 424
其九:Google Docs 425
其十:你的专业技能 426
启动R! 附录B 安装R
强大的数据分析功能靠的是复杂的内部机制。好在只需几分钟就能安装
和启动R,本附录将介绍如何不费吹灰之力安装R。
附录C 安装Excel分析工具
ToolPak
Excel有一些最好的功能在默认情况下并不安装。为了执行第3章的优化和第
9章的直方图,需要激活Solver和Analysis ToolPak,Excel在默认情况下安
装了这两种扩展插件,但若非用户主动操作,这些插件不会被激活。
页码(选填)
这本书已经添加了这些章节,请勾选或者新建你的书摘所属的章节
add
up
down
remove
总目录
序言 I
1 数据分析引言:分解数据 1
2 实验:检验你的理论 37
3 最优化:寻找最大值 75
4 数据图形化:图形让你更精明 111
5 假设检验:假设并非如此 139
6 贝叶斯统计:穿越第一关 169
7 主观概率:信念数字化 191
8 启发法:凭人类的天性作分析 225
9 直方图:数字的形状 251
10 回归:预测 279
11 误差:合理误差 315
12 相关数据库:你能关联吗? 359
13 整理数据:井然有序 385
附录A 尾声:正文未及的十大要诀 417
附录B 安装R:启动R! 427
附录C 安装Excel分析工具:ToolPak 431
细分目录及各章引子
序言
大脑对待数据分析的态度。一边是你努力想学会一些知识,一边是你
的大脑忙着开小差。你的大脑在想:“最好把位置留给更重要的事,
像该离哪些野生动物远点啊,像光着身子滑雪是不是个坏点子啊。”
既然如此,你该如何引诱你的大脑意识到,懂得数据分析是你安身立
命的根本?
谁适合阅读本书? II
我们了解你在想什么 III
元认知 V
征服大脑 VII
自述 VIII
技术顾问组 X
致谢 XI
1.分解数据数据分析引言
Acme化妆品公司需要你出力 2
首席执行官希望数据分析师帮他提高销量 3
数据分析就是仔细推敲证据 4
确定问题 5
客户将帮助你确定问题 6
Acme公司首席执行官给了你一些反馈 8
把问题和数据分解为更小的组块 9
现在再来看看了解到的情况 10
评估组块 13
分析从你介入的那一刻开始 14
提出建议 15
报告写好了 16
首席执行官欣赏你的工作 17
一则新闻 18
首席执行官确信的观点让你误入歧途 20
你对外界的假设和你确信的观点就是你的心智模型 21
统计模型取决于心智模型 22
心智模型应当包括你不了解的因素 25
首席执行官承认自己有所不知 26
Acme给你发来了一长串原始数据 28
深入挖掘数据 31
泛美批发公司确认了你的印象 32
回顾你的工作 35
你的分析让客户作出了英明的决策 36
2.实验
检验你的理论
你能向别人揭示自己坚信的信念吗?正在进行实证检验?做个好实验吧,再
没有什么办法能像一个好实验那样,既能解决问题又能揭示事物的真正运行
规律。一个好实验往往能让你摆脱对观察数据的无限依赖,能帮助你理清因
果联系;可靠的实证数据将让你的分析判断更有说服力。
咖啡业的寒冬到了! 38
星巴仕董事会将在三个月内召开 39
星巴仕调查表 41
务必使用比较法 42
比较是破解观察数据的法宝 43
价值感是导致销售收入下滑的原因吗? 44
一位典型客户的想法 46
观察分析法充满混杂因素 47
店址可能对分析结果有哪些影响 48
拆分数据块,管理混杂因素 50
情况比预料的更糟! 53
你需要做一个实验,指出哪种策略最有效 54
星巴仕首席执行官已经急不可待 55
星巴仕降价了 56
一个月后…… 57
以控制组为基准 58
避免解雇123 61
让我们重新做一次实验 62
一个月后… 63
实验照样会毁于混杂因素 64
精心选择分组,避免混杂因素 65
随机选择相似组 67
随机访谈 68
准备就绪,开始实验 71
结果在此 72
星巴仕找到了与经验吻合的销售策略 73
3.寻找最大值最优化
有些东西人人都想多多益善。为此我们上下求索。要是能用数字表示我
们不断追求的东西——利润、钱、效率、速度等,实现更高目标的机会
就在眼前。有一种数据分析工具能够帮助我们调整决策变量,找出解决
方案和优化点,使我们最大限度地达到目标。本章将使用这样一种工具,
并通过强大的电子表格软件包Solver来实现这个工具。
现在是浴盆玩具游戏时间 76
你能控制的变量受到约束条件的限制 79
决策变量是你能控制的因素 79
你碰到了一个最优化问题 80
借助目标函数发现目标 81
你的目标函数 82
列出有其他约束条件的产品组合 83
在同一张图形里绘制多种约束条件 84
合理的选择都出现在可行区域里 85
新约束条件改变了可行区域 87
用电子表格实现最优化 90
Solver一气呵成解决最优化问题 94
利润跌穿地板 97
你的模型只是描述了你规定的情况 98
按照分析目标校正假设 99
提防负相关变量 103
新方案立竿见影 108
你的假设立足于不断变化的实际情况 109
4.数据图形化
图形让你更精明
数据表远非你所需。你的数据庞杂晦涩,各种变量让你目不暇接,应付堆积
如山的电子表格不只令人厌倦不堪,而且确实浪费时间。相反,与仅仅使用
电子表格不同,一幅用纸不多、栩栩如生的清晰图像,却能让你摆脱“一叶
障目,不见泰山”的烦恼。
新军队需要优化网站 112
结果面世,信息设计师出局 113
前一位信息设计师提交的三份信息图 114
这些图形隐含哪些数据? 115
体现数据! 116
这是前一位设计师主动提供的意见 117
数据太多绝不会成为你的问题 118
让数据变美观也不是你要解决的问题 119
数据图形化的根本在于正确比较 120
你的图形已经比打入冷宫的图形更有用 123
使用散点图探索原因 124
最优秀的图形都是多元图形 125
同时展示多张图形,体现更多变量 126
图形很棒,但网站掌门人仍不满意 130
优秀的图形设计有助于思考的原因 131
实验设计师出声了 132
实验设计师们有自己的假设 135
客户欣赏你的工作 136
订单从四面八方滚滚而来! 137
5.假设并非如此假设检验
世事纷纭,真假难辨。人们需要用庞杂多变的数据预测未来,然而免不了
剪不断,理还乱。正因如此,分析师不会简单听信浮于表面的解释,也不
会想当然地认可这些解释的真实性:通过数据分析的仔细推理,分析师能
够异常细致地评估大量备选答案,然后将手头的一切信息整合到各种模
型中。接下来要学的证伪法即是一种切实有效的非直觉方法。
给我来块“皮肤”…… 140
我们何时开始生产新手机皮肤? 141
PodPhone不希望别人看透他们的下一步行动 142
我们得知的全部信息 143
电肤的分析与数据相符吗? 144
电肤得到了机密《战略备忘录》 145
变量之间可以正相关,也可以负相关 146
现实世界中的各种原因呈网络关系,而非线性关系 149
假设几个PodPhone备选方案 150
用手头的资料进行假设检验 151
假设检验的核心是证伪 152
借助诊断性找出否定性最小的假设 160
无法一一剔除所有假设,但可以判定哪个假设最强 163
你刚刚收到一条图片短信…… 164
即将上市! 167
6.贝叶斯统计
穿越第一关
数据收集工作永不停息。必须确保每一个分析过程都充分利用所搜集到的与
问题有关的数据。虽说你已学会了证伪法,处理异质数据源不在话下,可要
是碰到直接概率问题该怎么办?这就要讲到一个极其方便的分析工具,叫做
贝叶斯规则,这个规则能帮助你利用基础概率和波动数据做到明察秋毫。
医生带来恼人的消息 170
让我们逐条细读正确性分析 173
蜥蜴流感到底有多普遍? 174
你计算的是假阳性 175
这些术语说的都是条件概率 176
你需要算算 177
1%的人患蜥蜴流感 178
你患蜥蜴流感的几率仍然非常低 181
用简单的整数思考复杂的概率 182
搜集到新数据后,用贝叶斯规则处理基础概率 182
贝叶斯规则可以反复使用 183
第二次试验结果:阴性 184
新试验的正确性统计值有变化 185
新信息会改变你的基础概率 186
放心多了! 189
7. 信念数字化
主观概率
虚拟数据未尝不可。真的。不过,这些数字必须描述你的心智状态,表
明你的信念。主观概率就是这样一种将严谨融入直觉的简便办法,具体
做法马上介绍。随着讲解的进行,你将学会如何利用标准偏差评估数据
分布,前面学过的一个更强大的分析工具也会再次登台亮相。
背水投资公司需要你效力 192
分析师们相互叫阵 193
主观概率体现专家信念 198
主观概率可能表明:根本不存在真正的分歧 199
分析师们答复的主观概率 201
首席执行官不明白你在忙些什么 202
首席执行官欣赏你的工作 207
标准偏差量度分析点与平均值的偏差 208
这条新闻让你措手不及 213
贝叶斯规则是修正主观概率的好办法 217
首席执行官完全知道该怎么处理这条新信息了 223
俄罗斯股民欢欣鼓舞! 224
8.启发法
凭人类的天性做分析
现实世界的风云变幻让分析师难以料事如神。总有一些数据可望不可及,即
使有所能及,最优化方法也往往艰深耗时。所幸,生活中的大部分实际思维
活动并非以最理性的方式展开,而是利用既不齐全也不确定的信息,凭经验
进行处理,迅速做出决策。奇就奇在这些经验确实能够奏效,因此也是进行
数据分析的重要而必要的工具。
邋遢集向市议会提交了报告 226
邋遢集确实把镇上打扫得干干净净 227
邋遢集已经计量了自己的工作效果 228
他们的任务是减少散乱垃圾量 229
计量垃圾量不可行 230
问题刁钻,回答简单 231
数据邦市的散乱垃圾结构复杂 232
无法建立和运用统一的散乱垃圾计量模型 233
启发法是从直觉走向最优化的桥梁 236
使用快省树 239
是否有更简单的方法评估邋遢集的成就? 240
固定模式都具有启发性 244
分析完毕,准备提交 246
看来你的分析打动了市议会的议员们 249
9. 数字的形状直方图
直方图能说明什么?数据的图形表示方法不计其数,直方图是其中出类
拔萃的一种。直方图与柱状图有些相似,能迅速而有效地汇总数据。接
下来你将用这种小巧而实用的图形量度数据的分布、差异、集中趋势等。
无论数据集多么庞大,只要画一张直方图,就能“看出”数据中的奥妙。
让我们在本章中用一个新颖、免费、无所不能的软件工具绘制直方图。
员工年度考评即将到来 252
伸手要钱形式多样 254
这是历年加薪记录 255
直方图体现每组数据的发生频数 262
直方图不同区间之间的缺口即数据点之间的缺口 263
安装并运行R 264
将数据加载到R程序 265
R创建了美观的直方图 266
用数据的子集绘制直方图 271
加薪谈判有回报 276
谈判要求加薪对你意味着什么? 277
10.回归
预测
洞悉一切,未卜先知。回归分析法力无边,只要使用得法,就能帮助你预测
某些结果值。若与控制实验同时使用,回归分析还能预测未来。商家狂热地
运用回归分析帮助自己建立模型,预测客户行为。本章即将让你看到,明智
地使用回归分析,确实能够带来巨大效益。
你打算怎么花这些钱? 280
以获取大幅度加薪为目的进行分析 283
稍等片刻……加薪计算器! 284
这个算法的玄机在于预测加薪幅度 286
用散点图比较两种变量 292
直线能为客户指明目标 294
使用平均值图形预测每个区间内的数值 297
回归线预测出人们的实际加薪幅度 298
回归线对于具有线性相关特点的数据很有用 300
你需要用一个等式进行精确预测 304
让R创建一个回归对象 306
回归方程与散点图密切相关 309
加薪计算器的算法正是回归方程 310
你的加薪计算器没有照计划行事…… 313
11. 合理误差误差
世界错综复杂。预测有失精准并不稀奇。不过,如果在进行预测的时候
指出误差范围,你和你的客户就不仅能知道平均预测值,还能知道该误
差造成的典型偏差,指出误差可以让预测和信念更全面。通过本章讲授
的工具,你还会懂得如何控制误差及如何尽量降低误差,从而提高预测
可信度。
客户大为恼火 316
你的加薪预测算法做了什么? 317
客户组成 318
要求加薪25%的家伙不在模型范围内 321
如何对待想对数据范围以外的情况进行预测的客户 322
由于使用外插法而惨遭解雇的家伙冷静下来了 327
你只解决了部分问题 328
扭曲的加薪结果数据看起来是什么样子? 329
机会误差=实际结果与模型预测结果之间的偏差 330
误差对你和客户都有好处 334
机会误差访谈 335
定量地指定误差 336
用均方根误差定量表示残差分布 337
R模型知道存在均方根误差 338
R的线性模型汇总展示了均方根误差 340
分割的根本目的是管理误差 346
优秀的回归分析兼具解释功能和预测功能 350
相比原来的模型,分区模型能更好地处理误差 352
你的客户纷纷回头 357
12.你能关联吗? 关系数据库
如何组织变化多端的多变量数据?一张电子数据表只有两维数据:行和
列。如果你的数据包括许多方面,则表格格式很快就会过时。在本章,
你会看出电子表格很难管理多变量数据,还能看到关系数据库管理系统
让多变量数据的存储和检索变得极其简单。
《数据邦新闻》希望分析销量 360
这是他们保存的运营跟踪数据 361
你需要知道数据表之间的相互关系 362
数据库就是一系列相互有特定关系的数据 365
找到一条贯穿各种关系的路线,以便进行必要的比较 366
创建一份穿过这条路径的电子表格 366
通过汇总将文章数目和销量关联起来 371
看来你的散点图确实画得很好 374
复制并粘贴所有这些数据是件痛苦的事 375
用关系数据库管理关系 376
《数据邦新闻》利用你的关系图建立了一个RDBMS 377
《数据邦新闻》用SQL提取数据 379
RDBMS数据可以进行无穷无尽的比较 382
你上了封面 383
13.井然有序整理数据
乱糟糟的数据毫无用处。许多数据搜集者需要花大量时间整理数据。不
整齐的数据无法进行分割、无法套用公式,甚至无法阅读,被人们视而
不见也是常事,对不对?其实,你可以做得更好。只要眼前清楚地浮现
出希望看到的数据外观,再用上一些文本处理工具,就能抽丝剥茧地整
理数据,化腐朽为神奇。
刚从停业的竞争对手那儿搞到一份客户名单 386
数据分析不可告人的秘密 387
Head First猎头公司想为自己的销售团队搞到这份名单 388
清理混乱数据的根本在于准备 392
一旦组织好数据,就能修复数据 393
将#号作为分隔符 394
Excel通过分隔符将数据分成多个列 395
用SUBSTITUTE替换“^”字符 399
所有的“姓”都整理好了 400
用SUBSTITUTE替换名字模式太麻烦了 402
用嵌套文本公式处理复杂的模式 403
R能用正则表达式处理复杂的数据模式 404
用sub指令整理“名” 406
现在可以向客户交货了 407
可能尚未大功告成…… 408
为数据排序,让重复数值集中出现 409
这些数据有可能来源于某个关系数据库 412
删除重复名字 413
你创建了美观、整洁、具有唯一性的记录 414
Head First猎头公司正在一网打尽各种人才! 415
再见…… 416
附录A 尾声
正文未及的十大要诀
你已颇有收获。但数据分析这门技术不断变迁,学之不尽。由于本书篇幅有
限,尚有一些密切相关的知识未予介绍,我们将在本附录中浏览十大知识点。
其一:统计知识大全 418
其二:Excel技巧 419
其三:耶鲁大学教授Edward Tufte(爱德华•塔夫特)的图形原则 420
其四:数据透视表 421
其五:R社区 422
其六:非线性与多元回归 423
其七:原假设-备择假设检验 424
其八:随机性 424
其九:Google Docs 425
其十:你的专业技能 426
启动R! 附录B 安装R
强大的数据分析功能靠的是复杂的内部机制。好在只需几分钟就能安装
和启动R,本附录将介绍如何不费吹灰之力安装R。
附录C 安装Excel分析工具
ToolPak
Excel有一些最好的功能在默认情况下并不安装。为了执行第3章的优化和第
9章的直方图,需要激活Solver和Analysis ToolPak,Excel在默认情况下安
装了这两种扩展插件,但若非用户主动操作,这些插件不会被激活。
×
添加一个书摘本
搜索创建书摘本
搜索
正在搜索...
不对,换一下
书名
作者
出版社
备注
ISBN
*
*
总目录
序言 I
1 数据分析引言:分解数据 1
2 实验:检验你的理论 37
3 最优化:寻找最大值 75
4 数据图形化:图形让你更精明 111
5 假设检验:假设并非如此 139
6 贝叶斯统计:穿越第一关 169
7 主观概率:信念数字化 191
8 启发法:凭人类的天性作分析 225
9 直方图:数字的形状 251
10 回归:预测 279
11 误差:合理误差 315
12 相关数据库:你能关联吗? 359
13 整理数据:井然有序 385
附录A 尾声:正文未及的十大要诀 417
附录B 安装R:启动R! 427
附录C 安装Excel分析工具:ToolPak 431
细分目录及各章引子
序言
大脑对待数据分析的态度。一边是你努力想学会一些知识,一边是你
的大脑忙着开小差。你的大脑在想:“最好把位置留给更重要的事,
像该离哪些野生动物远点啊,像光着身子滑雪是不是个坏点子啊。”
既然如此,你该如何引诱你的大脑意识到,懂得数据分析是你安身立
命的根本?
谁适合阅读本书? II
我们了解你在想什么 III
元认知 V
征服大脑 VII
自述 VIII
技术顾问组 X
致谢 XI
1.分解数据数据分析引言
Acme化妆品公司需要你出力 2
首席执行官希望数据分析师帮他提高销量 3
数据分析就是仔细推敲证据 4
确定问题 5
客户将帮助你确定问题 6
Acme公司首席执行官给了你一些反馈 8
把问题和数据分解为更小的组块 9
现在再来看看了解到的情况 10
评估组块 13
分析从你介入的那一刻开始 14
提出建议 15
报告写好了 16
首席执行官欣赏你的工作 17
一则新闻 18
首席执行官确信的观点让你误入歧途 20
你对外界的假设和你确信的观点就是你的心智模型 21
统计模型取决于心智模型 22
心智模型应当包括你不了解的因素 25
首席执行官承认自己有所不知 26
Acme给你发来了一长串原始数据 28
深入挖掘数据 31
泛美批发公司确认了你的印象 32
回顾你的工作 35
你的分析让客户作出了英明的决策 36
2.实验
检验你的理论
你能向别人揭示自己坚信的信念吗?正在进行实证检验?做个好实验吧,再
没有什么办法能像一个好实验那样,既能解决问题又能揭示事物的真正运行
规律。一个好实验往往能让你摆脱对观察数据的无限依赖,能帮助你理清因
果联系;可靠的实证数据将让你的分析判断更有说服力。
咖啡业的寒冬到了! 38
星巴仕董事会将在三个月内召开 39
星巴仕调查表 41
务必使用比较法 42
比较是破解观察数据的法宝 43
价值感是导致销售收入下滑的原因吗? 44
一位典型客户的想法 46
观察分析法充满混杂因素 47
店址可能对分析结果有哪些影响 48
拆分数据块,管理混杂因素 50
情况比预料的更糟! 53
你需要做一个实验,指出哪种策略最有效 54
星巴仕首席执行官已经急不可待 55
星巴仕降价了 56
一个月后…… 57
以控制组为基准 58
避免解雇123 61
让我们重新做一次实验 62
一个月后… 63
实验照样会毁于混杂因素 64
精心选择分组,避免混杂因素 65
随机选择相似组 67
随机访谈 68
准备就绪,开始实验 71
结果在此 72
星巴仕找到了与经验吻合的销售策略 73
3.寻找最大值最优化
有些东西人人都想多多益善。为此我们上下求索。要是能用数字表示我
们不断追求的东西——利润、钱、效率、速度等,实现更高目标的机会
就在眼前。有一种数据分析工具能够帮助我们调整决策变量,找出解决
方案和优化点,使我们最大限度地达到目标。本章将使用这样一种工具,
并通过强大的电子表格软件包Solver来实现这个工具。
现在是浴盆玩具游戏时间 76
你能控制的变量受到约束条件的限制 79
决策变量是你能控制的因素 79
你碰到了一个最优化问题 80
借助目标函数发现目标 81
你的目标函数 82
列出有其他约束条件的产品组合 83
在同一张图形里绘制多种约束条件 84
合理的选择都出现在可行区域里 85
新约束条件改变了可行区域 87
用电子表格实现最优化 90
Solver一气呵成解决最优化问题 94
利润跌穿地板 97
你的模型只是描述了你规定的情况 98
按照分析目标校正假设 99
提防负相关变量 103
新方案立竿见影 108
你的假设立足于不断变化的实际情况 109
4.数据图形化
图形让你更精明
数据表远非你所需。你的数据庞杂晦涩,各种变量让你目不暇接,应付堆积
如山的电子表格不只令人厌倦不堪,而且确实浪费时间。相反,与仅仅使用
电子表格不同,一幅用纸不多、栩栩如生的清晰图像,却能让你摆脱“一叶
障目,不见泰山”的烦恼。
新军队需要优化网站 112
结果面世,信息设计师出局 113
前一位信息设计师提交的三份信息图 114
这些图形隐含哪些数据? 115
体现数据! 116
这是前一位设计师主动提供的意见 117
数据太多绝不会成为你的问题 118
让数据变美观也不是你要解决的问题 119
数据图形化的根本在于正确比较 120
你的图形已经比打入冷宫的图形更有用 123
使用散点图探索原因 124
最优秀的图形都是多元图形 125
同时展示多张图形,体现更多变量 126
图形很棒,但网站掌门人仍不满意 130
优秀的图形设计有助于思考的原因 131
实验设计师出声了 132
实验设计师们有自己的假设 135
客户欣赏你的工作 136
订单从四面八方滚滚而来! 137
5.假设并非如此假设检验
世事纷纭,真假难辨。人们需要用庞杂多变的数据预测未来,然而免不了
剪不断,理还乱。正因如此,分析师不会简单听信浮于表面的解释,也不
会想当然地认可这些解释的真实性:通过数据分析的仔细推理,分析师能
够异常细致地评估大量备选答案,然后将手头的一切信息整合到各种模
型中。接下来要学的证伪法即是一种切实有效的非直觉方法。
给我来块“皮肤”…… 140
我们何时开始生产新手机皮肤? 141
PodPhone不希望别人看透他们的下一步行动 142
我们得知的全部信息 143
电肤的分析与数据相符吗? 144
电肤得到了机密《战略备忘录》 145
变量之间可以正相关,也可以负相关 146
现实世界中的各种原因呈网络关系,而非线性关系 149
假设几个PodPhone备选方案 150
用手头的资料进行假设检验 151
假设检验的核心是证伪 152
借助诊断性找出否定性最小的假设 160
无法一一剔除所有假设,但可以判定哪个假设最强 163
你刚刚收到一条图片短信…… 164
即将上市! 167
6.贝叶斯统计
穿越第一关
数据收集工作永不停息。必须确保每一个分析过程都充分利用所搜集到的与
问题有关的数据。虽说你已学会了证伪法,处理异质数据源不在话下,可要
是碰到直接概率问题该怎么办?这就要讲到一个极其方便的分析工具,叫做
贝叶斯规则,这个规则能帮助你利用基础概率和波动数据做到明察秋毫。
医生带来恼人的消息 170
让我们逐条细读正确性分析 173
蜥蜴流感到底有多普遍? 174
你计算的是假阳性 175
这些术语说的都是条件概率 176
你需要算算 177
1%的人患蜥蜴流感 178
你患蜥蜴流感的几率仍然非常低 181
用简单的整数思考复杂的概率 182
搜集到新数据后,用贝叶斯规则处理基础概率 182
贝叶斯规则可以反复使用 183
第二次试验结果:阴性 184
新试验的正确性统计值有变化 185
新信息会改变你的基础概率 186
放心多了! 189
7. 信念数字化
主观概率
虚拟数据未尝不可。真的。不过,这些数字必须描述你的心智状态,表
明你的信念。主观概率就是这样一种将严谨融入直觉的简便办法,具体
做法马上介绍。随着讲解的进行,你将学会如何利用标准偏差评估数据
分布,前面学过的一个更强大的分析工具也会再次登台亮相。
背水投资公司需要你效力 192
分析师们相互叫阵 193
主观概率体现专家信念 198
主观概率可能表明:根本不存在真正的分歧 199
分析师们答复的主观概率 201
首席执行官不明白你在忙些什么 202
首席执行官欣赏你的工作 207
标准偏差量度分析点与平均值的偏差 208
这条新闻让你措手不及 213
贝叶斯规则是修正主观概率的好办法 217
首席执行官完全知道该怎么处理这条新信息了 223
俄罗斯股民欢欣鼓舞! 224
8.启发法
凭人类的天性做分析
现实世界的风云变幻让分析师难以料事如神。总有一些数据可望不可及,即
使有所能及,最优化方法也往往艰深耗时。所幸,生活中的大部分实际思维
活动并非以最理性的方式展开,而是利用既不齐全也不确定的信息,凭经验
进行处理,迅速做出决策。奇就奇在这些经验确实能够奏效,因此也是进行
数据分析的重要而必要的工具。
邋遢集向市议会提交了报告 226
邋遢集确实把镇上打扫得干干净净 227
邋遢集已经计量了自己的工作效果 228
他们的任务是减少散乱垃圾量 229
计量垃圾量不可行 230
问题刁钻,回答简单 231
数据邦市的散乱垃圾结构复杂 232
无法建立和运用统一的散乱垃圾计量模型 233
启发法是从直觉走向最优化的桥梁 236
使用快省树 239
是否有更简单的方法评估邋遢集的成就? 240
固定模式都具有启发性 244
分析完毕,准备提交 246
看来你的分析打动了市议会的议员们 249
9. 数字的形状直方图
直方图能说明什么?数据的图形表示方法不计其数,直方图是其中出类
拔萃的一种。直方图与柱状图有些相似,能迅速而有效地汇总数据。接
下来你将用这种小巧而实用的图形量度数据的分布、差异、集中趋势等。
无论数据集多么庞大,只要画一张直方图,就能“看出”数据中的奥妙。
让我们在本章中用一个新颖、免费、无所不能的软件工具绘制直方图。
员工年度考评即将到来 252
伸手要钱形式多样 254
这是历年加薪记录 255
直方图体现每组数据的发生频数 262
直方图不同区间之间的缺口即数据点之间的缺口 263
安装并运行R 264
将数据加载到R程序 265
R创建了美观的直方图 266
用数据的子集绘制直方图 271
加薪谈判有回报 276
谈判要求加薪对你意味着什么? 277
10.回归
预测
洞悉一切,未卜先知。回归分析法力无边,只要使用得法,就能帮助你预测
某些结果值。若与控制实验同时使用,回归分析还能预测未来。商家狂热地
运用回归分析帮助自己建立模型,预测客户行为。本章即将让你看到,明智
地使用回归分析,确实能够带来巨大效益。
你打算怎么花这些钱? 280
以获取大幅度加薪为目的进行分析 283
稍等片刻……加薪计算器! 284
这个算法的玄机在于预测加薪幅度 286
用散点图比较两种变量 292
直线能为客户指明目标 294
使用平均值图形预测每个区间内的数值 297
回归线预测出人们的实际加薪幅度 298
回归线对于具有线性相关特点的数据很有用 300
你需要用一个等式进行精确预测 304
让R创建一个回归对象 306
回归方程与散点图密切相关 309
加薪计算器的算法正是回归方程 310
你的加薪计算器没有照计划行事…… 313
11. 合理误差误差
世界错综复杂。预测有失精准并不稀奇。不过,如果在进行预测的时候
指出误差范围,你和你的客户就不仅能知道平均预测值,还能知道该误
差造成的典型偏差,指出误差可以让预测和信念更全面。通过本章讲授
的工具,你还会懂得如何控制误差及如何尽量降低误差,从而提高预测
可信度。
客户大为恼火 316
你的加薪预测算法做了什么? 317
客户组成 318
要求加薪25%的家伙不在模型范围内 321
如何对待想对数据范围以外的情况进行预测的客户 322
由于使用外插法而惨遭解雇的家伙冷静下来了 327
你只解决了部分问题 328
扭曲的加薪结果数据看起来是什么样子? 329
机会误差=实际结果与模型预测结果之间的偏差 330
误差对你和客户都有好处 334
机会误差访谈 335
定量地指定误差 336
用均方根误差定量表示残差分布 337
R模型知道存在均方根误差 338
R的线性模型汇总展示了均方根误差 340
分割的根本目的是管理误差 346
优秀的回归分析兼具解释功能和预测功能 350
相比原来的模型,分区模型能更好地处理误差 352
你的客户纷纷回头 357
12.你能关联吗? 关系数据库
如何组织变化多端的多变量数据?一张电子数据表只有两维数据:行和
列。如果你的数据包括许多方面,则表格格式很快就会过时。在本章,
你会看出电子表格很难管理多变量数据,还能看到关系数据库管理系统
让多变量数据的存储和检索变得极其简单。
《数据邦新闻》希望分析销量 360
这是他们保存的运营跟踪数据 361
你需要知道数据表之间的相互关系 362
数据库就是一系列相互有特定关系的数据 365
找到一条贯穿各种关系的路线,以便进行必要的比较 366
创建一份穿过这条路径的电子表格 366
通过汇总将文章数目和销量关联起来 371
看来你的散点图确实画得很好 374
复制并粘贴所有这些数据是件痛苦的事 375
用关系数据库管理关系 376
《数据邦新闻》利用你的关系图建立了一个RDBMS 377
《数据邦新闻》用SQL提取数据 379
RDBMS数据可以进行无穷无尽的比较 382
你上了封面 383
13.井然有序整理数据
乱糟糟的数据毫无用处。许多数据搜集者需要花大量时间整理数据。不
整齐的数据无法进行分割、无法套用公式,甚至无法阅读,被人们视而
不见也是常事,对不对?其实,你可以做得更好。只要眼前清楚地浮现
出希望看到的数据外观,再用上一些文本处理工具,就能抽丝剥茧地整
理数据,化腐朽为神奇。
刚从停业的竞争对手那儿搞到一份客户名单 386
数据分析不可告人的秘密 387
Head First猎头公司想为自己的销售团队搞到这份名单 388
清理混乱数据的根本在于准备 392
一旦组织好数据,就能修复数据 393
将#号作为分隔符 394
Excel通过分隔符将数据分成多个列 395
用SUBSTITUTE替换“^”字符 399
所有的“姓”都整理好了 400
用SUBSTITUTE替换名字模式太麻烦了 402
用嵌套文本公式处理复杂的模式 403
R能用正则表达式处理复杂的数据模式 404
用sub指令整理“名” 406
现在可以向客户交货了 407
可能尚未大功告成…… 408
为数据排序,让重复数值集中出现 409
这些数据有可能来源于某个关系数据库 412
删除重复名字 413
你创建了美观、整洁、具有唯一性的记录 414
Head First猎头公司正在一网打尽各种人才! 415
再见…… 416
附录A 尾声
正文未及的十大要诀
你已颇有收获。但数据分析这门技术不断变迁,学之不尽。由于本书篇幅有
限,尚有一些密切相关的知识未予介绍,我们将在本附录中浏览十大知识点。
其一:统计知识大全 418
其二:Excel技巧 419
其三:耶鲁大学教授Edward Tufte(爱德华•塔夫特)的图形原则 420
其四:数据透视表 421
其五:R社区 422
其六:非线性与多元回归 423
其七:原假设-备择假设检验 424
其八:随机性 424
其九:Google Docs 425
其十:你的专业技能 426
启动R! 附录B 安装R
强大的数据分析功能靠的是复杂的内部机制。好在只需几分钟就能安装
和启动R,本附录将介绍如何不费吹灰之力安装R。
附录C 安装Excel分析工具
ToolPak
Excel有一些最好的功能在默认情况下并不安装。为了执行第3章的优化和第
9章的直方图,需要激活Solver和Analysis ToolPak,Excel在默认情况下安
装了这两种扩展插件,但若非用户主动操作,这些插件不会被激活。