国外计算机科学经典教材数据挖掘原理(第3版)/(英)麦克斯.布拉默

首页 > 图书 > 教材教辅/2020-09-23 / 加入收藏 / 阅读 [打印]
国外计算机科学经典教材数据挖掘原理(第3版)/(英)麦克斯.布拉默

国外计算机科学经典教材数据挖掘原理(第3版)/(英)麦克斯.布拉默

作者:[英]麦克斯·布拉默Max Bramer

开 本:16开

书号ISBN:9787302526810

定价:

出版时间:2019-09-01

出版社:清华大学出版社


8.4.3 设置minIntervals和maxIntervals 95
8.4.4 ChiMerge算法:总结 96
8.4.5 对ChiMerge算法的评述 96
8.5 比较树归纳法的全局离散化和局部离散化 97
8.6 本章小结 98
8.7 自我评估练习 98
第 9 章 避免决策树的过度拟合 99
9.1 处理训练集中的冲突 99
9.2 关于过度拟合数据的更多规则 103
9.3 预剪枝决策树 104
9.4 后剪枝决策树 106
9.5 本章小结 111
9.6 自我评估练习 111
第 10 章 关于熵的更多信息 113
10.1 简介 113
10.2 使用位的编码信息 116
10.3 区分值 117
10.4 对“非等可能”的值进行编码 118
10.5 训练集的熵 121
10.6 信息增益必须为正数或零 122
10.7 使用信息增益来简化分类任务的特征 123
10.7.1 示例1:genetics数据集 124
10.7.2 示例2:bcst96数据集 126
10.8 本章小结 128
10.9 自我评估练习 128
第 11 章 归纳分类的模块化规则 129
11.1 规则后剪枝 129
11.2 冲突解决 130
11.3 决策树的问题 133
11.4 Prism算法 135
11.4.1 基本Prism算法的变化 141
11.4.2 将Prism算法与TDIDT算法进行比较 142
11.5 本章小结 143
11.6 自我评估练习 143
第 12 章 度量分类器的性能 145
12.1 真假正例和真假负例 146
12.2 性能度量 147
12.3 真假正例率与预测精度 150
12.4 ROC图 151
12.5 ROC曲线 153
12.6 寻找*佳分类器 153
12.7 本章小结 155
12.8 自我评估练习 155
第 13 章 处理大量数据 157
13.1 简介 157
13.2 将数据分发到多个处理器 159
13.3 案例研究:PMCRI 161
13.4 评估分布式系统PMCRI的有效性 163
13.5 逐步修改分类器 167
13.6 本章小结 171
13.7 自我评估练习 171
第 14 章 集成分类 173
14.1 简介 173
14.2 估计分类器的性能 175
14.3 为每个分类器选择不同的训练集 176
14.4 为每个分类器选择一组不同的属性 177
14.5 组合分类:替代投票系统 177
14.6 并行集成分类器 180
14.7 本章小结 181
14.8 自我评估练习 181
第 15 章 比较分类器 183
15.1 简介 183
15.2 配对t检验 184
15.3 为比较评估选择数据集 189
15.4 抽样 191
15.5 “无显著差异”的结果有多糟糕? 193
15.6 本章小结 194
15.7 自我评估练习 194
第 16 章 关联规则挖掘I 195
16.1 简介 195
16.2 规则兴趣度的衡量标准 196
16.2.1 Piatetsky-Shapiro标准和RI度量 198
16.2.2 规则兴趣度度量应用于chess数据集 200
16.2.3 使用规则兴趣度度量来解决冲突 201
16.3 关联规则挖掘任务 202
16.4 找到*佳N条规则 202
16.4.1 J-Measure:度量规则的信息内容 203
16.4.2 搜索策略 204
16.5 本章小结 207
16.6 自我评估练习 207
第 17 章 关联规则挖掘II 209
17.1 简介 209
17.2 事务和项目集 209
17.3 对项目集的支持 211
17.4 关联规则 211
17.5 生成关联规则 213
17.6 Apriori 214
17.7 生成支持项目集:一个示例 217
17.8 为支持项目集生成规则 219
17.9 规则兴趣度度量:提升度和杠杆率 220
17.10 本章小结 222
17.11 自我评估练习 222
第 18 章 关联规则挖掘III:频繁模式树 225
18.1 简介:FP-growth 225
18.2 构造FP-tree 227
18.2.1 预处理事务数据库 227
18.2.2 初始化 229
18.2.3 处理事务1:f, c, a, m, p 230
18.2.4 处理事务2:f, c, a, b, m 231
18.2.5 处理事务3:f, b 235
18.2.6 处理事务4:c, b, p 236
18.2.7 处理事务5:f, c, a, m, p 236
18.3 从FP-tree中查找频繁项目集 238
18.3.1 以项目p结尾的项目集 240
18.3.2 以项目m结尾的项目集 248
18.4 本章小结 254
18.5 自我评估练习 254
第 19 章 聚类 255
19.1 简介 255
19.2 k-means聚类 257
19.2.1 示例 258
19.2.2 找到*佳簇集 262
19.3 凝聚式层次聚类 263
19.3.1 记录簇间距离 265
19.3.2 终止聚类过程 268
19.4 本章小结 268
19.5 自我评估练习 268
第 20 章 文本挖掘 269
20.1 多重分类 269
20.2 表示数据挖掘的文本文档 270
20.3 停用词和词干 271
20.4 使用信息增益来减少特征 272
20.5 表示文本文档:构建向量空间模型 272
20.6 规范权重 273
20.7 测量两个向量之间的距离 274
20.8 度量文本分类器的性能 275
20.9 超文本分类 275
20.9.1 对网页进行分类 276
20.9.2 超文本分类与文本分类 277
20.10 本章小结 279
20.11 自我评估练习 280
第 21 章 分类流数据 281
21.1 简介 281
21.2 构建H-Tree:更新数组 283
21.2.1 currentAtts数组 284
21.2.2 splitAtt数组 284
21.2.3 将记录排序到适当的叶节点 284
21.2.4 hitcount数组 285
21.2.5 classtotals数组 285
21.2.6 acvCounts阵列 285
21.2.7 branch数组 286
21.3 构建H-Tree:详细示例 287
21.3.1 步骤1:初始化根节点0 287
21.3.2 步骤2:开始读取记录 287
21.3.3 步骤3:考虑在节点0处分裂 288
21.3.4 步骤4:在根节点上拆分并初始化新的叶节点 289
21.3.5 步骤5:处理下一组记录 290

 2/3   首页 上一页 1 2 3 下一页 尾页

教材 研究生/本科/专科教材 工学

在线阅读

  • 最新内容
  • 相关内容
  • 网友推荐
  • 图文推荐