数据挖掘-方法与应用-应用案例 本书特色
本书主要以作者近五年在清华大学开展数据挖掘应用研究和教学工作为基础,从所指导的多个数据挖掘与分析的应用案例中精选出包括交通、体育、金融、生物信息、社交网络、电力等领域代表性的数据挖掘与分析案例,结合基本的数据挖掘应用实施思路,展示了在不同行业领域开展数据挖掘与分析工作的实际过程。
本书可作为高等院校学生学习数据挖掘的参考读物,同时可供工程技术人员开展数据挖掘与分析工作时参考。
数据挖掘-方法与应用-应用案例 内容简介
精选六大行业领域数据挖掘与分析案例。? 遵从数据挖掘应用实施过程进行介绍。? 从实际应用的角度点评数据挖掘的效果。? 洞察数据挖掘的重要实施环节。? 既是高等学校的教学辅导用书,又是行业专业人士参考用书。
数据挖掘-方法与应用-应用案例 目录
目录
第1章绪论1
1.1本书背景1
1.2数据挖掘应用概述2
1.3本书的主要内容安排4
1.4小结5
第2章基于GPS信息的出租车行车轨迹数据挖掘6
2.1概述6
2.2出租车GPS数据挖掘问题描述6
2.3基于GPS数据的出租车轨迹挖掘与分析9
2.4挖掘任务点评30
2.5小结31
第3章NBA比赛结果预测32
3.1问题背景32
3.2数据采集33
3.2.1数据来源33
3.2.2数据采集方法33
3.2.3原始数据34
3.3挖掘方法36
3.3.1挖掘的目标与实现思路36
3.3.2预测特征选取37
3.4分类和预测方法38
3.5预测结果的分析和对比39
3.5.1使用球队平均数据预测比赛结果39
3.5.2使用球队近期数据预测比赛结果40
3.6挖掘任务点评43
3.7小结43
参考文献44
第4章大型商业银行后台运维数据故障分析46
4.1概述46
4.1.1应用背景46
4.1.2主要研发内容49
4.2相关方法回顾51
4.2.1主成分分析法51
4.2.2前向特征选择法52
4.2.3随机森林方法52
4.3交易超时故障预测方法设计与实现54
4.3.1问题定义54
4.3.2工作流程55
4.3.3数据预处理55
4.3.4降维处理61
4.3.5预测模型62
4.3.6防范模型63
4.3.7评价方法64
4.4综合系统的设计与实现65
4.4.1系统框架65
4.4.2数据预处理模块65
4.4.3随机森林模块66
4.4.4展示模块67
4.4.5*终效果模块67
4.5结果分析与评价69
4.5.1实验数据69
4.5.2交易故障预测相关实验70
4.6挖掘任务点评75
4.7小结76
4.7.1总结76
4.7.2展望77
参考文献77
第5章RNA排序预测80
5.1概述80
5.2研发现状81
5.2.1内部核糖体进入位点的数据
挖掘研发现状81
5.2.2冷冻电镜图像蛋白质颗粒挑选
研究现状84
5.3工作设计与实现86
5.3.1基本的设计框架与实现思路86
5.3.2核心挖掘模型设计与实现91
5.4应用实现94
5.4.1实现程序与功能94
5.4.2数据挖掘分析结果展示95
5.5操作说明98
5.6挖掘任务点评98
5.7小结99
参考文献100
第6章“乐学”微信公众号关注趋势分析101
6.1前言101
6.1.1研究背景101
6.1.2数据来源102
6.1.3数据预处理102
6.1.4研究思路103
6.2平台发展现状104
6.2.1平台用户特性105
6.2.2平台传播状态108
6.2.3便捷操作发展状况113
6.3推送发展模式探究119
6.3.1成功推送案例分析120
6.3.2理想发展模式探究123
6.3.3不同模式下的平台关注量预测123
6.3.4推送发展的改进思路126
6.4便捷操作功能探究127
6.4.1用户使用习惯分析127
6.4.2便捷操作功能的改进思路128
6.5挖掘任务点评129
6.6小结130
参考文献130
第7章保险行业客户特征识别131
7.1概述131
7.2数据挖掘问题描述133
7.2.1问题背景133
7.2.2关于数据集133
7.3保险客户特征识别与分析134
7.3.1数据预处理134
7.3.2挖掘与分析结果145
7.4挖掘任务点评148
7.5小结150
参考文献150
第8章电力系统不良数据辨识案例分析155
8.1概述155
8.1.1电力系统不良数据辨识155
8.1.2数据介绍156
8.2研究内容157
8.2.1基于GSA的k?means聚类157
8.2.2基于有效指数的k?means聚类164
8.2.3模糊C?means聚类168
8.3总结分析171
8.3.1不良数据辨识结果对比171
8.3.2不良数据分析173
8.4挖掘任务点评175
8.5小结175
第9章总结177
数据挖掘-方法与应用-应用案例 作者简介
徐华 博士,1998年获得西安交通大学计算机专业学士学位;2003年获得清华大学计算机应用技术专业博士学位;现为清华大学计算机系副教授,博士生导师。主要研究兴趣领域包括:网络文本数据挖掘、智能信息处理和机器人智能控制等。作为项目负责人、首席技术专家或研发骨干,负责完成国家科技重大专项课题3项,国家自然科学基金项目4项,国家973项目二级课题2项,国家863项目(课题)5项,国际500强企业(宝洁、西门子、安捷伦等)合作项目13项。目前已在本专业领域权威期刊和会议上发表学术论文97篇;编写教材2本,参与编写学术专著2部。作为第一完成人获得国家发明专利16项,国际PCT发明专利4项,软件著作权15项。作为清华方面的第一完成人,获得国家科技进步二等奖1项,北京市科学技术一等奖、二等奖和三等奖各1项,重庆市科学技术三等奖1项,行业协会科学技术一等奖2项等。