数据挖掘基础


数据挖掘基础

文章插图
数据挖掘基础【数据挖掘基础】《数据挖掘基础》是2018年清华大学出版社出版的图书,图书作者是刘鹏、张燕、陶建辉、姜才康 。
基本介绍书名:数据挖掘基础
作者:刘鹏、张燕、陶建辉、姜才康 
ISBN:9787302502197
出版社:清华大学出版社 
出版时间:2018年 
图书信息数据挖掘基础作者:刘鹏、张燕、陶建辉、姜才康 定价:48元印次:1-1ISBN:9787302502197出版日期:2018.06.01印刷日期:2018.06.21内容简介本书介绍了数据挖掘的基本概念,包括数据挖掘的常用算法、常用工具、用途和套用场景及套用状况,讲述了常用数据挖掘方法,如分类、聚类、关联规则的概念、思想、典型算法、套用场景等 。此外,本书 还从实际套用出发,讲解了基于日誌的大数据挖掘技术的原理、工具、套用场景和成功案例 。日誌挖掘技 术现在已得到了广泛的运用 。通过以上内容的学习,读者将了解数据挖掘的基本概念、思想和算法,并掌握其套用要领 。本书可以 作为培养套用型人才的课程教材,也可作为相关开发人员的自学教材和参考手册 。目录第1章数据挖掘概念1.1数据挖掘概述1.1.1什幺是数据挖掘1.1.2数据挖掘常用算法概述1.1.3数据挖掘常用工具概述1.2数据探索1.2.1数据概述1.2.2数据质量1.2.3数据预处理1.3数据挖掘的套用1.3.1数据挖掘现状及发展趋势1.3.2数据挖掘需要解决的问题1.3.3数据挖掘的套用场景1.4作业与练习参考文献第2章分类2.1分类概述2.1.1分类的基本概念2.1.2解决分类问题的一般方法2.1.3决策树案例:Web机器人检测2.1.4模型的过分拟合2.2贝叶斯决策与分类器2.2.1规则分类器2.2.2分类中贝叶斯定理的套用2.2.3分类中朴素贝叶斯的套用2.3支持向量机2.3.1最大边缘超平面2.3.2线性支持向量机SVM2.3.3非线性支持向量机SVM2.4分类在实际场景中的套用案例案例一:如何解决文章主题关键字与搜寻引擎关键字带来的检索结果差异案例二:甄别新金融交易方式的欺诈行为案例三:线上广告推荐中的分类2.5作业与练习参考文献第3章聚类3.1聚类概述3.1.1聚类的基本概念3.1.2聚类算法3.2聚合分析方法3.2.1欧氏距离3.2.2聚合过程3.2.3聚类树3.2.4聚合分析方法套用例子3.3聚类在实际场景中的套用案例3.4聚类的实现例子3.5作业与练习参考文献第4章关联规则4.1关联规则概述4.1.1经典案例导入4.1.2关联规则的基本概念和定义4.1.3关联规则的分类4.2关联规则的挖掘过程4.2.1知识回顾4.2.2频繁项集产生4.2.3强关联规则4.2.4关联规则评价标準4.3关联规则的Apriori算法4.3.1知识回顾4.3.2Apriori算法的核心思想4.3.3Apriori算法描述4.3.4Apriori算法评价4.3.5Apriori算法改进4.4关联规则的FP-growth算法4.4.1构建FP树4.4.2从FP树中挖掘频繁项集4.5实战:关联规则挖掘实例4.5.1关联规则挖掘技术在国内外的套用现状4.5.2关联规则套用实例4.5.3关联规则在大型超市中套用的步骤4.6作业与练习参考文献第5章综合实战—日誌的挖掘与套用5.1日誌概念5.1.1日誌是什幺5.1.2日誌能做什幺5.2日誌处理5.2.1产生日誌5.2.2传输日誌5.2.3存储日誌5.2.4分析日誌5.2.5日誌规範与标準5.3日誌分析原理及工具5.3.1日誌分析原理5.3.2日誌分析工具5.3.3日誌分析系统规划建设5.4日誌挖掘套用5.4.1安全运维5.4.2系统健康分析5.4.3用户行为分析5.4.4业务分析设计5.5日誌分析挖掘实例5.6作业与练习参考文献第6章数据挖掘套用案例6.1电力行业採用聚类方法进行主变油温分析6.1.1需求背景及採用的大数据分析方法6.1.2大数据分析方法的实现过程6.1.3大数据分析方法的实现结果6.2银行信贷评价6.2.1简介6.2.2神经网路模型6.2.3实证检验6.3指数预测6.3.1金融时间序列概况6.3.2小波消噪6.3.3向量机6.3.4指数预测6.4客户分群的精準智慧型行销6.4.1挖掘目标6.4.2分析方法和过程6.4.3建模仿真6.5使用WEKA进行房屋定价6.6作业与练习参考文献附录A大数据和人工智慧实验环境附录BHadoop环境要求附录C名词解释