数据挖掘：概念、模型、方法和算法

文章插图
数据挖掘：概念、模型、方法和算法【数据挖掘：概念、模型、方法和算法】《数据挖掘——概念、模型、方法和算法》是一本由清华大学出版社在2004年出版的书籍。作为一本教科书，本书全面讲述了数据挖掘的概念、模型、方法和算法。本书共包括13章和2个附录，全面、详细地讲述了从数据挖掘的基本概念到数据挖掘的整个过程，以及数据挖掘工具及其典型套用领域。本书编写严谨、内容权威、结构合理、科学规範、语言流畅，特别适合作为高等院校数据挖掘课程的教科书，还适合作为数据挖掘研究人员必备的参考书。
基本介绍书名：数据挖掘：概念、模型、方法和算法
作者：(美)Mehmed Kantardzic
ISBN：9787302307143
页数：403
出版社：清华大学出版社
出版时间：2013年
装帧：平装
开本：16
字数：655000
出版信息拼音题名shu ju wa jue其它题名并列题名ISBN978-7-302-30714-3责任者(美)Mehmed Kantardzic着出版者清华大学出版社出版地北京出版时间2013中图分类号TP311.13附注国外计算机科学经典教材摘要本书全面讲述了数据挖掘的概念、模型、方法和算法，包括14章和2个附录，详细讲述了从数据挖掘的基本概念到数据挖掘的整个过程，以及数据挖掘工具及其典型套用领域。目录第1章数据挖掘的概念1.1 概述1.2 数据挖掘的起源1.3 数据挖掘过程1.4 大型数据集1.5 数据仓库1.6 数据挖掘的商业方面:为什幺数据挖掘项目会失败1.7 本书结构安排1.8 複习题1.9 参考书目第2章数据準备2.1 原始数据的表述2.2 原始数据的特性2.3 原始数据的转换2.3.1 标準化2.3.2 数据平整2.3.3 差值和比率2.4 丢失数据2.5 时间相关数据2.6 异常点分析2.7 複习题2.8 参考书目第3章数据归约3.1 大型数据集的维度3.2 特徵归约3.2.1 特徵选择3.2.2 特徵提取3.3 re1ief算法3.4 特徵排列的熵度量3.5 主成分分析3.6 值归约3.7 特徵离散化:chimerge技术3.8 案例归约3.9 複习题3.10 参考书目第4章从数据中学习4.1 学习机器4.2 统计学习原理4.3 学习方法的类型4.4 常见的学习任务4.5 支持向量机4.6 knn:最近邻分类器4.7 模型选择与泛化4.8 模型的评估4.9 90%準确的情形4.9.1 保险欺诈检测4.9.2 改进心脏护理4.10 複习题4.11 参考书目第5章统计方法5.1 统计推断5.2 评测数据集的差异5.3 贝叶斯定理5.4 预测回归5.5 方差分析5.6 对数回归5.7 对数—线性模型5.8 线性判别分析5.9 複习题5.10 参考书目第6章决策树和决策规则6.1 决策树6.2 c4.5算法:生成决策树6.3 未知属性值6.4 修剪决策树6.5 c4.5算法:生成决策规则6.6 cart算法和gini指标6.7 决策树和决策规则的局限性6.8 複习题6.9 参考书目第7章人工神经网路7.1 人工神经元的模型7.2 人工神经网路的结构7.3 学习过程7.4 使用ann完成的学习任务7.4.1 模式联想7.4.2 模式识别7.5 多层感知机7.6 竞争网路和竞争学习7.7 som7.8 複习题7.9 参考书目第8章集成学习8.1 集成学习方法论8.2 多学习器组合方案8.3 bagging和boosting8.4 adaboost算法8.5 複习题8.6 参考书目第9章聚类分析9.1 聚类的概念9.2 相似度的度量9.3 凝聚层次聚类9.4 分区聚类9.5 增量聚类9.6 dbscan算法9.7 birch算法9.8 聚类验证9.9 複习题9.10 参考书目第10章关联规则10.1 购物篮分析10.2 apriori算法10.3 从频繁项集中得到关联规则10.4 提高apriori算法的效率10.5 fp增长方法10.6 关联分类方法10.7 多维关联规则挖掘10.8 複习题10.9 参考书目第11章 web挖掘和文本挖掘11.1 web挖掘11.2 web内容、结构与使用挖掘11.3 hits和logsom算法11.4 挖掘路径遍历模式11.5 pagerank算法11.6 文本挖掘 11.7 潜在语义分析11.8 複习题11.9 参考书目第12章数据挖掘高级技术12.1 图挖掘12.2 时态数据挖掘12.2.1 时态数据表示12.2.2 序列之间的相似性度量12.2.3 时态数据模型12.2.4 数据挖掘12.3 空间数据挖掘(sdm)12.4 分散式数据挖掘(ddm)12.5 关联并不意味着存在因果关係12.6 数据挖掘的隐私、安全及法律问题12.7 複习题12.8 参考书目第13章遗传算法13.1 遗传算法的基本原理13.2 用遗传算法进行最佳化13.2.1 编码方案和初始化13.2.2 适合度估计13.2.3 选择13.2.4 交叉13.2.5 突变13.3 遗传算法的简单例证13.3.1 表述13.3.2 初始群体13.3.3 评价13.3.4 交替13.3.5 遗传运算元13.3.6 评价(第二次叠代)13.4 图式13.5 旅行推销员问题13.6 使用遗传算法的机器学习13.6.1 规则交换13.6.2 规则概化13.6.3 规则特化13.6.4 规则分割13.7 遗传算法用于聚类13.8 複习题13.9 参考书目第14章模糊集和模糊逻辑14.1 模糊集14.2 模糊集的运算14.3 扩展原理和模糊关係14.4 模糊逻辑和模糊推理系统14.5 多因子评价14.6 从数据中提取模糊模型14.7 数据挖掘和模糊集14.8 複习题14.9 参考书目第15章可视化方法15.1 感知和可视化15.2 科学可视化和信息可视化15.3 平行坐标15.4 放射性可视化15.5 使用自组织映射进行可视化15.6 数据挖掘的可视化系统15.7 複习题15.8 参考书目附录a 数据挖掘工具附录b 数据挖掘套用