化学数据挖掘方法与套用


化学数据挖掘方法与套用

文章插图
化学数据挖掘方法与套用【化学数据挖掘方法与套用】《化学数据挖掘方法与套用》是2012年化学工业出版社出版的图书,作者是陆文聪、李国正、刘亮、包新华 。
基本介绍书名:化学数据挖掘方法与套用
作者:陆文聪、李国正、刘亮、包新华 着
ISBN:9787122127082
出版社:化学工业出版社
出版时间:2012年02月
开卷分类:自然科学
出版信息ISBN:9787122127082定价:68.00元作者:陆文聪、李国正、刘亮、包新华 着出版社:化学工业出版社出版时间:2012年02月版次:1-1装帧:精字数:289千字开卷分类:自然科学内容简介本书主要介绍了化学常用数据挖掘方法和技术的基本原理,并重点介绍了模式识别、支持向量机、集成学习方法在材料设计、工业最佳化、构效关係、生物信息学等领域的套用研究实例 。书中所有套用研究实例全部取自作者的套用研究课题,有关算法程式可採用作者开发的套用软体HyperMiner(见附录1) 。本书可供化学、化工及相关领域的科研人员和工程技术人员阅读,亦可作为高等学校的教学参考书 。目录1 化学数据挖掘综述1.1 化学数据挖掘的目的和意义1.1.1 数据挖掘与材料设计1.1.2 数据挖掘与构效关係1.1.3 数据挖掘与工业最佳化1.2 化学数据挖掘方法概要1.3 化学数据挖掘套用进展1.3.1 机器学习的数学本质1.3.2 统计模型的“过拟合”问题1.3.3 模式识别最佳化算法及其改进1.3.4 支持向量机算法的套用效果1.3.5 建立综合运用多种算法的数据处理平台参考文献2 模式识别基本原理和方法2.1 模式识别方法的基本原理和预备知识2.2 模式识别经典方法2.2.1 最近邻方法2.2.2 主成分分析方法2.2.3 多重判别矢量和Fisher判别矢量方法2.2.4 偏最小二乘方法2.2.5 非线性映照方法2.3 模式识别套用技术2.3.1 最佳投影识别方法2.3.2 超多面体建模2.3.3 逐级投影建模方法2.3.4 最佳投影回归方法2.3.5 模式识别逆投影方法2.4 决策树算法2.4.1 C4.5算法2.4.2 随机决策树算法2.4.3 随机森林算法参考文献3 人工神经网路和遗传算法3.1 人工神经网路3.1.1 反向人工神经网路3.1.2 Kohonen自组织网路3.2 遗传算法参考文献4 支持向量机方法4.1 统计学习理论(SLT)简介4.1.1 背景4.1.2 原理4.2 支持向量分类(SVC)算法4.2.1 线性可分情形4.2.2 非线性可分情形4.3 支持向量机(SVM)的核函式4.4 支持向量回归(SVR)方法4.4.1 线性回归情形4.4.2 非线性回归情形4.5 支持向量机分类与回归算法的实现4.6 套用前景参考文献5 集成学习方法5.1 集成学习算法概述5.2 Boosting算法5.3 Adaboost算法5.4 Bagging算法参考文献6 特徵选择方法和套用6.1 特徵选择研究概述6.2 基于支持向量分类的特徵选择6.2.1 后向浮动搜寻算法6.2.2 用SVM?BFS进行特徵选择6.3 支持向量回归的特徵选择6.3.1 PRIFER算法6.3.2 计算结果的评价準则6.3.3 PRIFER方法与常规计算方法的结果比较6.4 集成学习及其特徵选择6.4.1 个体子集的特徵选择6.4.2 基于预报风险的特徵选择6.4.3 PRIFEB算法6.4.4 UCI数据集上的计算结果参考文献7 钙钛矿型离子导体导电性的数据挖掘7.1 钙钛矿型离子导体与燃料电池材料7.2 钙钛矿的结构特性7.3 钙钛矿型晶体的原子参数7.3.1 钙钛矿容忍因子7.3.2 钙钛矿平均离子半径7.3.3 钙钛矿单位晶格边值与临界半径7.3.4 钙钛矿组成元素的电负性7.3.5 钙钛矿平均离子极化率与所带电荷7.3.6 钙钛矿原子参数与量化参数的组合7.4 钙钛矿离子导体数据的收集7.5 数据集的自变数筛选7.5.1 自变数的经典统计相关性分析7.5.2 贝叶斯网路进行变数关联性分析7.5.3 前进?后退法进行自变数筛选7.6 多种数据挖掘方法建立原子参数?钙钛矿导电能力模型7.6.1 PLS,BP?ANN与SVR建立的回归模型7.6.2 回归模型的留一法交叉验证与独立测试集验证7.6.3 SVR模型的敏感性分析参考文献8 熔盐相图资料库的数据挖掘8.1 相图计算的意义8.2 原子参数?模式识别方法概述8.3 智慧型资料库技术在材料科学中的套用8.4 熔盐相图智慧型资料库的研究和开发8.5 判别卤化物体系是否形成中间化合物8.6 白钨矿结构物相含稀土异价固溶体的形成规律8.6.1 白钨矿型物相及其异价固溶体的形成规律8.6.2 白钨矿型MⅠM′Ⅲ(XO4)2(X=Mo,W)物相及其异价固溶体的形成规律8.7 钙钛矿及类钙钛矿结构的物相的若干规律性8.7.1 钙钛矿结构的复卤化物的若干规律性8.7.2 含钙钛矿结构层的夹层化合物的规律参考文献9 镀锡薄钢板质量的数据挖掘9.1 镀锡薄钢板的发展 9.2 镀锡板生产过程简介9.3 镀锡板耐蚀性能与工业生产软熔条件的关係9.4 镀锡板耐蚀性能与实验室模拟软熔条件的关係9.5 工业生产中防止淬水斑产生的数学模型9.6 镀锡板淬水斑的实验室模拟研究参考文献10 合成氨生产效益的数据挖掘10.1 氨合成装置简介10.1.1 生产原理10.1.2 生产流程10.1.3 生产数据的複杂性和数据挖掘的必要性10.2 DMOS合成氨最佳化系统的开发10.2.1 DMOS合成氨最佳化系统简介10.2.2 DMOS合成氨最佳化系统离线版软体10.2.3 DMOS合成氨最佳化系统线上版软体10.2.4 DMOS合成氨最佳化系统最佳化生产实施步骤10.2.5 DMOS合成氨最佳化系统主要特点10.3 氨合成装置生产最佳化模型的研究10.3.1 数据集10.3.2 1号合成塔生产最佳化数学模型10.4 讨论和结论参考文献11 分子结构性质关係的数据挖掘11.1 偶氮染料最大吸收波长的支持向量回归模型11.1.1 分子结构特徵参数的计算和筛选11.1.2 支持向量回归的计算结果11.1.3 讨论11.2 胍类化合物Na/H交换抑制活性的支持向量分类模型11.2.1 特徵参数的计算与筛选11.2.2 支持向量分类的计算结果11.2.3 与其他方法的比较11.3 抗爱滋病药物HEPT活性的支持向量分类模型11.3.1 特徵参数的计算与筛选11.3.2 支持向量分类的计算结果11.3.3 与其他方法的比较11.4 三唑类化合物分子筛选的最佳投影识别模型11.4.1 特徵参数的计算和筛选11.4.2 特徵参数间的共线性检查11.4.3 OPR法的计算11.4.4 OPR法的测试结果11.4.5 结论参考文献12 HIV?1蛋白酶特异性位点的数据挖掘12.1 数据集準备12.2 mRMR方法和特徵选取12.3 不同的特徵子集建模预报能力比较12.4 特徵分析和结论参考文献13 蛋白质结构及功能类型预测13.1 用集成学习方法预测蛋白质的亚细胞定位13.1.1 蛋白质亚细胞定位的生物学基础及研究现状13.1.2 蛋白质亚细胞定位数据集以及特徵参数的提取13.1.3 亚细胞定位预测中模型参数的选择与模型的验证13.1.4 分析与讨论13.2 蛋白质结构类型的集成学习方法预测13.2.1 蛋白质结构类型简介及研究现状 13.2.2 数据集以及特徵参数的提取13.2.3 预测蛋白质结构类型时的模型参数选择与模型验证13.2.4 分析与讨论13.3 膜蛋白类型的集成学习方法预测13.3.1 膜蛋白简介及计算预测研究现状13.3.2 膜蛋白预测的数据集以及特徵参数的提取13.3.3 预测膜蛋白质类型的模型参数选择与模型验证13.3.4 预测膜蛋白质类型的模型变数分析13.4 蛋白质亚细胞定位和膜蛋白类型预报的线上Web服务参考文献附录1 “HyperMiner数据挖掘软体”下载和套用说明一、软体简介和下载方法二、套用案例:V?PTC材料最佳配方及最佳工艺条件的探索附录2 第6章所用的数据集一、大脑胶质瘤数据集二、多元校正数据集三、基因晶片数据集参考文献