利用函数计算,基本绘图函数、透视分析等基础方法 数据挖掘的分析基础( 三 )


一位频数分析即单变量数的透视表分析 。
1.1计数数据的频数分析
下面是课程开设数据的频数表与条图
1.2计量数据的频数分析 身高数据的频数表与条图
支出数据的频数表与条图
2.二位聚集分析 2.1计数数据的列联表 二维列联表
()函数可以把双变量分类数据整理成二维表形式 。
行和列的合计可使用参数=True.
用参数来计算边缘比例 。
=’index‘:各数据占行的比例
=’‘:表示各数据占列的比列
=’all‘:表示各数据占总和的比例
复试条图
其中参数设置为False时,做出的图是分段式条图,为True时做出的图是并列式条图 。
2.2计量数据的聚集表
分组()函数
提供了一项技术灵活高效的功能,通过它可以以一种自然的方式对数据集进行切片、切块、摘要等操作;根据一个或多个键拆分对象
按列分组
按分组统计
在分组结果的基础上应用size()、sum()、count()等统计函数,可分别统计分组数量、不同列的分组和、不同列的分组数量 。
应用agg()函数计算统计量
应用apply()函数计算统计量
apply()函数不同于agg()函数的地方在于:前者作用域数据框的各个列,后者仅作用于指定的列 。
3.多维透视分析 3.1计数数据的透视分析
用包的()函数生成各种统计表,可以达到Excel等电子表格的透视表功能 。
3.2计量数据的透视分析
为要计算的统计量函数 。
3.3复合数据的透视分析
【利用函数计算,基本绘图函数、透视分析等基础方法数据挖掘的分析基础】这时的参数即是分类变量,也可以是数值变量 。统计量函数可包括计数和计量函数,如长度、均值和标准差函数len、mean和std 。