s.str.upper()
将/Index中的字符串转换为大写 。
s.str.len()
计算字符串长度 。
s.str.strip()
帮助从两侧的系列/索引中的每个字符串中删除空格(包括换行符) 。
s.str.split()
用给定的模式拆分每个字符串 。# s.str.split(’ ')
s.str.cat(sep=)
使用给定的分隔符连接系列/索引元素 。# s.str.cat(sep=’ ')
s.str.()
返回具有单热编码值的数据帧() 。
s.str.()
如果元素中包含子字符串,则返回每个元素的布尔值True,否则为False 。#s.str.(’ ')包含空格返回True
s.str.(a,b)
将值a替换为值b 。
s.str.(value)
重复每个元素指定的次数value 。
s.str.count()
返回模式中每个元素的出现总数 。
s.str.()
如果系列/索引中的元素以模式开始,则返回true 。
s.str.()
如果系列/索引中的元素以模式结束,则返回true 。
s.str.find()
返回模式第一次出现的位置 。-1表示元素中没有这样的模式可用 。
s.str.()
返回模式的所有出现的列表 。空列表([])表示元素中没有这样的模式可用 。
s.str.
变换字母大小写 。
s.str.()
检查系列/索引中每个字符串中的所有字符是否小写,返回布尔值 。
s.str.()
检查系列/索引中每个字符串中的所有字符是否大写,返回布尔值 。
s.str.()
检查系列/索引中每个字符串中的所有字符是否为数字,返回布尔值 。
6. 描述性统计函数
描述性统计,有很多方法用来计算的描述性统计信息和其他相关操作 。其中大多数是sum(),mean()等聚合函数,但其中一些,如(),产生一个相同大小的对象 。一般来说,这些方法采用轴参数,就像.{sum,std,…},但轴可以通过名称或整数来指定 。
函数说明
len(df)
统计行数 。# print(len(df))不包括表头(列标签)
df.count()
返回每列的计数(计数仅包括非空值的数量)
df.sum(axis)
返回所请求轴的值的总和,默认情况下axis=0 。
df.mean()
返回每列的平均值
df.std()
返回数值列的标准偏差
df.( )
计算有关列的统计信息的摘要 。该函数给出了平均值,标准差和IQR值 。而且,函数排除字符列,并给出关于数字列的摘要 。【 是用于传递关于什么列需要考虑用于总结的必要信息的参数,获取值列表,默认情况下是汇总数字列(数字值),汇总字符串列,all 将所有列汇总在一起(不应将其作为列表值传递) 。】
df.head(n)
返回前n行(观察索引值) 。默认数量为5,可以传递自定义数值 。
df.tail(n)
返回最后n行(观察索引值) 。默认数量为5,可以传递自定义数值 。
df.()
返回每列的中位数
df.mode()
值的模值,众数
df.min()
所有值中的最小值
df.max()
所有值中的最大值
df.abs()
绝对值
df.prod()
数组元素的乘积
df.()
累计总和
df.()
累计乘积 。sum(),()函数能与数字和字符(或)字符串数据元素一起工作,不会产生任何错误 。字符聚合从来都比较少被使用,虽然这些函数不会引发任何异常 。由于这样的操作无法执行,因此,当包含字符或字符串数据时,像abs(),()这样的函数会抛出异常 。
df.mad()
平均绝对方差
df.()
累计最大值
df.()
累计最小值
df.var()
方差
df.sem()
标准误差
df.skew()
偏差
df.kurt()
样本值峰度
df.()
分位数
df[‘lable’].()
统计有多少种不同的值
df[‘lable’].()
- 茜之塔多肉怎么养
- 榆熙电商:流量也有淡旺季之分吗?
- 谈谈数据分析
- 采集全球最新地震分布数据 Python之表格数据采集练习
- 八九之中取一个是什么生肖
- Android设计模式之代理模式 Proxy
- python数据分析——业务指标分析
- 实验心理学:众包之猛
- 人生之路第23集在哪儿在线播放
- 设计模式-代理模式之动态代理