Nodepad image audio pdo air vuejs视频教程 pmp教学视频 linux超级用户 java二维数组赋值 flutter项目案例 kubernetes视频教程 python数据库 javatrim java集合 java中的队列 java的集合框架 java学习课程 java正则匹配数字 sql实例 房产证生成器 魔之符咒 删除数组中的某个元素 stata软件 robotstudio 英雄联盟崩溃 mathcad15 findall pmbok第六版 php正则匹配 透视网格工具怎么取消 txplatform 狮子狗打野天赋 贪吃蛇c语言代码 饥荒黄油 su镜像 熊猫关键词 jsps2寸照片制作 坐标反算 ai投影 csshover
当前位置: 首页 > 学习教程  > python

python对DataFrame自定义描述性统计

2021/2/6 22:23:53 文章标签: 测试文章如有侵权请发送至邮箱809451989@qq.com投诉后文章立即删除

在对数据进行分析之前,首先需要对数据的分布状况有一个大致的了解,这为后续的数据预处理工作提供一定的方向。 即将过年啦,现在把我之前在工作写下的小函数总结如下,一来我可以方便后续的时候,二来若能为同行业的人士提…

在对数据进行分析之前,首先需要对数据的分布状况有一个大致的了解,这为后续的数据预处理工作提供一定的方向。 即将过年啦,现在把我之前在工作写下的小函数总结如下,一来我可以方便后续的时候,二来若能为同行业的人士提供方便,那也是很棒的喔!

## 数据的描述性统计
def dataDescription(data_df):
    from collections import OrderedDict
    dict_result = OrderedDict()
    ## 最小值
    dict_result['Min.']= data_df.min() 
    ## 下四分位数
    dict_result['1st Qu.']= data_df.quantile(q = 0.25)
    ## 中位数
    dict_result['Median']= data_df.median() 
    ## 均值
    dict_result['Mean']= data_df.mean()
    ## 上四分位数
    dict_result['3rd Qu.']= data_df.quantile(q = 0.75)
    ## 最大值
    dict_result['Max.']= data_df.max() 
    ## 缺失值的个数
    dict_result['NA counts']= data_df.isnull().sum()
    return  pd.DataFrame(dict_result).T
if __name__ == '__main__':
    import pandas as pd
    import numpy as np
    data = pd.read_csv('data/cs-training.csv')
    ## 调用描述性统计函数,描述数据各个指标
    describe_data = dataDescription(data)

本文链接: http://www.dtmao.cc/news_show_2000072.shtml

附件下载

相关教程

    暂无相关的数据...

共有条评论 网友评论

验证码: 看不清楚?