package Java包装类 resultMap centos8 methods sed tcp webkit 进销存源码 jquery删除子元素 centos查看python版本 maven插件 cad正在执行命令 python基础 mysql教程 python随机整数 java在线学习 java8特性 java语法基础 java时间格式 linux基础教程 linux如何安装 网络适配器驱动 雪地求生 摩斯密码翻译器 蓝牙测试软件 phpword 游戏python界面编程 数组求和 js文件上传 免费微信答题制作 js获取数组长度 cdr字体变形 头条视频解析 winsxs可以删除吗 appsync补丁 文字转音频软件 ajax获取数据 汪文君 达芬奇resolve
当前位置: 首页 > 学习教程  > python

python_数据分析_广东省历年专利申请数量和类别

2021/2/8 12:16:09 文章标签: 测试文章如有侵权请发送至邮箱809451989@qq.com投诉后文章立即删除

因为手上有相关专利数据,想着还是做点分析吧,万一对社会有价值呢? 原始数据如下: 处理分析后的数据如下: 分析的代码如下: import pandas as pd import os import matplotlib.pyplot as plt os.chdir(…

因为手上有相关专利数据,想着还是做点分析吧,万一对社会有价值呢?
原始数据如下:
在这里插入图片描述

处理分析后的数据如下:
在这里插入图片描述

分析的代码如下:

import pandas as pd
import os
import matplotlib.pyplot as plt
os.chdir(r'D:\data\广东省\\')
dir = r'D:\data\广东省\\'
save = r'D:\data\专利数据\\'
'''
本文件重要统计分析内容:
1、统计广东省历年专利公告数量
2、专利分类统计
'''
ton = pd.read_csv(save + '专利统计分析数据.csv', engine='python')
ton['size'] = ton['size'].map(lambda x:int(x))

def count_data():
    files = os.listdir(dir)
    for file in files:
        data = pd.read_excel(dir+file)
        data['category'] = data['分类号'].map(lambda x:x[:1])
        year = file.split('.')[0].split('_')[1]
        groups = data.groupby('category').size()
        groups = groups.reset_index(name='size')
        groups['year'] = year
        groups.to_csv(save+'专利统计分析数据.csv',index=False,header=False,mode='a')


def year_size():
    year_count = ton.groupby('year').agg({'size':sum})
    year_count.plot()
    plt.show()

year_size()


def category_size():
    year_count = ton.groupby('category').agg({'size':sum})
    year_count.plot()
    plt.show()

category_size()

如需要更详细的分析、或者需要数据,请到我其他文章找到我的qq

AI信仰者 数据挖掘专家 机器学习专家 AI领军人物
擅长大数据挖掘、机器学习和深度学习
擅长Java、Python、Javascript等编程语言
在金融、交通、工业等方向有丰富的项目经验

本文链接: http://www.dtmao.cc/news_show_2000330.shtml

附件下载

相关教程

    暂无相关的数据...

共有条评论 网友评论

验证码: 看不清楚?