树莓派USB excel xml cocoa knockoutjs insert jaxb Parsley Momentjs web前端开发实战项目 jquery循环 java三维数组 hash怎么下载 tomcat调优和jvm调优 java中的接口 java时间类 php项目实例 python 教程 右键菜单背景 轮播图js代码 一件换肤 免费脚本 视频修复工具 mysql使用教程 火萤壁纸下载 华为手机刷公交卡 vue引入第三方js 抠图教程 qq魔法卡片登陆 pp安卓助手 maplesim 微信昵称特殊字符保存 无线网改密码 js继承的几种方式 删除mysql服务 js数组操作 狂战传说套装选择 class选择器 dw网页设计教程 ps颜色查找
当前位置: 首页 > 学习教程  > 编程语言

数据挖掘期末复习速成大法 华南农业大学

2021/1/13 20:24:09 文章标签: 测试文章如有侵权请发送至邮箱809451989@qq.com投诉后文章立即删除

每日不定时持续更新 仅代表博主个人观点,大部分是博主个人语言,与任课老师无关,故请勿乱套帽子 本速成大法包括: 第一部分:重点知识详解第二部分:个人预测必考考点详解 复习大纲 第1章 绪论 【1】数据挖掘…

每日不定时持续更新

仅代表博主个人观点,大部分是博主个人语言,与任课老师无关,故请勿乱套帽子

本速成大法包括:

  • 第一部分:重点知识详解
  • 第二部分:个人预测必考考点详解

复习大纲

  • 第1章 绪论
    【1】数据挖掘的概念
    【2】数据挖掘的研究内容
  • 第2章 数据预处理
    【1】数据预处理的目的
    【2】数据清理
    【3】数据集成和数据变换(数据规范化)
    【4】数据规约
  • 第3章 关联规则挖掘
    【1】关联规则挖掘中的基本概念:项,事务,项集,频繁项集,支持度,置信度,最小支持度,最小置信度等
    【2】Apriori算法的流程(掌握手算步骤)
  • 第4章 决策树分类算法
    【1】决策树的基本概念:内部节点,叶节点,根节点
    【2】基本的决策树生成流程
    【3】 ID3算法(掌握流程和计算方法)
    【4】 C4.5算法与ID3算法的区别
  • 第5章 贝叶斯分类算法
    【1】贝叶斯定理和贝叶斯决策准则
    【2】朴素贝叶斯分类器(写出详细计算流程)
    【3】贝叶斯信念网络(读懂)
  • 第6章 人工神经网络算法
    【1】人工神经元模型
    【2】BP神经网络的原理
  • 第7章 支持向量机
    【1】支持向量机原理
    【2】核函数
    【3】支持向量机的优缺点
  • 第8,9章 K-means和K-中心点聚类算法
    【1】聚类的概念
    【2】距离的定义
    【3】K-means聚类算法流程
    【4】K-means的优点与问题
    【5】K-中心点聚类算法
    【6】基于密度的聚类算法的原理DBSCAN和密度峰值聚类
  • 第10章 SOM神经网络聚类方法
    【1】SOM网络的拓扑结构
    【2】SOM网络的学习算法

第一章:绪论

1.1 数据挖掘的概念

  • 数据挖掘的概念

数量多,不完全,有噪声,模糊的信息 → \rightarrow 我们未知的,有潜在价值,可理解的信息

  • 数据挖掘分三个步骤:数据准备,规律寻找,规律表示

所谓“规律表示”,就是数据可视化

1.2 数据挖掘的研究内容

  • 数据挖掘最常见的五类知识:广义,关联,分类,预测,偏差

广义知识:就是对于数据上宏观的认知,比如你给出一个商店的盈亏数据,那这堆数据在广义上可能表示了一个现象:这个商店生意很好,那么得出生意很好的这个结论就是我们的广义知识。
关联知识:就是两个对象之间的联系是什么,当然后面我们会知道怎样去对这个联系进行一个量化表示。
预测知识:这里是针对时间序列的数据进行预测,用过往发生的事件未来可能出现的。
偏差知识:研究的是指出数据中的“怪异分子”,异常现象,数据挖掘就是这么一个学科,我们既需要关注大众化的数据堆,也要关注那些少数的异常分子,这就是我们的哲学。

  • 数据挖掘的功能:特征化和区分、关联分析、分类预测、聚类、演变分析

特征化:兔子是个怎样的动物?
关联分析::销售啤酒和尿布之间的关系是?
分类预测::某种动物是什么纲目的?预测的话就是:两个小时之后交通量多大?
聚类分析:这群学生里面有几类人?
演变分析:针对时间的种群演化?

数据挖掘的技术举例子:预测技术,关联规则技术,聚类分析技术,人工智能技术,决策树,统计分析,并行计算,可视化技术,进化系统等等。

数据挖掘在生活中的例子:金融领域挺多的,风险评估,效益分析,股市数据预测,医疗也有,药物分子作用的预测和分析,等等。

不用背的,看看就行了


第二章:数据预处理

2.1 数据预处理的目的

为什么我们要进行数据预处理?

因为我们拿到的数据:不完整,有噪声,杂乱模糊。

不完整:就是数据缺失现象
噪声:错误数据混进来了
杂乱模糊:信息重复和冗余,缺乏标准

  • 数据预处理技术包括:数据清理,数据集成,数据变换,数据归约

2.2 数据清理


本文链接: http://www.dtmao.cc/news_show_600291.shtml

附件下载

相关教程

    暂无相关的数据...

共有条评论 网友评论

验证码: 看不清楚?