数据挖掘

数据挖掘

(一)第一章 导论 学时:2

教学内容:数据挖掘的社会需求;什么是数据挖掘;数据挖掘的数据来源;数据挖掘的分类;数据挖掘的体系结构;数据挖掘与其他相关技术;数据挖掘工具的评价标准。

教学要求:本章作为导论,其目的是让学生对数据挖掘技术有一个总体的认识。要求学生能够对数据挖掘的产生背景、技术的概念及发展趋势有所了解,进而了解本课程的教学目的。

重点、难点:数据挖掘的产生背景。

实验课、习题课、讨论课等教学形式:理论课。

(二)第二章 数据仓库技术 学时:4

教学内容:数据仓库的发展;数据仓库与数据库的区别;数据仓库的定义;数据仓库系统的结构;数据仓库建模;联机分析处理(OLAP);数据仓库与数据挖掘的关系。

教学要求:要求学生了解和掌握数据仓库的产生背景、数据仓库的体系结构与功能、数据仓库的多维数据模型、数据仓库的联机分析处理 (OLAP)技术,以及数据仓库与数据挖掘的关系。

重点、难点: 数据库与数据仓库的区别,数据仓库的多维数据模型

实验课、习题课、讨论课等教学形式:理论课

(三)第三章 数据预处理 学时:2

教学内容:为什么对数据进行预处理;数据清理;数据集成和变换;数据归约;离散化和概念分层生成

教学要求:要求学生了解数据预处理的基本过程及基本技术,明确数据预处理对数据挖掘整个过程的重要性。

重点、难点:数据清理、数据集成和数据规约。

实验课、习题课、讨论课等教学形式:理论课。

(四)第四章 关联分析技术 学时:6

教学内容:关联规则概念;关联规则挖掘过程;布尔型关联规则(Apriori算法与FP-Growth算法)、多值关联规则、可扩展的关联规则、多层关联规则及约束性关联规则等挖掘技术。

教学要求:要求学生了解关联规则能够解决的问题,以及解决问题的方法,熟悉掌握布尔型关联规则挖掘算法,并能够进行简单的应用。

重点、难点:布尔型关联规则Apriori类算法;可扩展的关联规则算法。

实验课、习题课、讨论课等教学形式:理论课

(五)第五章 分类分析技术 学时:8

教学内容:分类分析技术解决问题的能力;分类分析的挖掘过程;决策树分类分析方法(ID3和C4.5算法);可扩展的分类算法SLIIQ;随机森林原理及算法;贝叶斯分类算法。

教学要求:要求学生了解分类分析所能解决问题的能力,分类分析的过程;熟悉掌握ID3和C4.5决策树算法,并能够应用于解决实际问题。

重点、难点:C4.5决策树分类算法,随机森林原理与算法。

实验课、习题课、讨论课等教学形式:理论课

(六)第六章 聚类分析技术 学时:6

教学内容:聚类分析是什么;聚类分析能干什么;聚类分析的目标;聚类分析有哪些方法;距离和相似性系数;划分聚类算法(Kmeans算法,PAM算法);层次聚类算法(合并法,BIRCH算法);密度聚类算法(DBSCAN算法)。

教学要求:要求学生了解聚类分析所能解决问题的能力及聚类分析的过程;熟悉掌握划分聚类算法和密度聚类算法,并能够用聚类算法解决实际问题。

重点、难点:Kmeans算法、PAM算法和DBSCAN算法。

实验课、习题课、讨论课等教学形式:理论课

(七)第七章 序列模式挖掘 学时:4

教学内容:序列模式挖掘的原理;序列模式挖掘流程;AprioriAll算法;AprioriSome算法;DynamicSome算法;有时间约束的序列模式挖掘 GSP;FreeSpan算法。

教学要求:要求学生了解序列模式挖掘所能解决问题的能力及序列模式挖掘的过程;掌握Apriori类算法,并能够用以解决简单的实际应用问题。

重点、难点:AprioriAll算法、AprioriSome算法;DynamicSome算法;有时间约束的序列模式挖掘 GSP算法。

实验课、习题课、讨论课等教学形式:理论课。

相关推荐

合作伙伴