课程介绍
数据挖掘导论》是在人工智能及大数据时代,面向计算机科学与技术、软件工程、人工智能等专业本科生开设的一门专业课程,也是人工智能科学及大数据科学的重要核心课程之一。数据挖掘理论技术是在机器学习、统计学、人工智能和数据库技术等多种理论技术的基础上发展起来的一项多学科交叉的新兴理论技术,具有较强的理论性和实践性。数据挖掘的目的是寻找和发现数据中潜在的、有价值的信息、知识和模式。
本课程是数据挖掘学科的入门级课程,通过本课程的学习,让大家理解数据挖掘的基本概念,掌握基本的数据挖掘和机器学习的理论、模型及算法,熟悉1-2个主流的数据挖掘实验平台,逐步建立“数据”思维方式。
课程大纲
学习目标
课程目标1:了解数据挖掘学科产生的背景和发展过程,理解数据挖掘课程的基本概念,包括机器学习和数据仓库的相关概念;
课程目标2:掌握数据挖掘常用的算法和技术,包括聚类算法、关联规则、决策树、人工神经网络等算法,理解并掌握回归等常见的统计技术;
课程目标3:理解并掌握基于数据集的知识发现(KDD)的基本过程,掌握KDD的基本步骤;
课程目标4:理解并掌握常见的评估技术,能对有指导学习模型和无指导学习模型进行评估。能根据数据特点和要求对数据挖掘技术进行合理选择。
课程目标5:熟悉1-2种主流的数据挖掘平台和工具的安装、使用和开发技术,能应用该平台进行数据挖掘建模和分析、评估等任务,应用以上理论和技术解决实际问题。
课程目标6:建立数据分析的思维,形成终身学习的观点,善于学习和应用新的数据挖掘与机器学习领域的新算法理论和工具,了解数据挖掘技术最新进展和前沿成果。
学习要求
本课程具有一定理论性和实践性,需要把线上和线下学习结合起来,把课程理论学习、习题练习、课程讨论、课下上机实践有效结合起来。
考核标准
[线上成绩]
[课件浏览]:__60___%
[客观练习]:__0___%
[主观练习]:__20___%
[课内讨论]:__20___%
[综合成绩]
[线上成绩]:__100___%
[线下成绩]:_0__%
[其他](翻转、论坛等):___0__%
教材教参
1、戴红,常子冠,于宁. 数据挖掘导论. 清华大学出版社,2015.
2、刘鹏,张燕,陶建辉,姜才康,数据挖掘基础,清华大学出版社,2018年6月