关联规则和决策树的应用
更新时间:2023-08-11 01:58:01 阅读量: 经管营销 文档下载
数据挖掘—关联规则与决策树的应用
关联规则的概念 关联规则用来发现在同一事件中出现的不 同项的相关性,即找出事务中频繁发生的 项或属性的所有子集,以及项目之间的相 互关联性。 关联规则就是形如XY的逻辑蕴含关系,其 中XI,YI且XY=Φ,X称作规则的前件,Y是 结果,对于关联规则XY,存在支持度和信 任度。关联规则就是支持度和信任度分别 满足用户给定阈值的规则。
关联规则的分类 基于关联规则中处理的变量的类别,可以 分为布尔型和数值型两种。 基于规则中数据的抽象层次分类,可以分 为单层关联规则和多层关联规则。
关联规则的分类 基于模式与规则之间的相互关系分类,可 以分为完全频繁模式挖掘、最大频繁模式 挖掘和闭合频繁模式挖掘。 基于规则中涉及到的数据的维数分类,关 联规则可以分为单维的和多维的。 基于模式与规则之间的相互关系分类,可 以分为完全频繁模式挖掘、最大频繁模式 挖掘和闭合频繁模式挖掘。
关联规则的算法 1993年,R.Agrawal等人首次提出了挖掘顾 客交易数据中项目集间的关联规则问题, 其核心是基于两阶段频繁集思想的递推算 法。该关联规则在分类上属于单维、单层 及布尔关联规则,典型的算法是Aprior算 法。
Apriori的两个步骤 第1步:通过迭代,检索出源数据中的所有 频繁项集,即支持度不低于用户设定的阀 值的项集; 第2步:利用第1步中检索出的频繁项集构 造出满足用户最小信任度的规则。
Apriori算法的优缺点 Apriori算法的一个突出优势是其对大型数 据库的处理能力,不需将事务数据库读入 内存就可以完成挖掘任务。 缺点是需要多次扫描数据库。
Apriori的改进 对其连接和剪枝过程进行优化,在此基础 上产生了很多变体。– 大都采用同Apriori同样的产生候选集的思想 – 包括基于hash的技术、划分、取样、使用垂直 数据格式等。 – 这些算法的侧重点一般在于:减少扫描数据的 次数;减少产生的候选集数目;减少候选频繁 项集的计算时间。
正在阅读:
关联规则和决策树的应用08-11
浅谈《梁祝》小提琴协奏曲05-26
学习资料(公文写作分类)03-08
廉洁从政实施方案05-10
旷课检讨书02-17
端午节知识竞赛50题04-20
公盛小学2012双拥工作领导小组10-21
- 教育局拟征求中考升学奖励制度
- 2020房地产销售主管年终工作总结
- 虚拟多台位互感器检定装置投资项目可行性分析
- 车间工人辞职报告范本
- 溴投资项目可行性分析
- 改名字申请书怎么写
- 忧与爱作文素材
- 溴苯腈投资项目可行性分析
- 2020清华大学考研复试时间:3月6日至22日
- 2020年蚌埠高考查分系统网址
- 2020年二建《建筑工程实务》测试题及答案(13)
- 生死感悟——人间世观感一
- 武陵源区军地小学观看魏书生《如何当好班主任》讲座录像
- 全球10大安全旅游国出炉日本排名第9
- 企业策划书模板
- 高中英语教师工作总结3篇
- 法定代表人证明范本
- 大学助学金申请书范文1700字
- 案外人申请不予执行仲裁裁决司法解释施行首份申请书递交齐齐哈尔...
- 环球国际房地产开发项目策划
- 关联
- 决策
- 规则
- 应用