基于堆栈模型的数据挖掘算法研究
A Data Mining Algorithm Based on Stack Model
-
摘要: 基于关联规则的数据挖掘算法的时空耗费关键主要有两个:一个是需要对海量事务数据库进行多趟扫描.另一个是在JOIN运算中产生了大量潜在频繁项集.提出了利用堆栈模型动态生成频繁项集,每次用上次生成结果来产生新的频繁项集,边产生边判断,把满中最小信任度的频繁项集存放于链表中,减少了JOIN运算产生的多余项所占用的空间耗费.利用事务压缩法来减少事务库数据规模,对每次扫描后的事务数据库进行优化,从而达到减少空间耗费和扫描规模,提高效率的目的.
-
关键词:
- 数据挖掘,关联规则,堆栈模型,算法
-
-
计量
- 文章访问数: 267
- HTML全文浏览数: 124
- PDF下载数: 0
- 施引文献: 0