关联规则算法有哪些,python 集合运算方法,python关联规则算法源代码
首先介绍了包含apriori算法的mlxtend库,
pip安装mlxtend
调用apriori分析关联规则。具体代码如下。在这些数据集中,选取博客《机器学习算法相关规则3354》中的例子,将最小支持度(min_support)设为0.4,最小可靠度(min_threshold)设为0.1,以供参考。
最小提升1.0,对数据集进行关联规则分析。
fromlxtend . preprocessingimporttransactionencoder
from mlxtend . frequency _ patterns importapriori
from mlxtend . frequency _ patterns importassociation _ rules
进口熊猫作为pd
Df_arr=[[苹果,香蕉,梨],
橘子、葡萄、苹果、哈密瓜、火龙果、
香蕉,哈密瓜,火龙果,葡萄,
橘子,橡胶,
[哈密瓜,梨,葡萄]
]
#转换为算法允许的模型(布尔型))))))))))
te=TransactionEncoder()
df_tf=te.fit_transform(df_arr)
df=PD.dataframe(df_TF,columns=te.columns_)
#设置支持度,查找频繁项集。
frequent_itemsets=apriori(df,min_support=0.4,use_colnames=True)).
#找出相关规则,将最低可靠度设为0.15。
rules=association _ rules(frequent _ items ets,metric=confidence ,min_threshold=0.15)))))).
#设置最小升程
rules=rules . drop(rules[rules . lift 1.0])。索引).
#设置标题索引并打印结果
rules . rename(columns={ antecedents : from , consequents:to , support:sup, concont)
rules=rules[[from , to , sup , conf , lift]]
是,打印(规则)
#rules是数据帧格式,可以根据需要保存到文件中。
输出结果如下。
来自超级会议电梯
0)哈密瓜(火龙果)0.4 0.4。56860.68668686661
火龙果(哈密瓜)0.4)1000000)1.4565666676766
甜瓜(葡萄)0.6)1.000000)1.5000000001
葡萄(甜瓜)0.6)1.000000)1.5000000001
葡萄(火龙果)0.4(66667)1。56667.66666666661
火龙果(葡萄)0.4)1.000000)1.546666666676
甜瓜、葡萄(火龙果(0.4)0.66667)36666.666666666667
7)甜瓜、火龙果(葡萄)0.4)1.00000)1.20000000001
葡萄、火龙果(哈密瓜)0.4)1.00001.566666666661
9)哈密瓜(葡萄、火龙果)0.4)0.66667)1 . 56667 . 666666666666
葡萄(哈密瓜、火龙果)0.4)0.66667)1。56667.66666666661
11)火龙果(甜瓜,葡萄)0.4)1.00000)1.20000000001
进程结束,退出代码为0
以上是python实现关联规则算法Apriori的详细例子。关于python实现关联规则算法Apriori的信息,可以参考聚美学院的其他相关文章。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。