关联规则算法有哪些,python 集合运算方法,python关联规则算法源代码

  关联规则算法有哪些,python 集合运算方法,python关联规则算法源代码

  首先介绍了包含apriori算法的mlxtend库,

  pip安装mlxtend

  调用apriori分析关联规则。具体代码如下。在这些数据集中,选取博客《机器学习算法相关规则3354》中的例子,将最小支持度(min_support)设为0.4,最小可靠度(min_threshold)设为0.1,以供参考。

  最小提升1.0,对数据集进行关联规则分析。

  fromlxtend . preprocessingimporttransactionencoder

  from mlxtend . frequency _ patterns importapriori

  from mlxtend . frequency _ patterns importassociation _ rules

  进口熊猫作为pd

  Df_arr=[[苹果,香蕉,梨],

  橘子、葡萄、苹果、哈密瓜、火龙果、

  香蕉,哈密瓜,火龙果,葡萄,

  橘子,橡胶,

  [哈密瓜,梨,葡萄]

  ]

  #转换为算法允许的模型(布尔型))))))))))

  te=TransactionEncoder()

  df_tf=te.fit_transform(df_arr)

  df=PD.dataframe(df_TF,columns=te.columns_)

  #设置支持度,查找频繁项集。

  frequent_itemsets=apriori(df,min_support=0.4,use_colnames=True)).

  #找出相关规则,将最低可靠度设为0.15。

  rules=association _ rules(frequent _ items ets,metric=confidence ,min_threshold=0.15)))))).

  #设置最小升程

  rules=rules . drop(rules[rules . lift 1.0])。索引).

  #设置标题索引并打印结果

  rules . rename(columns={ antecedents : from , consequents:to , support:sup, concont)

  rules=rules[[from , to , sup , conf , lift]]

  是,打印(规则)

  #rules是数据帧格式,可以根据需要保存到文件中。

  输出结果如下。

  来自超级会议电梯

  0)哈密瓜(火龙果)0.4 0.4。56860.68668686661

  火龙果(哈密瓜)0.4)1000000)1.4565666676766

  甜瓜(葡萄)0.6)1.000000)1.5000000001

  葡萄(甜瓜)0.6)1.000000)1.5000000001

  葡萄(火龙果)0.4(66667)1。56667.66666666661

  火龙果(葡萄)0.4)1.000000)1.546666666676

  甜瓜、葡萄(火龙果(0.4)0.66667)36666.666666666667

  7)甜瓜、火龙果(葡萄)0.4)1.00000)1.20000000001

  葡萄、火龙果(哈密瓜)0.4)1.00001.566666666661

  9)哈密瓜(葡萄、火龙果)0.4)0.66667)1 . 56667 . 666666666666

  葡萄(哈密瓜、火龙果)0.4)0.66667)1。56667.66666666661

  11)火龙果(甜瓜,葡萄)0.4)1.00000)1.20000000001

  进程结束,退出代码为0

  以上是python实现关联规则算法Apriori的详细例子。关于python实现关联规则算法Apriori的信息,可以参考聚美学院的其他相关文章。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: