关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化

原文链接:http://tecdat.cn/?p=22732
原文出处:拓端数据部落公众号
关联规则挖掘是一种无监督的学习方法 , 从交易数据中挖掘规则 。 它有助于找出数据集中的关系和一起出现的项目 。 在这篇文章中 , 我将解释如何在R中提取关联规则 。
关联规则模型适用于交易数据 。 交易数据的一个例子可以是客户的购物历史 。
数据分析的第一件事是了解目标数据结构和内容 。 出于学习的目的 , 我认为使用一个简单的数据集更好 。 一旦我们知道了这个模型 , 就可以很容易地把它应用于更复杂的数据集 。
在这里 , 我们使用杂货店的交易数据 。 首先 , 我们创建一个数据框并将其转换为交易类型 。
读取数据

  1. n=500 # 交易数量
  2. trans <- data.frame() # 收集数据的数据框架
创建数据并将其收集到交易数据框中 。
  1. for(i in 1:n)
  2. {
  3. count <- sample(1:3, 1) # 从1到3的物品计数
  4. 如果(i %% 2 == 1)
  5. {
  6. if(!add_product %in% selected)
  7. {
  8. tran <- data.frame(items = add_product, tid = i)
检查交易数据框中的数据 。

关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片

接下来 , 我们需要将生成的数据框转换为交易数据类型 。
  1. as(split([, "items"], [, "tid"]), "transa")

关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片

为了检查交易数据的内容 , 我们使用 inspect() 命令 。

关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片

挖掘规则 sort(rules_1, dby = "confidence")

关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片


关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片

我们从上面的列表中获取第一个rhs项(规则后项)来检查该项的规则 。 但如果你知道目标项目 , 可以在参数中只写rhs="melon" 。
  1. inspect(rules_1@rhs[1])

关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片

> rhs_item <- gsub("\\}","", rhs)

关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片

我们为我们的rhs_item建立规则

关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片

按 "置信度 "排序并检查规则
  1. sort(rules_2, "confidence")

关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片

结果可视化 最后 , 我们从规则集_2中绘制出前5条规则 。
> plot(rules_2[1:5])

关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片

绘制全部规则

关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片

交互可视化 绘制出前5条规则
  1. precision = 3
  2. igraphLayout = layout_nicely
  3. list(nodes = nodes, edges = edges, nodesToDataframe = nodesToDataframe,
  4. edgesToDataframe = edgesToDataframe,
  5. x$legend <- legend
  6. htmlwidgets::createWidget( x, width = width,
  7. height = height)

关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片

绘制全部规则

关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片


关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片


关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
文章图片

最受欢迎的见解
1.采用spss-modeler的web复杂网络对所有腧穴进行分析
2.用R语言和python进行社交网络中的社区检测
3.R语言文本挖掘NASA数据网络分析 , tf-idf和主题建模
4.在R语言中使用航空公司复杂网络对疫情进行建模
5.python隶属关系图模型 基于模型的网络中密集重叠社区检测
6.使用Python和SAS Viya分析社交网络
7.关联网络分析:已迁离北京外来人口的数据画像
8.情感语义网络:游记数据感知旅游目的地形象
【关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化】9.用关联规则数据挖掘探索药物配伍中的规律

    推荐阅读