关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化
原文链接:http://tecdat.cn/?p=22732
原文出处:拓端数据部落公众号
关联规则挖掘是一种无监督的学习方法 , 从交易数据中挖掘规则 。 它有助于找出数据集中的关系和一起出现的项目 。 在这篇文章中 , 我将解释如何在R中提取关联规则 。
关联规则模型适用于交易数据 。 交易数据的一个例子可以是客户的购物历史 。
数据分析的第一件事是了解目标数据结构和内容 。 出于学习的目的 , 我认为使用一个简单的数据集更好 。 一旦我们知道了这个模型 , 就可以很容易地把它应用于更复杂的数据集 。
在这里 , 我们使用杂货店的交易数据 。 首先 , 我们创建一个数据框并将其转换为交易类型 。
读取数据
- n=500 # 交易数量
- trans <- data.frame() # 收集数据的数据框架
- for(i in 1:n)
- {
- count <- sample(1:3, 1) # 从1到3的物品计数
- 如果(i %% 2 == 1)
- {
- if(!add_product %in% selected)
- {
- tran <- data.frame(items = add_product, tid = i)
文章图片
接下来 , 我们需要将生成的数据框转换为交易数据类型 。
- as(split([, "items"], [, "tid"]), "transa")
文章图片
为了检查交易数据的内容 , 我们使用 inspect() 命令 。
文章图片
挖掘规则 sort(rules_1, dby = "confidence")
文章图片
文章图片
我们从上面的列表中获取第一个rhs项(规则后项)来检查该项的规则 。 但如果你知道目标项目 , 可以在参数中只写rhs="melon" 。
- inspect(rules_1@rhs[1])
文章图片
> rhs_item <- gsub("\\}","", rhs)
文章图片
我们为我们的rhs_item建立规则
文章图片
按 "置信度 "排序并检查规则
- sort(rules_2, "confidence")
文章图片
结果可视化 最后 , 我们从规则集_2中绘制出前5条规则 。
> plot(rules_2[1:5])
文章图片
绘制全部规则
文章图片
交互可视化 绘制出前5条规则
- precision = 3
- igraphLayout = layout_nicely
- list(nodes = nodes, edges = edges, nodesToDataframe = nodesToDataframe,
- edgesToDataframe = edgesToDataframe,
- x$legend <- legend
- htmlwidgets::createWidget( x, width = width,
- height = height)
文章图片
绘制全部规则
文章图片
文章图片
文章图片
最受欢迎的见解
1.采用spss-modeler的web复杂网络对所有腧穴进行分析
2.用R语言和python进行社交网络中的社区检测
3.R语言文本挖掘NASA数据网络分析 , tf-idf和主题建模
4.在R语言中使用航空公司复杂网络对疫情进行建模
5.python隶属关系图模型 基于模型的网络中密集重叠社区检测
6.使用Python和SAS Viya分析社交网络
7.关联网络分析:已迁离北京外来人口的数据画像
8.情感语义网络:游记数据感知旅游目的地形象
【关联规则|拓端数据tecdat:R语言关联规则模型(Apriori算法)挖掘交易数据与交互可视化】9.用关联规则数据挖掘探索药物配伍中的规律
推荐阅读
- Tencent|微信小程序新规则:调用个人敏感信息将需授权
- 系列|OPPO Find X5渲染图的相机造型继续不规则凸起!还多出一块?
- 电子商务|淘宝新增未成年人保护、欺诈招工禁售规则
- 规则|联想拯救者游戏设备统一命名规则:Y700 平板和 Y90 手机即将发布
- 最新消息|新年前夜临近,Airbnb正在收紧“反派对”租房规则
- 最新消息|除夕夜临近,Airbnb正在收紧“反派对”租房规则
- 最新消息|薇娅夫妇名下共有36家关联公司 近两月多家被列入经营异常
- 规则|打破UI设计规则的“留海”,微软率先进行响应
- Epic|Epic《FF7RE》或为限时独占 网友发现Steam关联文件
- 通信|世界首台光学示波器问世,有望改变通信技术游戏规则