Tag:关联规则

R语言关联规则压力测试-arules

前文说到如何用R与PostgreSQL进行数据挖掘之关联规则, 下面使用真实数据使用Apriori算法做个压力测试(系统配置,Windows 2008 64-bit,SSD,128G内存),620items, 163763 transactions。mini confidence和mini support均选择0.00001(选择这么低并没有意义),minlen=2,maxlen=5,输出规则高达3亿5千万之多,现实rule占用16.6G。 Apriori Parameter specification: confidence minval smax arem aval originalSupport support minlen maxlen target ext 1e-05 0.1 1 none FALSE TRUE 1e-05 2…

Read More

如何用R与PostgreSQL进行数据挖掘之关联规则

前面用PostgreSQL 函数实现了一个简易版的关联规则算法,今天尝试下R语言的关联规则包“arules”中的apriori算法。 连接数据库并读取数据 library(RPostgreSQL) drv <- dbDriver("PostgreSQL") con <- dbConnect(drv, user='postgres', dbname='steven', password='', host='127.0.0.1') rs <- dbSendQuery(con,"select customer_id,brand from trans;") results <- fetch(rs,n=-1) trans表的结构和数据示例如下, CREATE TABLE public.maoye ( customer_id text…

Read More

PostgreSQL-关联规则的纯SQL实现

该SQL是基于Apriori算法的一个尝试(代码比较粗糙),并且只实现了一推一的情况,对照MadLib的结果做了验证,没有问题。 CREATE OR REPLACE FUNCTION assoc.rules() RETURNS void LANGUAGE plpgsql AS $function$ begin /* create view assoc.trans as select * from trans where purchase_date between '2015-08-01' and '2016-07-31'; */ create…

Read More