Currently browsing tag

SAS

SAS导入导出时编码问题汇总

获得SAS默认编码(其实是通过启动时加载配置文件决定的,nls),

启动后无法修改,如果尝试通过下面命令设置,会得到警告,

WARNING 30-12: SAS option ENCODING is valid only at startup of the SAS System. The SAS option is …

SAS不同版本数据库兼容问题

客户(使用SAS8.2)收到我提供的SAS数据库(SAS9.4),说无法打开,  

网上寻找答案,说可以指定逻辑库的版本号,比如SAS8.2支持V7,

使用v7生成的数据库,SAS8.2仍然不支持,我试着用SAS9.3来同样做了一遍,OK了。 备注:测试SAS8.2,SAS9.3和SAS9.4均只支持V6的读,不支持V6的写。      

R语言关联规则压力测试-arules

前文说到如何用R与PostgreSQL进行数据挖掘之关联规则, 下面使用真实数据使用Apriori算法做个压力测试(系统配置,Windows 2008 64-bit,SSD,128G内存),620items, 163763 transactions。mini confidence和mini support均选择0.00001(选择这么低并没有意义),minlen=2,maxlen=5,输出规则高达3亿5千万之多,现实rule占用16.6G。

  接下来把maxlen增大到6,报内存不足,失败

  同样的数据集,用SAS Enterprise Miner Workstation 13.2测试,失败,代码如下,

SAS 连PostgreSQL的几种方法

SAS 9.4之前,需要ODBC的方式连接PostgreSQL(记得提前配置好DSN),这些方法不仅仅实用于PostgreSQL,很多常用的数据库都可以通过ODBC或者直接连接的方式访问。 方法一,ODBC里执行PostgreSQL的SQL语句

方法二,建逻辑库

方法三,不使用DSN,而是配置ODBC.ini 配置文件(未测试过,这个比较适合Linux环境)

方法四,SAS 9.4开始可以直接连接PostgreSQL等多种数据库了,使用更简单了,

  SAS导入PostgreSQL的注意事项, PostgreSQL鼓励使用Text(不指定长度的varchar),但SAS会因为它不指定长度,而使用默认的最大长度(1024),这样导致SAS库变得非常大,而访问非常缓慢,如下图所示,在PostgreSQL里,clustername是text,clustername1则是varchar(20),所以记得重新定义下长度,这种情况下,ODBC里执行PostgreSQL的命令相对最好用。   P.S. 从SAS9.4开始,SAS/ACCESS 接口增加了更多的数据库支持, Amazon Redshift, Aster, …

实用SAS 代码片段

SAS表的Name是类似_COL0,_COL1,_COL2这样的字段,Label是中文名,直接导出到PostgreSQL的话,字段实用的是Name,

这时候需要做rename,代码,

 

SAS University Edition安装体验

正版SAS很贵,盗版的很难安装,想学习SAS,可以试试SAS University Edition,它基于虚拟机和网页操作,带SAS Studio, 正版,免费,轻巧,好用! 下面通过执行一些简单代码来看看产品版本信息和证书信息,

官方提供都安装方法如下, ® University Edition:Oracle VirtualBox 快速入门 以下说明适用于在 Windows、Macintosh 和 Linux 操作环境中使用 Oracle …

ReadStat: 免费 SAS, Stata, SPSS,RData,CSV之间互转工具

ReadStat是一款开源,跨平台的多格式数据互转工具(命令行程序),支持格式如下, SAS: SAS7BDAT and SAS7BCAT(读,写) Stata: DTA(读,写) SPSS: POR and SAV(读,写) R:rdata and RDS(读,写) CSV(写) XLSX(写) 下面是我在Macbook Pro下使用MXE编译的,偷懒,没有集成librdata和libxlsxwriter,欢迎下载试用(内存和CPU耗用非常小,速度还不错)。 readstat Windows64位版本 readstat win32版本 …