Tag:SAS

SAS导入导出时编码问题汇总

获得SAS默认编码(其实是通过启动时加载配置文件决定的,nls), "D:\Program Files\SASHome9.4\SASFoundation\9.4\sas.exe" -CONFIG "d:\Program Files\SASHome9.4\SASFoundation\9.4\nls\zh\sasv9.cfg" 启动后无法修改,如果尝试通过下面命令设置,会得到警告, option encoding='utf-8'; WARNING 30-12: SAS option ENCODING is valid only at startup of the SAS System. The SAS option is ignored. %put &sysencoding;…

Read More

R语言关联规则压力测试-arules

前文说到如何用R与PostgreSQL进行数据挖掘之关联规则, 下面使用真实数据使用Apriori算法做个压力测试(系统配置,Windows 2008 64-bit,SSD,128G内存),620items, 163763 transactions。mini confidence和mini support均选择0.00001(选择这么低并没有意义),minlen=2,maxlen=5,输出规则高达3亿5千万之多,现实rule占用16.6G。 Apriori Parameter specification: confidence minval smax arem aval originalSupport support minlen maxlen target ext 1e-05 0.1 1 none FALSE TRUE 1e-05 2…

Read More

SAS 连PostgreSQL的几种方法

SAS 9.4之前,需要ODBC的方式连接PostgreSQL(记得提前配置好DSN),这些方法不仅仅实用于PostgreSQL,很多常用的数据库都可以通过ODBC或者直接连接的方式访问。 方法一,ODBC里执行PostgreSQL的SQL语句 PROC SQL; CONNECT TO ODBC(DSN="ml"); /* con-Name : is the ODBC connection name. Connection should be pre established */ CREATE TABLE temp_sas AS SELECT * FROM CONNECTION…

Read More

实用SAS 代码片段

SAS表的Name是类似_COL0,_COL1,_COL2这样的字段,Label是中文名,直接导出到PostgreSQL的话,字段实用的是Name, NOTE: SAS 变量标签、格式和长度并未写入 DBMS 表。 这时候需要做rename,代码, libname sas"X:\job\xxx\data"; libname psql odbc datasrc = 'PostGreSQL30' schema = alitrack PRESERVE_TAB_NAMES=yes; *sas.Member的表结构信息输出到sas.Member_label proc contents data=sas.Member out=sas.Member_label noprint; run; *拼接rename字段 proc sql; select…

Read More

SAS University Edition安装体验

正版SAS很贵,盗版的很难安装,想学习SAS,可以试试SAS University Edition,它基于虚拟机和网页操作,带SAS Studio, 正版,免费,轻巧,好用! 下面通过执行一些简单代码来看看产品版本信息和证书信息, /* Output current version of SAS */ proc product_status; run; For Base SAS Software ... Custom version information: 9.4_M3 Image version information: 9.04.01M3P060315 For…

Read More

ReadStat: 免费 SAS, Stata, SPSS,RData,CSV之间互转工具

ReadStat是一款开源,跨平台的多格式数据互转工具(命令行程序),支持格式如下, SAS: SAS7BDAT and SAS7BCAT(读,写) Stata: DTA(读,写) SPSS: POR and SAV(读,写) R:rdata and RDS(读,写) CSV(写) XLSX(写) 下面是我在Macbook Pro下使用MXE编译的,偷懒,没有集成librdata和libxlsxwriter,欢迎下载试用(内存和CPU耗用非常小,速度还不错)。 readstat Windows64位版本 readstat win32版本 P.S. 尝试将一个5G的sas7bdat文件转为csv,32位的耗时更小,原因尚不清楚。

Read More