Currently browsing tag

sas7bdat

奇怪的中文字符导致多个开源sas7bdat解析程序崩溃

最近在用开源软件解析sas7bdat时,经常碰到这样的错误(haven,readstat),

或者(parso),

  造成这样错误的sas7bdat由下面的代码生成,

继续尝试了sas7bdat.py,通过,

P.S. 刚刚Mac下测试了最新的haven通过,

  sas7bdat (R版本),可以解析,但不输出中文变量,而是用一组特殊字符(比如,X.bf..c2..c4..dd…fb..90)替代。

   

没有SAS,如何解析读取SAS7BDAT?

ReadStat(c) haven(R, bases on ReadStat),最新版读取5G的sas7bdat成功 sas7bdat(R),读取5G的sas7bdat失败 sas7bdat.parso(R, 基于 parso), 未测试 spark-sas7bdat(sparkR, 基于 parso), spark版本,读取5G的sas7bdat成功,但后续分析失败 parso(java), 读取5G的sas7bdat成功, 并基于它写了一个H2 Databased存储过程sasread sas7bdat(python),读取5G的sas7bdat成功

ReadStat: 免费 SAS, Stata, SPSS,RData,CSV之间互转工具

ReadStat是一款开源,跨平台的多格式数据互转工具(命令行程序),支持格式如下, SAS: SAS7BDAT and SAS7BCAT(读,写) Stata: DTA(读,写) SPSS: POR and SAV(读,写) R:rdata and RDS(读,写) CSV(写) XLSX(写) 下面是我在Macbook Pro下使用MXE编译的,偷懒,没有集成librdata和libxlsxwriter,欢迎下载试用(内存和CPU耗用非常小,速度还不错)。 readstat Windows64位版本 readstat win32版本 …