Tag:encoding

SAS导入导出时编码问题汇总

获得SAS默认编码(其实是通过启动时加载配置文件决定的,nls), "D:\Program Files\SASHome9.4\SASFoundation\9.4\sas.exe" -CONFIG "d:\Program Files\SASHome9.4\SASFoundation\9.4\nls\zh\sasv9.cfg" 启动后无法修改,如果尝试通过下面命令设置,会得到警告, option encoding='utf-8'; WARNING 30-12: SAS option ENCODING is valid only at startup of the SAS System. The SAS option is ignored. %put &sysencoding;…

Read More

R语言下如何获得正确的文件编码

一个UTF-8的csv文件(可以在Windows下用notepad新建一个包含中文字符的文件,并在保存时编码选择UTF-8),在mac OS下读取没有任何问题, > read.csv("~/tmp/utf8.txt") 测试 <0 rows> (or 0-length row.names) 同样的代码,在Windows下报错, > read.csv("c:\\soft\\utf8.txt") Error in make.names(col.names, unique = TRUE) : invalid multibyte string 1 即使指定编码,输出仍然是乱码, > read.csv("c:\\soft\\utf8.txt",fileEncoding = "UTF-8") X.…

Read More

如何快速获得一个文件的类型和所使用的编码信息

前文iconv批量转换字符集编码的利器, 说到通过UltraEdit来得知CSV的编码是Unicode(对于小文件,Notepad也可以代劳),那么有什么更简便的办法获得文件的编码,甚至文件类型(Mime-type)呢? Linux下有个非常实用的file command, 现在我把它移植到Windows中来了。 下载地址:file-win32-5.28.zip 官网及源码下载:Fine Free File Command 使用方法非常简单,这里举例如下, file test_utf16le.txt test_utf16le.txt: Little-endian UTF-16 Unicode text, with no line terminators file --mime-encoding test_utf16le.txt test_utf16le.txt: utf-16le   file file.exe…

Read More