Month: September 2016

R语言下如何获得正确的文件编码

一个UTF-8的csv文件(可以在Windows下用notepad新建一个包含中文字符的文件,并在保存时编码选择UTF-8),在mac OS下读取没有任何问题, > read.csv("~/tmp/utf8.txt") 测试 <0 rows> (or 0-length row.names) 同样的代码,在Windows下报错, > read.csv("c:\\soft\\utf8.txt") Error in make.names(col.names, unique = TRUE) : invalid multibyte string 1 即使指定编码,输出仍然是乱码, > read.csv("c:\\soft\\utf8.txt",fileEncoding = "UTF-8") X.…

Read More

如何访问局域网内PostgreSQL服务器

提前休假回家过中秋,却没有能好好休息,客户赶进度,而服务器在局域网内,没有通过路由设置把端口暴露出来,也没有VPN,可以远程桌面(RDP),虽然可以访问,但速度太慢,于是想到了前段时间下载的ngrok,一款内网转发服务软件,需要注册才支持TCP服务,试了下,效果还不错。 如果临时使用ngrok是不错的选择,不过免费版本,只能映射一个端口,其实如果自己有外网的服务器或者虚拟主机,plink(windows下使用,linux推荐autossh,plink需要自己写个批处理命令实现for循环,好在短线后自动连接,我写的是死循环)更方便些,不限制端口个数,自己的服务器,安全也能更加保证。

Read More

R语言mapply应用一例

需求:求data frame下两列有交集的元素个数,例如,m2和m3存储的都是以逗号分割的字符串,现在求m2和m3的交集, x1<-data.frame(m1=c(1,2,3),m2=c('f,a,b,c','edfc,avv,c','g,e,f,k') ,m3=c('--,c,b,d','--kr,edfc,avcv,ce','f,g,l,e,l,p') ,stringsAsFactors=F) 答案, x1$gg=mapply(function(x,y) length(intersect(strsplit(x,split=',')],strsplit(y,split=',')])), x1$m2, x1$m3)  

Read More

在Ubuntu下安装RPostgreSQL

在Windows上安装RPostgreSQL非常简单, install.packages("RPostgreSQL") 但同样都命令在Ubuntu(Linux)环境下就会遇到如下错误, checking for "/libpq-fe.h"... no configure: creating ./config.status config.status: creating src/Makevars gcc -std=gnu99 -I/usr/share/R/include -DNDEBUG -I -fpic -g -O2 -fstack-protector-strong -Wformat -Werror=format-security -Wdate-time -D_FORTIFY_SOURCE=2 -g -c RS-DBI.c -o…

Read More

SAS University Edition安装体验

正版SAS很贵,盗版的很难安装,想学习SAS,可以试试SAS University Edition,它基于虚拟机和网页操作,带SAS Studio, 正版,免费,轻巧,好用! 下面通过执行一些简单代码来看看产品版本信息和证书信息, /* Output current version of SAS */ proc product_status; run; For Base SAS Software ... Custom version information: 9.4_M3 Image version information: 9.04.01M3P060315 For…

Read More

PostgreSQL9.5 下安装MADlib

下载安装MADlib前的准备工作,安装编译环境和必要的组件: apt-get update apt-get install build-essential m4 postgresql-server-dev-9.5 \ postgresql-plpython-9.5 git cmake 下载、编译、安装MADlib: git clone https://github.com/apache/incubator-madlib cd incubator-madlib ./configure make install 部署MADlib到指定数据库 /usr/local/madlib/bin/madpack -p postgres -c postgres@127.0.0.1/test install  

Read More

Ubuntu下安装Rattle

Rattle是基于R的一款可视化挖掘工具,是众多知名R GUI的一个,这里介绍下Ubuntu下安装Rattle的注意事项, install.packages("rattle") * installing *source* package ‘RGtk2’ ... ** package ‘RGtk2’ successfully unpacked and MD5 sums checked checking for pkg-config... /usr/bin/pkg-config checking pkg-config is at least version 0.9.0... yes…

Read More