R語言讀取excel文件

Excel R語言 Java 技術 數學之美 2017-03-28
R語言讀取excel文件文件其實有很多的包可以做到,最常用的就是xlsx和readxl, 首先,安裝並載入讀取excel文件所用的包:
install.packages("xlsx")
library(xlsx)

或者,

install.packages("readxl")
library(readxl)

兩個包的基本介紹

  • xlsx是用R把excel文件中的工作表以data.frame的格式讀入R語言,他有兩個常用函數,其中read.xlsx2通常會比read.xlsx讀取的速度更快一些,因為它的好多工作是利用Java完成的,所以速度有所提升,但是在讀取子數據集的時候沒有read.xlsx穩定性好。

read.xlsx(file, sheetIndex, sheetName=NULL, rowIndex=NULL, startRow=NULL, endRow=NULL, colIndex=NULL, as.data.frame=TRUE, header=TRUE, colClasses=NA, keepFormulas=FALSE, encoding="unknown", ...)

read.xlsx2(file, sheetIndex, sheetName=NULL, startRow=1, colIndex=NULL, endRow=NULL, as.data.frame=TRUE, header=TRUE, colClasses="character", ...)

注:

  1. sheetIndex:工作表單號

  2. rowIndex:行號,就是你想讀取那些行

  3. header:表頭,就是有沒有列名。比如姓名,年齡,學號等

  4. startRow:比如你想從第五行開始讀取,就設置startRow = 5

  • readxl包可以用來讀取xls和xlsx格式的文件

read_excel(path, sheet = 1, col_names = TRUE, col_types = NULL, na = "", skip = 0)

注:

  1. sheet:讀取的工作表

  2. col_names: 如果是FALSE的話,就表示第一行不是列名,R會自動給你取成x1,x2...

  3. colt_types: blank,numeric,date,text

  4. na: 缺失值,默認空著的單元是缺失值,你也可以自己指定,比如認為999是缺失值

相關推薦

推薦中...