R語言data.table 包

R語言數據結構 C語言科技數學之美 2017-04-11

data.table包是幹什麼的

R語言裡有data.frame的數據結構。data.table是data.frame的一個擴展，它幾乎繼承了所有的data.frame特性，我們通常對data.frame作出的操作，對於data.table同樣也是有效的。那麼data.table存在的價值是什麼呢？它是由C語言寫的，所以運行速度快，數據存儲效率高，像取子集，變量分組，更新變量等操作都要優於data.frame，而且對於大型數據集的支持比較好。所以，如果你還沒有學習過data.frame，可以直接越過它直接學習data.table。

實例中學習

創建數據集

創建data.frame

df <- data.frame(x=rnorm(9),y=rep(c('a','b','c'),each=3),z=rnorm(9))

## x y z

創建data.table

library(data.table)dt <- data.table(x=rnorm(9),y=rep(c('a','b','c'),each=3),z=rnorm(9))

## x y z

查看內存下所有的data table的情況

tables()

## NAME NROW NCOL MB COLS KEY

像data.frame一樣進行操作

dt[2,] #取第二行，所有列

## x y z

dt[dt$y=="a",] #取dt表中y列取值為"a"的所有行

## x y z

和data.frame的區別

dt[c(2,3)] #data.table中索引沒有逗號，默認是按行取，這裡取出的是第2，3行

## x y z

df[c(2,3)] #data.frame沒有逗號默認是按列取得，這裡取出了第2，3列

## y z

取子集操作

data.table包用來取子集的函數與R中常用數據類型有些不同。
它採用：逗號+expression 的表達方式。
一個 expression 是指包含在一對花括號裡的一系列語句。

例1

設想你想要求出x這一列的均值，z這一列的總和：

dt[,list(mean(x),sum(z))]

## V1 V2

例2

設想你想要對y變量各種值出現的頻次做個統計

dt[,table(y)]

## y

例3

設想你想生成新的一列，新列是z那一列的平方

dt[,w:=z^2]

這裡用 data.table，而不是用 data.frame 的好處就體現出來了，data.table 是直接在原來的表裡添加新的一列，而 data.frame 要重新生成一個表，再把新列加進去，所以當數據集很大時，非常佔內存，速度也會下降。

例4

dt2 <- dtdt[,y:=2]

## x y z w

head(dt2,3)

## x y z w

這裡，我們把dt賦值給了dt2，然後修改了dt的值，發現dt2的值也被修改了。也就是說dt和dt2在內存中佔用的是同一個地方，並沒有做到真正的複製。這裡我們需要用 copy 函數來進行真正的複製。

dt3 <- copy(dt)dt[,y:=3]

## x y z w

head(dt3,n=3)

## x y z w

例5

多條expression的情形

這裡我們創建一個叫做 m 的新列，這個表達式包含兩個語句，放在一個花括號裡，語句之間用分號隔開，最後的返回值就是新列的值。

dt[,m:={tmp=x+z;log(abs(tmp)+2)}]

## x y z w m

在對數據進行分組時，常常依據一些判斷條件，例如下面對 a 的正負性進行分組。

dt[,a:=x>0]

## x y z w m a

分組之後就可以求出不同組的一些特徵，例如

dt[,b:=mean(x+w),by=a]

## x y z w m a b

dt[,.N,by=a]

## a N

相關推薦

'java語言的大體概述'

"一、什麼是java語言 Java是一種簡單的，跨平臺的，面向對象的，分佈式的，解釋的，健壯的安全的，結構的中立的，可移植的，性能很優異的多線程的，動態的語言。java是一個編程語言,例如：C語言，C++ ，C#，VB ，彙編語言等等很多編程語言，java是在社會中的主流...

Java Java虛擬機編程語言瀏覽器 C語言程序員數據庫操作系統技術 GNU 彙編語言編譯器 Sun公司人生第一份工作設計程序設計 2019-09-18

'C語言定義無參數的函數時，f()和f(void)有什麼區別？'

"相信C語言初學者常會在前輩留下的項目，或者一些開源項目中看到以 void 作為參數的函數，例如 void fun(void)，雖然我們都明白在C語言中，“void”表示空，但是按理說，如果函數不需要參數，直接空著就行：void fun()，為什麼還要多此一舉的寫上 voi...

C語言 GCC 2019-09-12

'C語言到底有多重要呢？我們大學都要學C語言基礎，這是為什麼？'

"於大部分程序員，C語言是學習編程的第一門語言，很少有不瞭解C的程序員。C語言除了能讓你瞭解編程的相關概念，帶你走進編程的大門，還能讓你明白程序的運行原理，比如，計算機的各個部件是如何交互的，程序在內存中是一種怎樣的狀態，操作系統和用戶程序之間有著怎樣的“愛恨情仇”，這些底...

C語言程序員電腦編程語言軟件 Java 操作系統硬件 Python 面向對象程序編程算法 PHP 彙編語言設計大學 Objective-C 跳槽那些事兒黑客 2019-09-08

'現在這麼多編程語言可學，為什麼還要學那麼舊的C語言？有用嗎？'

"編寫操作系統最常用的編程語言就是C語言了。用C語言編寫的第一個操作系統是 Unix，之後的 GNU/Linux 等操作系統也都是使用C語言編寫的。編寫操作系統最常用的編程語言就是C語言了C語言不僅僅是操作系統語言，也是當今幾乎所有流行的高級編程語言的先驅，這些編程語言多多...

C語言編程語言操作系統程序員 Ruby Perl ARM 電腦 iMac 設計彙編語言 Atmel AVR 智能手機 Intel Core UNIX Linux Atmel Python 英特爾 GNU Java GTK+ 德州儀器 Palm OS PHP 編譯器硬件中央處理器 OpenGL 2019-09-08

'許多高級編程語言都借鑑了C語言的架構，或者乾脆就是C語言編寫的'

C語言編程語言操作系統程序員 ARM 電腦 Atmel AVR iMac 設計 Perl Ruby Intel Core 智能手機 Linux 英特爾彙編語言 GTK+ Atmel 硬件 Python GNU UNIX PHP Palm OS 中央處理器 OpenGL 九陽神功 Java 2019-09-07

'聽說人工智能被這幾種語言給“征服”了'

"人工智能技術的提升不僅為企業的運營帶來了效率，而且為人民的生活帶來了便利。迄今為止，人工智能已經實現了生物識別智能、自動駕駛汽車和人臉識別等等項目。就像大多數軟件應用程序的開發一樣，開發人員也在使用多種語言來編寫人工智能項目，但是現在還沒有任何一種完美的編程語言是可以完全...

人工智能 Java Python JavaScript 編程語言 Java虛擬機機器學習深度學習 Apache 瀏覽器 C語言 Rust GPU R語言無人駕駛 Hadoop Clojure 設計技術 Scala Kotlin 虛擬機 Spark NLTK CSS WebGL 程序員 Google 大數據 2019-09-07

'萬能的C語言，也能像其他語言那樣定義帶“默認參數”的函數嗎？'

"使用C++開發過程序時，定義函數可以指定默認參數，例如 void fun(int x, int y=3); 在調用 fun() 時第二個參數可以不傳遞，此時 fun() 函數默認第二個參數等於 3，例如 f(1) 就相當於 f(1,3)。這是一個很好用的特性，那麼在C語言...

C語言編程語言 Linux 文章 2019-09-06

'Python成高收入國家增長最快語言，你動心了嗎？'

"根據Stack Overflow流量分析了Python及其他一些編程語言的發展情況，同時也對高收入國家與非高收入國家的情況進行了對比。我們最近的研究表明，富裕國家（世界銀行定義為高收入國家）喜歡研究的技術與其他國家的不同。其中，我們看到最大的差異是Python語言。當我們...

Python 泛函編程 0verflow Stack Overflow 編程語言 Java Android Swift語言 Scala Linux iOS HTML 軟件 Perl Flash Clojure Haskell jQuery CSS Objective-C R語言 Ruby Windows 英國文章技術 Rust PHP 2019-09-06

'既然C語言無所不能，那麼它也能定義帶“默認參數”的函數嗎？'

C語言編程語言文章 Linux 2019-09-05

'各編程語言出生簡介：C語言竟是因為無聊產生，那你心中的它呢？'

"編程語言有上千種，但是流行的不過10來種，那些我們經常使用的編程語言都是誰在什麼時候創造出來的呢？一起來看看。1880年約瑟夫·瑪麗·雅卡爾設計出人類歷史上首臺可設計織布機--雅卡爾織布機，對將來發展出其他可編程機器(例如計算機)起了重要作用。當時，他的發明受到了Skyn...

C語言編程語言程序員約翰·巴科斯 Ruby 電腦阿蘭·圖靈葛麗絲·霍普 Smalltalk 貝爾實驗室算法 COBOL 丹尼斯·裡奇 Java 人生第一份工作 Python 愛達·勒芙蕾絲設計 Guido 人工智能 Xkcd 阿諾德·巴克斯 Pascal 英國 Lua 阿爾伯特·愛因斯坦網景 BASIC語言 Objective-C Fortran 世界歷史瀏覽器 2019-09-05

'一個資深C語言工程師：淺說C語言的重要性以及如何學好C語言'

"前言C語言屬於高級程序語言的一種，它的前身是“ALGOL”。其創始人是布朗·W·卡尼漢和丹尼斯·M·利奇。C語言問世時是帶有很大的侷限性，因為它只能用於UNIX系統上。然而隨著科學技術的進步，計算機工業的發展，C語言逐漸脫離UNIX。1987年美國標準化協會制定了C語言的...

C語言編程語言工程師數據結構 Java JavaScript BASIC語言程序員程序設計 UNIX 編譯器算法 Windows VBScript FoxPro 多看閱讀軟件 Visual Basic Perl 小遊戲硬件 ASP 2019-09-05

'C語言快速入門——指針與數組'

"與數組有關的地址我本來打算以一個程序開始，讓我們直接理解相關概念。但轉念一想，如果引導你思考問題而得出結論，或許會有另一種效果，因此，我們的討論以下面的定義為基礎。int a = 9;int b[3] = { 0, 1, 2 };程序中定義的每個變量都對應一個具體的地址。...

C語言設計 2019-09-05

'Go語言和Java、python等其他語言的對比分析'

"作者：qfliweimin 鏈接：https://www.jianshu.com/p/a075147dba4d設計Go是為了解決當時Google開發遇到的問題大量的C++代碼，同時又引入了Java和Python成千上萬的工程師數以萬計行的代碼分佈式的編譯系統數百萬的服務器...

Go語言 Python Java C語言 Google 設計工程師編程語言面向對象程序編程程序員人民的名義 PHP 人生第一份工作 2019-09-02

'C語言開發必讀書目推薦，從小工到專家必備'

"喜歡的可以收藏轉發加關注做程序開發工作，不僅僅要實踐，讀書也是非常重要的。讀的書多了，知道的東西自然就多了，再通過實踐的鞏固，這樣一方面知識整合的速度比較快，另一方面通過實踐之後知識的掌握程度也更加深刻，才能轉化為自己的能力。安德斯·艾利克森在《刻意練習》中強調練習要講究...

C語言讀書人生第一份工作程序員收藏 2019-08-31

'用於打包和解包數據的C語言聯合'

"前一篇文章討論了最初的聯合應用程序已經為互斥變量創建了一個共享內存區域。但隨著時間的推移，程序員已廣泛將聯合用於完全不同的應用程序：從較大的數據對象中提取較小的數據部分。在本文中，我們將更詳細地介紹這個聯合的特定應用。使用聯合打包/解包數據聯合的成員存儲在共享內存區域中。...

C語言 Word 程序員硬件編譯器 2019-08-31

'有趣的問題，C語言程序中，為什麼十六進制數字以前綴0x開頭呢？'

"C語言允許程序員逐位操作變量，此時，最直觀的數字表示方式自然是二進制。不過這樣常常會讓數字看起來“過長”，例如十進制的 255 使用二進制表示為 11111111，因此，在C語言程序開發中，為了程序員閱讀代碼的方便，需要逐位操作變量時，常常使用十六進制。0xFF 看起來可...

C語言程序員編譯器文章肯·湯普遜彙編語言 Linux 2019-08-31

'C語言是如何轉換成彙編語言的？6個步驟帶你解析'

"大家都知道計算機只能處理和識別二進制指令，而我們利用各種高級編程語言所編寫的程序，要經過一些列的處理步驟，最終轉變為彙編指令，再最後轉變為機器指令。C語言以上這些轉變是如何發生的就屬於大名鼎鼎的“編譯原理”所研究的範疇，作為計算機專業學生，它的重要性毫無質疑，自然也是必修...

彙編語言 C語言編程語言電腦中央處理器技術程序員程序設計 2019-08-28

'C｜C語言為了效率或便利而不考慮安全的一些語法特性'

"C語言是效率最高的高級語言，也是最不安全的高級語言。作為強類型語言，且類型檢查是其安全和效率所在，但與此同時，類型的隱式轉換（表達式計算、賦值、函數的實參與形參的結合與返回以及邏輯類型），簡單粗暴的顯式類型轉換也會造成安全隱患。C語言的設計就效率與安全的考量而言，是將效率...

C語言編譯器程序員 2019-08-28

'我的全棧之路-C語言基礎之C語言概述'

"1.1 信息技術發展趨勢目前信息技術主要經歷了互聯網、移動互聯網以及以大數據、雲計算、物聯網、人工智能區塊為代表的新興技術三個階段。互聯網互聯網自從20世紀90年代逐漸興起，主要是通過網絡連接了世界各地的PC機，筆記本以及背後提供數據服務的大型服務器集群。其中絕大多數PC...

C語言移動互聯網大數據技術區塊鏈 Windows 中央處理器電腦人工智能固態硬盤 Android iOS 物聯網操作系統雲計算軟件 Linux 騰訊編程語言硬件 Java 聲卡數字貨幣智能家居數據庫 QQ音樂華為公司高能小子終極裝備 UNIX 計算複雜性理論鼠標 Google 百度小米科技騰訊QQ 編譯器筆記本電腦微軟 Ubuntu 音樂蘋果公司金融 CentOS 2019-08-26

'零基礎程序員如何快速入門C語言，附視頻教程'

"學習C語言不是一朝一夕的事情，但卻也不是需要花費幾年時間才能精通的。那麼如何以最小的代價，學習C語言呢？這最小的代價也絕不是什麼捷徑，而是以最短的時間去收穫最多的知識，但同時也意味著你需要經歷艱苦的過程。學習C語言是如此，學習其他語言亦是如此。一、要讀就讀好書，否則不如...

C語言程序員編程語言 UNIX Microsoft Visual Studio Windows 編譯器集成開發環境程序設計 Linux 讀書 GCC 歷史 2019-08-26

推薦中...