'合格的數據科學家,這些Github知識必須瞭解'

"
全文共2270字,預計學習時長5分鐘


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


合格的數據科學家,這些Github知識必須瞭解

圖片來源:pexels.com/@divinetechygirl


現在簡要介紹如何使用Github和Git從命令行中執行最常見的操作。如果還沒有賬戶,需要先註冊一個(完全免費)。


傳送門:https://github.com/


若要從頭創建存儲庫,請訪問以上鍊接並單擊“New”按鈕。


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


合格的數據科學家,這些Github知識必須瞭解

圖片來源:pexels.com/@divinetechygirl


現在簡要介紹如何使用Github和Git從命令行中執行最常見的操作。如果還沒有賬戶,需要先註冊一個(完全免費)。


傳送門:https://github.com/


若要從頭創建存儲庫,請訪問以上鍊接並單擊“New”按鈕。


合格的數據科學家,這些Github知識必須瞭解


接下來需要為項目輸入名稱,並選擇是將此項目設為公共項目還是私有項目。


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


合格的數據科學家,這些Github知識必須瞭解

圖片來源:pexels.com/@divinetechygirl


現在簡要介紹如何使用Github和Git從命令行中執行最常見的操作。如果還沒有賬戶,需要先註冊一個(完全免費)。


傳送門:https://github.com/


若要從頭創建存儲庫,請訪問以上鍊接並單擊“New”按鈕。


合格的數據科學家,這些Github知識必須瞭解


接下來需要為項目輸入名稱,並選擇是將此項目設為公共項目還是私有項目。


合格的數據科學家,這些Github知識必須瞭解


接下來,選中“Initializethis repository with a README”,然後單擊“Create repository”。


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


合格的數據科學家,這些Github知識必須瞭解

圖片來源:pexels.com/@divinetechygirl


現在簡要介紹如何使用Github和Git從命令行中執行最常見的操作。如果還沒有賬戶,需要先註冊一個(完全免費)。


傳送門:https://github.com/


若要從頭創建存儲庫,請訪問以上鍊接並單擊“New”按鈕。


合格的數據科學家,這些Github知識必須瞭解


接下來需要為項目輸入名稱,並選擇是將此項目設為公共項目還是私有項目。


合格的數據科學家,這些Github知識必須瞭解


接下來,選中“Initializethis repository with a README”,然後單擊“Create repository”。


合格的數據科學家,這些Github知識必須瞭解



現在可以添加和更改知識庫中的文件了。要從命令行中執行此操作,首先需要按照說明下載並安裝Git。


說明傳送門:https://git-scm.com/downloads


要在本地處理項目,首先還需要克隆知識庫。如果想克隆別人的項目來進行操作,也要遵循這個步驟。


cd my-directory
git clone
https://github.com/rebeccavickery/my-repository.git


可以通過單擊“Cloneor download”按鍵找到倉儲的鏈接。


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


合格的數據科學家,這些Github知識必須瞭解

圖片來源:pexels.com/@divinetechygirl


現在簡要介紹如何使用Github和Git從命令行中執行最常見的操作。如果還沒有賬戶,需要先註冊一個(完全免費)。


傳送門:https://github.com/


若要從頭創建存儲庫,請訪問以上鍊接並單擊“New”按鈕。


合格的數據科學家,這些Github知識必須瞭解


接下來需要為項目輸入名稱,並選擇是將此項目設為公共項目還是私有項目。


合格的數據科學家,這些Github知識必須瞭解


接下來,選中“Initializethis repository with a README”,然後單擊“Create repository”。


合格的數據科學家,這些Github知識必須瞭解



現在可以添加和更改知識庫中的文件了。要從命令行中執行此操作,首先需要按照說明下載並安裝Git。


說明傳送門:https://git-scm.com/downloads


要在本地處理項目,首先還需要克隆知識庫。如果想克隆別人的項目來進行操作,也要遵循這個步驟。


cd my-directory
git clone
https://github.com/rebeccavickery/my-repository.git


可以通過單擊“Cloneor download”按鍵找到倉儲的鏈接。


合格的數據科學家,這些Github知識必須瞭解


新目錄現在將出現在當前項目目錄中,其名稱與知識庫相同。這是項目的本地版本。


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


合格的數據科學家,這些Github知識必須瞭解

圖片來源:pexels.com/@divinetechygirl


現在簡要介紹如何使用Github和Git從命令行中執行最常見的操作。如果還沒有賬戶,需要先註冊一個(完全免費)。


傳送門:https://github.com/


若要從頭創建存儲庫,請訪問以上鍊接並單擊“New”按鈕。


合格的數據科學家,這些Github知識必須瞭解


接下來需要為項目輸入名稱,並選擇是將此項目設為公共項目還是私有項目。


合格的數據科學家,這些Github知識必須瞭解


接下來,選中“Initializethis repository with a README”,然後單擊“Create repository”。


合格的數據科學家,這些Github知識必須瞭解



現在可以添加和更改知識庫中的文件了。要從命令行中執行此操作,首先需要按照說明下載並安裝Git。


說明傳送門:https://git-scm.com/downloads


要在本地處理項目,首先還需要克隆知識庫。如果想克隆別人的項目來進行操作,也要遵循這個步驟。


cd my-directory
git clone
https://github.com/rebeccavickery/my-repository.git


可以通過單擊“Cloneor download”按鍵找到倉儲的鏈接。


合格的數據科學家,這些Github知識必須瞭解


新目錄現在將出現在當前項目目錄中,其名稱與知識庫相同。這是項目的本地版本。


合格的數據科學家,這些Github知識必須瞭解

4. 分支


分支可以讓使用者複製知識庫、在複製的知識庫裡進行更改並在合併到主項目之前測試它們是否正常工作。最好的做法是始終在分支上進行更改,而不是在主項目上工作。在創建分支之前,最好檢查本地項目是否是和遠程知識庫庫一樣的最新版本。可以通過輸入以下內容來檢查狀態:


git status



"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


合格的數據科學家,這些Github知識必須瞭解

圖片來源:pexels.com/@divinetechygirl


現在簡要介紹如何使用Github和Git從命令行中執行最常見的操作。如果還沒有賬戶,需要先註冊一個(完全免費)。


傳送門:https://github.com/


若要從頭創建存儲庫,請訪問以上鍊接並單擊“New”按鈕。


合格的數據科學家,這些Github知識必須瞭解


接下來需要為項目輸入名稱,並選擇是將此項目設為公共項目還是私有項目。


合格的數據科學家,這些Github知識必須瞭解


接下來,選中“Initializethis repository with a README”,然後單擊“Create repository”。


合格的數據科學家,這些Github知識必須瞭解



現在可以添加和更改知識庫中的文件了。要從命令行中執行此操作,首先需要按照說明下載並安裝Git。


說明傳送門:https://git-scm.com/downloads


要在本地處理項目,首先還需要克隆知識庫。如果想克隆別人的項目來進行操作,也要遵循這個步驟。


cd my-directory
git clone
https://github.com/rebeccavickery/my-repository.git


可以通過單擊“Cloneor download”按鍵找到倉儲的鏈接。


合格的數據科學家,這些Github知識必須瞭解


新目錄現在將出現在當前項目目錄中,其名稱與知識庫相同。這是項目的本地版本。


合格的數據科學家,這些Github知識必須瞭解

4. 分支


分支可以讓使用者複製知識庫、在複製的知識庫裡進行更改並在合併到主項目之前測試它們是否正常工作。最好的做法是始終在分支上進行更改,而不是在主項目上工作。在創建分支之前,最好檢查本地項目是否是和遠程知識庫庫一樣的最新版本。可以通過輸入以下內容來檢查狀態:


git status



合格的數據科學家,這些Github知識必須瞭解



如果你的並不是最新版本,可以簡單地輸入“gitpull”。


要建立並檢查一個分支,輸入以下內容。


git branch my-branch
git checkout my-branch


現在就可以進行更改,在合併分支和主項目之前,它們不會影響遠程倉儲。現在可以更改README.md文件,並完成提交和合並此次更改的過程。


在你喜歡的文本編輯器中打開README.md文件並進行任何更改。這裡使用Sublime Text(https://www.sublimetext.com/)並只在文件中添加一行。


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


合格的數據科學家,這些Github知識必須瞭解

圖片來源:pexels.com/@divinetechygirl


現在簡要介紹如何使用Github和Git從命令行中執行最常見的操作。如果還沒有賬戶,需要先註冊一個(完全免費)。


傳送門:https://github.com/


若要從頭創建存儲庫,請訪問以上鍊接並單擊“New”按鈕。


合格的數據科學家,這些Github知識必須瞭解


接下來需要為項目輸入名稱,並選擇是將此項目設為公共項目還是私有項目。


合格的數據科學家,這些Github知識必須瞭解


接下來,選中“Initializethis repository with a README”,然後單擊“Create repository”。


合格的數據科學家,這些Github知識必須瞭解



現在可以添加和更改知識庫中的文件了。要從命令行中執行此操作,首先需要按照說明下載並安裝Git。


說明傳送門:https://git-scm.com/downloads


要在本地處理項目,首先還需要克隆知識庫。如果想克隆別人的項目來進行操作,也要遵循這個步驟。


cd my-directory
git clone
https://github.com/rebeccavickery/my-repository.git


可以通過單擊“Cloneor download”按鍵找到倉儲的鏈接。


合格的數據科學家,這些Github知識必須瞭解


新目錄現在將出現在當前項目目錄中,其名稱與知識庫相同。這是項目的本地版本。


合格的數據科學家,這些Github知識必須瞭解

4. 分支


分支可以讓使用者複製知識庫、在複製的知識庫裡進行更改並在合併到主項目之前測試它們是否正常工作。最好的做法是始終在分支上進行更改,而不是在主項目上工作。在創建分支之前,最好檢查本地項目是否是和遠程知識庫庫一樣的最新版本。可以通過輸入以下內容來檢查狀態:


git status



合格的數據科學家,這些Github知識必須瞭解



如果你的並不是最新版本,可以簡單地輸入“gitpull”。


要建立並檢查一個分支,輸入以下內容。


git branch my-branch
git checkout my-branch


現在就可以進行更改,在合併分支和主項目之前,它們不會影響遠程倉儲。現在可以更改README.md文件,並完成提交和合並此次更改的過程。


在你喜歡的文本編輯器中打開README.md文件並進行任何更改。這裡使用Sublime Text(https://www.sublimetext.com/)並只在文件中添加一行。


合格的數據科學家,這些Github知識必須瞭解


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


合格的數據科學家,這些Github知識必須瞭解

圖片來源:pexels.com/@divinetechygirl


現在簡要介紹如何使用Github和Git從命令行中執行最常見的操作。如果還沒有賬戶,需要先註冊一個(完全免費)。


傳送門:https://github.com/


若要從頭創建存儲庫,請訪問以上鍊接並單擊“New”按鈕。


合格的數據科學家,這些Github知識必須瞭解


接下來需要為項目輸入名稱,並選擇是將此項目設為公共項目還是私有項目。


合格的數據科學家,這些Github知識必須瞭解


接下來,選中“Initializethis repository with a README”,然後單擊“Create repository”。


合格的數據科學家,這些Github知識必須瞭解



現在可以添加和更改知識庫中的文件了。要從命令行中執行此操作,首先需要按照說明下載並安裝Git。


說明傳送門:https://git-scm.com/downloads


要在本地處理項目,首先還需要克隆知識庫。如果想克隆別人的項目來進行操作,也要遵循這個步驟。


cd my-directory
git clone
https://github.com/rebeccavickery/my-repository.git


可以通過單擊“Cloneor download”按鍵找到倉儲的鏈接。


合格的數據科學家,這些Github知識必須瞭解


新目錄現在將出現在當前項目目錄中,其名稱與知識庫相同。這是項目的本地版本。


合格的數據科學家,這些Github知識必須瞭解

4. 分支


分支可以讓使用者複製知識庫、在複製的知識庫裡進行更改並在合併到主項目之前測試它們是否正常工作。最好的做法是始終在分支上進行更改,而不是在主項目上工作。在創建分支之前,最好檢查本地項目是否是和遠程知識庫庫一樣的最新版本。可以通過輸入以下內容來檢查狀態:


git status



合格的數據科學家,這些Github知識必須瞭解



如果你的並不是最新版本,可以簡單地輸入“gitpull”。


要建立並檢查一個分支,輸入以下內容。


git branch my-branch
git checkout my-branch


現在就可以進行更改,在合併分支和主項目之前,它們不會影響遠程倉儲。現在可以更改README.md文件,並完成提交和合並此次更改的過程。


在你喜歡的文本編輯器中打開README.md文件並進行任何更改。這裡使用Sublime Text(https://www.sublimetext.com/)並只在文件中添加一行。


合格的數據科學家,這些Github知識必須瞭解


合格的數據科學家,這些Github知識必須瞭解


5. 合併申請功能


在協作項目中工作的最佳做法是使用合併申請功能(pullrequests)。合併申請功能是允許使用者或其他人在將更改合併到主版本之前查看所做出的更改的過程。在打開合併申請功能之前,需要添加並提交更改。


git add .
git commit -m "change to README.md"
git push —set-upstream origin my-branch


只需要在第一次創造新分支時添加分支:“set-upstreamorigin my-branch”。然後就能在遠程知識庫中看見此消息。


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


合格的數據科學家,這些Github知識必須瞭解

圖片來源:pexels.com/@divinetechygirl


現在簡要介紹如何使用Github和Git從命令行中執行最常見的操作。如果還沒有賬戶,需要先註冊一個(完全免費)。


傳送門:https://github.com/


若要從頭創建存儲庫,請訪問以上鍊接並單擊“New”按鈕。


合格的數據科學家,這些Github知識必須瞭解


接下來需要為項目輸入名稱,並選擇是將此項目設為公共項目還是私有項目。


合格的數據科學家,這些Github知識必須瞭解


接下來,選中“Initializethis repository with a README”,然後單擊“Create repository”。


合格的數據科學家,這些Github知識必須瞭解



現在可以添加和更改知識庫中的文件了。要從命令行中執行此操作,首先需要按照說明下載並安裝Git。


說明傳送門:https://git-scm.com/downloads


要在本地處理項目,首先還需要克隆知識庫。如果想克隆別人的項目來進行操作,也要遵循這個步驟。


cd my-directory
git clone
https://github.com/rebeccavickery/my-repository.git


可以通過單擊“Cloneor download”按鍵找到倉儲的鏈接。


合格的數據科學家,這些Github知識必須瞭解


新目錄現在將出現在當前項目目錄中,其名稱與知識庫相同。這是項目的本地版本。


合格的數據科學家,這些Github知識必須瞭解

4. 分支


分支可以讓使用者複製知識庫、在複製的知識庫裡進行更改並在合併到主項目之前測試它們是否正常工作。最好的做法是始終在分支上進行更改,而不是在主項目上工作。在創建分支之前,最好檢查本地項目是否是和遠程知識庫庫一樣的最新版本。可以通過輸入以下內容來檢查狀態:


git status



合格的數據科學家,這些Github知識必須瞭解



如果你的並不是最新版本,可以簡單地輸入“gitpull”。


要建立並檢查一個分支,輸入以下內容。


git branch my-branch
git checkout my-branch


現在就可以進行更改,在合併分支和主項目之前,它們不會影響遠程倉儲。現在可以更改README.md文件,並完成提交和合並此次更改的過程。


在你喜歡的文本編輯器中打開README.md文件並進行任何更改。這裡使用Sublime Text(https://www.sublimetext.com/)並只在文件中添加一行。


合格的數據科學家,這些Github知識必須瞭解


合格的數據科學家,這些Github知識必須瞭解


5. 合併申請功能


在協作項目中工作的最佳做法是使用合併申請功能(pullrequests)。合併申請功能是允許使用者或其他人在將更改合併到主版本之前查看所做出的更改的過程。在打開合併申請功能之前,需要添加並提交更改。


git add .
git commit -m "change to README.md"
git push —set-upstream origin my-branch


只需要在第一次創造新分支時添加分支:“set-upstreamorigin my-branch”。然後就能在遠程知識庫中看見此消息。


合格的數據科學家,這些Github知識必須瞭解


單擊“compare and pullrequest” ,然後再單擊“create pull request”。


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


合格的數據科學家,這些Github知識必須瞭解

圖片來源:pexels.com/@divinetechygirl


現在簡要介紹如何使用Github和Git從命令行中執行最常見的操作。如果還沒有賬戶,需要先註冊一個(完全免費)。


傳送門:https://github.com/


若要從頭創建存儲庫,請訪問以上鍊接並單擊“New”按鈕。


合格的數據科學家,這些Github知識必須瞭解


接下來需要為項目輸入名稱,並選擇是將此項目設為公共項目還是私有項目。


合格的數據科學家,這些Github知識必須瞭解


接下來,選中“Initializethis repository with a README”,然後單擊“Create repository”。


合格的數據科學家,這些Github知識必須瞭解



現在可以添加和更改知識庫中的文件了。要從命令行中執行此操作,首先需要按照說明下載並安裝Git。


說明傳送門:https://git-scm.com/downloads


要在本地處理項目,首先還需要克隆知識庫。如果想克隆別人的項目來進行操作,也要遵循這個步驟。


cd my-directory
git clone
https://github.com/rebeccavickery/my-repository.git


可以通過單擊“Cloneor download”按鍵找到倉儲的鏈接。


合格的數據科學家,這些Github知識必須瞭解


新目錄現在將出現在當前項目目錄中,其名稱與知識庫相同。這是項目的本地版本。


合格的數據科學家,這些Github知識必須瞭解

4. 分支


分支可以讓使用者複製知識庫、在複製的知識庫裡進行更改並在合併到主項目之前測試它們是否正常工作。最好的做法是始終在分支上進行更改,而不是在主項目上工作。在創建分支之前,最好檢查本地項目是否是和遠程知識庫庫一樣的最新版本。可以通過輸入以下內容來檢查狀態:


git status



合格的數據科學家,這些Github知識必須瞭解



如果你的並不是最新版本,可以簡單地輸入“gitpull”。


要建立並檢查一個分支,輸入以下內容。


git branch my-branch
git checkout my-branch


現在就可以進行更改,在合併分支和主項目之前,它們不會影響遠程倉儲。現在可以更改README.md文件,並完成提交和合並此次更改的過程。


在你喜歡的文本編輯器中打開README.md文件並進行任何更改。這裡使用Sublime Text(https://www.sublimetext.com/)並只在文件中添加一行。


合格的數據科學家,這些Github知識必須瞭解


合格的數據科學家,這些Github知識必須瞭解


5. 合併申請功能


在協作項目中工作的最佳做法是使用合併申請功能(pullrequests)。合併申請功能是允許使用者或其他人在將更改合併到主版本之前查看所做出的更改的過程。在打開合併申請功能之前,需要添加並提交更改。


git add .
git commit -m "change to README.md"
git push —set-upstream origin my-branch


只需要在第一次創造新分支時添加分支:“set-upstreamorigin my-branch”。然後就能在遠程知識庫中看見此消息。


合格的數據科學家,這些Github知識必須瞭解


單擊“compare and pullrequest” ,然後再單擊“create pull request”。


合格的數據科學家,這些Github知識必須瞭解


此時,如果在項目中與其他人或團隊協作,可能會要求其他人去檢查更改。他們可以添加評論,當所有人對更改滿意時,就可以合併申請功能了。


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


合格的數據科學家,這些Github知識必須瞭解

圖片來源:pexels.com/@divinetechygirl


現在簡要介紹如何使用Github和Git從命令行中執行最常見的操作。如果還沒有賬戶,需要先註冊一個(完全免費)。


傳送門:https://github.com/


若要從頭創建存儲庫,請訪問以上鍊接並單擊“New”按鈕。


合格的數據科學家,這些Github知識必須瞭解


接下來需要為項目輸入名稱,並選擇是將此項目設為公共項目還是私有項目。


合格的數據科學家,這些Github知識必須瞭解


接下來,選中“Initializethis repository with a README”,然後單擊“Create repository”。


合格的數據科學家,這些Github知識必須瞭解



現在可以添加和更改知識庫中的文件了。要從命令行中執行此操作,首先需要按照說明下載並安裝Git。


說明傳送門:https://git-scm.com/downloads


要在本地處理項目,首先還需要克隆知識庫。如果想克隆別人的項目來進行操作,也要遵循這個步驟。


cd my-directory
git clone
https://github.com/rebeccavickery/my-repository.git


可以通過單擊“Cloneor download”按鍵找到倉儲的鏈接。


合格的數據科學家,這些Github知識必須瞭解


新目錄現在將出現在當前項目目錄中,其名稱與知識庫相同。這是項目的本地版本。


合格的數據科學家,這些Github知識必須瞭解

4. 分支


分支可以讓使用者複製知識庫、在複製的知識庫裡進行更改並在合併到主項目之前測試它們是否正常工作。最好的做法是始終在分支上進行更改,而不是在主項目上工作。在創建分支之前,最好檢查本地項目是否是和遠程知識庫庫一樣的最新版本。可以通過輸入以下內容來檢查狀態:


git status



合格的數據科學家,這些Github知識必須瞭解



如果你的並不是最新版本,可以簡單地輸入“gitpull”。


要建立並檢查一個分支,輸入以下內容。


git branch my-branch
git checkout my-branch


現在就可以進行更改,在合併分支和主項目之前,它們不會影響遠程倉儲。現在可以更改README.md文件,並完成提交和合並此次更改的過程。


在你喜歡的文本編輯器中打開README.md文件並進行任何更改。這裡使用Sublime Text(https://www.sublimetext.com/)並只在文件中添加一行。


合格的數據科學家,這些Github知識必須瞭解


合格的數據科學家,這些Github知識必須瞭解


5. 合併申請功能


在協作項目中工作的最佳做法是使用合併申請功能(pullrequests)。合併申請功能是允許使用者或其他人在將更改合併到主版本之前查看所做出的更改的過程。在打開合併申請功能之前,需要添加並提交更改。


git add .
git commit -m "change to README.md"
git push —set-upstream origin my-branch


只需要在第一次創造新分支時添加分支:“set-upstreamorigin my-branch”。然後就能在遠程知識庫中看見此消息。


合格的數據科學家,這些Github知識必須瞭解


單擊“compare and pullrequest” ,然後再單擊“create pull request”。


合格的數據科學家,這些Github知識必須瞭解


此時,如果在項目中與其他人或團隊協作,可能會要求其他人去檢查更改。他們可以添加評論,當所有人對更改滿意時,就可以合併申請功能了。


合格的數據科學家,這些Github知識必須瞭解


這時,此改變將被併入主項目中。


"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


合格的數據科學家,這些Github知識必須瞭解

圖片來源:pexels.com/@divinetechygirl


現在簡要介紹如何使用Github和Git從命令行中執行最常見的操作。如果還沒有賬戶,需要先註冊一個(完全免費)。


傳送門:https://github.com/


若要從頭創建存儲庫,請訪問以上鍊接並單擊“New”按鈕。


合格的數據科學家,這些Github知識必須瞭解


接下來需要為項目輸入名稱,並選擇是將此項目設為公共項目還是私有項目。


合格的數據科學家,這些Github知識必須瞭解


接下來,選中“Initializethis repository with a README”,然後單擊“Create repository”。


合格的數據科學家,這些Github知識必須瞭解



現在可以添加和更改知識庫中的文件了。要從命令行中執行此操作,首先需要按照說明下載並安裝Git。


說明傳送門:https://git-scm.com/downloads


要在本地處理項目,首先還需要克隆知識庫。如果想克隆別人的項目來進行操作,也要遵循這個步驟。


cd my-directory
git clone
https://github.com/rebeccavickery/my-repository.git


可以通過單擊“Cloneor download”按鍵找到倉儲的鏈接。


合格的數據科學家,這些Github知識必須瞭解


新目錄現在將出現在當前項目目錄中,其名稱與知識庫相同。這是項目的本地版本。


合格的數據科學家,這些Github知識必須瞭解

4. 分支


分支可以讓使用者複製知識庫、在複製的知識庫裡進行更改並在合併到主項目之前測試它們是否正常工作。最好的做法是始終在分支上進行更改,而不是在主項目上工作。在創建分支之前,最好檢查本地項目是否是和遠程知識庫庫一樣的最新版本。可以通過輸入以下內容來檢查狀態:


git status



合格的數據科學家,這些Github知識必須瞭解



如果你的並不是最新版本,可以簡單地輸入“gitpull”。


要建立並檢查一個分支,輸入以下內容。


git branch my-branch
git checkout my-branch


現在就可以進行更改,在合併分支和主項目之前,它們不會影響遠程倉儲。現在可以更改README.md文件,並完成提交和合並此次更改的過程。


在你喜歡的文本編輯器中打開README.md文件並進行任何更改。這裡使用Sublime Text(https://www.sublimetext.com/)並只在文件中添加一行。


合格的數據科學家,這些Github知識必須瞭解


合格的數據科學家,這些Github知識必須瞭解


5. 合併申請功能


在協作項目中工作的最佳做法是使用合併申請功能(pullrequests)。合併申請功能是允許使用者或其他人在將更改合併到主版本之前查看所做出的更改的過程。在打開合併申請功能之前,需要添加並提交更改。


git add .
git commit -m "change to README.md"
git push —set-upstream origin my-branch


只需要在第一次創造新分支時添加分支:“set-upstreamorigin my-branch”。然後就能在遠程知識庫中看見此消息。


合格的數據科學家,這些Github知識必須瞭解


單擊“compare and pullrequest” ,然後再單擊“create pull request”。


合格的數據科學家,這些Github知識必須瞭解


此時,如果在項目中與其他人或團隊協作,可能會要求其他人去檢查更改。他們可以添加評論,當所有人對更改滿意時,就可以合併申請功能了。


合格的數據科學家,這些Github知識必須瞭解


這時,此改變將被併入主項目中。


合格的數據科學家,這些Github知識必須瞭解


如果完成了在此分支上的工作,最好點擊“delete branch”按鈕刪除它。

Github指南傳送門:https://guides.github.com/

"
全文共2270字,預計學習時長5分鐘


合格的數據科學家,這些Github知識必須瞭解

圖片來源:Unsplash/HackCapital攝


版本控制經驗已逐漸成為所有數據科學家的必要能力。版本控制可以幫助數據科學家更好地做團隊工作、促進項目協作、共享工作並幫助其他數據科學家重複相同或類似的過程。


即使是獨立工作的數據科學家,在併入當前項目之前,能夠先回滾更改或先對某個分支進行更改,並測試此更改不會終止任何項目內容也是非常有用的。


本文將介紹以下內容:

1. 什麼是Github?

2. 為什麼數據科學家需要使用Github?

3. 創建知識庫

4. 分支

5. 合併申請功能


合格的數據科學家,這些Github知識必須瞭解

1. 什麼是Github?


Github是最著名和最廣泛使用的版本控制平臺之一。GitHub使用一個名為Git的應用程序將版本控制應用於代碼。項目文件被遠程存儲在一個被稱為知識庫(repository)的中心位置。每次在本地機器上進行更改並推送到Github時,遠程版本都會被更新,並記錄該提交的存儲。如果要在提交之前回滾到項目的早期版本,則此次記錄就可以讓使用者執行此操作。


此外,由於項目文件是遠程存儲的,任何其他有訪問權限的人都可以下載此文件並對項目進行更改。分支的概念,本質上意味著你對完全獨立的項目做了一個臨時的複製,它意味著你可以先在分支裡進行更改,而不必擔心終止任何東西。如果你正在做一個項目,而項目工作中的某個特性依賴於代碼工作,那麼這一點就尤其重要了。


合格的數據科學家,這些Github知識必須瞭解


2. 為什麼數據科學家需要使用Github?


數據科學家需要使用GitHub的原因與軟件工程師的原因基本相同——為了協作、“安全”地對項目進行更改,以及隨後的追蹤和回滾更改。


傳統上,數據科學家不必非要使用GitHub,因為在通常情況下,將模型投入項目的過程(在此過程中版本控制變得至關重要)會被移交給軟件或數據工程團隊。然而,系統中有一個日益增長的趨勢,即讓數據科學家更容易寫出代碼並將其運用到產品中——參見H20.ai和谷歌雲人工智能平臺(Google Cloud AI Platform)之類的工具。因此,數據科學家能熟練使用版本控制變得越來越重要。


合格的數據科學家,這些Github知識必須瞭解

3. 創建知識庫


合格的數據科學家,這些Github知識必須瞭解

圖片來源:pexels.com/@divinetechygirl


現在簡要介紹如何使用Github和Git從命令行中執行最常見的操作。如果還沒有賬戶,需要先註冊一個(完全免費)。


傳送門:https://github.com/


若要從頭創建存儲庫,請訪問以上鍊接並單擊“New”按鈕。


合格的數據科學家,這些Github知識必須瞭解


接下來需要為項目輸入名稱,並選擇是將此項目設為公共項目還是私有項目。


合格的數據科學家,這些Github知識必須瞭解


接下來,選中“Initializethis repository with a README”,然後單擊“Create repository”。


合格的數據科學家,這些Github知識必須瞭解



現在可以添加和更改知識庫中的文件了。要從命令行中執行此操作,首先需要按照說明下載並安裝Git。


說明傳送門:https://git-scm.com/downloads


要在本地處理項目,首先還需要克隆知識庫。如果想克隆別人的項目來進行操作,也要遵循這個步驟。


cd my-directory
git clone
https://github.com/rebeccavickery/my-repository.git


可以通過單擊“Cloneor download”按鍵找到倉儲的鏈接。


合格的數據科學家,這些Github知識必須瞭解


新目錄現在將出現在當前項目目錄中,其名稱與知識庫相同。這是項目的本地版本。


合格的數據科學家,這些Github知識必須瞭解

4. 分支


分支可以讓使用者複製知識庫、在複製的知識庫裡進行更改並在合併到主項目之前測試它們是否正常工作。最好的做法是始終在分支上進行更改,而不是在主項目上工作。在創建分支之前,最好檢查本地項目是否是和遠程知識庫庫一樣的最新版本。可以通過輸入以下內容來檢查狀態:


git status



合格的數據科學家,這些Github知識必須瞭解



如果你的並不是最新版本,可以簡單地輸入“gitpull”。


要建立並檢查一個分支,輸入以下內容。


git branch my-branch
git checkout my-branch


現在就可以進行更改,在合併分支和主項目之前,它們不會影響遠程倉儲。現在可以更改README.md文件,並完成提交和合並此次更改的過程。


在你喜歡的文本編輯器中打開README.md文件並進行任何更改。這裡使用Sublime Text(https://www.sublimetext.com/)並只在文件中添加一行。


合格的數據科學家,這些Github知識必須瞭解


合格的數據科學家,這些Github知識必須瞭解


5. 合併申請功能


在協作項目中工作的最佳做法是使用合併申請功能(pullrequests)。合併申請功能是允許使用者或其他人在將更改合併到主版本之前查看所做出的更改的過程。在打開合併申請功能之前,需要添加並提交更改。


git add .
git commit -m "change to README.md"
git push —set-upstream origin my-branch


只需要在第一次創造新分支時添加分支:“set-upstreamorigin my-branch”。然後就能在遠程知識庫中看見此消息。


合格的數據科學家,這些Github知識必須瞭解


單擊“compare and pullrequest” ,然後再單擊“create pull request”。


合格的數據科學家,這些Github知識必須瞭解


此時,如果在項目中與其他人或團隊協作,可能會要求其他人去檢查更改。他們可以添加評論,當所有人對更改滿意時,就可以合併申請功能了。


合格的數據科學家,這些Github知識必須瞭解


這時,此改變將被併入主項目中。


合格的數據科學家,這些Github知識必須瞭解


如果完成了在此分支上的工作,最好點擊“delete branch”按鈕刪除它。

Github指南傳送門:https://guides.github.com/

合格的數據科學家,這些Github知識必須瞭解

留言 點贊 關注

我們一起分享AI學習與發展的乾貨

歡迎關注全平臺AI垂類自媒體 “讀芯術”

"

相關推薦

推薦中...