2019年5月五大機器學習Github庫

GitHub 人工智能 Google 微軟算法許嵩數據挖掘技術機器人 Lime Qt 歐幾里得開源軟件人工智能遇見磐創 2019-06-20

No1: InterpretML by Microsoft Machine Learning Interpretability

地址：https://github.com/microsoft/interpret

可解釋性是目前機器學習中的一個重要問題。能夠理解模型如何產生它所輸出的內容，這是每個機器學習項目的關鍵。

Interpretml是微軟的一個開源軟件包，用於訓練可解釋模型和解釋黑盒系統。微軟在解釋為什麼解釋性是必要的時候說得非常好：

模型調試：為什麼我的模型犯了這個錯誤？
檢測偏差：我的模型有區別嗎？
人工智能合作：我如何理解和信任模型的決策？
法規遵從性：我的模型是否滿足法律要求？
高風險應用：醫療、金融、司法等。

從過去的經驗看，最容易理解的模型不是很準確，而最準確的模型是不可理解的。隨著複雜性的增加，解釋機器學習模型的內部工作變得更加困難。於是，MicrosoftResearch開發了一種稱為可解釋增強機（EBM）*的算法，該算法具有高精度和可理解性。EBM使用現代機器學習技術，如 bagging 和boosting，為傳統的GAM模型注入新的活力。這使它們像隨機森林和梯度提升樹一樣準確，並且還增強了它們的可理解性和可編輯性。

此外，該算法不僅限於使用EBM，它還支持LIME、線性模型、決策樹等算法。比較模型併為我們的項目挑選最好的模型從未如此簡單！

而Interpretml的安裝也很簡單，僅需要如下幾行代碼：

pip install numpy scipy pyscaffold
pip install -U interpret

No2：Tensor2Robot (T2R) by Google Research

地址：https://github.com/google-research/tensor2robot

Google Research再次出現在我們推薦的Github系列項目中。因為他們擁有業務中最強大的計算能力，且他們正在將它用於機器學習。

Google最新發布了名為Tensor2Robot（T2R）的開源項目。 T2R是用於大規模深度神經網絡訓練、評估和推理的庫。，此存儲庫包含分佈式機器學習和強化學習基礎結構。它在Alphabet內部使用，開源的目的是使Robotics @ Google的研究對於更廣泛的機器人和計算機視覺社區更具可重複性。

以下是使用Tensor2Robot實現的幾個項目：

QT-Opt（https://arxiv.org/abs/1806.10293
Grasp2Vec（https://github.com/google-research/tensor2robot/blob/master/research/grasp2vec）

No3：Generative Models in TensorFlow 2

地址：https://github.com/timsainb/tensorflow2-generative-models

這是一個在Tensorflow 2中實現大量生成模型的小項目。（TensorFlow 2.0是今年最受期待的TensorFlow版本，於不久前正式推出。）圖層和優化器都是使用Keras。這些模型是針對兩個數據集實現的：fashion MNIST和NSYNTH。編寫網絡的目的是儘可能簡單和一致，同時具有可讀性。因為每個網絡都是自包含在notebook中的，所以它們應該可以在colab會話中輕鬆運行。

該存儲庫包含多個生成模型的TF實現，包括：

生成對抗網絡（GAN）
自動編碼器
變分自動編碼器（VAE）
VAE-GAN等。

No4：STUMPY – Time Series Data Mining

地址：https://github.com/TDAmeritrade/stumpy

STUMPY是一個功能強大且可擴展的庫，可幫助我們執行時間序列數據挖掘任務。 STUMPY旨在計算矩陣輪廓，矩陣輪廓是一個向量，它存儲時間序列中任何子序列與其最近鄰居之間的 z-normalized 歐幾里德距離。

以下是此矩陣配置文件幫助我們執行的一些時間序列數據挖掘任務：

異常發現
語義分割
密度估計
時間序列鏈（時序有序的子序列模式集）

使用以下代碼可以通過pip直接安裝STUMPY：

pip install stumpy

No5：MeshCNN in PyTorch

地址：https://github.com/ranahanocka/MeshCNN

MeshCNN是用於3D三角網格的通用深度神經網絡。這些網格可用於3D形狀分類或分割等任務。MeshCNN框架包括直接應用於網格邊緣的卷積，池化和解除層：

卷積神經網絡（CNN）非常適合處理圖像和視覺數據。 CNN近年來風靡一時，隨著圖像相關應用的湧現而興起：物體檢測、圖像分割、圖像分類等，隨著CNN的進步，這些都變成了可能。

而最近3D深度學習吸引了業界的興趣，包括機器人和自動駕駛等領域。3D形狀的問題在於它們本質上是不規則的。這使得像卷積這樣的操作變得很困難。這也是MeshCNN發揮作用的地方。它是是用於3D三角網格的通用深度神經網絡：網格是頂點，邊和麵的列表，它們共同定義3D對象的形狀。

相關推薦

'如何優化人工智能、機器學習和深度學習的存儲'

"如今的人工智能和深度學習應用程序中使用了大數據集和快速I/O技術，但數據存儲可能會導致性能問題。人們需要了解人工智能和深度學習存儲系統應該具備哪些功能。人工智能技術廣泛應用在機器學習和深度學習中，已經引發了研究和產品開發的爆炸性增長，因為企業發現了創造性的方法，將這些新算...

人工智能深度學習機器學習設計操作系統算法軟件技術分佈式計算 GPU 硬件英偉達工程師人生第一份工作中央處理器電腦固態硬盤 2019-09-16

'機器學習和深度學習的區別是什麼'

"機器學習和深度學習是人工智能的兩個子集，在過去兩年中引起了很多關注。如果你在這裡想以最簡單的方式理解這兩個術語，那就沒有比這更好的地方了。人工智能這兩個領域，即機器學習和深度學習，提出了比整個領域組合更多的問題，主要是因為這兩個領域經常混淆並在提到數據統計建模時可以互換使...

機器學習深度學習人工智能算法技術軟件設計高德納集團人生第一份工作維基百科 2019-09-15

'AiLearning:一個 GitHub萬星的中文機器學習資源'

"關注微信公眾號：人工智能前沿講習，重磅乾貨，第一時間送達傳送門：ailearning.apachecn.orgGithub：github.com/apachecn/AiLearning這套名叫AI Learning的GitHub資源，彙集了30多名貢獻者的集體智慧，把學習...

GitHub 人工智能自然語言處理算法 2019-09-15

'5分鐘內看懂機器學習和深度學習的區別'

"在本文中，我們將研究深度學習和機器學習之間的差異。我們將逐一瞭解它們，然後討論他們在各個方面的不同之處。除了深度學習和機器學習的比較外，我們還將研究他們未來的趨勢和走向。深度學習 VS 機器學習深度學習與機器學習簡介一、什麼是機器學習？通常，為了實現人工智能，我們使用機器...

人工智能算法自然語言處理技術信息檢索 GPU 人生第一份工作市場營銷隨機森林 2019-09-09

'機器學習之誤差反向傳播算法'

"機器學習之誤差反向傳播算法我們知道神經網絡是由大量的參數即權重構成，神經網絡的學習過程則是這些參數的變化更新過程。誤差反向傳播算法就是用於更新這些參數的。這裡我們假設激活函數為Sigmoid。Ps: 在吳恩達機器學習反向傳播算法課程中，而不是：這是因為吳恩達中使用的損失...

機器學習算法吳恩達人工智能 2019-09-09

'瞭解學習樂高機器人和少兒編程的關鍵問題'

"樂高的機器人編程和代碼編程，說的再詳細一點，寫一篇更明白的文章，供大家參考。樂高機器人就是一種比較簡單的編程語言。編程者不需要自己去敲代碼，只需要將功能界面上的麼一個不一樣的了指令方框，拖到主界面上，接下來對指令框做一些參數設置這樣的操作，在有什麼好處呢？孩子一開始接觸編...

樂高積木機器人編程語言不完美媽媽程序員人生第一份工作 2019-09-08

'數據科學家不可不知的10種機器學習方法'

"作者 | CDA數據分析師10 machine learning methods that every data scientist should know機器學習是研究和工業中的熱門話題，新方法一直在發展。該領域的速度和複雜性使得即使對於專家而言也難以跟上新技術 - 並...

機器學習算法技術可視化技術人工智能數學隨機森林貨車建築 2019-09-07

'機器學習在ABR算法中的應用縱覽'

"本文整理自LiveVideoStack線上分享第三季，第五期，由清華大學計算機系網絡技術研究所博士生王莫為為大家介紹近些年ABR算法的發展，探討基於機器學習的ABR算法的優劣勢，並結合AiTrans比賽分析其在直播場景中的應用問題。文/王莫為整理/LiveVideoSta...

算法機器學習技術深度學習愛奇藝清華大學 YouTube 創作者來直播人工智能歷史 2019-09-07

'全棧工程師必備的進階教材：Python+數據分析+機器學習全套無償送'

"全棧工程師是指掌握多種技能，並能利用多種技能獨立完成產品的人。也叫全端工程師(同時具備前端和後臺能力)，英文Full Stack developer。什麼樣的人適合學習“ Python全棧 ”？一、零基礎、邏輯思維能力強如果你認為自己的邏輯思維能力很強，想通過學一門技術來...

Python 工程師機器學習數據庫技術人工智能物理數學編程語言大學 Linux 跳槽那些事兒彙編語言網絡爬蟲 SQL 英語大數據物聯網 2019-09-06

'每個數據科學家都應該知道的10種機器學習方法'

機器學習算法技術可視化技術人工智能數學貨車隨機森林建築 2019-09-06

'新藥研發、診斷疾病…機器學習如何改變醫療行業？'

"全文共1785字，預計學習時長3分鐘圖片來源：pexels.com/@pixabay醫療行業正生成著大量數據。如今，傳感器生成數據等新式數據收集方法為醫療行業贏得了領先地位。利用這些數據，可以用更低的成本提供更優質的醫療服務，並提高病人的滿意度——只要有機器學習(ML)技...

人工智能技術大數據圖像處理 Hadoop IBM 自然語言處理軟件癌症檔案腫瘤 2019-09-05

'2019年，機器學習的10種方式正在革新制造業'

"作者 | Louis Columbus來源 | CDA數據分析師10 Ways Machine Learning Is Revolutionizing Manufacturing In 2019人工智能有可能在全球業務的營銷和銷售中創造1.4T至2.6T的價值，在供應鏈管...

機器學習人工智能麥肯錫公司技術波士頓諮詢公司 Azure 投資算法德勤無人駕駛區塊鏈市場營銷原汁原味的德系SUV 微軟深度學習 2019-09-04

'聊一聊大家都關注的機器學習的可解釋性，這個太重要了'

"隨著AI和機器學習的發展，越來越多的決策會交給自動化的機器學習算法來做。但是當我們把一些非常重要的決定交給機器的時候，我們真的放心麼？當波音飛機忽略駕駛員的指令，決定義無反顧的衝向大地；當銀行系統莫名其妙否決你的貸款申請的時候；當自動化敵我識別武器系統決定向無辜平民開火的...

機器學習算法人工智能技術可視化技術 2019-09-04

'影響未來的十大算法之一：機器學習與數據挖掘的PageRank算法'

"由於公司架構調整和業務方向的轉變，我所在的項目組即將接手一個機器學習和數據挖掘的項目，為了後續更好地開展工作，也為了能提高自己的專業技能，我決定開始學習機器和數據挖掘方面的知識。那麼，問題就來了：到底應該從哪裡開始學起呢？最開始我也買了一些機器學習相關的入門書籍，跟著聽一...

算法機器學習數據挖掘 Google 拉里·佩奇斯坦福大學 Python 發現佩奇在線教育 2019-09-03

'分享圖靈大佬總結的人工智能、機器學習、數據挖掘的區別'

"導語人工智能、機器學習、數據挖掘已然越來越火，我只是聽了個耳熟，真正學習才剛剛開始，簡單的說一下最近的學習成果：AI ML DM的區別。總體來說三者的區別是目的不同，但達到目的的方法有很大重疊之處。數據挖掘是用來理解事物的；機器學習是用來預測事物的；人工智能是用來生成行動...

人工智能數據挖掘阿蘭·圖靈算法數據庫技術電腦英語計算複雜性理論 2019-09-03

'GitHub機器學習代碼分類器：300種編程語言僅憑代碼輕鬆鑑別'

"【新智元導讀】OctoLingua的目標是提供一種服務，支持從多個粒度級別（從文件級別或片段級別到潛在的行級語言檢測和分類）進行強大可靠的語言檢測。最終，該服務可以支持代碼搜索和共享、語法高亮顯示和差異渲染等，旨在支持開發人員進行日常開發工作，同時幫助編寫高質量的代碼。...

GitHub 編程語言人工智能 Ruby Java Python 腳本語言 Vim 斐波那契眾包 Perl Objective-C Emacs 2019-09-03

'實力認證！百度機器學習開發平臺戰略領跑市場，居於首位'

"近日，國際權威研究機構IDC發佈了首份《IDC MarketScape：中國機器學習開發平臺2019廠商評估》，報告中百度機器學習開發平臺以能力和戰略領先同行，處於象限右上方，尤其是戰略方向領跑市場，居於首位。該報告誕生的背景是，在2019年 IDC 看到機器學習的應用場...

人工智能百度技術中國人壽保險酷派能源魅族16s Pro 銀行上海浦東發展銀行山東 2019-09-02

'半路出家，如何從0到1學習機器學習？'

"作為一個數學系出身，半路出家開始搞機器學習的人，在學習機器學習的過程中自然踩了無數的坑，也走過很多本不該走的彎路。於是很想總結一份如何入門機器學習的資料，也算是為後來人做一點點微小的貢獻。▌前言在 2016 年 3 月，隨著 AlphaGo 打敗了李世乭，人工智能開始大規...

人工智能 SQL 操作系統數學算法 Hive Linux 腳本語言推薦技術工程師文章電腦讀書騰訊新聞知乎大數據人生第一份工作 2019-09-02

'三分鐘快速理解人工神經網絡，分享機器學習資料'

"概念認識隨著機器學習和神經網絡兩個不同學科的獨立發展，兩個學科碰撞出了火花--就是我們說的深度學習，深度學習借鑑了神經元的模型，通過模擬多個神經元的連接運算進行訓練學習，實際上深度學習指的就是人工神經網絡，為什麼叫人工呢？這是因為它與神經網絡事有區別的，神經網絡並沒有層的...

人工智能機器學習深度學習大數據 2019-09-02

'吳恩達關於機器學習職業生涯以及閱讀論文的一些建議（附鏈接）'

"來源：AI公園本文約2800字，建議閱讀7分鐘。本文將介紹關於吳恩達如何建立機器學習職業生涯的建議。介紹既然你已經在閱讀這篇文章了，那麼你可能已經知道該領域的先驅之一Andrew Ng是誰，並且你可能對會對他關於如何建立機器學習職業生涯的建議感興趣。本博客總結了斯坦福大學...

吳恩達人工智能讀書人生第一份工作 Twitter 語音識別技術文章跳槽那些事兒 YouTube 數學算法斯坦福大學 2019-09-02

推薦中...