「可解釋ML/3D深度學習等」Github六月最受歡迎的機器學習庫來啦

GitHub 機器學習深度學習 Google 微軟機器人人工智能技術許嵩算法歐幾里得 Lime 金融可視化技術開源軟件數據學習DataLearner 2019-06-27

SHUBHAM SINGH總結了Github上6月份最火的7個項目。這七個項目涵蓋可解釋性機器學習、3D深度學習、時間序列挖掘以及可視化工具等。各個項目都非常優秀。值得收藏查看。

InterpretML by Microsoft – Machine Learning Interpretability

解釋性在機器學習中是一件巨大的事情。能夠理解模型如何產生它所做的輸出 - 這是任何機器學習項目的關鍵方面。

InterpretML是Microsoft的一個開源軟件包，用於訓練可解釋的模型和解釋黑盒系統。微軟在解釋為什麼可解釋性至關重要時說得最好：

模型調試：為什麼我的模型犯了這個錯誤？
檢測偏差：我的模型是否有區分能力？
人與人工智能合作：我如何理解並信任模型的決策？
法規遵從性：我的模型是否滿足法律要求？
高風險應用：醫療保健，金融，司法等

隨著複雜性的增加，解釋機器學習模型的內部工作變得更加困難。你有沒有試過拆開並理解多個模型合奏？這需要花費大量的時間和精力。

我們不能簡單地使用複雜的模型去應對我們的客戶或領導，而不能解釋它如何產生良好的分數/準確性。

Microsoft Research的人員開發了可解釋的提升機（EBM）算法來幫助解釋。這種EBM技術具有高精度和可解釋性。

解釋ML不僅限於使用EBM。它還支持LIME，線性模型，決策樹等算法。它能比較模型併為我們的項目挑選最好的模型！

https://github.com/microsoft/interpret

Tensor2Robot (T2R) by Google Research

Google發佈的最新開源名為Tensor2Robot（T2R）的庫非常有意思。 T2R是用於大規模深度神經網絡的訓練，評估和推理的庫。但是它的開發考慮了一個特定的目標，即它適用於與機器人感知和控制相關的神經網絡。

此存儲庫包含分佈式機器學習和強化學習基礎結構

它在Alphabet內部使用，開源的目的是使Robotics @ Google的研究對於更廣泛的機器人和計算機視覺社區提供可重複性的工作。T2R是基於Tensorflow的框架。

機器人研究中的常見任務涉及向神經網絡圖添加新的傳感器模態或新的標籤張量。這涉及1）更改保存的數據，2）在訓練時更改數據管道代碼以讀取新模態3）添加新的tf.placeholder以在測試時處理新的輸入模態。 Tensor2Robot的主要功能是為步驟2和3自動生成TensorFlow代碼。Tensor2Robot可以自動生成模型的佔位符以匹配其輸入，或者導出可以與TFExportedSavedModelPolicy一起使用的SavedModel，以便原始圖形不是必須重建。

https://github.com/google-research/tensor2robot

Generative Models in TensorFlow 2

這是一個在Tensorflow 2中實現大量生成模型的小項目。圖層和優化器使用Keras。這些模型是針對兩個數據集實現的：MNIST和NSYNTH。編寫這個框架的目的是儘可能簡單和一致，同時仍然可讀。因為每個網絡都是自包含在notebook中的，所以它們應該可以在colab會話中輕鬆運行。

這個庫已經實現的模型包含：

Autoencoder(AE)
Variational Autoencoder(VAE)
Generative Adversarial Network(GAN)
Wasserstein GAN with Gradient Penalty (WGAN-GP)
VAE-GAN
Generative adversarial interpolative autoencoder (GAIA)

https://github.com/timsainb/tensorflow2-generative-models

STUMPY – Time Series Data Mining

STUMPY是一個功能強大且可擴展的庫，可幫助我們執行時間序列數據挖掘任務。 STUMPY旨在計算矩陣輪廓（matrix profile）。矩陣輪廓是一個向量，它存儲了時間序列中任何子序列與其最近鄰居之間的z標準化歐幾里德距離。

詳情可參考：https://stumpy.readthedocs.io/en/latest/Tutorial_0.html

它可以用來處理很多時序數據的挖掘任務：

模式/主題（在較長時間序列內近似重複的子序列）發現
異常點發現
shapelet 發現
語義分割
密度估計
時間序列鏈（時序有序的子序列模式）
等等其他的

https://github.com/TDAmeritrade/stumpy

MeshCNN in PyTorch

MeshCNN是用於3D三角網格的通用深度神經網絡。這些網格可用於3D形狀分類或分割等任務。計算機視覺的精湛應用。

MeshCNN框架包括直接應用於網格邊緣的卷積，池化和解除層：

3D深度學習吸引了業界的興趣，包括機器人和自動駕駛等領域。 3D形狀的問題在於它們本質上是不規則的。這使得像卷積這樣的操作變得很困難。

https://github.com/ranahanocka/MeshCNN

Awesome Decision Tree Research Papers

決策樹算法是我們在機器學習中學到的第一批高級技術。這種方法可以在更大的數據集上使用。

這個存儲庫是數據科學家的寶庫。存儲庫包含基於樹的算法的論文集合，包括決策，迴歸和分類樹。存儲庫還包含每篇論文的實現。

https://github.com/benedekrozemberczki/awesome-decision-tree-papers

TensorWatch by Microsoft Research

TensorWatch是一個調試和可視化工具，專為數據科學，深度學習和強化學習而設計。它適用於Jupyter Notebook，可顯示機器學習訓練的實時可視化，併為您的模型和數據執行其他幾項關鍵分析任務。

TensorWatch旨在靈活且可擴展，因此您還可以構建自己的自定義可視化，UI和儀表板。除了傳統的“所見即所見”方法外，它還具有針對您的實時ML訓練流程執行任意查詢的獨特功能，作為查詢結果返回流並使用。

https://github.com/microsoft/tensorwatch

相關推薦

'如何優化人工智能、機器學習和深度學習的存儲'

"如今的人工智能和深度學習應用程序中使用了大數據集和快速I/O技術，但數據存儲可能會導致性能問題。人們需要了解人工智能和深度學習存儲系統應該具備哪些功能。人工智能技術廣泛應用在機器學習和深度學習中，已經引發了研究和產品開發的爆炸性增長，因為企業發現了創造性的方法，將這些新算...

人工智能深度學習機器學習設計操作系統算法軟件技術分佈式計算 GPU 硬件英偉達工程師人生第一份工作中央處理器電腦固態硬盤 2019-09-16

'機器學習和深度學習的區別是什麼'

"機器學習和深度學習是人工智能的兩個子集，在過去兩年中引起了很多關注。如果你在這裡想以最簡單的方式理解這兩個術語，那就沒有比這更好的地方了。人工智能這兩個領域，即機器學習和深度學習，提出了比整個領域組合更多的問題，主要是因為這兩個領域經常混淆並在提到數據統計建模時可以互換使...

機器學習深度學習人工智能算法技術軟件設計高德納集團人生第一份工作維基百科 2019-09-15

'AiLearning:一個 GitHub萬星的中文機器學習資源'

"關注微信公眾號：人工智能前沿講習，重磅乾貨，第一時間送達傳送門：ailearning.apachecn.orgGithub：github.com/apachecn/AiLearning這套名叫AI Learning的GitHub資源，彙集了30多名貢獻者的集體智慧，把學習...

GitHub 人工智能自然語言處理算法 2019-09-15

'機器學習&深度學習基礎（tensorflow版本實現的算法概述0）'

"tensorflow集成和實現了各種機器學習基礎的算法，可以直接調用。代碼集：https://github.com/ageron/handson-ml監督學習1）決策樹（Decision Tree）和隨機森林決策樹：決策樹是一種樹形結構，為人們提供決策依據，決策樹可以用...

機器學習算法深度學習隨機森林 2019-09-14

'又有一本深度學習方面的入門書要與您見面啦'

"小編告訴您一個好消息，有一本最新的深度學習入門書即將要與您見面。喜歡深度學習的朋友們可以關注一下。深度學習案例精粹（Deep Learning By Example）使用TensorFlow框架，輕鬆理解深度學習算法包含大量案例，快速動手實現深度學習任務可下載配套源碼+...

深度學習人工智能算法機器學習自然語言處理電腦人生第一份工作生物醫學 CNN 讀書 2019-09-13

'5分鐘內看懂機器學習和深度學習的區別'

"在本文中，我們將研究深度學習和機器學習之間的差異。我們將逐一瞭解它們，然後討論他們在各個方面的不同之處。除了深度學習和機器學習的比較外，我們還將研究他們未來的趨勢和走向。深度學習 VS 機器學習深度學習與機器學習簡介一、什麼是機器學習？通常，為了實現人工智能，我們使用機器...

人工智能算法自然語言處理技術信息檢索 GPU 人生第一份工作市場營銷隨機森林 2019-09-09

'聊一聊大家都關注的機器學習的可解釋性，這個太重要了'

"隨著AI和機器學習的發展，越來越多的決策會交給自動化的機器學習算法來做。但是當我們把一些非常重要的決定交給機器的時候，我們真的放心麼？當波音飛機忽略駕駛員的指令，決定義無反顧的衝向大地；當銀行系統莫名其妙否決你的貸款申請的時候；當自動化敵我識別武器系統決定向無辜平民開火的...

機器學習算法人工智能技術可視化技術 2019-09-04

'GitHub機器學習代碼分類器：300種編程語言僅憑代碼輕鬆鑑別'

"【新智元導讀】OctoLingua的目標是提供一種服務，支持從多個粒度級別（從文件級別或片段級別到潛在的行級語言檢測和分類）進行強大可靠的語言檢測。最終，該服務可以支持代碼搜索和共享、語法高亮顯示和差異渲染等，旨在支持開發人員進行日常開發工作，同時幫助編寫高質量的代碼。...

GitHub 編程語言人工智能 Ruby Java Python 腳本語言 Vim 斐波那契眾包 Perl Objective-C Emacs 2019-09-03

'深度學習-機器學習從入門到深入全套資源分享'

" 深度學習、機器學習從入門到深入，全套資源分享。涉及深度學習、機器學習數學、算法基礎理論、實戰和工程開發相關最佳資源。深度學習常用模型相關教程，深度學習模型優化、調參相關技巧；深度學習常用的框架，公開數據集、國際頂級會議等相關資源。本文內容整理自網絡，原文地址：http...

深度學習人工智能 Kaggle 吳恩達算法工程師數學技術自然語言處理大數據跳槽那些事兒電腦 Google Coursera 麻省理工學院 2019-08-24

'近期七大Github熱門機器學習項目'

"讓我們一起來看下近期熱門的機器學習Github倉庫，包括了自然語言處理（NLP）、計算機視覺（CV）與大數據等多個領域。7月Top機器學習Github項目No.1 Pytorch-Transformers(NLP)https://github.com/huggingfac...

GitHub 機器學習 Python Linux 大數據變形金剛物聯網自然語言處理技術跳槽那些事兒算法 2019-08-19

'「機器學習」神經網絡淺講：從神經元到深度學習（一）'

"作者：計算機的潛意識鏈接：https://www.cnblogs.com/subconscious/p/5058741.html神經網絡是一門重要的機器學習技術。它是目前最為火熱的研究方向--深度學習的基礎。學習神經網絡不僅可以讓你掌握一門強大的機器學習方法，同時也可以更...

人工智能技術算法設計吳恩達電腦生物 2019-08-18

'來！一起捋一捋機器學習分類算法'

"大數據文摘出品來源：builtin編譯：邢暢、劉兆娜、李雷、錢天培說起分類算法，相信學過機器學習的同學都能侃上一二。可是，你能夠如數家珍地說出所有常用的分類算法，以及他們的特徵、優缺點嗎？比如說，你可以快速地回答下面的問題麼:KNN算法的優缺點是什麼？Naive Baye...

算法機器學習大數據技術歐幾里得信用卡程序設計 2019-08-12

'機器學習深度學習面試問題彙總（提升你的面試成功率）'

"作者：George Seif編譯：ronghuaiyang導讀在面試之前，你會覺得自己什麼都懂，但是真的開始面試了，你發現你自己什麼都不懂！可怕的機器學習面試。在面試之前，你會覺得自己什麼都懂，但是真的開始面試了，你發現你自己什麼都不懂！在過去的幾個月裡，我面試了很多公司...

機器學習人生第一份工作深度學習可視化技術算法技術人工智能創業自然語言處理科技向善萬家團圓亞馬遜三星集團 2019-08-06

'一篇文章講清楚人工智能、機器學習和深度學習的區別與聯繫+資料'

"人工智能：從概念提出到走向繁榮1956年，幾個計算機科學家相聚在達特茅斯會議，提出了“人工智能”的概念，夢想著用當時剛剛出現的計算機來構造複雜的、擁有與人類智慧同樣本質特性的機器。其後，人工智能就一直縈繞於人們的腦海之中，並在科研實驗室中慢慢孵化。之後的幾十年，人工智能一...

人工智能技術演化計算文章算法無人駕駛電腦自然語言處理工程師可視化技術軟件達特茅斯學院數學大學 2019-07-29

'李彥宏：人工智能時代，是機器來學習和適應人類'

"李彥宏資料圖“從戰略高度、世界眼光、前瞻思維、倫理角度等關鍵維度，不斷認知人工智能在經濟發展、社會進步、國際政治經濟格局等方面產生的深刻影響，才能加速我國新一代人工智能的發展。”百度董事長兼首席執行官李彥宏今（22）日在《人民日報》發表署名評論文章中感慨道。李彥宏指出，...

人工智能李彥宏技術倫理經濟歷史百度 2019-07-25

'3D重建傳統算法對比深度學習，SFU譚平：更需要的是二者的融合'

"機器之心原創作者：一鳴近年來，深度學習在計算機視覺的重要領域——三維重建中取得了一系列成果。然而，最近有論文指出，深度學習的 3D 重建表現甚至不如某些基線模型。而 CVPR 2019 最佳論文使用的是傳統的三維重建方法，並不依賴深度學習模型。近日，機器之心發表文章《 3...

算法譚平深度學習技術城市規劃大學高能小子終極裝備無人駕駛弗雷澤加拿大機器人新加坡國立大學照相機測繪不列顛哥倫比亞大學機器學習新加坡文章麻省理工學院浙江大學 2019-07-19

'人工智能知識點：機器學習+深度學習'

"1. 機器學習首先要學習機器學習算法，這是人工智能的核心，也是重中之重。在學習機器學習算法理論同時，建議大家使用scikit-learn這個python機器學習的庫，試著完成一些小項目。同時關注一下能否各種算法結合使用來提高預測結果準確率。在學習的過程中不必強求自己能夠完...

人工智能深度學習算法 Spark 機器人工程師 Python 技術人生第一份工作數學自然語言處理數據挖掘分佈式計算網絡爬蟲推薦技術 PyCharm 大數據 CNN Google 2019-07-18

'討厭機器學習！ML五大缺陷引熱議'

"魚羊發自凹非寺量子位報道 | 公眾號 QbitAI在當今的人工智能領域，機器學習已成主宰，獨領時代風騷。但登上技術王座並不意味著地位永固，萬眾歸心。偏偏就有人不買賬，恨不能拿著大喇叭向全世界宣佈：討厭機器學習！甚至還有理有據，靈魂拷問機器學習。振臂一呼，追隨者眾。對...

人工智能技術工程師高能小子終極裝備 GPU 程序員 Google 2019-07-18

'李沐新書推薦！零基礎《動手學深度學習》，能運行、可討論'

"編輯部發自凹非寺量子位編輯 | 公眾號 QbitAI最近很多想入門深度學習的讀者表示，深度學習的涉及面比較廣，對數學的要求比較高，想學也不太敢學，生怕認真學了卻沒學會。關於深度學習，網上的資料很多，不過大部分都不太適合初學者。有幾個原因：1、深度學習需要一定的數學基...

人工智能加州大學伯克利分校數學算法卡內基梅隆大學大學章用亞馬遜 Markdown HTML 伊利諾伊百度 LaTeX 澳大利亞 GitHub 聖迭戈 2019-07-17

'使用機器學習算法來構建智能聊天機器人'

"翻譯 | CDA數據分析研究院，轉載需授權原文 | https://blog.statsbot.co/chatbots-machine-learning-e83698b1a91e你是否曾與蘋果的Siri，亞馬遜的Alexa，微軟的Cortana或其他助手交談以設置鬧鐘、給...

人工智能算法機器人 Siri 文章 Alexa Internet 微軟小娜微軟哲學 2019-07-16

推薦中...