機器學習中幾種常見的分佈

機器學習人工智能技術機器學習與數據挖掘 2018-12-05

數據分佈在機器學習中非常重要，因此，學習算法更需要了解不同的數據分佈。

伯努利分佈

伯努利分佈又稱為0/1分佈，是一種離散分佈,有兩種可能的結果。1表示成功，出現的概率為p(其中0<p<1)。0表示失敗，出現的概率為q=1−p。

二項分佈

二項分佈，即重複n次獨立的伯努利試驗。在每次試驗中只有兩種可能的結果，而且兩種結果發生與否互相對立，並且相互獨立，與其它各次試驗結果無關，事件發生與否的概率在每一次獨立試驗中都保持不變，則這一系列試驗總稱為n重伯努利實驗，當試驗次數為1時，二項分佈就是伯努利分佈。

多項式分佈

多項式分佈（Multinomial Distribution）是二項式分佈的推廣。

二項分佈的典型例子是扔硬幣，硬幣正面朝上概率為p,重複扔n次硬幣，k次為正面的概率即為一個二項分佈概率。（嚴格定義見伯努利實驗定義）。把二項分佈公式推廣至多種狀態，就得到了多項分佈。

某隨機實驗如果有k個可能結局A1、A2、…、Ak，分別將他們的出現次數記為隨機變量X1、X2、…、Xk，它們的概率分佈分別是p1，p2，…，pk，那麼在n次採樣的總結果中，A1出現x1次、A2出現x2次、…、Ak出現xk次的這種事件的出現概率P有下面公式：

泊松分佈

泊松分佈的參數λ是單位時間(或單位面積)內隨機事件的平均發生率。泊松分佈適合於描述單位時間內隨機事件發生的次數。

指數分佈

beta分佈

瞭解beta分佈之前，我們需要了解beta函數：

拋硬幣的例子中，x為正整數，所以拋n次硬幣，出現x次正面的後驗概率分佈為

所以才有Beta分佈與二項分佈互為共軛分佈。

Dirichlet分佈

前面我們講到Beta分佈式二項式分佈的共軛先驗，Dirichlet分佈則是多項式分佈的共軛先驗。

Dirichlet（狄利克雷）同時可以看做是將Beta分佈推廣到多變量的情形。概率密度函數定義如下：

α為其參數，且大於零。

B(α)表示 Dirichlet分佈的歸一化常數：

Dirichlet分佈的期望為：

注：Dirichlet分佈在LDA中用重要的應用。

給大家推薦一款專注於機器學習的問答社區——“八斗問答”(微信小程序搜索)。圍繞深度學習、機器學習等主題展開，有很多高校教授、博士生、工程師入駐，免費在線解答疑惑。有任何人工智能相關的問題都可以在這兒提問，當然也會得到滿意的答案。

想要系統學習知識，大家也可以關注下面專欄，內容寫的還不錯。

相關推薦

'能否加速破解暗物質之謎？大型強子對撞機，再加上機器學習算法'

"博科園：本文為粒子物理學類大型強子對撞機的每一次質子碰撞都不同，但只有少數是特殊的。這種特殊的碰撞產生了不尋常的粒子（可能是新粒子、違反物理現象等）或者有助於填補我們對宇宙不完整的認識。發現這些碰撞比眾所周知的大海撈針要困難得多，但改變的革新正在路上。費米實驗室的科學家和...

機器學習算法技術 Azure 電腦硬件物理中央處理器麻省理工學院歐洲 GPU 設計摩托車彼得·希格斯 2019-09-19

'自然語言理解技術在電商行業中的應用'

"本文將通過最新的概念驗證項目，盤點不同電子商務場景下的最新自然語言處理技術應用，深入瞭解電子商務行業與NLP技術的發展趨勢。電子商務是目前在互聯網相關產業中最為重要的一個環節之一，電商泛指通過互聯網技術實現的商貿活動，其內容包括各種在線上進行的商業活動，交易活動，金融活動...

自然語言處理技術語音識別技術電子商務人工智能萬物嚐鮮節機器人金融市場營銷人力資源電腦 2019-09-19

'機器速記上馬服務奧運會：訊飛成北京冬奧會自動語音轉換供應商'

"2019年9月16日，北京2022年冬奧會和冬殘奧會官方自動語音轉換與翻譯獨家供應商發佈會在北京冬奧組委園區舉行。科大訊飛股份有限公司正式成為北京2022年冬奧會和冬殘奧會官方自動語音轉換與翻譯獨家供應商。北京冬奧組委專職副主席、祕書長韓子榮，科大訊飛董事長劉慶峰，中國奧...

冬季奧林匹克運動會奧林匹克運動會科大訊飛技術語音合成機器學習劉慶峰語音識別技術國家電網中國石油化工集團自然語言處理體育喻紅招聘青島中國石油 2019-09-19

'德媒：經濟科技進步增強中國人自信心'

"德國《每日鏡報》網站9月4日刊登題為《中國之光》的報道稱，從北京到柏林的航班上，一箇中國旅行團的團員們在大聲交談，周圍好幾排人都能聽到他們的談話。他們大多是退休人員，第一次到歐洲旅遊，在談論自己的孫子，談論想要在旅途中購買什麼東西。飛機降落後，他們興奮地高喊：“這是柏林！...

德國經濟技術柏林習近平人工智能農村華為公司歐洲大數據 2019-09-18

'微軟亞洲研究院向國內高校教師和從業者推出AI教育與學習共建社區'

"微軟亞洲研究院人工智能教育團隊日前已經創建名為人工智能教育與學習共建社區為國內教師和從業者提供幫助。據介紹該社區是在教育部指導下依託人工智能開放科研教育平臺，由微軟亞洲研究院研發團隊和學術合作部建立。在學習社區中微軟亞洲研究院將提供人工智能應用開發的真實案例，配套的教程以...

微軟人工智能微軟亞洲研究院技術亞洲 Windows Windows 10 2019-09-18

'華科學子在全國大學生智能汽車競賽中再創佳績'

" 近日，第十四屆全國大學生"恩智浦"杯智能汽車競賽全國總決賽舉行，華中科技大學智能車隊的五支代表隊分別參加了無線節能、雙車會車、室內機器人對弈、室外光電導航和室外電磁越野等五個組別的比賽；經過激烈爭奪五支參賽隊均獲得各自組別的一等獎（最高獎），取得了我校參加該項賽事以來的...

賽車華中科技大學恩智浦半導體機器人技術人工智能清華大學哈爾濱工業大學屏住呼吸智能汽車來了浙江大學無人駕駛設計電信大學操作系統 2019-09-18

'從BIM到“BAI”，在技術融合中設計更加有力量'

"歐特克/圖為2019歐特克AU中國“大師匯”現場。中國經濟導報中國發展網記者王曉濤報道毛志兵，中國建築股份有限公司總工程師；Alok Gandhi，Base FX PLE全球負責人，前者的企業是全球著名投資建設企業，後者的公司則是電影特效製作行業的翹楚。在人們的眼中，...

技術設計人工智能 Autodesk 建築軟件中國建築物聯網經濟巴黎人生第一份工作可視化技術廣東機器學習塞納河傳媒投資 2019-09-18

'投資10億，機器人造機器人！全球最大機器人工廠落戶上海'

"近日，由上海建工五建集團承建的ABB機器人未來工廠項目舉行了開工奠基儀式。建成後，該項目為ABB公司在全球範圍內最大、最先進、最具柔性的機器人工廠。該工廠預計將於2021年投入運營，總投資額達1.5億美元（約10億人民幣）。ABB機器人未來工廠項目舉行開工奠基儀式該工程由...

機器人上海技術上海建工集團機器學習跳槽那些事兒投資 2019-09-18

'動漫中的“蜘蛛坦克”有實用價值嗎？日本網友把模型做出來了'

"【動漫雜談】手工大佬與蜘蛛機器人：科幻動畫有很多分支，如果故事的舞臺背景設定在近未來，那有兩種技術幾乎是一定會出現。那就是“人工智能”和“仿生學”。這兩種技術不僅容易理解，而且創作的過程也有很多現成的東西作為參考，稍微下點功夫，就能展現出濃濃的“科幻感”。而“蜘蛛機器人”...

坦克蜘蛛動漫機器人設計日本技術動畫機關槍科幻小說人工智能 PSYCHO-PASS 攻殼機動隊 2019-09-17

'多地瞄準中高端領域謀佈局 5G、工業互聯網釋放新潛力'

"外匯天眼APP訊 : 過去幾年，全球機器人市場出現拐點，由高速增長轉為低速增長。業內認為，機器人產業已經進入深度調整階段，而5G、人工智能、工業互聯網等新興科技將有望重塑機器人產業，推動供給和需求的擴大，讓機器人產業仍然是推動新舊動能轉換和經濟高質量發展的重要動力。圍繞高...

我的第一部5G手機機器人人工智能技術經濟航天科技設計手術兩百年算法中國民營火箭發射徐曉蘭 2019-09-17

'中秋佳節：沒編程合集大團圓！318本編出電子書籍➕視頻資料項目'

"中秋節佳節，小夥伴們都放假開心的回家團圓去了吧？這不、小編給你們帶來了更開心的事情、那就是給你們準備好了編程合集大團圓！全網最全編程語言視頻教程（從零基礎到大牛哦！）包含java、python、web、大數據、人工智能、等視頻教程+項目+源碼，現在免費分享給各位！[領取方...

Java 人工智能 Linux 技術腳本語言大數據 Node.js UNIX 程序設計設計 Python 數據庫移動互聯網 HTML HTML5 編程語言操作系統最圓不過中秋月網頁設計 CSS 程序員 JavaScript JSP 自然語言處理 GNU ASP IBM Velocity 讀書中央處理器硬件英語 PHP 文章 2019-09-17

'如何優化人工智能、機器學習和深度學習的存儲'

"如今的人工智能和深度學習應用程序中使用了大數據集和快速I/O技術，但數據存儲可能會導致性能問題。人們需要了解人工智能和深度學習存儲系統應該具備哪些功能。人工智能技術廣泛應用在機器學習和深度學習中，已經引發了研究和產品開發的爆炸性增長，因為企業發現了創造性的方法，將這些新算...

人工智能深度學習機器學習設計操作系統算法軟件技術分佈式計算 GPU 硬件英偉達工程師人生第一份工作中央處理器電腦固態硬盤 2019-09-16

'活在想象中的高科技疊衣櫃，看似智能卻處處智障'

"髒衣服攢啊攢，一直堆成一大籃子再一起洗，這種痛你也經歷過嗎？關鍵問題吧，光洗一大籃子衣服也就罷了，洗完還要拿出去晾乾，然後還要再疊起來放起來。。要是。。有臺機器可以幫著疊衣服那該多好啊~你別說，還真有！幾年前，島國的 Seven Dreamers 公司就研發了一款號稱是全...

服裝機器人人工智能技術良心國貨大賞工程師 2019-09-16

'阿里在職架構師推出了的一份Python學習清單，這一定是你最需要的'

"站在風口上，豬都能飛起來。人工智能風口，讓Pyhon這門膠水語言轉變成非常火的網紅語言。編程功力深厚的程序員花一兩個星期就能上手Python，而一些新手程序員花幾個月就可以上手。學編程，用Python確實是一個相當不錯的選擇。不過，面對Python網上有紛雜的資料，一些程...

Python MySQL 數據庫 Linux 程序員讀書 Django 面向對象程序編程 CSS HTML JavaScript MongoDB jQuery 人工智能編程語言算法硬件物聯網路由器操作系統 2019-09-16

'趨勢報告：嵌入式人工智能在軍事中的應用'

"人工智能正重新定義決策和反應能力，形成了一種誰擁有人工智能誰就具有全球影響力的環境。各個國家和地區正在部署採用人工智能的智能機器和其他認知攻擊能力，試圖在新時代的戰爭開始時，提高各自的全球影響力，同時削弱其他國家的全球影響力。新時代的戰爭將使用人工智能，並採用合理且可廣泛...

人工智能技術無人駕駛中央處理器雲計算軟件硬件算法物聯網電腦設計政治電子戰雷達大數據 2019-09-16

'A股紅盤迎中秋四條投資主線不可錯過'

"益學投資金融研究院院長張翠霞深滬兩市股指在主動性技術調整兩個交易日後，給出觸底回升小陽線，為北上資金規模性淨買入、機構資金主動作為的積極盤口，有利節後繼續演繹震盪攀升主升浪。盤口看，保險、釀酒、房地產、日用化工、運輸服務、旅遊、建築、證券、化纖、家用電器、通信設備、鋼鐵...

滬指潤和軟件大富科技浪潮軟件榕基軟件海格通信傑賽科技中秋節長電科技盛路通信投資技術通信軟件深圳證券交易所金融頭號大贏家| 理財大賽第二季我的第一部5G手機證券投資基金人工智能信息安全東方國信上海新陽風華高科東方財富海通證券上海貝嶺中國證監會家用電器 2019-09-16

'分佈式機器學習之——Spark MLlib並行訓練原理'

"這裡是王喆的機器學習筆記的第二十五篇文章。接下來的幾篇文章希望與大家一同討論一下機器學習模型的分佈式訓練的問題。這個問題在推薦、廣告、搜索領域尤為突出，因為在互聯網場景下，動輒TB甚至PB級的數據量，幾乎不可能利用單點完成機器學習模型的訓練，分佈式機器學習訓練成為唯一...

Spark 機器學習分佈式計算並行計算大數據 GPU 算法 Docker 中央處理器工程師文章物理 2019-09-16

'中秋假期能玩啥換銘瑄RTX SUPER宅家樂'

"開學十來天就遇到中秋假，雖然時間不長也好歹有小三日，去外面玩可能時間困窘（指週一還是要正常上學），所以拿著剛剛開學季更換的電腦在家打打遊戲不妨一種消遣。到時候回家了，除了陪伴家人，自由時間做點啥？有經濟性一點的肯定是打打遊戲啦。新出的遊戲很多，例如之前寫過的《戰爭機器5》...

怪物獵人中秋節開放世界龍騰世紀電腦解謎遊戲 A-RPG 人工智能 2019-09-15

'機器學習和深度學習的區別是什麼'

"機器學習和深度學習是人工智能的兩個子集，在過去兩年中引起了很多關注。如果你在這裡想以最簡單的方式理解這兩個術語，那就沒有比這更好的地方了。人工智能這兩個領域，即機器學習和深度學習，提出了比整個領域組合更多的問題，主要是因為這兩個領域經常混淆並在提到數據統計建模時可以互換使...

機器學習深度學習人工智能算法技術軟件設計高德納集團人生第一份工作維基百科 2019-09-15

'學編程時搞不懂邏輯怎麼辦，要不玩個遊戲放鬆學習一下！'

"邏輯學習每位小萌新在學習程序開發的時候，都會遇到邏輯問題，學習的效果甚微，可能就是學習邏輯不夠哦，那麼除了學習，適當的放鬆也是不錯的喲，下面推薦一個遊戲。這個遊戲的名字就叫異常，在其他app商店都可以找到。遊戲介紹《異常》是一個關於AI編程的遊戲。在遊戲中，玩家要幫助虛...

機器人人工智能程序員電腦 2019-09-15

推薦中...