機器到底是如何學習的？

機器學習蚯蚓人工智能一個小時頭 2017-06-20

機器學習的一種方式，叫做人工神經網絡。我就講講這個神經網絡。

機器到底是如何學習的？

有一隻蚯蚓，它面前有一條路，路的左右兩側分別是兩堵牆，一堵是黑色的，一堵是白色的。白色的牆帶電，碰到就把蚯蚓電死了。

這隻蚯蚓的皮膚表面，有兩個光線傳感器，一左一右。這種傳感器，看到黑色，輸出0，看到白色，輸出1，看到灰色，輸出0.5。我們把左傳感器的輸出稱為SL，右傳感器的輸出稱為SR。

這隻蚯蚓腦子裡面有兩個可以修改的數字（變量），一個叫左神經元，一個叫右神經元，分別稱為GL和GR，取值範圍是-1到+1之間。

這隻蚯蚓在前進的過程中，可以向左偏或者向右偏，我們把這個稱為蚯蚓的決定，稱為D。決定的取值範圍是-1到+1，代表從左到右，取值為0就表示走中間。

我們現在定義：D = SL * GL + SR * GR

上式表示蚯蚓的決定，是通過將光線傳感器的輸出，分別乘以一個神經元變量，再加到一起得到的。

假設GL = -1，GR = +1，當SL = 1、SR = 0（左邊的牆白色，右邊的牆黑色）的時候，D = -1，表示往左走。顯然，蚯蚓就電死了。

假設GL = +1，GR = -1, 當SL = 1、SR = 0（左邊的牆白色，右邊的牆黑色）的時候，D= 1，表示往右走。蚯蚓就活了下來。

假設GL = +1，GR = -1, 當SL = 0、SR = 1（左邊的牆黑色，右邊的牆白色）的時候，D= -1，表示往左走。雖然調換了牆壁的亮度，但蚯蚓還是活了下來。

而且通過代入不同的亮度值我們還發現，即便某一邊的牆不是白色，但只要該邊的牆比另一邊的牆亮度更高，蚯蚓依然會偏向另一邊走，以增大存活機率。說明我們這個神經網絡還有普遍適應性，就算傳感器上有灰塵也能正常工作。

綜上所述，通過合理設定GL和GR的值，我們就可以讓一個有兩個神經元的神經網絡，通過簡單的四則運算，讓一條機器蚯蚓獲得了自動避開白色牆壁的能力。講到這裡，有的人問，這個值是你設定的，不是蚯蚓自己學習的呀！說的沒錯，有的複雜的系統，神經元可能有數十萬個，連接錯綜複雜，運算規則也可能各不相同，如果我不使用機器學習的方法，僅靠手動指定根本沒辦法確定每個神經元的取值。

機器到底是如何學習的？

下面我就來演示一種最簡單的學習方法。

我製造了1000條蚯蚓，每條蚯蚓的GL和GR都是從-1到+1之間的一個隨機數。然後我把這些蚯蚓，放到兩個牆壁之間，讓他們自己去走，最後肯定有一些蚯蚓電死了，有一些蚯蚓活下來；有一些蚯蚓迅速，有一些蚯蚓遲鈍。我就把那些迅速衝向一邊、而且沒被電死的蚯蚓，全抓出來，統計之後發現他們的神經元取值，都非常靠近(GL = +1, GR = -1)。這樣一來我就可以決定GL和GR的值了。這就是機器學習：GL和GR的取值是待解決的問題，1000條蚯蚓和他們的最終結局是訓練樣例，帶電的白牆是用來產生訓練樣例的現實過程。其中的魅力在於：我並不需要知道白牆和黑牆到底哪個帶電，一樣可以訓練出自動求生的蚯蚓！換言之，機器學習是通過經驗積累，而不是邏輯判斷的方式來解決問題。通過重複的操作實現經驗的積累，其實就是學習的本質；人工智能是這樣，人腦其實也是這樣的。如果我們能模擬人腦那麼多的神經元，並且將一個人幾十年的生活經驗作為訓練樣例，我們就能夠獲得一顆具有人類智慧的大腦。

講完這麼多，聰明的同學已經看出讓人工智能靠近人腦所面臨的幾大問題了。

1. 用計算機模擬10億個神經元的活動非常困難。（訓練困難）

2. 沒有辦法把一個人幾十年的生活過程記錄下來用做訓練樣例；即便記錄下來，產生的人工智能也僅僅具有這個人的思考能力而已。（優質樣例獲取困難）

實際上，人類今天所具有的各種求生本能，以及高級思考能力，是數十萬年來靠無數代的變異和自然選擇淘汰得到的。這個過程很像機器蚯蚓的訓練過程：不合格的蚯蚓只有死路一條，留下的自然是合格的。這意味著具有人類思考能力的人工智能，離我們還比較遙遠。不過幸運的是，在人工智能的應用過程中，往往並不需要人類的所有本能和所有思考能力，而往往只需要人類的非常小的某一部分神經所實現的能力（例如圖像辨識和語言組織能力）。也就是說，實用的人工智能，其能力介於傳統計算機和人類之間：既可以像人類那樣通過經驗解決一些規則和原理不明確的問題，同時又具有計算機的速度和準確度優勢。在未來的十五到三十年，這樣的人工智能會取代大量的知識性、經驗性但非創造性的工作，比如代替網友去淘寶刷好評，比如代替公安翻看視頻監控（這個已經實現了，現在可以自動識別套牌），比如代替作者和讀者交流文學作品（韓寒很需要）。

機器到底是如何學習的？

提高神經網絡的能力，可以分解成提高速度和提高容量。提高速度可以通過硬件性能上的提升、算法的優化實現；容量則分為兩個方面，一個是承載神經網絡的系統的容量（內存大小），一個是對網絡進行訓練的樣本容量。沒有足夠的樣本，難以得到好的訓練結果（一如沒有足夠的蚯蚓，難以積累求生的經驗）。當適用於機器學習的軟硬件平臺成熟普及之後，數據就成了追逐的對象，因為人工智能源於數據。

相關推薦

'一個悲傷的教育真相：不愛學習的孩子，可能是“自戀型”父母的人為製造'

"作者 | 劉純婷編輯 | Vivi1.一位母親，她兒子學業表現普通，但是她總是能找到很多好的角度看待他。我能真實地感覺到她那種發自內心對孩子的喜愛和欣賞。去年中考，她兒子表現很一般，只能去第三批次的高中。她們集團公司聚會的時候，她給兒子買帥氣的西服，孩子父親看見了，問她...

不完美媽媽服裝大學肺炎讀書西裝中國研究生入學考試中考文化蚯蚓 2019-09-19

'刷臉支付是如何盈利的？如何把握住刷臉支付風口？'

"馬雲豪言！刷臉支付的新風口，2019年將誕生一批千萬富翁！2019年是刷臉支付元年，付唄緊跟市場趨勢，9月起全員ALL in 掃臉這一重量級產品，目前已接入刷臉商戶5000 ，付唄蜻蜓為刷臉支付而生，產品因“具有精準營銷能力”，一上線便得到了市場的廣泛認可，超市、生鮮等行...

支付寶人臉識別技術馬雲蜻蜓人工智能阿里巴巴集團螞蟻金服萬物嚐鮮節雷軍青蛙西安金融創業 2019-09-19

'能否加速破解暗物質之謎？大型強子對撞機，再加上機器學習算法'

"博科園：本文為粒子物理學類大型強子對撞機的每一次質子碰撞都不同，但只有少數是特殊的。這種特殊的碰撞產生了不尋常的粒子（可能是新粒子、違反物理現象等）或者有助於填補我們對宇宙不完整的認識。發現這些碰撞比眾所周知的大海撈針要困難得多，但改變的革新正在路上。費米實驗室的科學家和...

機器學習算法技術 Azure 電腦硬件物理中央處理器麻省理工學院歐洲 GPU 設計摩托車彼得·希格斯 2019-09-19

'機器速記上馬服務奧運會：訊飛成北京冬奧會自動語音轉換供應商'

"2019年9月16日，北京2022年冬奧會和冬殘奧會官方自動語音轉換與翻譯獨家供應商發佈會在北京冬奧組委園區舉行。科大訊飛股份有限公司正式成為北京2022年冬奧會和冬殘奧會官方自動語音轉換與翻譯獨家供應商。北京冬奧組委專職副主席、祕書長韓子榮，科大訊飛董事長劉慶峰，中國奧...

冬季奧林匹克運動會奧林匹克運動會科大訊飛技術語音合成機器學習劉慶峰語音識別技術國家電網中國石油化工集團自然語言處理體育喻紅招聘青島中國石油 2019-09-19

'如何讓孩子愛上閱讀（一）'

"面對閱讀，很多家長都有這樣的疑問：我的孩子是不會讀，還是不愛讀？為什麼別人家的孩子那麼愛看書，我家的孩子卻只喜歡玩兒？閱讀要從多大開始培養？現在不培養，上學以後是不是很難適應？……很多媽媽想幫孩子，但卻苦於無從下手。培養閱讀需要找老師嗎？需要送去培訓機構嗎？其實家長自己也...

讀書不完美媽媽人工智能技術心理學機器人 2019-09-18

'人工智能將如何影響智能製造？| CNCC2019'

"雷鋒網按：回顧歷史，我們發現從18世紀60年代蒸汽機的發明引爆第一次工業革命開始，製造行業經歷了以蒸汽機為代表的機械化時代、以電力為代表的電氣自動化時代以及以計算機為代表的信息時代。進入二十一世紀後，隨著物聯網、雲計算、大數據、5G、機器人、人工智能等新技術的不斷髮展，以...

人工智能技術電腦物聯網雲計算我的第一部5G手機經濟機器人算法軟件跳槽那些事兒江蘇潘雲鶴南京歷史 2019-09-18

'KATRI李鉉友：韓國如何制定無人駕駛規劃'

"作者丨王瑞編輯丨郝秋慧傳統汽車行業已脫離機械製造範疇，朝智能化與數據化方向不斷髮展。9月16日，在上海市人民政府、工信部共同主辦的2019世界智能網聯汽車大會上，韓國機動車輛測試和研究中心（KATRI）自動車安全研究院首席運營官李鉉友做了主題演講，並接受億歐汽車的採訪。近...

無人駕駛韓國技術我的第一部5G手機通信交通人工智能網絡安全起亞汽車能源大學家用電器三星集團 CES 蘋果公司 Google 雷諾汽車上海拉斯維加斯 2019-09-18

'微軟亞洲研究院向國內高校教師和從業者推出AI教育與學習共建社區'

"微軟亞洲研究院人工智能教育團隊日前已經創建名為人工智能教育與學習共建社區為國內教師和從業者提供幫助。據介紹該社區是在教育部指導下依託人工智能開放科研教育平臺，由微軟亞洲研究院研發團隊和學術合作部建立。在學習社區中微軟亞洲研究院將提供人工智能應用開發的真實案例，配套的教程以...

微軟人工智能微軟亞洲研究院技術亞洲 Windows Windows 10 2019-09-18

'機器人火熱背後，下一步會如何？行業專家這些觀點值得一看'

"2019年9月16日，由中國機電一體化應用協會指導，CIRS組委會和中國機器人網、中國機電一體化應用協會智能機器人分會共同主辦的第九屆中國國際機器人高峰論壇在中國上海召開，一千多名來自全國各地的行業專家以及學者出席了本次會議。中國機器人網CEO趙勇、中國機電一體化應用協會...

機器人人工智能機械電子技術高峰李亞平上海能源法律環境保護操作系統經濟復星國際 2019-09-18

'投資10億，機器人造機器人！全球最大機器人工廠落戶上海'

"近日，由上海建工五建集團承建的ABB機器人未來工廠項目舉行了開工奠基儀式。建成後，該項目為ABB公司在全球範圍內最大、最先進、最具柔性的機器人工廠。該工廠預計將於2021年投入運營，總投資額達1.5億美元（約10億人民幣）。ABB機器人未來工廠項目舉行開工奠基儀式該工程由...

機器人上海技術上海建工集團機器學習跳槽那些事兒投資 2019-09-18

'揭祕集客工廠：如何開發自動集客模式'

"客流少成交難利潤低成本高面對以上難題，你是否有破局方法？接下來，讓我們一起揭祕集客工廠，如何開發自動集客模式？電銷是每個企業不可或缺的一股銷售力量，其優勢就是讓企業和客戶在未見面的前提下就能篩選並建立出合作意向，相比跑外尋找客戶要方便很多。同時，電銷在企業中的弊端也極為突...

機器人人工智能跳槽那些事兒語音識別技術技術人生第一份工作電腦 2019-09-18

'禾牧黑斑蛙特種養殖技術：如何提高青蛙養殖成活率'

"由於自然和人為因素的多種影響, 我國野生青蛙數量在不斷減少, 但消費者對青蛙的需求越來越多, 青蛙的高收益吸引著養殖戶投入青蛙養殖, 加上為了保持生態平衡, 人工養殖青蛙得到支持和鼓勵。由於我國目前對青蛙黑斑蛙的養殖技術研究不深入, 養殖技術不成熟, 使得青蛙養殖成功率不...

青蛙畜牧業技術昆蟲飼料螻蛄蚯蚓蝌蚪 2019-09-17

'馬克思如何區分生產消費和個人消費？其理論背景是什麼？'

"緊接上期。【案：下面寫勞動過程本身。前面的勞動資料和原料、產品等等都是過程的要素。】因此，產品作為生產資料進入新的勞動過程，也就喪失產品的性質【案：這是從生產資料進入生產過程看的，喪失產品性質。】。它們只是作為活勞動的物質因素起作用【案：活勞動的物質因素其實就是作為勞動對...

亞麻人工智能農民設計 2019-09-17

'產研專家學者集聚一堂談機器人未來會如何？落地產業或是出路'

機器人人工智能機械電子技術經濟高峰李亞平投資上海復星國際能源法律操作系統 2019-09-17

'如何優化人工智能、機器學習和深度學習的存儲'

"如今的人工智能和深度學習應用程序中使用了大數據集和快速I/O技術，但數據存儲可能會導致性能問題。人們需要了解人工智能和深度學習存儲系統應該具備哪些功能。人工智能技術廣泛應用在機器學習和深度學習中，已經引發了研究和產品開發的爆炸性增長，因為企業發現了創造性的方法，將這些新算...

人工智能深度學習機器學習設計操作系統算法軟件技術分佈式計算 GPU 硬件英偉達工程師人生第一份工作中央處理器電腦固態硬盤 2019-09-16

'阿里在職架構師推出了的一份Python學習清單，這一定是你最需要的'

"站在風口上，豬都能飛起來。人工智能風口，讓Pyhon這門膠水語言轉變成非常火的網紅語言。編程功力深厚的程序員花一兩個星期就能上手Python，而一些新手程序員花幾個月就可以上手。學編程，用Python確實是一個相當不錯的選擇。不過，面對Python網上有紛雜的資料，一些程...

Python MySQL 數據庫 Linux 程序員讀書 Django 面向對象程序編程 CSS HTML JavaScript MongoDB jQuery 人工智能編程語言算法硬件物聯網路由器操作系統 2019-09-16

'河間果子窪回鄉創業大學生如何從30元到40萬白手起家'

" 1983年出生的劉延傑是河間市果子窪鄉後黑馬村人，2005年畢業於北華航天工業學院機械製造與自動化系，憑著過硬的專業知識，多年來輾轉於深圳、北京等地打工。後來結婚生子，在城裡買樓買車，過著鄉下人羨慕的體面生活。但是，他的心裡一直有個夢，一個關於農村關於土地的夢。為此，...

畜牧業河間飼料蚯蚓創業不完美媽媽蔬菜農業致富經白蠟樹盆景農民發現佩奇槐樹動物 2019-09-16

'約翰·庫奇：天生極富創造力的我們，是如何被教育一步步摧毀的？'

"教育，一直是所有人關注的問題，從孩子出生開始，家長們就開始了一場沒有硝煙的競賽：學區房、早教、幼兒園，補習班，升學、特長學習……每個階段都不敢有絲毫的鬆懈。但是，我們的教育方式真的對嗎？家長們給孩子報的補習班，真的是他們想要學的嗎？在這場激烈的追逐賽中，我們是否停下來想一...

學前教育在線教育幼兒園不完美媽媽人工智能技術讀書人生第一份工作大學心理學數學設計藝術農村麻省理工學院蘋果公司 2019-09-16

'超高清視頻政策頻頻發佈，5G如何攪動4萬億市場規模？'

"9月12日消息，工信部答覆十三屆全國人大二次會議第6334號建議稱，四川在超高清視頻產業領域不僅擁有長虹、索貝等一批重點企業，還形成了較為完整的產業鏈。下一步，工業和信息化部、國家廣播電視總局將積極支持四川省落實國家和地方超高清視頻行動計劃要求，制定完善工作舉措，推動超高...

我的第一部5G手機技術愛奇藝體育四川廣東中國中央電視臺騰訊遊戲湖南上海中國聯通華為公司騰訊投資人工智能廣播週末綜藝指南 2019-09-16

'分佈式機器學習之——Spark MLlib並行訓練原理'

"這裡是王喆的機器學習筆記的第二十五篇文章。接下來的幾篇文章希望與大家一同討論一下機器學習模型的分佈式訓練的問題。這個問題在推薦、廣告、搜索領域尤為突出，因為在互聯網場景下，動輒TB甚至PB級的數據量，幾乎不可能利用單點完成機器學習模型的訓練，分佈式機器學習訓練成為唯一...

Spark 機器學習分佈式計算並行計算大數據 GPU 算法 Docker 中央處理器工程師文章物理 2019-09-16

推薦中...