一起學人工智能：推薦算法並不難，相似性是基礎，來看看相似算法

算法人工智能歐幾里得曼哈頓啤酒程序設計程序員 Java 西餐沙茶敏碎碎念 2019-06-11

有這麼一個有名的故事，一家超市把啤酒跟尿布放在一起之後銷量驚人，調查後是發現給孩子買奶布的同時，也會給爸爸買啤酒。啤酒與奶布，這兩種看起來毫不相關的東西，卻發現有一定的關聯性，在以前，發現物品的相關性需要一定的機緣巧合，但是在大數據時代，找到物品的相關性卻是非常的簡單，這也是人工智能的一個分支。

今天我們來講一講，常見的物品/用戶相似性的評分算法。

歐幾里德距離評價算法

我們不凡想象這麼一個業務場景，我們常常使用的外賣或者美食點評軟件，我們經常會對點過的餐或者吃過的餐廳進行評價，例如A給日料店4分，給粵菜館5分，給西餐3分，用戶B給日料店3分，給粵菜館4.5分，給西餐廳4分，那麼，這兩個用戶是不是相似的呢？如果有一天A用戶去了一家新的餐廳，給出了高評價，那麼我們時候應該運用一定的推薦算法，把它推薦給B呢？

偉大的古希臘數學家歐幾里德提出，平面上兩個點的距離等於橫縱座標的差的平方之和開根號。我們把這個算法應用評估兩個商品是否相近當中，上述例子，A用戶跟B用戶最終的相似度為sqrt((4-3)^2 + (5-4.5)^2 + (3-4)^2) = 1.5, 很顯然，歐幾里德越小，說明越相似。

曼哈頓距離評價算法

曼哈頓距離評價算法與歐幾里德距離評價算法非常的接近，曼哈頓距離是由十九世紀的赫爾曼·閔可夫斯基提出了的一種衡量兩點距離的算法，曼哈頓距離的計算為每個維度的差值的絕對值之和，像上述例子種，我們使用曼哈頓距離評價算法，計算出來的結果為abs（4-3）+ abs（4-4.5） + abs(3-4) 等於2.5，很明顯，曼哈頓距離評價算法計算出來的結果越小，說明兩者越接近。

皮爾遜相關度評價算法

在我們的生活中常常存在這樣的場景，不同的兩個人，可能洗好相同，但是評分的尺度卻不一樣。例如兩個人都是程序員，都關注了沙茶敏碎碎念，喜歡閱讀程序設計類相關的書籍，A的評分標準比較低，通常都給4-5分，B的評分標準比較高，通常只給3-4分，這兩個人，本應該是相似的，但使用前面歐幾里德算法與曼哈頓距離算法，都會計算出來他們有一定的偏差，所以我們可能就需要用到皮爾遜相關度評價算法進行評價。

皮爾遜相關度評價算法主要是擬合一條直線，然後依賴直線的斜率來判斷兩者的相似程度，斜率的範圍有0到1，越大表示相關性越高，越小標識相關性越低，如果你對具體的算法感興趣，可以關注我，後臺私信“皮爾遜”可以獲得相關學習資料

Tanimoto分值

有些應用場景，可能沒有評分這樣的算法，例如用戶A購買了程序設計、算法導論、Java高級編程3本書，用戶B購買了JAVA高級編程，算法導論，程序員頸椎康復訓練3本書，雙方都沒有進行評價，那麼如何計算出兩者的相關度呢？

我們可以使用兩者的交集去除以兩者的並集，和明顯越接近1表示兩者越接近。

總結

今天我們就介紹這四種常用的用來評價相關度的算法，其實都非常地簡單，人工智能的很多知識並非高深莫測，關注我，我們由淺入深，慢慢來學習人工智能的一些相關算法吧。關注後私信"皮爾遜"，可以獲取更多算法資料哦。

相關推薦

'英偉達新算法6-DoF GraspNet可助機器人拿起任意物體'

"據外媒報道，英偉達研究院在利用深度學習訓練各種任務模型方面取得了長足進展。最近，該公司讓BERT實現了有史以來最快的訓練時間並還對有史以來最大的基於轉型的模型進行了訓練。然而正如預期的那樣，基於深度學習的算法首先需要一個龐大的數據集，這在許多情況下是一種奢侈品。除了繼續使...

英偉達算法機器人人工智能人生第一份工作韓國技術設計 2019-09-15

'螞蟻花唄Java開發崗：算法+Spring+Redis+MySQL（含面試答案）'

"一面自我介紹map怎麼實現hashcode和equals,為什麼重寫equals必須重寫hashcode使用過concurrent包下的哪些類，使用場景等等。concurrentHashMap怎麼實現？concurrenthashmap在1.8和1.7裡面有什麼區別Cou...

Redis Java MySQL 算法數據庫人生第一份工作數據結構設計模式虛擬機 2019-09-14

'緩存置換算法 - LRU算法'

"LRU算法1 原理對於在內存中並且不被使用的數據塊就是LRU，這類數據需要從內存中刪除，以騰出空間來存儲常用的數據。LRU算法（Least Recently Used，最近最少使用），是內存管理的一種頁面置換算法，就是用來刪除內存中不被使用的數據，騰出空間來把常用的數據存...

算法 Redis 數據庫 Java Java虛擬機歷史 CSDN 2019-09-14

'人工智能算法是如何從數據中學習規律的'

"⾸先我們來看⼀下最常⻅的⼈⼯智能算法是什麼樣的：⼈⼯智能算法包括⼏個部分： x是模型的輸⼊，y是模型的輸出，模型就是對輸⼊轉化為輸出的計算。⽐如輸⼊x可以是⼀張圖⽚（如貓的照⽚），模型對圖⽚進⾏計算處理，然後輸出這張圖⽚上對應的物品的類別（貓）。我們可以把算法理解成⼀...

人工智能算法數學 2019-09-13

'2019WAIC 算法產業化落地，思必馳劍指AI語音未來'

"前沿算法探索和實踐不僅是純學術性的研究，更是引領人工智能產業化落地方的風向標，前沿算法的產業化落地變得尤為重要。人工智能60多年的發展歷程中，算法一直推動學術和產業向前發展的核心力量。今天，人工智能已經從價值驗證期走向規模化落地期。2019世界人工智能大會於8月29-31...

算法 2019世界人工智能大會技術人工智能語音識別技術機器人耳機硬件智能硬件人機交互音箱機器學習上海餐飲 2019-09-12

'競價排名服務中的算法運用之法律風險評析'

"背景隨著人工智能技術在互聯網領域的廣泛應用，無處不在的數據和算法對互聯網應用的各個領域進行了全面的革新。人工智能技術的不斷髮展必將持續造福人類社會，但是人工智能技術的廣泛應用也給人類社會帶來了隱私保護、算法歧視、網絡安全等問題。搜索引擎服務平臺在互聯網時代承擔了信息接入口...

算法搜索引擎人工智能網絡安全技術法律電子商務大數據搜狗百度數學淘寶網文章編程語言 2019-09-12

'程序員的靈魂！算法'

"寫作有金線，金線之上，作家的文字才可能會被流傳下來。編程也是一樣，卓越的程序員和普通程序員之間也有一條看不見的金線，金線之上的程序員，才能做出更具規模，更有創新，更優性能，更智能的軟件和服務。這條金線是什麼呢？數據結構和算法。每個程序員都知道數據結構和算法的重要性，但是真...

算法程序員工程師數據結構數學機器學習編程語言人工智能技術程序設計電腦推薦技術人生第一份工作 2019-09-12

'「雜談」什麼是我心目中深度學習算法工程師的標準'

"有三AI平臺只專心做原創輸出很少扯淡也不蹭熱點，不過最近詢問的朋友多了，不得不統一寫篇文章來回答一下這個大家都很關心的問題，當然，這僅僅是個人觀點。作者&編輯 | 言有三目前利用深度學習這個工具可以做很多事情，各大領域(圖像，語音，NLP等)，各大行業(娛樂，金融...

人工智能算法工程師人生第一份工作 Python 招聘文章技術設計金融不完美媽媽 C語言 GitHub 數學麻將大眾汽車 Linux 2019-09-11

'將門好聲音 | 安全生產重於泰山！基於能量函數的安全控制算法'

"內容來自將門機器人控制規劃社群From: CMU Intelligent Control Lab作者：魏天昊；編輯：T.R.本文為新欄目——將門好聲音第8期。作者是來自將門機器人控制規劃社群的群友、即將到CMU Intelligent Control Lab深造的魏天昊。...

算法機器人中國好聲音數學設計 GitHub 人工智能無人駕駛讀書 2019-09-11

'機器學習之誤差反向傳播算法'

"機器學習之誤差反向傳播算法我們知道神經網絡是由大量的參數即權重構成，神經網絡的學習過程則是這些參數的變化更新過程。誤差反向傳播算法就是用於更新這些參數的。這裡我們假設激活函數為Sigmoid。Ps: 在吳恩達機器學習反向傳播算法課程中，而不是：這是因為吳恩達中使用的損失...

機器學習算法吳恩達人工智能 2019-09-09

'AI時代的“數據隱私”與“算法歧視”'

"文：劉志剛@互聯網江湖主編如果說近二十年來有哪一項科技成果能夠媲美上個世紀電腦的發明，那麼這份榮譽一定屬於基於深度學習算法的AI技術，因為學習算法的誕生，才使得信息時代海量信息與數據第一次能夠完整的為人們提供可商業化的價值，並將由此開啟人類的“人工智能”時代。但踏入人工智...

人工智能算法大數據技術軟件數據庫智能手機電腦人臉識別萬物嚐鮮節市場營銷 IBM 深度學習 Velocity 讀書舍恩伯格 2019-09-09

'如何看待 2020 屆校招算法崗「爆炸」?算法崗已經供過於求了嗎？'

"今天在知乎看到了這個問題：如何看待 2020 屆校招算法崗「爆炸」的情況？於是嘗試回答了一發。先說說我的個人結論：候選人數目爆炸，但是優秀的候選人並沒有增加太多。公司不是不想招人，是招不到合適的人。女神不是不想找男朋友，是不想找個屌絲做男朋友。另外，找工作其實是門玄學，對...

算法人生第一份工作跳槽那些事兒招聘 Spark 人工智能百度阿里巴巴集團知乎華為公司人力資源 Java 大數據經濟 Hadoop 自然語言處理電腦 2019-09-08

'雪花般的分佈式唯一ID--雪花算法'

"導讀：唯一ID可以標識數據的唯一性，在分佈式系統中生成唯一ID的方案有很多，常見的方式大概有以下三種依賴數據庫，使用如MySQL自增列或Oracle序列等。UUID隨機數snowflake雪花算法（本文將要討論）一、數據庫和UUID方案的不足之處採用數據庫自增序列：讀寫分...

算法數據庫 MySQL Scala Java 技術 2019-09-08

'LeetCode算法第72題：編輯距離'

"問題描述：給定兩個單詞 word1 和 word2，計算出將 word1 轉換成 word2 所使用的最少操作數。你可以對一個單詞進行如下三種操作：插入一個字符刪除一個字符替換一個字符示例 1:輸入: word1 = "horse", word2 = "ros"輸出: ...

算法 Java 2019-09-07

'今天的內容你可能看不懂，全是關於AI算法的終極討論'

"人工智能下一站是哪裡？深度學習還能紅多久？全球最頂尖的科學家，共論AI的未來。他們的眼光，越過當下，落在那個AI與人類共存的未來。數據、算法、算力，人工智能三要素。如果說數據和算力是必要條件，決定了AI的過去，那麼算法作為“靈魂”，定義了AI的未來。自人工智能概念被提出6...

人工智能算法深度學習機器學習電腦技術加拿大周志華語音識別技術大學卡內基梅隆大學讀書高能小子終極裝備人生第一份工作 2019-09-07

'圖解算法：說一道字節跳動的算法題 | Android 向'

"一. 審題面試題：給定一個 RootView，打印其內 View Tree 的每個 View。在 Android 下，UI 的佈局結構，對標到數據結構中，本質就是一個由 View 和 ViewGroup 組成的多叉樹結構。其中 View 只能作為葉子節點，而 ViewGr...

算法 Android 數據結構 Java Vi Java虛擬機跳槽那些事兒 2019-09-07

'十個算法，能讓程序員浪跡編程界，你信不信？附教程分享'

"什麼是算法？簡而言之，任何定義明確的計算步驟都可稱為算法，接受一個或一組值為輸入，輸出一個或一組值。可以這樣理解，算法是用來解決特定問題的一系列步驟（不僅計算機需要算法，我們在日常生活中也在使用算法）。算法必須具備如下3個重要特性：有窮性，執行有限步驟後，算法必須中止。確...

算法程序員 Google+ Google 電腦網絡安全技術 Facebook 數學搜索引擎智能手機數據挖掘 Linkedin 殺毒軟件瀏覽器 Wi-Fi 人工智能 YouTube 社交網絡 2019-09-07

'編程算法神書《算法圖解》分享給你，附各類編程視頻教程'

"許多小夥伴後臺私信小編說，Python算法讓自己很頭疼，有沒有可以讓算法像小說一樣有趣的書籍資料呢？看這裡吧！小編為大家找到了這本《算法圖解》的PDF電子版！讓你在學習Python的路上變得輕鬆有趣！內容提要本書示例豐富，圖文並茂，以簡明易懂的方式闡釋了算法，旨在幫...

算法 Python Java 技術人工智能網絡爬蟲編程語言程序員工程師 JavaScript Flash 深度學習設計模式 Django jQuery 數據庫大數據 HTML 可視化技術 JSP Scrapy 小說 2019-09-07

'機器學習在ABR算法中的應用縱覽'

"本文整理自LiveVideoStack線上分享第三季，第五期，由清華大學計算機系網絡技術研究所博士生王莫為為大家介紹近些年ABR算法的發展，探討基於機器學習的ABR算法的優劣勢，並結合AiTrans比賽分析其在直播場景中的應用問題。文/王莫為整理/LiveVideoSta...

算法機器學習技術深度學習愛奇藝清華大學 YouTube 創作者來直播人工智能歷史 2019-09-07

推薦中...