Facebook用AI看圖識菜譜是怎麼實現的？| 硅谷洞察

人工智能 Facebook 烹飪技巧硅谷硅谷密探 2019-07-11

研究內容是什麼：

根據人類的判斷，一種直接從食物圖像中生成菜譜的新方法，可以生成比基於檢索的方法更吸引人的菜譜。通過在大規模菜譜數據集上進行的評估，該方法提高了與以前的成分預測方法基線相比的性能。通過這項工作,我們旨在通過輸入食物圖像來提供準備一頓飯的途徑。（簡單說就是：你不再需要搜做什麼的菜譜如何，給 AI 一張食物圖片，它就能給你判斷食材和製作過程有哪些，然後生成菜譜）

工作原理：

從圖像生成菜譜需要同時瞭解構成菜譜的配料以及它們所經過的任何加工，例如切片或與其他配料混合。傳統上，圖像到菜譜的問題被表述為一個檢索任務，菜譜是根據嵌入空間中的圖像相似度評分從一個固定的數據集檢索出來的。這些系統的性能在很大程度上取決於數據集的大小和多樣性，以及所學的嵌入的質量。毫不奇怪，當靜態數據集中不存在用於圖像查詢的匹配菜譜時，這些系統就會失效。

克服檢索系統數據集約束的另一種方法是將圖像到菜譜的問題表示為條件生成問題。我們認為，與直接從圖像中獲取菜譜不同，生成菜譜的管道將受益於中間步驟：預測配料列表。然後根據圖像及其對應的配料列表將會生成指令序列，其中圖像和配料之間的相互作用可以提供關於後者是如何加工成最終菜餚的額外見解。

我們的圖像到菜譜的生成系統將食物圖像作為輸入，並輸出包含標題、配料和烹飪說明的配方。我們的方法首先對圖像編碼器和成分解碼器進行預訓練，它們利用從輸入圖像和成分共現中提取的視覺特徵來預測一組成分。

然後，我們訓練成分編碼器和指令解碼器，它們通過提取圖像的視覺特徵和預測的成分，並將它們輸入一個最先進的序列生成模型，從而生成標題和指令。

為什麼重要：

食品識別挑戰了當前的計算機視覺系統，使其不僅僅是可見的。與自然圖像理解相比，視覺成分預測需要高級推理和先驗知識（例如，羊角麵包可能含有黃油）。這帶來了額外的挑戰，因為食物成分具有很高的類內變異性，在烹飪過程中會發生嚴重的變形，而且成分經常在烹飪的菜餚中被掩蓋。我們的系統是邁向更廣泛的食品理解系統的第一步，如卡路里估算和菜譜創建。

此外，此類培訓可用於需要從圖像和預測關鍵字預測長結構化文本的任何問題。管道的第一部分（成分預測）可用於解決更廣泛的問題，如圖像到集合預測。

感興趣的可以點擊官方原文閱讀：

https://ai.facebook.com/blog/inverse-cooking/

更多精彩，敬請關注硅谷洞察官方網站（http://www.svinsight.com）

相關推薦

'Facebook用自然語言教會AI玩轉實時戰略遊戲，項目已經開源'

"魚羊發自凹非寺量子位報道 | 公眾號 QbitAI怎麼教AI打遊戲呢？當然是直接下指令啦。告訴AI造農民，基地就開始唰唰往外吐農民：△下方英文指令：創造新農民指揮農民挖礦造兵工廠，一句話同樣搞定：發現敵方大龍，當然是直接開打啊：前線打得歡，經濟也不能落下：這是來自F...

人工智能策略遊戲 Facebook 即時戰略遊戲設計經濟農民 Xbox 微軟 2019-09-18

'行業 | 索尼申請柔性屏專利 Facebook開源了CraftAssist實現AI助手的平臺 5G規模組網的招標公示'

"如果你厭倦了枯燥的人工智能（AI）應用，那麼不妨去 AI Portraits 網站體驗下“鬧鬼”的感覺。因為它可以將用戶的自拍照，處理成相當古典的風格。作為麻省理工（MIT）和 IBM 沃森 AI 實驗室的一項“不務正業”的創作，這款小工具能夠將用戶上傳的照片進行特殊的藝...

人工智能物聯網索尼 NTT DOCOMO Facebook 韓國日本中國電信 Wi-Fi 通信華為公司麻省理工學院滴滴打車運營商大唐移動算法投資證券投資基金諾基亞軟件中興通訊經濟物理機器人阿布扎比 2019-07-31

'研究人員教人工智能連接視覺和觸覺等感官 | 硅谷洞察'

"更多精彩，敬請關注硅谷洞察官方網站（http://www.svinsight.com）在加拿大作家Margaret Atwood的著作《盲人刺客》中,她說“觸覺先於視覺，也先於語言。它是第一語言,也是最後一種語言,而且它總是講真話。”當我們的觸覺給我們一個感知物質世界的通...

人工智能麻省理工學院硅谷機器人加州大學伯克利分校技術物理電腦設計加拿大鼠標 2019-07-19

'拖延症、喝奶茶、愛熬夜...我真是控制不住我寄己啊！| 硅谷洞察'

"更多精彩，敬請關注硅谷洞察官方網站（http://www.svinsight.com）沒人點奶茶是因為覺得它能延年益壽、補氣養血 —— 我們都知道奶茶糖多、不健康、沒營養，為什麼還忍不住喝奶茶？都知道熬夜對身體不好，為什麼還是覺得早睡覺就 “浪費” 了一個美好夜晚？（這張...

拖延症人工智能奶茶硅谷怪誕行為學技術 MySQL 經濟算法 Google 人生第一份工作大學創業 SaaS Salesforce 數據庫睡眠 2019-07-19

'從硅谷產品經理談談：AI產品經理要不要懂技術&算法？'

"跟硅谷谷歌的產品經理觀察到一個同國內一樣熱門的問題，產品經理和AI產品經理要不要懂技術&算法呢？本文先講硅谷產品經理對產品經理是否需要懂技術的觀點，然後結合筆者對AI產品經理是否需要懂技術&算法講一些實操觀點。一、硅谷產品經理需不需要懂技術？在硅谷產品經理...

算法人工智能產品經理硅谷技術 Google 計算複雜性理論算法設計工程師文化無人駕駛人生第一份工作 Facebook 斯坦福大學設計電腦 Paypal 歷史 Y Combinator 亞馬遜 2019-07-17

'川普哭訴“推特狂掉粉”，將用行政命令監管硅谷？| 硅谷洞察'

"更多精彩，敬請關注硅谷洞察官方網站（http://www.svinsight.com）美東時間 7 月 11 日下午 3 點，美國總統特朗普在白宮舉行“ 2019 社交媒體峰會”（Social Media Summit）。但是，在谷歌、Facebook、推特等一眾社交巨頭...

Twitter 硅谷 Google Facebook 蘋果公司 CNN 美聯社法律技術傑克·多西微軟政治亞馬遜公司人生第一份工作 2019-07-15

MIT&谷歌大腦用AI破解失傳的古代文字，被稱“現代版羅塞塔石碑”

郭一璞發自凹非寺量子位報道 | 公眾號 QbitAI漫漫塵埃下，掩藏了許多曾經輝煌燦爛古代文明，但我們現在卻無法清晰地知道，這些地方究竟發生了什麼...

人工智能麻省理工學院 Google 語言我在宮裡做廚師 Presto 算法數據庫 FLOW 克里特島植物動物希臘敘利亞 2019-07-14

上海正式對垃圾分類了，美國科技清垃圾產業投資創紀錄 |硅谷洞察

聽說，最近上海的小夥伴都在熱議，到底垃圾怎麼分類？所以考點來了：哦不……微博上是這麼說的：（圖自新浪微博）上海人民從今天起，再不好好扔垃圾，可要被罰款了啊...

硅谷風險投資上海投資技術機器人人工智能英國人生第一份工作建築百度 2019-07-04

為什麼谷歌、Facebook、百度都押注AI？

近年來，國內外互聯網巨頭紛紛將發展AI作為公司的戰略。先是Google2016年將公司的發展戰略從過去的“移動為先”（Mobile First）調整為“A...

百度人工智能百度雲 Google 技術無人駕駛 Facebook 信息安全亞馬遜公司雲計算量子計算理論音箱硬件微軟人生第一份工作智能硬件蘋果公司 2019-06-30

關於Facebook發幣的7個問題，專家都是怎麼說的？| 硅谷洞察

更多精彩，敬請關注硅谷洞察官方網站（http://www.svinsight.com）北京時間 6 月18日下午，Facebook 旗下全球數字加密貨幣 ...

Facebook 數字貨幣區塊鏈金融技術經濟投資硅谷 Paypal 銀行 eBay Uber 音樂比特幣通信 2019-06-21

傳硅谷巨頭facebook數字貨幣下週推出已獲Visa萬事達巨頭等支持

（原標題：Sources: Facebook has signed up 12+ companies, including Visa, Mastercar...

Facebook 數字貨幣比特幣硅谷社交網絡萬事達卡 Paypal Uber 投資天秤座信用卡中本聰金融 2019-06-18

AI、基因編輯如何在未來10年重塑人類生命形態？| 硅谷洞察

更多精彩，敬請關注硅谷洞察官方網站（http://www.svinsight.com）《硅谷百年史》作者、硅谷人工智能研究院院長皮埃羅·斯加魯菲(Pier...

人工智能硅谷技術生物技術麻省理工學院大學高通伊隆·馬斯克納米技術機器人 3D打印 IBM Paypal 算法世界歷史大數據投資科幻小說英特爾 2019-06-13

華為Mate 20：AI識物和AI翻譯等功能強大，用起科技感十足

原來的聯想樂檬X3C50手機運存3G，不夠用了，換手機果斷相信華為品牌，直接選定最新旗艦型號。喜歡屏幕大點的，所以沒要Pro。電池性能不是很驚豔，中度使用...

華為Mate 華為公司人工智能攝影安兔兔 Wi-Fi 聯想集團軟件照相機 2019-05-31

生物圖像的數據集可用於開發新的人工智能算法 | 硅谷洞察

更多精彩，敬請關注硅谷洞察官方網站（http://www.svinsight.com）Recursion研發了300多億字節的數據，它希望這將成為創新機器...

人工智能算法生物生物技術數據庫硅谷技術藥品 2019-05-31

AIRLOOK發佈超算平臺，用AI實現建模語義化和自動修模

摘要：除了進一步完善在空間大數據領域的產業鏈服務能力，其商業模式也更為明晰。以“還原世界的樣子”為發展願景，國內空間高精度數據運營商AIRLOOK正式發佈...

人工智能大數據技術測繪軟件可視化技術地理數據挖掘無人機運營商大眾汽車王剛 2019-05-24

硅谷封面丨Facebook再次轉型這次還會錯過技術大潮嗎

劃重點：1、2011年末，即將上市的Facebook發現自己落在移動技術大潮的後面，當時，科技公司紛紛向移動領域轉型，而Facebook仍認為自己主要是桌...

Facebook 技術馬克·扎克伯格智能手機 Android 硅谷社交網絡 iOS 設計臺式電腦 Instagram HTML5 電腦筆記本電腦工程師跳槽那些事兒操作系統讀書首次公開募股 WhatsApp iPhone 產品經理軟件歷史 2019-05-22

'少年硅谷'落戶紅軍小學暨百所老區學校跨入AI時代啟動儀式舉行

5月17 日上午，"少年硅谷"落戶紅軍小學暨百所老區學校跨入AI時代啟動儀式在中國工農紅軍青海西寧紅軍小學舉行2019年5月17 日上午，"少年硅谷落戶紅...

硅谷人工智能慈善顧秀蓮青海西寧王宇燕不完美媽媽甘肅王萍內蒙古上海軟件歷史湖南貴州機器人吉林 2019-05-20

全球創業生態系統報告之北京：獨角獸僅次硅谷，AI全球第2

創頭條編譯根據Startup Genome發佈的“2019年全球創業生態系統報告（GSER）”，從科技獨角獸方面看，北京位居世界第二，僅次硅谷。在全球估...

創業硅谷人工智能金融中關村經濟天津銀行投資百度大數據聯想集團新浪 2019-05-20

英偉達計劃消除人工智能在放射學中的“焦慮” | 硅谷洞察

更多精彩，敬請關注硅谷洞察官方網站（http://www.svinsight.com）英偉達與美國放射學院(American College of Rad...

人工智能英偉達放射科硅谷技術算法數據庫俄亥俄州華盛頓大學馬薩諸塞州軟件護理大學語音識別技術歷史加利福尼亞 2019-05-18

Uber上市：誰成了高富帥，誰成了接盤俠？| 硅谷洞察

更多精彩，敬請關注硅谷洞察官方網站（http://www.svinsight.com）美國時間 5 月 10 號，共享出行巨頭 Uber 以 45 美元的...

Uber 軟體銀行硅谷投資首次公開募股證券投資基金 eBay 美國股市阿里巴巴集團風險投資 Snapchat Instagram Twitter Dropbox CNN Facebook Google Yelp 新聞 2019-05-17

推薦中...