LeetCode基礎算法題第123篇：找出數據流中的第K大元素

算法 Python Java C語言大數據設計操作系統吾是我師 2019-05-13

技術提高是一個循序漸進的過程，所以我講的leetcode算法題從最簡單的level開始寫的，然後> 到中級難度，最後到hard難度全部完。目前我選擇C語言，Python和Java作為實現語言，因為這三種語言還是比較典型的。由於篇幅和> 精力有限，其他語言的實現有興趣的朋友請自己嘗試。初級難度說的差不多的時候，我打算再加點其他內容，我可能會從操作系統到協議棧，從分佈式> 聊到大數據框架，從大數據聊到人工智能，... ...。
如果有任何問題可以在文章後評論或者私信給我。
我會持續分享下去，敬請您的關注。

LeetCode 703. 數據流中的第K大元素（Kth Largest Element in a Stream）

問題描述：

設計一個找到數據流中第K大元素的類（class）。注意是排序後的第K大元素，不是第K個不同的元素。你的 KthLargest 類需要一個同時接收整數 k 和整數數組nums 的構造器，它包含數據流中的初始元素。每次調用 KthLargest.add，返回當前數據流中第K大的元素。注:你可以假設 nums 的長度≥ k-1 且k ≥ 1。

示例：

C語言實現：

這是一個簡單的優先隊列問題。所以考慮如何實現優先隊列。

優先隊列實現分為有序實現，和無序實現。

有序實現有普通數組、普通鏈表和普通二叉樹。有序實現包括有序數組，有序鏈表，二叉搜索樹，以及二叉堆。（這裡首先聲明一點，二叉堆並不是真正的有序，或者說不保證任何遍歷是有序的，但是它可以保證最大值或者最小值一點是根節點。）

通常優先隊列的實現也都是用二叉堆，因為二叉堆的綜合性能比較好，即插入，刪除和查找最大值（或最小值）的平均性能比較好。

二叉堆是一種特殊二叉樹，它必須是一個完全二叉樹，這個性質決定了，二叉堆可以很方便的用數組來實現。而優先隊列要求，最小值（或最大值）位於隊列的頭部（或尾部），方便彈出，而二叉堆的數組存儲形式中，最大值(或最小值)就是數組的第一個元素，可見二叉堆非常適合實現優先隊列。

根據值大小的分佈情況，二叉堆又分為：

最小堆：所有節點的值必須小於等於子節點的值, 則最小值在根節點；
最大堆：所有節點的值必須大於等於子節點的值, 則最大值在根節點；

如下圖，左邊是最小堆，右邊是最大堆：

如上圖，我們可以將二叉樹從根節點開始從上到小按層從左到右將節點一個個存入數組中，這樣就得到二叉堆數組存儲形式。

觀察後，這樣我們可以得出結論：

如果二叉堆有k個節點，那麼數組的長度也是k.
而對於某個下標為n的節點，它的子節點的下標將會是2n+1和2n+2, 它的父節點下標將是(n-1)/2。

本題是找出第k個最大值，所以適合用最小堆。

我們可以將隊列的容量設置為k，即限制二叉堆所有節點數不超過k個，則第k大的值即整個二叉堆的最小值在根節點。對於第k-1大以後的元素，與本題的解沒有關係，所以忽略。

我們要實現這個過程就需要將元素一個個插入到二叉堆中，這就涉及到二叉堆的堆化。堆化的意義是，當入隊和出隊的時候，可能會使得當前的二叉樹不再是一個二叉堆，堆化就是重新對樹進行調整，讓其再次變成二叉堆。

（下面的描述是針對最小堆，最大堆類似。）

二叉堆的堆化根據方向，分為上浮和下沉兩種情況，我們針對這道題來說明。

上浮：

當隊列的容量沒有滿的時候，這時候我們插入新元素是直接插入二叉堆的末尾，形成一個新的葉子節點，然後比較父節點和新元素值的大小，如果父節點的值大於新元素，就相互交換，新元素交換後再和新的父節點比較，如此下去。

下沉：

針對本題，當隊列滿的時候，插入一個新元素，且該元素大於二叉堆的根節點時，表示當前的根節點將會變成第k+1個元素，即它不應該再作為二叉堆的根，所以首先，將其出隊，然後用新插入的元素值代替；再拿子節點中值最小的元素和新元素進行比較，如果新元素大，就交換。如此下去。

所以最終可以得出如下的代碼：

注意二叉堆的前中後序遍歷都均無法保證有序性，尤其是是中序遍歷，一定是無序的。但是通常這個並不重要。二叉堆可以保證根節點在整個樹中是最小或最大，這樣就可以了。

Java語言實現：

Java 提供了優先隊列的實現，PriorityQueue，所以我們可以直接使用：代碼如下：

Python語言實現：

雖然 Python 庫中也提供了PriorityQueue，但是不建議用，而是建議用heapq, 理由是：

PriorityQueue無法一次完成heapq的heappushpop()的功能，而heappushpop對於這道題來說很方便。
用heapq實現更簡潔。
實際上，PriorityQueue就是對heapq的封裝，在同等條件下，多一層封裝往往意味著多一些消耗。

詳細代碼如下：

謝謝大家一直以來的關注和支持！

我一直在努力的寫好每一篇文章，畫好每一份插圖。但是作為一個996從業人員，時間精力十分有限。所以針對評論部分，以後只回答粉絲的問題和私信。希望僅僅是路過的朋友能夠體諒，希望更多人關注《吾是我師》，謝謝！

相關推薦

'顏控、輕奢、高配，第14代軒逸在競品中脫穎而出的底氣何在？'

"中國的家轎市場在2019再次進入了新一輪的白熱化，雖然新品不斷湧現並加入戰場，但戰場的規模卻不斷在縮小。2019年8月，中國轎車市場銷量同比下滑14.9%，幾乎每一款傳統的暢銷車的銷量都有不同程度的下跌，此時市場環境的競爭尤為激烈殘酷，因為在存量市場，人人都需要安身立命之...

日產軒逸全新卡羅拉華麗綻放東風日產乘用車公司設計轎車本田思域大眾汽車體育大眾寶來日本汽車別克汽車廣汽豐田雷凌跑車豐田汽車一汽豐田良心國貨大賞 Axela昂克賽拉 iPhone 2019-09-17

'在家庭教育中怎樣培養出優秀的孩子第6章讓孩子主動學數學'

"上一講我介紹了怎樣從孩子的需求出發，讓孩子自主閱讀。這一講，我們來說說怎麼讓孩子愛上數學，主動學習數學。我們都知道，學習數學對孩子很重要，它能培養孩子的思維能力和解決問題的能力。數學的學習會貫穿孩子整個學前到高中階段，那麼怎麼讓孩子主動學習數學呢？我認為，無論是哪個領域的...

數學家庭教育不完美媽媽可汗學院幼兒園英語讀書貓在線教育物理設計 2019-09-08

'法德合體的SUV，顏值出眾還有中控大屏，搭載奔馳引擎，即將上市'

"雖然說小型SUV體型不如緊湊級SUV，但一樣有著不錯的空間表現和較高的視野，加上較小的體型也能帶來更低的油耗水平，因此在國內市場，小型SUV市場也受到了很多消費者的關注，而在這一領域的標杆車型則是來自本田的倆兄弟：繽智和XR-V，在面對越來越多年輕消費者的背景下，這兩個車...

原汁原味的德系SUV 奔馳A級雷諾卡繽奔馳雷諾汽車本田技研工業本田繽智設計東風雷諾戴姆勒公司比亞迪汽車展覽時尚德國馬牌 2019-09-07

'LeetCode算法第72題：編輯距離'

"問題描述：給定兩個單詞 word1 和 word2，計算出將 word1 轉換成 word2 所使用的最少操作數。你可以對一個單詞進行如下三種操作：插入一個字符刪除一個字符替換一個字符示例 1:輸入: word1 = "horse", word2 = "ros"輸出: ...

算法 Java 2019-09-07

'家庭教育中怎樣培養出優秀的孩子-像理解用戶一樣理解孩子第1章'

"課程我想先跟你說說培養孩子的基礎，那就是像理解用戶一樣理解你的孩子。怎麼理解呢？我先講一個故事：兩年前的某一天，我們全家在美國的一個城市旅行。我在一家童鞋店閒逛，兩個孩子和爸爸在外面的遊樂場玩。過了一會，我兒子鬧鬧滿頭大汗地衝了進來。他全身髒兮兮的，鞋子和褲子上滿是沙子，...

家庭教育不完美媽媽設計文化 IDEO 蘋果公司工業設計設計師人生第一份工作斯坦福大學 2019-09-05

'LeetCode基礎算法題第1022. Sum of Root To Leaf Binary Numbers'

"技術提高是一個循序漸進的過程，所以我講的leetcode算法題從最簡單的level開始寫的，然後> 到中級難度，最後到hard難度全部完。目前我選擇C語言，Python和Java作為實現語言，因為這三種語言還是比較典型的。由於篇幅和> 精力有限，其他語言的實現...

算法 Python Numbers Java C語言技術 2019-08-22

'LeetCode基礎算法題第154篇：求第N個Tribonacci數'

算法 Python C語言 Java 技術田納西州 2019-08-19

'LeetCode基礎算法題第1103. Distribute Candies to People'

"技術提高是一個循序漸進的過程，所以我講的leetcode算法題從最簡單的level開始寫的，然後> 到中級難度，最後到hard難度全部完。目前我選擇C語言，Python和Java作為實現語言，因為這三種語言還是比較典型的。由於篇幅和精力有限，其他語言的實現有興趣的朋...

算法 Java Python C語言最後一個人 2019-08-17

'LeetCode算法第68題：文本左右對齊'

"問題描述：給定一個單詞數組和一個長度 maxWidth，重新排版單詞，使其成為每行恰好有 maxWidth 個字符，且左右兩端對齊的文本。你應該使用“貪心算法”來放置給定的單詞；也就是說，儘可能多地往每行中放置單詞。必要時可用空格 ' ' 填充，使得每行恰好有 maxWi...

算法鏡音雙子 Java 2019-08-05

'LeetCode基礎算法題第150篇：車能捕獲棋子的最大數'

算法 Python Java C語言大數據技術文章人工智能 2019-08-04

'LeetCode基礎算法題第130篇：反轉字符串 II'

算法 Python C語言 Java 大數據技術人工智能文章操作系統 2019-08-03

'看到中控大屏就夠了！豐田第12代卡羅拉到店實拍，預售12萬起'

"近日，豐田新一代卡羅拉已經實車到店，新車基於TNGA架構打造，配備豎向12.1英寸中控屏，提供1.2T和1.8L混合動力兩種動力版本選擇。據相關渠道消息，新車或將於8月8日正式上市，共推出八款車型，預售價12萬元起。外觀方面，新車深度融合了豐田最新的家族設計語言，前臉處銳...

豐田卡羅拉豐田汽車體育設計一汽豐田 2019-07-26

'LeetCode算法第41題：缺失的第一個正數'

"問題描述：給定一個未排序的整數數組，找出其中沒有出現的最小的正整數。示例 1:輸入: [1,2,0]輸出: 3示例 2:輸入: [3,4,-1,1]輸出: 2示例 3:輸入: [7,8,9,11,12]輸出: 1說明:你的算法的時間複雜度應為O(n)，並且只能使用常數級別...

算法 Java 2019-07-19

'優酷算法專家揭祕：易烊千璽、雷佳音出演《長安》都是大數據選角'

"最近引爆全民熱度的劇集非《長安十二時辰》莫屬，豆瓣近14萬人打出了8.6的高分。其中許多觀眾認為，雷佳音和易烊千璽與張小敬和李必這兩個角色的貼合度之高為劇集增色甚多。優酷方面向南都記者透露，雷佳音和易烊千璽其實都是通過大數據選角技術敲定的。雷佳音更是在AI和大數據的計算下...

雷佳音大數據易烊千璽優酷土豆人工智能算法長安十二時辰投資技術市場營銷長安鑑劇大賞電子商務歷史 2019-07-18

'LeetCode基礎算法題第146篇：刪除最外面的括號'

算法 Python Java C語言技術大數據人工智能操作系統 2019-07-17

'LeetCode基礎算法題第1021. Remove Outermost Parentheses'

算法 Python Java C語言技術大數據人工智能文章 2019-07-17

'LeetCode基礎算法題第144篇：使IP地址無效'

算法 Python Java C語言文章大數據技術操作系統人工智能 2019-07-16

'LeetCode基礎算法題第1108. Defanging an IP Address'

算法 Python 技術 Java 文章 C語言大數據人工智能操作系統 2019-07-15

中超第16輪，北京國安vs武漢卓爾賽前，球迷意見，大數據分析

2019中超足球超級聯賽第16輪，北京中赫國安vs武漢卓爾的比賽將在北京國安主場-工人體育場開賽，屆時北京國安坐鎮主場迎戰武漢卓爾，本場比賽將由張雷吹罰對...

武漢卓爾職業足球俱樂部北京國安足球俱樂部中國足球超級聯賽河北華夏幸福廣州恆大淘寶足球俱樂部足球大數據上海上港集團足球俱樂部李鐵廣州 2019-07-09

他在創造營中是第18名，與出道無緣，如今走機場被粉絲簇擁

最近《創造營2019》這檔綜藝已經結束了，最終的前11名可以獲得出道的機會，組合也已經正式成立了，這次我們就來說一下，並沒出道的成員吧。這個節目的選手，個...

設計時尚 2019-06-20

推薦中...