算法：排序算法之希爾排序

計算複雜性理論 Java 開發者小黑屋 2017-04-01

在前面已經對冒泡排序、直接插入排序做了說明分析（具體詳情可點擊下方的鏈接查看），本篇將對希爾排序進行相關說明分析。

《算法：排序算法之冒泡排序》
《算法：排序算法之插入排序》

排序算法系列目錄說明

冒泡排序（Bubble Sort）
插入排序（Insertion Sort）
希爾排序（Shell Sort）
選擇排序（Selection Sort）
快速排序（Quick Sort）
歸併排序（Merge Sort）
堆排序（Heap Sort）
計數排序（Counting Sort）
桶排序（Bucket Sort）
基數排序（Radix Sort）

希爾排序（Shell Sort）

希爾排序的實質就是分組插入排序，該方法又稱遞減增量排序算法，因DL．Shell於1959年提出而得名。希爾排序是非穩定的排序算法。

在上一篇《算法：排序算法之插入排序》中優化方案中就有提到過使用希爾排序進行改進。希爾排序是基於插入排序的以下兩點性質而提出改進方法的：

插入排序在對幾乎已經排好序的數據操作時，效率高，即可以達到線性排序的效率
但插入排序一般來說是低效的，因為插入排序每次只能將數據移動一位

1. 基本思想

先將整個待排元素序列分割成若干個子序列（由相隔某個“增量”的元素組成的）分別進行直接插入排序，然後依次縮減增量再進行排序，待整個序列中的元素基本有序（增量足夠小）時，再對全體元素進行一次直接插入排序。

因為直接插入排序在元素基本有序的情況下（接近最好情況），效率是很高的，因此希爾排序在時間效率上比前兩種方法有較大提高。

2. 實現邏輯

先取一個小於n的整數d1作為第一個增量，把文件的全部記錄分成d1個組。
所有距離為d1的倍數的記錄放在同一個組中，在各組內進行直接插入排序。
取第二個增量d2<d1重複上述的分組和排序，
直至所取的增量dt=1(dt<dt-l<…<d2<d1)，即所有記錄放在同一組中進行直接插入排序為止。

3. 動圖演示

算法：排序算法之希爾排序

希爾排序演示

具體我們以一組數字來說操作說明：

算法：排序算法之希爾排序

希爾排序示例圖

假設有一組｛9, 1, 2, 5, 7, 4, 8, 6, 3, 5｝無需序列。

第一趟排序：
設 gap1 = N / 2 = 5，即相隔距離為 5 的元素組成一組，可以分為 5 組。接下來，按照直接插入排序的方法對每個組進行排序。
第二趟排序：
將上次的 gap 縮小一半，即 gap2 = gap1 / 2 = 2 (取整數)。這樣每相隔距離為 2 的元素組成一組，可以分為 2 組。按照直接插入排序的方法對每個組進行排序。
第三趟排序：
再次把 gap 縮小一半，即gap3 = gap2 / 2 = 1。這樣相隔距離為 1 的元素組成一組，即只有一組。按照直接插入排序的方法對每個組進行排序。此時，排序已經結束。

注：需要注意一下的是，圖中有兩個相等數值的元素5和5。我們可以清楚的看到，在排序過程中，兩個元素位置交換了。

4. 性能分析

平均時間複雜度：O(Nlog2N)
最佳時間複雜度：
最差時間複雜度：O(N^2)
空間複雜度：O(1)
穩定性：穩定
複雜性：較複雜

希爾排序的效率取決於增量值gap的選取，時間複雜度並不是一個定值。

開始時，gap取值較大，子序列中的元素較少，排序速度快，克服了直接插入排序的缺點；其次，gap值逐漸變小後，雖然子序列的元素逐漸變多，但大多元素已基本有序，所以繼承了直接插入排序的優點，能以近線性的速度排好序。

最優的空間複雜度為開始元素已排序，則空間複雜度為 0；最差的空間複雜度為開始元素為逆排序，則空間複雜度為 O(N);平均的空間複雜度為O(1)希爾排序並不只是相鄰元素的比較，有許多跳躍式的比較，難免會出現相同元素之間的相對位置發生變化。比如上面的例子中希爾排序中相等數據5就交換了位置，所以希爾排序是不穩定的算法。

5. 代碼實現

C版本：

算法：排序算法之希爾排序

希爾排序（C版本實現）

C++版本：

算法：排序算法之希爾排序

希爾排序（C++實現）

Java版本：

算法：排序算法之希爾排序

希爾排序（Java實現）

6. 重點說明(步( 摘錄自wiki百科)

(6.1) 步長序列

步長的選擇是希爾排序的重要部分。只要最終步長為1任何步長序列都可以工作。算法最開始以一定的步長進行排序。然後會繼續以一定步長進行排序，最終算法以步長為1進行排序。當步長為1時，算法變為插入排序，這就保證了數據一定會被排序。

作者最初的建議是折半再折半知道最後的步長為1<也就是插入排序>,雖然這樣取可以比O(n2)類的算法（插入排序）更好，但這樣仍然有減少平均時間和最差時間的餘地。可能希爾排序最重要的地方在於當用較小步長排序後，以前用的較大步長仍然是有序的。比如, 如果一個數列以步長5進行了排序然後再以步長3進行排序，那麼該數列不僅是以步長3有序，而且是以步長5有序。如果不是這樣，那麼算法在迭代過程中會打亂以前的順序，那就不會以如此短的時間完成排序了。

(6.2) 常見步長序列

①步長序列：n/2i
最壞情況複雜度：O(n2)
②步長序列：2k-1
最壞情況複雜度：O(n3/2)
③步長序列：2i3j
最壞情況複雜度：O(nlog2n)
注意：頭條裡面無法顯示特殊符號，步長序列中i、k-1，j等都是右上標符號。

已知的最好步長序列是由Sedgewick提出的(1, 5, 19, 41, 109,...)，該序列的項來自9 x 4i - 9 x 2i + 1 和 2i+2 x (2i+2 -3)這兩個算式。(注意：頭條裡面無法顯示特殊符號，兩個公式中i，j等都是右上標符號)

總結

希爾排序通過將比較的全部元素分為幾個區域來提升插入排序的性能，交換不相鄰的元素以對數組的局部進行排序，最終用插入排序將局部有序的數組排序。

希爾排序時效分析很難，關鍵碼的比較次數與記錄移動次數依賴於增量因子序列d的選取，特定情況下可以準確估算出關鍵碼的比較次數和記錄的移動次數。目前還沒有人給出選取最好的增量因子序列的方法。增量因子序列可以有各種取法，有取奇數的，也有取質數的，但需要注意：增量因子中除1外沒有公因子，且最後一個增量因子必須為1。希爾排序方法是一個不穩定的排序方法。

源碼地址：https://github.com/7-sevens/algorithm

想要獲取更多精品技術乾貨，歡迎關注微信公眾號：開發者小黑屋

相關推薦

'計算機專業已過時？這五大“計算機專業”人才缺口大，畢業就高薪'

"隨著我國社會的發展，在大背景的情況下，計算機專業已經成為了一個熱門的專業。在當前巨大的就業壓力形勢下，擁有一個好的專業，在就業方面顯然是更有優勢的，而計算機就是一個很有優勢的專業。然而在社會上卻是有一些言論說，計算機專業已經飽和，並且是過時了，那麼這些言論是真實的嗎？我們...

電腦信息安全人生第一份工作大數據人工智能雲計算軟件工程 PHP Java 2019-09-18

'真正意義上算是雲計算的平臺有哪些？'

"雲計算平臺也稱為雲平臺，是指基於硬件資源和軟件資源的服務，提供計算、網絡和存儲能力。雲計算平臺可以劃分為3類：以數據存儲為主的存儲型雲平臺，以數據處理為主的計算型雲平臺以及計算和數據存儲處理兼顧的綜合雲計算平臺。那麼目前真正意義上算是雲計算的平臺有哪些呢？千鋒廣州雲計算老...

IaaS 雲計算技術 MongoDB 數據庫 Amazon EC2 軟件 Google SimpleDB Java GFS Linux Python BigTable Azure VMware 硬件亞馬遜公司 MapReduce Hadoop EMC IBM 2019-09-15

'螞蟻花唄Java開發崗：算法+Spring+Redis+MySQL（含面試答案）'

"一面自我介紹map怎麼實現hashcode和equals,為什麼重寫equals必須重寫hashcode使用過concurrent包下的哪些類，使用場景等等。concurrentHashMap怎麼實現？concurrenthashmap在1.8和1.7裡面有什麼區別Cou...

Redis Java MySQL 算法數據庫人生第一份工作數據結構設計模式虛擬機 2019-09-14

'緩存置換算法 - LRU算法'

"LRU算法1 原理對於在內存中並且不被使用的數據塊就是LRU，這類數據需要從內存中刪除，以騰出空間來存儲常用的數據。LRU算法（Least Recently Used，最近最少使用），是內存管理的一種頁面置換算法，就是用來刪除內存中不被使用的數據，騰出空間來把常用的數據存...

算法 Redis 數據庫 Java Java虛擬機歷史 CSDN 2019-09-14

'程序員的編程基礎知識｜計算機組成原理：計算機的層次與編程語言'

"計算機基礎方面的知識，對於一些非科班出身的同學來講，一直是他們心中的痛，而對於科班出身的同學，很多同學在工作之後，也意識到自身所學知識的不足與欠缺，想回頭補補基礎知識。關於計算機基礎的課程很多，內容繁雜，但無論是相關書籍還是大學課程，都有點脫離工作。特別地，計算機基礎知識...

電腦程序員編程語言硬件中央處理器彙編語言操作系統英特爾 Java 軟件超微半導體編譯器人生第一份工作設計歷史大學 2019-09-13

'學習雲計算需要具備哪些知識結構'

"首先，雲計算需要一個龐大的技術體系作為支撐，隨著雲計算逐漸從IaaS向PaaS和SaaS轉換，雲計算的技術生態也在不斷髮展和完善，雲計算自身的功能邊界也在不斷得到拓展，相信在產業互聯網階段，雲計算將進一步深入到產業領域，打造出更多基於行業的“全棧雲”。從技術體系結構上來看...

雲計算 Linux 數據庫操作系統編程語言技術物聯網 IaaS SaaS Docker Java 人工智能 2019-09-13

'軟件工程和計算機科學與技術兩個專業對比'

"因為這個問題在平時生活中很多人都在詢問，我就在這裡說一下自己的感受吧，權當一篇科普文。大一我去的是東北大學軟件工程專業，後來大二轉到了計算機科學與技術專業，所以兩個學院，兩個專業我都待過，有一定感受。首先，隸屬不同，軟件工程屬於軟件學院，一般比較年輕，成立比較晚，國內...

軟件工程電腦軟件技術離散數學數學數據結構人生第一份工作 Java 硬件大學 Linux 東北大學經濟物理設計模式 2019-09-09

'如何看待 2020 屆校招算法崗「爆炸」?算法崗已經供過於求了嗎？'

"今天在知乎看到了這個問題：如何看待 2020 屆校招算法崗「爆炸」的情況？於是嘗試回答了一發。先說說我的個人結論：候選人數目爆炸，但是優秀的候選人並沒有增加太多。公司不是不想招人，是招不到合適的人。女神不是不想找男朋友，是不想找個屌絲做男朋友。另外，找工作其實是門玄學，對...

算法人生第一份工作跳槽那些事兒招聘 Spark 人工智能百度阿里巴巴集團知乎華為公司人力資源 Java 大數據經濟 Hadoop 自然語言處理電腦 2019-09-08

'雪花般的分佈式唯一ID--雪花算法'

"導讀：唯一ID可以標識數據的唯一性，在分佈式系統中生成唯一ID的方案有很多，常見的方式大概有以下三種依賴數據庫，使用如MySQL自增列或Oracle序列等。UUID隨機數snowflake雪花算法（本文將要討論）一、數據庫和UUID方案的不足之處採用數據庫自增序列：讀寫分...

算法數據庫 MySQL Scala Java 技術 2019-09-08

'LeetCode算法第72題：編輯距離'

"問題描述：給定兩個單詞 word1 和 word2，計算出將 word1 轉換成 word2 所使用的最少操作數。你可以對一個單詞進行如下三種操作：插入一個字符刪除一個字符替換一個字符示例 1:輸入: word1 = "horse", word2 = "ros"輸出: ...

算法 Java 2019-09-07

'圖解算法：說一道字節跳動的算法題 | Android 向'

"一. 審題面試題：給定一個 RootView，打印其內 View Tree 的每個 View。在 Android 下，UI 的佈局結構，對標到數據結構中，本質就是一個由 View 和 ViewGroup 組成的多叉樹結構。其中 View 只能作為葉子節點，而 ViewGr...

算法 Android 數據結構 Java Vi Java虛擬機跳槽那些事兒 2019-09-07

'編程算法神書《算法圖解》分享給你，附各類編程視頻教程'

"許多小夥伴後臺私信小編說，Python算法讓自己很頭疼，有沒有可以讓算法像小說一樣有趣的書籍資料呢？看這裡吧！小編為大家找到了這本《算法圖解》的PDF電子版！讓你在學習Python的路上變得輕鬆有趣！內容提要本書示例豐富，圖文並茂，以簡明易懂的方式闡釋了算法，旨在幫...

算法 Python Java 技術人工智能網絡爬蟲編程語言程序員工程師 JavaScript Flash 深度學習設計模式 Django jQuery 數據庫大數據 HTML 可視化技術 JSP Scrapy 小說 2019-09-07

'就算是“男人的浪漫”又如何，今天《坦克世界》更新1.0了嗎？'

"一直以來，軍武類遊戲的款式雖然不多，但卻始終受到一批死忠玩家的擁簇，他們或許是軍武文化的資深愛好者，亦或只是喜歡親臨戰場的氛圍。儘管他們非常虔誠的擁護自己所喜歡的遊戲，但毋庸置疑的是，他們在大環境下始終只是一小部分人。而在2010年的時候，市面上出現了這樣一匹黑馬，他在全...

坦克世界空中網網絡遊戲軍事歷史俄羅斯歷史白俄羅斯坦克蘇聯明斯克戰艦世界戰機世界戰爭遊戲 Java MMORPG 2019-09-04

'鴻卓課工場—應該學習更多的Java編程技術還是大數據和雲計算技術'

"首先，學習更多的編程技術與學習大數據和雲計算並不衝突，Java語言也是大數據和雲計算領域比較常見的開發工具，所以完全可以同步進行。隨著大數據、雲計算和人工智能相關技術的發展，目前從事技術開發的程序員崗位也出現了一些比較顯著的變化，從技術崗位上來看，有兩個崗位的人才需求數量...

Java 大數據技術雲計算程序員跳槽那些事兒電腦 2019-09-03

'2019年互聯網人才招聘報告：Java吃香，算法工程師緊缺，頭條崛起'

"作者 | 八爪盒子責編 | 屠敏技術變革，人才驅動。當前互聯網的就業機會和風口在何處？在這篇文章中，我們將對 7 月份國內各個主流招聘網站發佈的384,0533 條互聯網招聘需求，其中在剔除銷售、行政等非常規互聯網職位以及非知名公司後的 7819 個在招職位進行全面分析，...

Java 招聘工程師算法技術人生第一份工作設計今日頭條 JSP 虛擬機數據庫面向對象程序編程上海人工智能騰訊大數據數據結構網易廣州阿里巴巴集團 SQL 深圳 Tomcat 設計模式華為公司武漢物聯網區塊鏈智能硬件 Java虛擬機 2019-09-02

'大學四年如何學習計算機？畢業學長親手總結，大一萌新快看過來'

"大學四年說長不長說短不短，對於大學四年該如何學好計算機的問題，我相信這是很多剛剛進入計算機系小萌新的問題，如何利用好自己的大學四年，學習好自己的專業知識，才是你們點擊進這篇文章的關鍵！作為一個某大學計算機專業大三快結束的老生，就表達一下我的觀點和想法吧。致大一:俗話說萬事...

大學電腦中國研究生入學考試 C語言技術文章工程師 Java Linux MySQL 人生第一份工作小遊戲程序員 HTML 2019-09-02

'打算報蕪湖java培訓的同學無需再糾結'

"Java作為世界第一的計算機應用語言，Java培訓程序員的市場需求量和薪資水平都在行業處於領先水平，是很多外行甚至同行其他崗位同學羨慕的對象，紛紛想轉行，到Java培訓機構接受再教育，實現華麗轉身。那麼如何選擇一家性價比高的培訓機構，蕪湖北大青鳥小編就用切身體驗給蕪湖準備...

Java 跳槽那些事兒蕪湖技術程序員文章軟件 2019-09-01

'計算機基礎知識'

"二進制計算機中的數據不同於人們生活中的數據，人們生活採用十進制數，而計算機中全部採用二進制數表示，它只包含 0、1兩個數，逢二進一，1+1=10。每一個0或者每一個1，叫做一個bit（比特）。下面瞭解一下十進制和二進制數據之間的轉換計算。十進制數據轉成二進制數據：使...

電腦 Windows 操作系統 Java 2019-08-30

'經典例題向Java程序員詮釋遞歸，這樣的算法公式你們必須懂'

"什麼是遞歸百度百科：程序調用自身的編程技巧稱為遞歸（ recursion）。借用知乎上Memoria的回答：假設你在一個電影院，你想知道自己坐在哪一排，但是前面人很多，你懶得去數了，於是你問前一排的人「你坐在哪一排？」，這樣前面的人 (代號 A) 回答你以後，你就知道自己...

程序員 Java 算法斐波那契數學法國梵天印度 2019-08-28

推薦中...