G牛總結的9種哈希算法代碼

貝爾實驗室 UNIX 鏡音雙子高德納科技老司機科技老司機 2017-09-07

// 這個算法在開源的SDBM中使用，似乎對很多不同類型的數據都能得到不錯的分佈。

unsigned int SDBMHash(const char *str) {

unsigned int hash = 0 ;

while (*str) {

// equivalent to: hash = 65599*hash + (*str++);

hash = (*str++) + (hash << 6 ) + (hash << 16 ) - hash;

}

return (hash & 0x7FFFFFFF );

}

// 從Robert Sedgwicks的 Algorithms in C一書中得到。

// 已經添加了一些簡單的優化的算法，以加快其散列過程。

unsigned int RSHash(const char *str) {

unsigned int b = 378551 ;

unsigned int a = 63689 ;

unsigned int hash = 0 ;

while (*str) {

hash = hash * a + (*str++);

a *= b;

}

return (hash & 0x7FFFFFFF );

}

// Justin Sobel寫的一個位操作的哈希函數。

unsigned int JSHash(const char *str) {

unsigned int hash = 1315423911 ;

while (*str) {

hash ^= ((hash << 5 ) + (*str++) + (hash >> 2 ));

}

return (hash & 0x7FFFFFFF );

}

// 該散列算法是基於貝爾實驗室的彼得J溫伯格的的研究。

// 在Compilers一書中（原則，技術和工具），建議採用這個算法的散列函數的哈希方法。

unsigned int PJWHash(const char *str) {

unsigned int BitsInUnignedInt = (unsigned int )(sizeof(unsigned int ) * 8 );

unsigned int ThreeQuarters = (unsigned int )((BitsInUnignedInt * 3 ) / 4 );

unsigned int OneEighth = (unsigned int )(BitsInUnignedInt / 8 );

unsigned int HighBits = (unsigned int )( 0xFFFFFFFF ) << (BitsInUnignedInt - OneEighth);

unsigned int hash = 0 ;

unsigned int test = 0 ;

while (*str) {

hash = (hash << OneEighth) + (*str++);

if ((test = hash & HighBits) != 0 ) {

hash = ((hash ^ (test >> ThreeQuarters)) & (~HighBits));

}

return (hash & 0x7FFFFFFF );

}

// 和PJW很相似，在Unix系統中使用的較多。

unsigned int ELFHash(const char *str) {

unsigned int hash = 0 ;

unsigned int x = 0 ;

while (*str) {

hash = (hash << 4 ) + (*str++);

if ((x = hash & 0xF0000000L) != 0 ) {

hash ^= (x >> 24 );

hash &= ~x;

}

return (hash & 0x7FFFFFFF );

}

// 這個算法來自Brian Kernighan 和 Dennis Ritchie的 The C Programming Language。

// 這是一個很簡單的哈希算法,使用了一系列奇怪的數字,形式如31,3131,31...31,看上去和DJB算法很相似。

unsigned int BKDRHash(const char *str) {

unsigned int seed = 131 ; // 31 131 1313 13131 131313 etc..

unsigned int hash = 0 ;

while (*str) {

hash = hash * seed + (*str++);

}

return (hash & 0x7FFFFFFF );

}

// 這個算法是Daniel J.Bernstein 教授發明的，是目前公佈的最有效的哈希函數。

unsigned int DJBHash(const char *str) {

unsigned int hash = 5381 ;

while (*str) {

hash += (hash << 5 ) + (*str++);

}

return (hash & 0x7FFFFFFF );

}

// 這是本文作者Arash Partow貢獻的一個哈希函數，繼承了上面以旋轉以為和加操作。

unsigned int APHash(const char *str) {

unsigned int hash = 0 ;

int i;

for (i= 0 ; *str; i++) {

if ((i & 1 ) == 0 ) {

hash ^= ((hash << 7 ) ^ (*str++) ^ (hash >> 3 ));

}

else {

hash ^= (~((hash << 11 ) ^ (*str++) ^ (hash >> 5 )));

}

return (hash & 0x7FFFFFFF );

}

// 由偉大的Knuth在《編程的藝術第三卷》的第六章排序和搜索中給出。

unsigned int DEKHash(const char *str) {

int len=strlen(str);

unsigned int hash = len;

for(int i = 0; i < len; i++) {

hash = ((hash << 5) ^ (hash >> 27)) ^ str[i];

}

return hash;

}

相關推薦

'最年輕的圖靈獎獲得者，算法和程序設計技術先驅的奇趣人生'

"高德納(DonaldErvinKnuth)——經典鉅著《計算機程序設計的藝術》的年輕作者。洋洋數百萬言的多卷本《計算機程序設計的藝術》(TheArtofComputerProgramming)堪稱計算機科學理論與技術的經典鉅著，有評論認為其作用與地位可與數學史上歐幾里得的...

程序設計高德納設計算法電腦技術 TeX 密爾沃基物理軟件藝術編譯器相對論離散數學幾何原本數學理查德·費曼數據結構大學歐幾里得俄亥俄州保羅·狄拉克阿爾伯特·愛因斯坦音樂威斯康星州 2019-09-05

'各種排序算法總結'

"排序算法是最基本最常用的算法，不同的排序算法在不同的場景或應用中會有不同的表現，我們需要對各種排序算法熟練才能將它們應用到實際當中，才能更好地發揮它們的優勢。今天，來總結下各種排序算法。下面這個表格總結了各種排序算法的複雜度與穩定性：各種排序算法複雜度比較.png冒泡排序...

算法鏡音雙子計算複雜性理論 2019-08-25

'UNIX操作系統設計：緩衝區分配算法'

"正如在圖2-1中所看到的那樣，文件子系統中的高層內核算法引用管理高速緩衝的算法。當它們試圖檢索一個塊時，由高層算法決定它們想要存取的邏輯設備號和塊號。舉例來說，正如在第4章將要看到的那樣，如果一個進程想要從一個文件中讀數據，則內核需判定哪一個文件系統包含該文件，以及該文件...

算法 UNIX 設計操作系統睡眠 2019-08-12

'LeetCode算法第68題：文本左右對齊'

"問題描述：給定一個單詞數組和一個長度 maxWidth，重新排版單詞，使其成為每行恰好有 maxWidth 個字符，且左右兩端對齊的文本。你應該使用“貪心算法”來放置給定的單詞；也就是說，儘可能多地往每行中放置單詞。必要時可用空格 ' ' 填充，使得每行恰好有 maxWi...

算法鏡音雙子 Java 2019-08-05

'Linux內核中的數據結構和算法'

"Linux內核(源代碼的鏈接在github)1.鏈表、雙向鏈表、無鎖鏈表。2.B+ 樹，這是一些你無法在教科書上找到的說明。一個相對簡單的B+樹的實現。我把它作為一個學習練習來幫助理解B+樹是如何工作的。這同樣也被證明是有用的。...一個在教科書中並不常見的技巧。最小的值...

Linux 算法數據結構高德納設計 GitHub 自動機程序設計技術 2019-08-03

編程中的基本數據結構與算法思想

編程的關鍵在於選擇數據結構和算法，數據結構用於描述問題，算法用於描述解決問題的方法和步驟。描述問題的數據除了各數據元素本身，還要考慮各元素的邏輯關係，主要...

數據結構算法鏡音雙子 2019-07-09

影響著計算機算法世界的大師，你知道幾個？

1、偉大的智者——Don E.Knuth，中文名：高德納(1938-)算法和程序設計技術的先驅者。Oh,God!一些國外網站這樣評價他。一般說來，不知道此...

算法程序設計算法設計技術程序員數學 Google 哥倫比亞大學設計大學約瑟夫·傅里葉亞馬遜公司荷蘭聖經高德納編譯器物理 IBM 微軟編程語言雅虎 UNIX 軟件哥倫比亞馮諾伊曼 2019-06-13

影響著計算機算法世界的大師，你知道幾個？

1、偉大的智者——Don E.Knuth，中文名：高德納(1938-)算法和程序設計技術的先驅者。Oh,God!一些國外網站這樣評價他。一般說來，不知道此...

算法程序設計數學算法設計程序員技術 Google 哥倫比亞大學設計大學亞馬遜公司約瑟夫·傅里葉荷蘭聖經高德納編譯器 IBM 微軟物理編程語言雅虎 UNIX 軟件哥倫比亞馮諾伊曼德克薩斯 2019-06-13

刷了一個半月算法題，我薪資終於Double了

戳藍字“CSDN雲計算”關注我們哦！技術頭條：乾貨、簡潔、多維全面。更多雲計算精華知識盡在眼前，get要點、solve難題，統統不在話下！前言很多人感覺大...

算法跳槽那些事兒程序員雲計算技術 Java 數據結構區塊鏈貝爾實驗室文章集成開發環境黑客 2019-05-22

rsync 的核心算法

rsync是unix/linux下同步文件的一個高效算法，它能同步更新兩處計算機的文件與目錄，並適當利用查找文件中的不同塊以減少數據傳輸。rsync中一...

算法 Linux UNIX 文章數據結構 2019-04-07

為什麼我反對純算法面試題

算法面試可能是微軟搞出來的面試方法，現在很多公司都在效仿，而且我們的程序員也樂於解算法題，我個人以為，這是應試教育的毒瘤！我在《再談“我是怎麼招程序員”》...

算法跳槽那些事兒需求分析程序員計算複雜性理論鏡音雙子數學 2019-04-04

十大經典排序算法（動圖演示）

0、算法概述0.1 算法分類十種常見排序算法可以分為兩大類：非線性時間比較類排序：通過比較來決定元素間的相對次序，由於其時間複雜度不能突破O(nlogn)...

計算複雜性理論鏡音雙子盤點技術 2018-11-30

Keras版faster-rcnn算法詳解（RPN計算）

雷鋒網 AI科技評論按：本文首發於知乎專欄Learning Machine，作者張瀟捷，雷鋒網 AI科技評論獲其授權轉載。前段時間學完Udacity的機器...

機器學習人工智能 GitHub 鏡音雙子雷鋒網 2017-09-24

計算機二級excel函數總結（第二篇）

上一篇我們講了19個函數，緊接著我們繼續來講第二篇，第二篇依舊是19個函數，函數序號從頭開始。1.Row函數Row函數得到一個單元格所在的行號，比如=ro...

Excel 大貓兒追愛記中考鏡音雙子大貓講辦公 2017-09-15

零久黑科技:mysql中文分詞及萬國語言分詞算法，詞義識別的基礎

這是本公司使用的分詞算法，我想用它來做詞義識別的，不過現在應用到了搜索上面，加上緩存後效果還不錯。運行速度本想象中快！質量也很理想！下面是效果圖：下面是代...

MySQL 鏡音雙子技術零久網絡 2017-09-12

哈佛斯坦福等大學如何教機器學習算法？10分鐘帶你掌握

工欲善其事，必先利其器！機器學習算法的教學，需要重現整個分析過程，並將說明文字、代碼、圖表、公式、結論都整合在一個文檔中。傳統的文本編輯工具顯然不能滿足...

機器學習 Markdown 大學高德納 AIAR學堂 2017-08-31

哈希算法的特點以及運用

什麼是哈希算法哈希算法將任意長度的二進制值映射為較短的固定長度的二進制值，這個小的二進制值稱為哈希值。哈希值是一段數據唯一且極其緊湊的數值表示形式。如果散...

信息安全數據結構 UNIX 科技 2017-06-02

PHP 實現四種基本排序算法

許多人都說算法是程序的核心，算法的好壞決定了程序的質量。作為一個初級phper，雖然很少接觸到算法方面的東西。但是對於基本的排序算法還是應該掌握的，它是程...

編程語言 PHP 鏡音雙子 2017-05-25

算法系列「希爾排序」篇

常見的內部排序算法有：插入排序、希爾排序、選擇排序、冒泡排序、歸併排序、快速排序、堆排序、基數排序等。用一張圖概括：關於時間複雜度：1. 平方階 (O(n...

鏡音雙子 JavaScript 德州儀器技術 2017-05-22

java桶式排序算法

/** * 桶式排序: * * 僅支持非負數排序！ * * 桶式排序不再是基於比較的了，它和基數排序同屬於分配類的排序，這類排序的特點是事先要知道待排 ...

編程語言 Java 鏡音雙子技術 2017-05-11

推薦中...