G牛總結的9種哈希算法代碼

// 這個算法在開源的SDBM中使用,似乎對很多不同類型的數據都能得到不錯的分佈。

unsigned int SDBMHash(const char *str) {

unsigned int hash = 0 ;

while (*str) {

// equivalent to: hash = 65599*hash + (*str++);

hash = (*str++) + (hash << 6 ) + (hash << 16 ) - hash;

}

return (hash & 0x7FFFFFFF );

}

// 從Robert Sedgwicks的 Algorithms in C一書中得到。

// 已經添加了一些簡單的優化的算法,以加快其散列過程。

unsigned int RSHash(const char *str) {

unsigned int b = 378551 ;

unsigned int a = 63689 ;

unsigned int hash = 0 ;

while (*str) {

hash = hash * a + (*str++);

a *= b;

}

return (hash & 0x7FFFFFFF );

}

// Justin Sobel寫的一個位操作的哈希函數。

unsigned int JSHash(const char *str) {

unsigned int hash = 1315423911 ;

while (*str) {

hash ^= ((hash << 5 ) + (*str++) + (hash >> 2 ));

}

return (hash & 0x7FFFFFFF );

}

// 該散列算法是基於貝爾實驗室的彼得J溫伯格的的研究。

// 在Compilers一書中(原則,技術和工具),建議採用這個算法的散列函數的哈希方法。

unsigned int PJWHash(const char *str) {

unsigned int BitsInUnignedInt = (unsigned int )(sizeof(unsigned int ) * 8 );

unsigned int ThreeQuarters = (unsigned int )((BitsInUnignedInt * 3 ) / 4 );

unsigned int OneEighth = (unsigned int )(BitsInUnignedInt / 8 );

unsigned int HighBits = (unsigned int )( 0xFFFFFFFF ) << (BitsInUnignedInt - OneEighth);

unsigned int hash = 0 ;

unsigned int test = 0 ;

while (*str) {

hash = (hash << OneEighth) + (*str++);

if ((test = hash & HighBits) != 0 ) {

hash = ((hash ^ (test >> ThreeQuarters)) & (~HighBits));

}

}

return (hash & 0x7FFFFFFF );

}

// 和PJW很相似,在Unix系統中使用的較多。

unsigned int ELFHash(const char *str) {

unsigned int hash = 0 ;

unsigned int x = 0 ;

while (*str) {

hash = (hash << 4 ) + (*str++);

if ((x = hash & 0xF0000000L) != 0 ) {

hash ^= (x >> 24 );

hash &= ~x;

}

}

return (hash & 0x7FFFFFFF );

}

// 這個算法來自Brian Kernighan 和 Dennis Ritchie的 The C Programming Language。

// 這是一個很簡單的哈希算法,使用了一系列奇怪的數字,形式如31,3131,31...31,看上去和DJB算法很相似。

unsigned int BKDRHash(const char *str) {

unsigned int seed = 131 ; // 31 131 1313 13131 131313 etc..

unsigned int hash = 0 ;

while (*str) {

hash = hash * seed + (*str++);

}

return (hash & 0x7FFFFFFF );

}

// 這個算法是Daniel J.Bernstein 教授發明的,是目前公佈的最有效的哈希函數。

unsigned int DJBHash(const char *str) {

unsigned int hash = 5381 ;

while (*str) {

hash += (hash << 5 ) + (*str++);

}

return (hash & 0x7FFFFFFF );

}

// 這是本文作者Arash Partow貢獻的一個哈希函數,繼承了上面以旋轉以為和加操作。

unsigned int APHash(const char *str) {

unsigned int hash = 0 ;

int i;

for (i= 0 ; *str; i++) {

if ((i & 1 ) == 0 ) {

hash ^= ((hash << 7 ) ^ (*str++) ^ (hash >> 3 ));

}

else {

hash ^= (~((hash << 11 ) ^ (*str++) ^ (hash >> 5 )));

}

}

return (hash & 0x7FFFFFFF );

}

// 由偉大的Knuth在《編程的藝術 第三卷》的第六章排序和搜索中給出。

unsigned int DEKHash(const char *str) {

int len=strlen(str);

unsigned int hash = len;

for(int i = 0; i < len; i++) {

hash = ((hash << 5) ^ (hash >> 27)) ^ str[i];

}

return hash;

}

相關推薦

推薦中...