結構化儲存數據庫——HBase

HBase 數據庫 Hadoop BigTable MapReduce 設計操作系統網絡爬蟲搜索引擎 Google 技術虛擬機可視化技術 Google文檔 HDFS Java Apache 咱小二 2019-05-29

概述

HBase是一個分佈式的、面向列的開源數據庫，該技術來源於 Fay Chang 所撰寫的Google論文"Bigtable:一個結構化數據的分佈式存儲系統"。就像Bigtable利用了Google文件系統(File System)所提供的分佈式數據存儲一樣，HBase在Hadoop之上提供了類似於Bigtable的能力。HBase是Apache的Hadoop項目的子項目。HBase不同於一般的關係數據庫，它是一個適合於非結構化數據存儲的數據庫。另一個不同的是HBase基於列的而不是基於行的模式。

搭建環境

部署節點操作系統為CentOS，防火牆和SElinux禁用，創建了一個shiyanlou用戶並在系統根目錄下創建/app目錄，用於存放Hadoop等組件運行包。因為該目錄用於安裝hadoop等組件程序，用戶對shiyanlou必須賦予rwx權限(一般做法是root用戶在根目錄下創建/app目錄，並修改該目錄擁有者為shiyanlou(chown –R shiyanlou:shiyanlou /app)。

Hadoop搭建環境：

l 虛擬機操作系統： CentOS6.6 64位，單核，1G內存

l JDK：1.7.0_55 64位

l Hadoop：1.1.2

HBase特性

強讀寫一致性：適合高速計數聚合操作
自動切分數據：分佈式存儲數據，隨著數據增長進行自動切片
RegionServer自動失效備援
與HDFS集成
支持MapReduce執行大規模並行操作
提供Java Client API
提供Thrift/REST API
針對大容量查詢優化的塊緩存和Bloom Fliter
可視化管理界面

劣勢

WAL的重新執行速度緩慢
故障恢復緩慢且複雜
主壓縮會引起 I/O風暴

HBase使用場景

互聯網搜索問題：爬蟲收集網頁，存儲到BigTable裡，MapReduce計算作業掃描全表生成搜索索引，從BigTable中查詢搜索結果，展示給用戶。
抓取增量數據：例如，抓取監控指標，抓取用戶交互數據，遙測技術，定向投放廣告等
內容服務
信息交互

HBase Shell命令行交互

啟動Shell $ hbase shell

列出所有的表 hbase > list

創建名為mytable的表，含有一個列族hb hbase > create ' mytable' , 'hb'

在‘mytable’表的'first'行中的‘hb:data’列對應的數據單元中插入字節數組‘hello HBase’

hbase > put 'mytable' , 'first' , 'hb:data' , 'hello HBase'

讀取mytable表 ‘first’行的內容 hbase > get 'mytable' , 'first'

讀取mytable表所有的內容 hbase > scan ‘mytable'

示例

HBase的RowKey設計

電信公司rowKey設計實例：

0.區域劃分：劃分100個區域，從00到99

CallerId + 201703 :hashcode % 100 = 00 -99

1.rowKey設計：rno + callerid + calltime[201702011212] + calleeid + duration ，這個地方注意：rno 等於callerid + calltime 的一部分

2.通話記錄：

1)創建表：$hbase>create 'ns1:calllogs','f1'

2)創建單元測試。向表中添加數據。

相關推薦

'一文看懂oracle數據庫監控ASM磁盤組IO吞吐量教程'

"概述監控ASM磁盤組IO吞吐量是管理ASM的基礎功能，今天主要分享通過asmiostat.sh腳本和asmcmd iostat命令監控ASM磁盤組IO吞吐量，它類似於大部分Unix操作系統提供的iostat命令。一、Oracle 11gR2 Database之前的版本使用...

數據庫 UNIX 腳本語言操作系統 2019-09-18

'“一個號碼”“一個平臺”“一套標準”“一個數據庫”8890平臺成企業群眾訴求主渠道'

"8890綜合服務平臺是推進“互聯網+政務服務”、建設一體化在線政務服務平臺的重要內容之一，今年以來，以“一個號碼”“一個平臺”“一套標準”“一個數據庫”為目標，全省8890正在成為企業群眾訴求主渠道。截至目前，省、市平臺共受理各類群眾訴求176.9萬件，辦結反饋率為89%...

數據庫大連瀋陽頭號大贏家| 理財大賽第二季人生第一份工作新聞 2019-09-17

'汽車銷售業者數據庫門戶大開，1.98億筆潛在車主資料曝光'

"Security Discovery本週揭露一起大規模的資料外洩事件，該公司的安全研究人員Jeremiah Fowler今年8月中，在網絡上發現了一個完全沒有密碼保護的ElasticSearch數據庫，當中存放了413GB的資料，涉及大量網站與1.98億名使用者的資料，追...

數據庫 ElasticSearch Google 2019-09-17

'SQLite，多個應用程序可以同時訪問單個數據庫文件嗎？'

"多個進程可以同時打開同一個數據庫。多個進程可以同時執行SELECT。但是，只有一個進程可以隨時對數據庫進行更改。SQLite使用讀/寫鎖來控制對數據庫的訪問。（在Win95 / 98 / ME下，缺少對讀寫鎖的支持，而是使用概率模擬。）但請注意：如果數據庫文件保存在NFS...

數據庫 SQL Windows 設計 MySQL PostgreSQL Windows 95 人生第一份工作 2019-09-17

'「轉」數據庫索引，到底是什麼做的？'

"問題1. 數據庫為什麼要設計索引？圖書館存了1000W本圖書，要從中找到《架構師之路》，一本本查，要查到什麼時候去？於是，圖書管理員設計了一套規則：(1)一樓放歷史類，二樓放文學類，三樓放IT類…(2)IT類，又分軟件類，硬件類…(3)軟件類，又按照書名音序排序…以便快速...

數據庫索引數據庫數據結構 SQL 軟件設計軟件設計硬件 2019-09-17

'簡單易用高性能的時序數據庫 pinusdb'

"松果時序數據庫(pinusdb)松果時序數據庫是一個開源的時間序列數據庫。以簡單、易用、高性能為目標，解決中小規模物聯網場景設備數據存儲，查詢。松果時序數據庫服務僅包含大約3萬行C++代碼，雖然代碼量少但也提供了豐富的功能、較高的性能。性能在i3-7100， 8G 內存...

數據庫 Windows Server Linux Windows 松球 C語言物聯網 2019-09-17

'批量將制定文件夾下的全部Excel文件導入微軟SQL數據庫'

"以下代碼將c:\\cs\\文件夾下的全部Excle中數據導入到SQL數據庫declare @query vARCHAR(1000)declare @max1 intdeclare @count1 intdeclare @filename varchar(100)set @...

數據庫 SQL Excel 微軟上海 2019-09-17

'Python Requests作者另一神作，Records通用而優雅的數據庫訪問庫'

"我們在開發過程中經常涉及與數據庫進行交互，比如MySQL、Oracle、PostgreSQL、Sqlite，一般，我們使用其對應的Python 第三方模塊，實現相關數據庫操作，如下MySQL數據庫：mysql-connector，pymysql PostgreSQL數據庫...

數據庫 Python SQL MySQL HTML YAML PostgreSQL Excel 2019-09-16

'工業互聯網時代，我們為什麼需要時序數據庫(2)'

"作為資深“槓精”，當然需要先知道要“槓”的到底是什麼？就時序數據庫而言，就是要“槓”兩個東西：1、“槓”數據；2、“槓”數據庫。先從數據“槓”起，數據可是一個高深莫測的東西。想當年圖靈用他深邃的眼睛，看穿了世間萬物的計算本質：凡是可以計算的，通過迭代，最終都可以表示為0、...

數據庫數據結構 HBase 技術 MySQL NoSQL Cassandra 阿蘭·圖靈 2019-09-15

'面試官：在使用mysql數據庫時，遇到重複數據怎麼處理？'

"前言前段時間，很多人問我能不能寫一些數據庫的文章，正好自己在測試mysql數據庫性能的時候，出現了一個問題，也就是出現了很多重複的數據，想起來自己long long ago寫過一篇類似的，僅此就拿來總結了一下。如果你在使用mysql的時候也遇到了這個問題，希望能對你有所幫...

數據庫 MySQL SQL 文章 Redis 設計 2019-09-14

'海量數據AtlasDB：把“數據庫好用”這件事做到極致'

"導語：堅守初心、不辱使命，近期海量數據研發的企業級數據庫AtlasDB獲得了市場的普遍關注。這款以“好用”著稱的國產數據庫產品，不僅承載著海量數據公司對技術創新的堅持和投入，更凝結著一群擁有“工匠之心”的數據庫人對用戶的無限敬意！當前，我國在信息技術應用、大數據分析等技術...

數據庫技術操作系統大數據軟件 MySQL 中央處理器人工智能交通人生第一份工作 2019-09-13

'程序員必讀丨國外數據庫十大風雲人物，你認識幾個？'

"原文：https://www.modb.pro/db/6365（複製鏈接至瀏覽器，即可查看）本文為墨天輪平臺原創文章，如有轉載，請標明出處。導讀：我們參考墨天輪社區數據庫排行榜，盤點了十大國外數據庫領域的風雲人物，與我們一起回首數據庫歷史吧！當今，數據庫技術的重要性不言而...

數據庫程序員拉里·埃裡森 MySQL MongoDB PostgreSQL 甲骨文公司軟件硅谷我在宮裡做廚師人生第一份工作技術電腦瀏覽器 BASIC語言 Redis 設計師黑客福布斯大學搜索引擎文章 2019-09-13

'NoSQL究竟是什麼？瞭解為什麼NoSQL數據庫不是傳統數據庫的對手'

"近年來，我們目睹了NoSQL的興起，並觀察它在各種應用中的應用。本文旨在對SQL和NoSQL技術進行客觀比較，並嘗試澄清一些不明確的方面，以幫助人們熟悉地選擇後端。我對NoSQL的態度一切都有時間，2014年我開始使用NoSQL。也許我遲到了，但我之前的項目需求完全被傳統...

NoSQL 數據庫 SQL 技術數據挖掘 Cassandra 數據結構軟件 Neo4J 設計大數據 CouchDB MemcacheDB MongoDB 文化人生第一份工作 SaaS 文章 2019-09-12

'乾貨｜詳解大數據之Hadoop—Hbase，讓小白都能讀懂的大數據教程'

"通過之前的介紹，我們瞭解了Hadoop框架下兩個核心技術，我們發現這兩個核心技術有一個共同的不足：操作數據延時性較高，不適合實時操作的場景。那麼今天我們來看看Hadoop框架下可以實現實時讀寫訪問的組件——Hbase。工程師：什麼是Hbase?小白：Hbase全稱為Had...

HBase Hadoop 大數據數據庫技術 HDFS 設計數據結構物理通信 MapReduce 分佈式計算工程師 SQL 穿越火線 2019-09-12

'分享一份數據庫高可用容災方案的設計與實現'

"概述一個系統可能包含很多模塊，如數據庫、前端、緩存、搜索、消息隊列等，每個模塊都需要做到高可用，才能保證整個系統的高可用。對於數據庫服務而言，高可用的實現可能更加複雜，對用戶的服務可用，不僅僅是能訪問，還需要有正確性保證，因此討論數據庫的高可用方案時，在容災之外，還要同時...

數據庫操作系統設計技術算法 2019-09-12

'BATJ高級Java面試題分享：JVM+Redis+Kafka +數據庫+設計模式'

"話不多說，這些都是這幾年來BATJ面試問的最多關於Java的面試題，大家可以以這個為標準！多做準備！Mysql與 Oracle 相比， Mysql 有什麼優勢？簡潔描述 Mysql 中 InnoDB 支持的四種事務隔離級別名稱，以及逐級之間的區別？在 Mysql 中 EN...

Java Redis 設計模式數據庫 Java虛擬機 MySQL Nginx 設計 Tomcat 人生第一份工作算法 UNIX 2019-09-12

'易語言實用例程1：簡單的數據庫網絡操作（C/S架構）---上篇'

"學了十多年的易語言，現在已全面轉向.net（原因就不說了），但與易語言十多年感情是丟不掉的。作為引導我步入編程大門的啟蒙語言，我覺得是非常適合國人當做入門語言，當你學會易語言並能寫出一些功能程序後，再轉而學習其它更先進的語言，你會覺沒有想像中的那麼難，java、C#、PH...

易語言數據庫 Microsoft Access Java 技術軟件 PHP Excel 網絡遊戲 2019-09-08

'雲HBase Thrift使用最佳實踐'

"HBase原生只提供了JAVA API客戶端，針對諸如python、php、c++等非java語言一般都是通過Thrift代理的方式訪問HBase服務，本文從thrift架構、hbase thrift api使用以及如何監控thrift等幾個方面詳細介紹雲HBase Th...

HBase Java Python PHP Facebook 2019-09-07

'危險廢油混入非危險廢油儲存青島偉勝電子塑膠被罰'

"近日，信網獲悉，青島偉勝電子塑膠有限公司(簡稱“偉勝塑膠”)將廢油桶等危險廢油混入非危險廢油中儲存。該公司違反了《中華人民共和國固體廢物汙染環境防治法》相關規定，根據該法，青島市生態環境局對偉勝塑膠進行一般行政處罰，罰款人民幣叄萬元。全國企業信用信息公示系統顯示，青島偉勝...

青島環境保護環境汙染山東技術中國農業銀行設計經濟銀行 2019-09-07

'「政公教育」結構化面試真題課堂（一）'

"2018年6月23日贛州市直事業單位面試真題一. 德才兼備是幹部考核的重點，對於德這方面你認為幹部需要具備哪些素質？德是領導幹部世界觀、人生觀、價值觀、權力觀、利益觀的綜合反映。道德的力量是無窮的，成功做事要先學會做人。只有堅持德才兼備、以德為先的用人標準，選撥任用群眾信...

跳槽那些事兒政治法律搜索引擎民主蔬菜技術 2019-09-07

推薦中...