Apache之Calcite介紹

NoSQL Apache Hive MySQL 科技優家 2017-03-28

Calcite（https://calcite.apache.org/）是Apache的一個孵化器項目，它是一個構建JDBC或者ODBC訪問數據庫的框架，通過自定義一些adapter通過sql訪問任意類型的數據，回想起我們之前使用SQL的場景只有使用訪問關係數據庫如MYSQL、ORACLE等，通過hive查詢HDFS上的數據，但是如果我們希望通過SQL接口訪問內存中的某個數據結構（首先這個結構有關係模型）、文件裡面的內容（例如CSV文件、有一定結構的普通文件，其實這些可以通過hive訪問）、訪問hbase和一些NOSQL數據庫，甚至想要跨數據源訪問（hive裡面的數據和mysql裡面的數據進行join查詢）。以上基本上代表了我們平時接觸到的各種各樣的數據存儲的位置，而Calcite要解決的問題就是讓你想辦法將這些數據建立一個關係模型，然後通過SQL查詢這些數據

Adapters

Schema adaptersPermalink

A schema adapter allows Calcite to read particular kind of data, presenting the data as tables within a schema.

1)Cassandra adapter (calcite-cassandra)

2)CSV adapter (example/csv)

3)Druid adapter (calcite-druid)

4)Elasticsearch adapter (calcite-elasticsearch)

5)File adapter (calcite-file)

6)JDBC adapter (part of calcite-core)

7)MongoDB adapter (calcite-mongodb)

8)Pig adapter (calcite-pig)

9)Solr cloud adapter (solr-sql)

10)Spark adapter (calcite-spark)

11)Splunk adapter (calcite-splunk)

12)Eclipse Memory Analyzer (MAT) adapter (mat-calcite-plugin)

Apache Calcite具有以下幾個技術特性：

支持標準SQL語言；

獨立於編程語言和數據源，可以支持不同的前端和後端；

支持關係代數、可定製的邏輯規劃規則和基於成本模型優化的查詢引擎；

支持物化視圖（materialized view）的管理（創建、丟棄、持久化和自動識別）；

基於物化視圖的Lattice和Tile機制，以應用於OLAP分析；

支持對流數據的查詢。

相關推薦

'分佈式之 Nginx'

"本篇一句話總結：Nginx是一款輕量級的Web 服務器，也可以用做反向代理、負載均衡、動靜分離和 HTTP緩存。正文開始：什麼是Nginx？為什麼選擇Nginx?怎麼用Nginx？上面這幾個問題，是每個剛接觸 Nginx 的人都想知道的。下面小兵綜合自己的理解和使用情況，...

Nginx Tomcat Apache CentOS 瀏覽器 HTML Wget GCC OpenSSL Java JSP 2019-09-19

'弱口令掃描介紹'

"1 弱口令推薦 github 上的弱口令字典https://github.com/Stardustsky/SaiDicthttps://github.com/tennc/fuzzdb得慢慢收集，臨時找找不著2 生成社工屬性的弱口令宗旨是生成能滿足密碼複雜度要求又好記的密碼...

GitHub 數據庫 Microsoft SQL Server 腳本語言 MySQL Google MongoDB 瀏覽器 Docker 大數據 Sed Redis 騰訊QQ 2019-09-08

'Apache Spark：彈性分佈式數據集'

"RDD代表瞭如何在Apache Spark中表示大型數據集的想法以及使用它的抽象。本節將介紹前者，以下部分將介紹後者。根據關於Spark的開創性論文，“RDD是不可變的，容錯的並行數據結構，它們允許用戶明確地將中間結果保存在內存中，控制它們的分區以優化數據放置，並使用豐富...

Spark Apache 數據結構技術機器學習 Hadoop 大數據數據挖掘算法設計 Google 2019-08-27

'Apache與Nginx的優缺點比較'

"1、nginx相對於apache的優點：輕量級，同樣起web 服務，比apache佔用更少的內存及資源抗併發，nginx 處理請求是異步非阻塞的，而apache 則是阻塞型的，在高併發下nginx 能保持低資源低消耗高性能高度模塊化的設計，編寫模塊相對簡單社區活躍...

Nginx Apache 軟件 PHP FreeBSD 技術設計 Perl 中央處理器經濟 2019-08-27

'數據倉庫Greenplum基本介紹'

"Greenplum簡介Greenplum是面向數據倉庫應用的關係型數據庫，基於PostgreSQL開發，跟PostgreSQL的兼容性非常好，大部分PostgreSQL客戶端工具及PostgreSQL應用都能運行在Greenplum平臺上。一、Greenplum屬於OLA...

數據庫 PostgreSQL SQL NewSql Line NoSQL 開源軟件 Hadoop 2019-08-27

'Python連接MySQL數據庫方法介紹（超詳細！手把手項目案例操作）'

"作者 | CDA數據分析師來源 | CDA數據分析研究院本文涉及到的開發環境：操作系統 Windows 10數據庫 MySQL 8.0Python 3.7.2 pip 19.0.3兩種方法進行數據庫的連接分別是PyMySQL和mysql.connector步驟：連接數據庫...

Python MySQL 數據庫 SQL 操作系統 Windows PowerShell Windows 10 2019-08-26

'您需要了解的有關Apache Flume的所有信息'

"什麼是Apache Flume？Apache Flume是一種高效，分佈式，可靠且容錯的數據提取工具。它有助於將來自各種來源（如Web服務器）的大量日誌文件流式傳輸到Hadoop分佈式文件系統（HDFS），分佈式數據庫（如HDFS上的HBase），甚至是近實時速度的Ela...

Apache HDFS 數據庫 Hadoop HBase Spark Twitter ElasticSearch Facebook Hive 雅虎 Cloudera Linkedin 2019-08-22

'良心文章 | MySQL性能優化分區之實戰(最全面最完整的分區)'

"本號主要用於分享企業中常用的技術，更加側重於實用，歡迎關注，便於瀏覽其它更多實用的歷史文章。一: 分區簡介分區是根據一定的規則，數據庫把一個表分解成多個更小的、更容易管理的部分。就訪問數據庫應用而言，邏輯上就只有一個表或者一個索引，但實際上這個表可能有N個物理分區對象組成...

MySQL 數據庫文章物理 2019-08-21

'ELKstack介紹及Elasticsearch部署'

"ELKstack課程大綱ELKstack簡介什麼是ELK？通俗來講，ELK是由Elasticsearch、Logstash、Kibana 三個開源軟件的組成的一個組合體，這三個軟件當中，每個軟件用於完成不同的功能，ELK 又稱為ELK stack，官方域名為elasti...

ElasticSearch Tomcat 數據庫 JSON Nginx 防火牆開源軟件 Linux Vim 設計 Redis Apache 軟件 2019-08-17

'滴滴：Apache Kylin 自助式治理與演進之路'

"kylin在滴滴的應用，在7月份的技術論壇上，滴滴出行的技術專家靳國衛分享了kylin在滴滴的應用。PPT 主要分為四個部分，第一部分講一下 Kylin 架構在滴滴的實際情況，展示集群數據規模，進而引出一些問題；第二部分講在滴滴如何進行集群的治理；第三部分結合具體實際場景...

中標麒麟滴滴打車 Apache HBase Spark Docker PowerPoint 技術 Presto Hadoop 可視化技術 Hive 2019-08-16

'「php框架實例」| Laravel之Model Observer模型'

"本文主要學習下Laravel的Model Observer模型觀察者，小編把自己的一點點經驗分享出來希望對別人能有幫助。同時，作者會將開發過程中的一些截圖和代碼黏上去，提高閱讀效率。開發環境：Laravel5.1+MAMP+PHP7+MySQL5.5沒有Model Obs...

PHP Redis MySQL 2019-08-12

'MyCat如何遷移到DBLE之分片算法對比解析：numberrange分片'

"關於作者鍾悅 - 資深DBLE用戶某宇宙行資深架構師，在大型重點項目中使用 DBLE。常年與 MySQL 糾纏不清，經常運用技術處理大企業病的技術or非技術問題的一個挨踢從業者。根據用戶定義的範圍與分片節點映射文件，直接定位目標分片。1. 用戶在 rule.xml 中配置...

算法 MySQL Java 2019-08-04

'你的真的懂Python？Python進階之學習筆記'

"俗話說的好，千里之行始於足下。無論做什麼基礎都是最重要的，當你以為自己“精通”某語言的時候，有沒有問過自己：“我能不能把這些知識，用最簡單的話說出來？讓不懂的人也能聽明白。”當你真正精通某語言的時候，我相信你一定能做到。如果做不到，那就需要往下看，再學習一下基礎。為了幫助...

Python 編程語言 Gentoo Linux 程序員紅帽公司網絡爬蟲 Linux 圖像處理 Guido 腳本語言 Scrapy Windows 程序設計 HTML OpenBSD 技術 OS X 設計 NetBSD Redis OpenCV IronPython 操作系統 Django 麻省理工學院 Fedora Ubuntu Apache 可視化技術 2019-08-02

'好程序員Java學習路線之MySQL的執行計劃'

"好程序員Java學習路線之MySQL的執行計劃。什麼是執行計劃？執行計劃通常是開發者優化SQL語句的第一步。MySQL在解析SQL語句時，會生成多套執行方案，然後內部會進行一個成本的計算，然後通過優化器選擇一個最優的方案執行，然後根據這個方案會生成一個執行計劃。開發者通過...

MySQL SQL 程序員 Java 2019-08-02

'Apache安全配置黑客學習必備'

"1.用普通用戶運行Apache在計算機管理的本地用戶裡新建一個用戶我的電腦——屬性——管理——服務——Apache服務——屬性——登錄 2.Apache目錄權限設置Apache所在的根目錄只需要讀取權限；可以在權限設置高級裡選擇——應用到：只有該文件夾——權限：列出文件夾...

Apache PHP MySQL 黑客 Linux 電腦 2019-08-01

'Apache Beam：開源的統一編程模型，實現批、流數據處理作業'

"Apache Beam: An advanced unified programming modelImplement batch and streaming data processing jobs that run on any execution engine.Ap...

Apache Google Spark 分佈式計算大數據 MapReduce 2019-07-29

'Apache Maven 最全教程，看了就懂~'

"一、為什麼使用Maven這樣的構建工具【why】二、maven是什麼【what】三、安裝maven四、第一個maven五、倉庫和座標六、依賴七、生命週期八、Eclipse中使用maven九、maven工程的依賴高級特性十、build配置前言：目前所有的項目都在使用mave...

Apache Java Gradle XML Eclipse 集成開發環境編譯器 2019-07-29

'phpdisk網站漏洞修復之sql注入攻擊'

"phpdisk是目前互聯網最大的網盤開源系統，採用PHP語言開發，mysql數據庫架構，在對其網站安全檢測以及網站漏洞檢測的同時，發現該網盤系統存在嚴重的sql注入攻擊漏洞，危害性較高，可以直接獲取網站的管理員賬號密碼，利用默認後臺地址登錄，可以直接獲取webshell權...

SQL PHP 網絡硬盤數據庫 MySQL 2019-07-25

'為什麼這麼多人說學大數據之前先學Java？'

"Java和大數據是眼下最火爆的編程語言了，在這個iOS，Android相繼沒落；PHP相繼飽和的時候，只有Java大數據能夠保持著旺盛的需求。大數據時代，不僅給想從事IT的人帶來了新的發展機會，也提供了新的職業發展通道。特別是近期世界人工智能大會的舉行，更是讓人工智能、大...

Java 大數據 Hadoop 編程語言技術人工智能 Spark 人生第一份工作 PHP Python 雲計算程序員 Android 設計工程師 iOS Apache 2019-07-20

'十五個點，理解Apache Kafka'

"一、介紹Kafka在世界享有盛名，大部分互聯網公司都在使用它，那麼它到底是什麼呢？Kafka由LinkedIn公司於2011年推出，自那時起功能逐步迭代，目前演變成一個完整的平臺級產品，它允許您冗餘地存儲巨大的數據量，擁有一個具有巨大吞吐量（數百萬/秒）的消息總線，並且支...

Apache Linux 數據庫操作系統技術設計人生第一份工作硬件 Linkedin 2019-07-20

推薦中...