從程序員進階到架構師，史上最全進階詳解（中篇）-架構擴展篇

NoSQL 編程語言 GFS 程序員優知學院優知學院 2017-08-28

本文作者，陳睿優知學院創始人,10年以上產品技術經驗，前百度研發經理、攜程定製旅遊CTO。

優知學院是IT人在線進階站,幫助IT人升職加薪，提供系統的互聯網產品技術入門指南、進階乾貨資料和課程，以及定期的線下實戰活動。

“

從程序員到架構師進階，將涉及到數據結構和算法，Java編程語言掌握，Javaweb核心技術，數據庫，Java框架與必備工具，系統架構設計等六大環節。
這是中篇，包含數據庫設計以及大數據方案， Java相關的框架與工具(消息隊列，web框架，構建工具，負載均衡，服務器等)。
最後一篇，講重點講解大型網站系統架構設計。

數據庫設計原則和大數據方案

從程序員進階到架構師，史上最全進階詳解（中篇）-架構擴展篇

談到數據庫將涉及到如下範圍：

數據庫設計原則和範式

第一範式，確保每列保持原子性。

第二範式，確保表中的每列都和主鍵相關。

第二範式，在第一範式的基礎之上更進一層。第二範式需要確保數據庫表中的每一列都和主鍵相關，而不能只與主鍵的某一部分相關（主要針對聯合主鍵而言）。也就是說在一個數據庫表中，一個表中只能保存一種數據，不可以把多種數據保存在同一張數據庫表中。

第三範式，確保每列都和主鍵列直接相關,而不是間接相關。

比如在設計一個訂單數據表的時候，可以將客戶編號作為一個外鍵和訂單表建立相應的關係。而不可以在訂單表中添加關於客戶其它信息（比如姓名、所屬公司等）的字段。

SQL與NoSql的優缺點以及使用場景分析

SQL (Structured Query Language) 數據庫，指關係型數據庫 - 主要代表：SQL Server，Oracle，MySQL(開源)，PostgreSQL(開源)。

NoSQL（Not Only SQL）泛指非關係型數據庫 -。主要代表：MongoDB，Redis，Memcached,Hbase,CouchDB。

目前許多大型互聯網項目都會選用MySQL（或任何關係型數據庫） + NoSQL的組合方案。

關係型數據庫適合存儲結構化數據，如用戶的帳號、地址：

1）這些數據通常需要做結構化查詢，比如join，這時候，關係型數據庫就要勝出一籌

2）這些數據的規模、增長的速度通常是可以預期的

3）事務性、一致性

NoSQL適合存儲非結構化數據，如文章、評論：

1）這些數據通常用於模糊處理，如全文搜索、機器學習

2）這些數據是海量的，而且增長的速度是難以預期的

3）根據數據的特點，NoSQL數據庫通常具有無限（至少接近）伸縮性

4）按key獲取數據效率很高，但是對join或其他結構化查詢的支持就比較差

關係式數據庫必備

事務（ACID、工作原理、事務的隔離級別、鎖、事務的傳播機制）

數據庫創建，權限分配，表的創建，增刪改查，連接，子查詢

索引

數據庫索引好比是一本書前面的目錄，能加快數據庫的查詢速度。索引分為聚簇索引和非聚簇索引兩種，聚簇索引是按照數據存放的物理位置為順序的，而非聚簇索引就不一樣了；聚簇索引能提高多行檢索的速度，而非聚簇索引對於單行的檢索很快。

還有觸發器、存儲過程、事務控制等

數據庫性能優化

索引原理及適用，大表查詢優化，多表連接查詢優化，子查詢優化等

大數據方案

分庫、分表、備份、遷移

導入，冷備熱備，主從備份、雙機熱備、縱向擴展、橫向擴展等這些都是屬於比較常見的數據庫方案，我在之前的文章淘寶具體挑戰性的一次架構演變中，談到了數據庫縱向和橫向的發展策略，裡面有詳細的方案。

java相關的框架與必備工具

從程序員進階到架構師，史上最全進階詳解（中篇）-架構擴展篇

web開發框架

Struts2，SpringMVC，spring（IoC、AOP等）

持久化：hibernate/MyBatis

推薦SSM組合(springMVC+Sping+Mybatis)

在搭建日誌：Log4j，以及單元測試：JUnit

構建工具

Maven Nexus,推薦自己動手搭建一套nexus以及配置maven

模板引擎

Velocity、FreeMaker等

消息隊列

ActiveMQ、RabbitMQ等

負載均衡

Nginx/HaProxy

Web服務器

Tomcat、JBoss、Jetty、Resin、WebLogic、WebSphere等

推薦在eclipse裡集成run-jetty-run插件，可以在開發環境實行熱部署，高效開發必備

java常用通信協議以及比較

RMI，Hessian，Burlap，Httpinvoker，WebService(cxf的soap、restful協議)

分佈式緩存

Redis、Memcached等，緩存在大型網站的架構中也是重中之重，特別是分佈式緩存和分佈式文件存儲系統，起著了天然數據庫端的防線作用。

分佈式文件存儲和大數據

常見的分佈式文件系統有，GFS、HDFS、Lustre 、Ceph 、GridFS 、mogileFS、TFS、FastDFS等。

GFS（Google File System）

Google公司為了滿足本公司需求而開發的基於Linux的專有分佈式文件系統。。儘管Google公佈了該系統的一些技術細節，但Google並沒有將該系統的軟件部分作為開源軟件發佈。

下面分佈式文件系統都是類 GFS的產品。

HDFS（Hadoop Distributed File System）

Hadoop 實現了一個分佈式文件系統，簡稱HDFS。 Hadoop是Apache Lucene創始人Doug Cutting開發的使用廣泛的文本搜索庫。它起源於Apache Nutch，後者是一個開源的網絡搜索引擎，本身也是Luene項目的一部分。Aapche Hadoop架構是MapReduce算法的一種開源應用，是Google開創其帝國的重要基石。

TFS(Taobao File System)

TFS是淘寶針對海量非結構化數據存儲設計的分佈式系統，構築在普通的Linux機器集群上，可為外部提供高可靠和高併發的存儲訪問，最初了為了解決淘寶大量小文件的存儲早期限制在1M內，現在已經加入大文件的存儲。淘寶的TFS其實本身就是從GFS借鑑而來，所以名字也很像。

工作流

Activity、JBPM

搜索引擎

lucene，基於lucene封裝的solr

以上，上篇和中篇，講解到了數據結構和算法，Java編程語言掌握，Java web核心技術，數據庫設計和大數據方案，Java相關的框架與必備工具等五大環節。

最後一篇，將重點講解最後一環節，系統架構設計，涉及到架構設計以的策略以及大型網站的架構方案，從負載均衡的開始，到web服務器集群和搭建，再到中間應用服務器集群以及中間件搭建(分佈式緩存，分佈式存儲等)的架構設計方案，再到後端數據庫端的策略，一份完整的大型網站系統架構設計方案。

相關推薦

'阿里資深架構師談職場：親述自己從一名碼農進階架構師的程序人生'

"“對於你們，我說實話，如果講能力，你們真的不是你們自己認定的那麼牛，換句話說，你們自視過高。總是認為別人、公司對不住你們，其實，這是所有人認為的“普遍現象”，公平是對有能力的人講的。不管在哪裡，即使再不爽，職位操守要有。你們，我認為----欠缺。我們總認為我們吃虧、心累，...

程序員瀏覽器電腦文章技術 Chrome 人生第一份工作 Linkedin 讀書算法 2019-09-09

'Java程序員走向Java架構師之路：類加載的過程詳解'

"Java開發需要經過虛擬機的編譯，這裡對類加載過程：加載、驗證、準備、解析、初始化進行簡單的分析。具體如何加載和千鋒廣州Java培訓小編一起來看看吧!加載在加載階段，虛擬機主要完成三件事：1.通過一個類的全限定名來獲取定義此類的二進制字節流。2.將這個字節流所代表的靜態存...

Java Java虛擬機程序員虛擬機數據結構 2019-08-25

'乾貨 | 十分鐘帶你從入門到進階python爬蟲'

"程序員的戀愛保證書1、對你不離不棄，憐惜你，心疼你，保護你2、做你的趴耳朵，不和你爭吵，不對你發脾氣3、做你的妻管嚴，對你死心塌地，始終如一，絕不三心二意4、一起做家務，一起逛菜市場，一起討價還價，一起做飯，學會做可口的飯菜一、基礎入門1.1什麼是爬蟲爬蟲(spider，...

Python 網絡爬蟲程序員瀏覽器 XML HTML 數據庫 JSON CSS Redis 技術 MySQL 2019-08-23

'進階的程序員：什麼是微服務？'

"微服務microservice微服務是指提供單個業務功能的服務，從技術角度看就是一種小而獨立的處理過程，類似流程概念，能夠自行單獨啟動或銷燬，擁有自己獨立的數據庫。一個複雜軟件架構是由很多這樣小而獨立運行（有自己的端口）微服務組成，這些獨立處理組件之間通訊是通過與語言無關...

程序員 Linux 數據庫紅帽公司通信 Docker 軟件 Google 技術設計 Twitter VMware 中央處理器亞馬遜公司硬件 eBay 2019-08-03

'Java知識進階-程序員徹底理解偏向鎖膨脹-知識鋪'

" 知識鋪：致力於打造輕知識點，持續更新每次的知識點較少，閱讀不累。不佔太多時間，不停的來喚醒你記憶深處的知識點。一、鎖分類偏向鎖：大多數一個線程競爭的場景，讓線程獲取鎖的代價降低，引入偏向鎖。輕量級鎖：有多個線程公平競爭的場景，不阻塞，自旋，不需要上下文切換，用戶態內...

程序員 Java 2019-08-03

'高手進階：Excel單元格自定義格式，常用情境彙總篇（強烈收藏）'

"大家都知道Excel強大，但是強大在哪裡卻說不出個所以然，我們也都知道程序猿厲害，畢竟整個互聯網世界都是他們的。現在告訴你Excel也可以寫代碼，你就知道為什麼它如此強大、功能如此豐富了！今天小米就給大家簡單介紹一下自定義個格式。ctrl+1，快捷方式打開“設置單元格格...

Excel 人生第一份工作程序員收藏軟件 PowerPoint 財會 2019-08-02

'學習Python基礎到進階難嗎？如何開始系統學習入門Python?'

"學Python編程難嗎？零基礎如何開始學習 Python?轉行零基礎學Python編程開發難度大嗎？從哪學起？近期很多小夥伴問我，如果自己轉行學習Python，完全0基礎能否學會呢？Python的難度到底有多大？一起來看下這些問題。學習Python難嗎？首先，我們普及一下...

Python 雅虎知識堂編程語言人生第一份工作 FLOW 電腦哲學日本 Flask 設計中央處理器大眾汽車 Java 英語 SQL Ruby 2019-07-20

'Java進階之路300集——從初級程序員到架構師，從小工到專家'

"怎樣學習才能從一名Java初級程序員成長為一名合格的架構師，或者說一名合格的架構師應該有怎樣的技術知識體系，這是不僅一個剛剛踏入職場的初級程序員也是工作三五年之後開始迷茫的老程序員經常會問到的問題。希望這篇文章會是你看到過的最全面最權威的回答。一：編程基礎不管是C還是C...

Java 程序員設計數據庫數據結構人生第一份工作技術算法 Redis MySQL 文章 2019-07-20

Py進階必學庫Pyinstaller使用詳解

簡介當我們希望將自己編寫好的程序傳送給他人使用時，如果對方沒有安裝 Python 環境就無法使用程序了，我們難以讓每個使用者都安裝 Python 環境，是...

Python 腳本語言程序員 Windows UNIX 2019-07-12

大前端趨勢下移動端程序員要涼？這些進階技能助你逆襲

在市場緊縮以及大前端的趨勢下，移動端程序員如何進行職業規劃，保持競爭力？今天 100offer 邀請到了在愛奇藝負責移動端金融產品研發工作的孔濤，他將在文...

程序員 Kotlin Android Java虛擬機 iOS Java 技術操作系統瀏覽器人生第一份工作 Google 虛擬機移動互聯網 Python 逆襲故事 Windows 工程師 Windows Phone 編程語言數據結構物聯網百度金融智能電視 2019-07-12

十年Android程序員：Java語言進階，必須會的-Android序列化總結

前言公園裡，一位仙風鶴骨的老者在打太極，一招一式都仙氣十足，一個年輕人走過去：“大爺，太極這玩意兒花拳繡腿，你練它幹啥？”老者淡淡一笑：“年輕人，你還沒有...

Java 程序員 Android 2019-07-09

你與騰訊架構師，差的不僅是年齡（進階必看）

為啥說你和大企業的架構師差的不僅是年齡？真的不僅是年齡，還有豐富的閱歷，更重要的更系統、更完整的架構師進階資料和教程！！！年齡只是大了幾歲，但是咱現在這時...

Java Java虛擬機技術讀書操作系統虛擬機程序員騰訊數據庫大數據 NoSQL 分佈式計算機器學習 LISP 維基百科人生第一份工作 2019-07-08

史上最強Java NIO入門：擔心從入門到放棄的，請讀這篇

本文原題“《NIO 入門》，作者為“Gregory M. Travis”，他是《JDK 1.4 Tutorial》等書籍的作者。1、引言Java NIO是...

Java 程序員技術操作系統人生第一份工作電腦 Windows UNIX 2019-07-04

Python 進階必學庫：Pyinstaller 使用詳解

HackPython 致力於有趣有價值的編程教學簡介當我們希望將自己編寫好的程序傳送給他人使用時，如果對方沒有安裝 Python 環境就無法使用程序了，我...

Python 腳本語言 Windows 程序員 UNIX 2019-06-29

百度T8架構師細談Java架構進階掃盲清單！（附圖文）

普通程序員寫代碼叫編碼，而架構師寫代碼就叫架構設計。這是因為他們在編碼時考慮的角度完全不同。普通程序員只需要考慮如何實現功能，而優秀的程序員（預備架構師）...

Java 程序員技術 Git MySQL 設計模式百度工程師軟件設計軟件 DevOps 人生第一份工作 Tomcat 算法數據結構 Docker 通信 2019-06-26

史上最全程序員表情包，不收藏你會後悔的

程序猿怒產品：程序猿不想和你說話，並… 被吐槽寫BUG時怎麼辦產品又來提需求產品又要改需求，怎麼辦產品說，這個功能三天後就要日常懟產...

程序員收藏 2019-06-25

程序員必備！史上最全Linux基礎知識點，你知道多少？

Linux是每個後端程序員必須要掌握的系統，今天小編就給你分享一篇Linux基礎知識點大全，看看你知道多少？（私信我python，獲得萬元python大禮...

Linux 程序員 UNIX 操作系統電腦 GNU CentOS MINIX 硬件 Python Ubuntu 林納斯·託瓦茲 Git 黑客自由軟件軟件 Windows 超級計算機 Tomcat 數據庫電子遊戲 2019-05-14

史上最全的程序員常用英語單詞

目錄概要常用單詞高級部分1.概要英語對提升軟件開發水平非常重要。如果你英文水平不高，這並不影響你成為一個普通程序員，程序更多是靠邏輯思維。如果做了多年開...

英語程序員編程語言軟件電腦 JavaScript 讀書掃描儀 Java 技術 Eclipse 面向對象程序編程數據庫複印機 2019-04-19

java程序員進階架構師你必須掌握的架構知識體系

Java架構師主要需要做哪些工作呢？負責設計和搭建軟件系統架構（平臺、數據庫、接口和應用架構等），解決開發中各種系統架構問題。優化現有系統的性能，解決軟件...

Java 程序員 SQL 數據庫設計技術掃描儀何來 2019-04-16

C語言面試題詳解指針篇，不知道內存分幾個區，不是合格的程序員

指針的使用，一直是c語言面試題中必考的部分，因為指針本身使用的複雜性與普適性，所以考點非常多，而且也可以與其他知識相互結合，因此我們將會使用五篇專題的篇幅...

C語言程序員 Linux 面試編譯器 2019-04-04

推薦中...