'青銅到王者,快速提升你 MySQL 數據庫的段位'
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
——日誌文件:
1、錯誤日誌 error log:對 mysql 啟動,運行,關閉過程進行了記錄。
2、全量日誌 general log:查詢日誌記錄了所有對 mysql 數據庫請求的信息,不論這些請求是否得到了正確的執行。
3、二進制日誌 binlog:記錄了對數據庫執行更改的所有操作。但是並不包括 select 和 show 這類操作。
4、中繼日誌 relay log:主從同步,從庫需要把主庫傳遞過來的日誌,記錄到自己的 relay log 裡面。
5、慢查詢日誌 slow log:運行時間超過某值的所有 sql 語句都記錄到慢查詢日誌文件中。
——對數據庫的表設計也要學習清楚
數據類型的選擇,主要參考官方文檔:
https://downloads.mysql.com/docs/licenses/mysqld-5.7-com-en.pdf
——數據碎片的整理
產生碎片的原因:
- 主要是因為對大表進行刪除操作;
- 其次隨機方式插入新數據,可能導致輔助索引產生大量的碎片;
整理碎片的方法:
- 備份數據表,導入導出,刪除舊錶
- 執行 alter table table_name engine=innodb;
——收集統計信息
保證統計信息的準確性,才能確保我們的 sql 執行計劃準確。收集方法:
- 重啟 mysql 服務
- 遍歷 tables 表
——學習分區表
分區表的種類:
1、range
2、list
3、hash
4、key
——學習對索引的認識
大致分為:
1、如何查看數據庫中索引:show index from table_name;
2、學會查看數據庫索引的選擇性:select count(distinct c1)/count(*) from table_name; 選擇性越高,越適合創建索引
3、創建索引的過程中,學會查看執行計劃。內功心法:先看 type 值,再看 key,再看 rows,最後看 extra;
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
——日誌文件:
1、錯誤日誌 error log:對 mysql 啟動,運行,關閉過程進行了記錄。
2、全量日誌 general log:查詢日誌記錄了所有對 mysql 數據庫請求的信息,不論這些請求是否得到了正確的執行。
3、二進制日誌 binlog:記錄了對數據庫執行更改的所有操作。但是並不包括 select 和 show 這類操作。
4、中繼日誌 relay log:主從同步,從庫需要把主庫傳遞過來的日誌,記錄到自己的 relay log 裡面。
5、慢查詢日誌 slow log:運行時間超過某值的所有 sql 語句都記錄到慢查詢日誌文件中。
——對數據庫的表設計也要學習清楚
數據類型的選擇,主要參考官方文檔:
https://downloads.mysql.com/docs/licenses/mysqld-5.7-com-en.pdf
——數據碎片的整理
產生碎片的原因:
- 主要是因為對大表進行刪除操作;
- 其次隨機方式插入新數據,可能導致輔助索引產生大量的碎片;
整理碎片的方法:
- 備份數據表,導入導出,刪除舊錶
- 執行 alter table table_name engine=innodb;
——收集統計信息
保證統計信息的準確性,才能確保我們的 sql 執行計劃準確。收集方法:
- 重啟 mysql 服務
- 遍歷 tables 表
——學習分區表
分區表的種類:
1、range
2、list
3、hash
4、key
——學習對索引的認識
大致分為:
1、如何查看數據庫中索引:show index from table_name;
2、學會查看數據庫索引的選擇性:select count(distinct c1)/count(*) from table_name; 選擇性越高,越適合創建索引
3、創建索引的過程中,學會查看執行計劃。內功心法:先看 type 值,再看 key,再看 rows,最後看 extra;
4、瞭解創建索引的好處
a、提高數據檢索效率
b、提高聚合函數效率
c、提高排序效率
d、個別時候可以避免回表
e、減少多表關聯時掃描行數
f、主鍵、唯一索引可以作為約束
——對事務的學習
先要知道事務的四大特性(ACID):
a. 原子性(Atomicity)
事務的原子性是指事務中包含的所有操作要麼都做,要麼都不做,保證數據庫是一致的
b. 一致性(Consistency)
一致性是指數據庫在事務操作前和事務處理後,其中的數據必須都滿足業務規則約束.
c. 隔離性(Isolation)
隔離性是數據庫允許多個併發事務同時對數據進行讀寫和修改的能力,隔離性可以防止多個事務併發執行時由於交叉執行而導致數據的不一致.
d. 持久性(Durability)
事務處理結束後,對數據的修改就是永久的
熟悉 mysql 數據庫四種事務隔離級別:
1. read uncommitted(RU)讀未提交:
一個事務中,可以讀取到其他事務未提交的變更
2. read committed(RC)讀已提交:
一個事務中,可以讀取到其他事務已經提交的變更
3. repetable read,(RR)可重複讀:
一個事務中,直到事務結束前,都可以反覆讀取到事務剛開始看到的數據,不會發生變化
4. serializable(串行讀):
即便每次讀都需要獲得表級共享鎖,每次寫都加表級排它鎖,兩個會話間讀寫會相互阻塞。
個人建議:對於交易類系統的網站,大家儘量使用事務級別比較高的RR;對於一些門戶類網站大家使用RC就可以了。
Innodb 的鎖,默認三種鎖算法:
- record;
- Gap lock;
- next-key lock
默認鎖算法是 next-key lock 間隙鎖保證不會出現幻讀現象。
數據庫字符集
先學會查看數據庫的字符集:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
——日誌文件:
1、錯誤日誌 error log:對 mysql 啟動,運行,關閉過程進行了記錄。
2、全量日誌 general log:查詢日誌記錄了所有對 mysql 數據庫請求的信息,不論這些請求是否得到了正確的執行。
3、二進制日誌 binlog:記錄了對數據庫執行更改的所有操作。但是並不包括 select 和 show 這類操作。
4、中繼日誌 relay log:主從同步,從庫需要把主庫傳遞過來的日誌,記錄到自己的 relay log 裡面。
5、慢查詢日誌 slow log:運行時間超過某值的所有 sql 語句都記錄到慢查詢日誌文件中。
——對數據庫的表設計也要學習清楚
數據類型的選擇,主要參考官方文檔:
https://downloads.mysql.com/docs/licenses/mysqld-5.7-com-en.pdf
——數據碎片的整理
產生碎片的原因:
- 主要是因為對大表進行刪除操作;
- 其次隨機方式插入新數據,可能導致輔助索引產生大量的碎片;
整理碎片的方法:
- 備份數據表,導入導出,刪除舊錶
- 執行 alter table table_name engine=innodb;
——收集統計信息
保證統計信息的準確性,才能確保我們的 sql 執行計劃準確。收集方法:
- 重啟 mysql 服務
- 遍歷 tables 表
——學習分區表
分區表的種類:
1、range
2、list
3、hash
4、key
——學習對索引的認識
大致分為:
1、如何查看數據庫中索引:show index from table_name;
2、學會查看數據庫索引的選擇性:select count(distinct c1)/count(*) from table_name; 選擇性越高,越適合創建索引
3、創建索引的過程中,學會查看執行計劃。內功心法:先看 type 值,再看 key,再看 rows,最後看 extra;
4、瞭解創建索引的好處
a、提高數據檢索效率
b、提高聚合函數效率
c、提高排序效率
d、個別時候可以避免回表
e、減少多表關聯時掃描行數
f、主鍵、唯一索引可以作為約束
——對事務的學習
先要知道事務的四大特性(ACID):
a. 原子性(Atomicity)
事務的原子性是指事務中包含的所有操作要麼都做,要麼都不做,保證數據庫是一致的
b. 一致性(Consistency)
一致性是指數據庫在事務操作前和事務處理後,其中的數據必須都滿足業務規則約束.
c. 隔離性(Isolation)
隔離性是數據庫允許多個併發事務同時對數據進行讀寫和修改的能力,隔離性可以防止多個事務併發執行時由於交叉執行而導致數據的不一致.
d. 持久性(Durability)
事務處理結束後,對數據的修改就是永久的
熟悉 mysql 數據庫四種事務隔離級別:
1. read uncommitted(RU)讀未提交:
一個事務中,可以讀取到其他事務未提交的變更
2. read committed(RC)讀已提交:
一個事務中,可以讀取到其他事務已經提交的變更
3. repetable read,(RR)可重複讀:
一個事務中,直到事務結束前,都可以反覆讀取到事務剛開始看到的數據,不會發生變化
4. serializable(串行讀):
即便每次讀都需要獲得表級共享鎖,每次寫都加表級排它鎖,兩個會話間讀寫會相互阻塞。
個人建議:對於交易類系統的網站,大家儘量使用事務級別比較高的RR;對於一些門戶類網站大家使用RC就可以了。
Innodb 的鎖,默認三種鎖算法:
- record;
- Gap lock;
- next-key lock
默認鎖算法是 next-key lock 間隙鎖保證不會出現幻讀現象。
數據庫字符集
先學會查看數據庫的字符集:
如果想保證不會出現中文亂碼的情況發生,必須滿足以下三點:
1、連接終端必須UTF8
2、操作系統必須UTF8
3、數據庫必須UTF8
三者統一就不會出現中文亂碼的問題
——數據庫權限問題的管理
1、權限申請流程要設置規範,合理.
2、測試和正式環境都要嚴格控制數據庫的寫權限,禁止分配 create,alter 這樣的權限給開發人員。並且讀權限和外業務服務分離.
3、領導需要權限時,問清目的,發郵件說明。儘量都由DBA全權管理
4、特權賬號 all privileges 必須由DBA人員控制
5、單庫單用戶,禁止給我一個用戶賬號管理多個庫。
6、只讀賬號 select,可以後期配合主從架構中read_only 一起使用
7、禁止 root 用戶作為遠程連接用戶使用
第四部分:尊貴鉑金篇
DBA 人員,如果不能保證數據的完整性,一切操作都是徒勞無功。所以備份的重要性可想而知。雖然備份不能帶來業務上的提升,還會增加我們的成本。但是沒有數據的完整性,無法保證我們線上業務的正常運行。是數據損壞時最後的一個救命稻草。
備份按方法分:冷備和熱備
冷備:數據庫關掉,影響業務。系統級別的文件 copy(PS:現在這種基本被廢棄了)
熱備:數據庫在線備份,不影響現有業務的進行。
在熱備裡面又分為:
1. 邏輯備份
a. mysqldump
b. mydumper
c. mysqlpump(mysql 5.7才出現)
2. 裸文件備份
物理底層去 copy 文件,工具是 percona-xtrabackup
按內容又可以分為:全量備份、增量備份
生產中最常用的兩種方法:
- mysqldump
- xtrabackup
mysqldump 參數詳解:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
——日誌文件:
1、錯誤日誌 error log:對 mysql 啟動,運行,關閉過程進行了記錄。
2、全量日誌 general log:查詢日誌記錄了所有對 mysql 數據庫請求的信息,不論這些請求是否得到了正確的執行。
3、二進制日誌 binlog:記錄了對數據庫執行更改的所有操作。但是並不包括 select 和 show 這類操作。
4、中繼日誌 relay log:主從同步,從庫需要把主庫傳遞過來的日誌,記錄到自己的 relay log 裡面。
5、慢查詢日誌 slow log:運行時間超過某值的所有 sql 語句都記錄到慢查詢日誌文件中。
——對數據庫的表設計也要學習清楚
數據類型的選擇,主要參考官方文檔:
https://downloads.mysql.com/docs/licenses/mysqld-5.7-com-en.pdf
——數據碎片的整理
產生碎片的原因:
- 主要是因為對大表進行刪除操作;
- 其次隨機方式插入新數據,可能導致輔助索引產生大量的碎片;
整理碎片的方法:
- 備份數據表,導入導出,刪除舊錶
- 執行 alter table table_name engine=innodb;
——收集統計信息
保證統計信息的準確性,才能確保我們的 sql 執行計劃準確。收集方法:
- 重啟 mysql 服務
- 遍歷 tables 表
——學習分區表
分區表的種類:
1、range
2、list
3、hash
4、key
——學習對索引的認識
大致分為:
1、如何查看數據庫中索引:show index from table_name;
2、學會查看數據庫索引的選擇性:select count(distinct c1)/count(*) from table_name; 選擇性越高,越適合創建索引
3、創建索引的過程中,學會查看執行計劃。內功心法:先看 type 值,再看 key,再看 rows,最後看 extra;
4、瞭解創建索引的好處
a、提高數據檢索效率
b、提高聚合函數效率
c、提高排序效率
d、個別時候可以避免回表
e、減少多表關聯時掃描行數
f、主鍵、唯一索引可以作為約束
——對事務的學習
先要知道事務的四大特性(ACID):
a. 原子性(Atomicity)
事務的原子性是指事務中包含的所有操作要麼都做,要麼都不做,保證數據庫是一致的
b. 一致性(Consistency)
一致性是指數據庫在事務操作前和事務處理後,其中的數據必須都滿足業務規則約束.
c. 隔離性(Isolation)
隔離性是數據庫允許多個併發事務同時對數據進行讀寫和修改的能力,隔離性可以防止多個事務併發執行時由於交叉執行而導致數據的不一致.
d. 持久性(Durability)
事務處理結束後,對數據的修改就是永久的
熟悉 mysql 數據庫四種事務隔離級別:
1. read uncommitted(RU)讀未提交:
一個事務中,可以讀取到其他事務未提交的變更
2. read committed(RC)讀已提交:
一個事務中,可以讀取到其他事務已經提交的變更
3. repetable read,(RR)可重複讀:
一個事務中,直到事務結束前,都可以反覆讀取到事務剛開始看到的數據,不會發生變化
4. serializable(串行讀):
即便每次讀都需要獲得表級共享鎖,每次寫都加表級排它鎖,兩個會話間讀寫會相互阻塞。
個人建議:對於交易類系統的網站,大家儘量使用事務級別比較高的RR;對於一些門戶類網站大家使用RC就可以了。
Innodb 的鎖,默認三種鎖算法:
- record;
- Gap lock;
- next-key lock
默認鎖算法是 next-key lock 間隙鎖保證不會出現幻讀現象。
數據庫字符集
先學會查看數據庫的字符集:
如果想保證不會出現中文亂碼的情況發生,必須滿足以下三點:
1、連接終端必須UTF8
2、操作系統必須UTF8
3、數據庫必須UTF8
三者統一就不會出現中文亂碼的問題
——數據庫權限問題的管理
1、權限申請流程要設置規範,合理.
2、測試和正式環境都要嚴格控制數據庫的寫權限,禁止分配 create,alter 這樣的權限給開發人員。並且讀權限和外業務服務分離.
3、領導需要權限時,問清目的,發郵件說明。儘量都由DBA全權管理
4、特權賬號 all privileges 必須由DBA人員控制
5、單庫單用戶,禁止給我一個用戶賬號管理多個庫。
6、只讀賬號 select,可以後期配合主從架構中read_only 一起使用
7、禁止 root 用戶作為遠程連接用戶使用
第四部分:尊貴鉑金篇
DBA 人員,如果不能保證數據的完整性,一切操作都是徒勞無功。所以備份的重要性可想而知。雖然備份不能帶來業務上的提升,還會增加我們的成本。但是沒有數據的完整性,無法保證我們線上業務的正常運行。是數據損壞時最後的一個救命稻草。
備份按方法分:冷備和熱備
冷備:數據庫關掉,影響業務。系統級別的文件 copy(PS:現在這種基本被廢棄了)
熱備:數據庫在線備份,不影響現有業務的進行。
在熱備裡面又分為:
1. 邏輯備份
a. mysqldump
b. mydumper
c. mysqlpump(mysql 5.7才出現)
2. 裸文件備份
物理底層去 copy 文件,工具是 percona-xtrabackup
按內容又可以分為:全量備份、增量備份
生產中最常用的兩種方法:
- mysqldump
- xtrabackup
mysqldump 參數詳解:
備份數據庫:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
——日誌文件:
1、錯誤日誌 error log:對 mysql 啟動,運行,關閉過程進行了記錄。
2、全量日誌 general log:查詢日誌記錄了所有對 mysql 數據庫請求的信息,不論這些請求是否得到了正確的執行。
3、二進制日誌 binlog:記錄了對數據庫執行更改的所有操作。但是並不包括 select 和 show 這類操作。
4、中繼日誌 relay log:主從同步,從庫需要把主庫傳遞過來的日誌,記錄到自己的 relay log 裡面。
5、慢查詢日誌 slow log:運行時間超過某值的所有 sql 語句都記錄到慢查詢日誌文件中。
——對數據庫的表設計也要學習清楚
數據類型的選擇,主要參考官方文檔:
https://downloads.mysql.com/docs/licenses/mysqld-5.7-com-en.pdf
——數據碎片的整理
產生碎片的原因:
- 主要是因為對大表進行刪除操作;
- 其次隨機方式插入新數據,可能導致輔助索引產生大量的碎片;
整理碎片的方法:
- 備份數據表,導入導出,刪除舊錶
- 執行 alter table table_name engine=innodb;
——收集統計信息
保證統計信息的準確性,才能確保我們的 sql 執行計劃準確。收集方法:
- 重啟 mysql 服務
- 遍歷 tables 表
——學習分區表
分區表的種類:
1、range
2、list
3、hash
4、key
——學習對索引的認識
大致分為:
1、如何查看數據庫中索引:show index from table_name;
2、學會查看數據庫索引的選擇性:select count(distinct c1)/count(*) from table_name; 選擇性越高,越適合創建索引
3、創建索引的過程中,學會查看執行計劃。內功心法:先看 type 值,再看 key,再看 rows,最後看 extra;
4、瞭解創建索引的好處
a、提高數據檢索效率
b、提高聚合函數效率
c、提高排序效率
d、個別時候可以避免回表
e、減少多表關聯時掃描行數
f、主鍵、唯一索引可以作為約束
——對事務的學習
先要知道事務的四大特性(ACID):
a. 原子性(Atomicity)
事務的原子性是指事務中包含的所有操作要麼都做,要麼都不做,保證數據庫是一致的
b. 一致性(Consistency)
一致性是指數據庫在事務操作前和事務處理後,其中的數據必須都滿足業務規則約束.
c. 隔離性(Isolation)
隔離性是數據庫允許多個併發事務同時對數據進行讀寫和修改的能力,隔離性可以防止多個事務併發執行時由於交叉執行而導致數據的不一致.
d. 持久性(Durability)
事務處理結束後,對數據的修改就是永久的
熟悉 mysql 數據庫四種事務隔離級別:
1. read uncommitted(RU)讀未提交:
一個事務中,可以讀取到其他事務未提交的變更
2. read committed(RC)讀已提交:
一個事務中,可以讀取到其他事務已經提交的變更
3. repetable read,(RR)可重複讀:
一個事務中,直到事務結束前,都可以反覆讀取到事務剛開始看到的數據,不會發生變化
4. serializable(串行讀):
即便每次讀都需要獲得表級共享鎖,每次寫都加表級排它鎖,兩個會話間讀寫會相互阻塞。
個人建議:對於交易類系統的網站,大家儘量使用事務級別比較高的RR;對於一些門戶類網站大家使用RC就可以了。
Innodb 的鎖,默認三種鎖算法:
- record;
- Gap lock;
- next-key lock
默認鎖算法是 next-key lock 間隙鎖保證不會出現幻讀現象。
數據庫字符集
先學會查看數據庫的字符集:
如果想保證不會出現中文亂碼的情況發生,必須滿足以下三點:
1、連接終端必須UTF8
2、操作系統必須UTF8
3、數據庫必須UTF8
三者統一就不會出現中文亂碼的問題
——數據庫權限問題的管理
1、權限申請流程要設置規範,合理.
2、測試和正式環境都要嚴格控制數據庫的寫權限,禁止分配 create,alter 這樣的權限給開發人員。並且讀權限和外業務服務分離.
3、領導需要權限時,問清目的,發郵件說明。儘量都由DBA全權管理
4、特權賬號 all privileges 必須由DBA人員控制
5、單庫單用戶,禁止給我一個用戶賬號管理多個庫。
6、只讀賬號 select,可以後期配合主從架構中read_only 一起使用
7、禁止 root 用戶作為遠程連接用戶使用
第四部分:尊貴鉑金篇
DBA 人員,如果不能保證數據的完整性,一切操作都是徒勞無功。所以備份的重要性可想而知。雖然備份不能帶來業務上的提升,還會增加我們的成本。但是沒有數據的完整性,無法保證我們線上業務的正常運行。是數據損壞時最後的一個救命稻草。
備份按方法分:冷備和熱備
冷備:數據庫關掉,影響業務。系統級別的文件 copy(PS:現在這種基本被廢棄了)
熱備:數據庫在線備份,不影響現有業務的進行。
在熱備裡面又分為:
1. 邏輯備份
a. mysqldump
b. mydumper
c. mysqlpump(mysql 5.7才出現)
2. 裸文件備份
物理底層去 copy 文件,工具是 percona-xtrabackup
按內容又可以分為:全量備份、增量備份
生產中最常用的兩種方法:
- mysqldump
- xtrabackup
mysqldump 參數詳解:
備份數據庫:
數據庫崩潰恢復原理介紹:Innodb 維護了一個 redo log,它記錄著 Innodb 所有數據的真實修改信息,當數據庫重啟過程中,redo log 會應用所有已經提交的事務進行前滾,並把所有未提交的事務進行回滾,來保證宕機那一時刻的數據完整性。
XtraBackup 在備份的時候並不鎖定表,而是一頁一頁地複製 InnoDB 的數據,與此同時,XtraBackup 還有另外一個線程監視著 transactions log,一旦 log 發生變化,就把變化過的 log pages 複製走。在全部數據文件複製完成之後,停止複製 logfile。
常用命令:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
——日誌文件:
1、錯誤日誌 error log:對 mysql 啟動,運行,關閉過程進行了記錄。
2、全量日誌 general log:查詢日誌記錄了所有對 mysql 數據庫請求的信息,不論這些請求是否得到了正確的執行。
3、二進制日誌 binlog:記錄了對數據庫執行更改的所有操作。但是並不包括 select 和 show 這類操作。
4、中繼日誌 relay log:主從同步,從庫需要把主庫傳遞過來的日誌,記錄到自己的 relay log 裡面。
5、慢查詢日誌 slow log:運行時間超過某值的所有 sql 語句都記錄到慢查詢日誌文件中。
——對數據庫的表設計也要學習清楚
數據類型的選擇,主要參考官方文檔:
https://downloads.mysql.com/docs/licenses/mysqld-5.7-com-en.pdf
——數據碎片的整理
產生碎片的原因:
- 主要是因為對大表進行刪除操作;
- 其次隨機方式插入新數據,可能導致輔助索引產生大量的碎片;
整理碎片的方法:
- 備份數據表,導入導出,刪除舊錶
- 執行 alter table table_name engine=innodb;
——收集統計信息
保證統計信息的準確性,才能確保我們的 sql 執行計劃準確。收集方法:
- 重啟 mysql 服務
- 遍歷 tables 表
——學習分區表
分區表的種類:
1、range
2、list
3、hash
4、key
——學習對索引的認識
大致分為:
1、如何查看數據庫中索引:show index from table_name;
2、學會查看數據庫索引的選擇性:select count(distinct c1)/count(*) from table_name; 選擇性越高,越適合創建索引
3、創建索引的過程中,學會查看執行計劃。內功心法:先看 type 值,再看 key,再看 rows,最後看 extra;
4、瞭解創建索引的好處
a、提高數據檢索效率
b、提高聚合函數效率
c、提高排序效率
d、個別時候可以避免回表
e、減少多表關聯時掃描行數
f、主鍵、唯一索引可以作為約束
——對事務的學習
先要知道事務的四大特性(ACID):
a. 原子性(Atomicity)
事務的原子性是指事務中包含的所有操作要麼都做,要麼都不做,保證數據庫是一致的
b. 一致性(Consistency)
一致性是指數據庫在事務操作前和事務處理後,其中的數據必須都滿足業務規則約束.
c. 隔離性(Isolation)
隔離性是數據庫允許多個併發事務同時對數據進行讀寫和修改的能力,隔離性可以防止多個事務併發執行時由於交叉執行而導致數據的不一致.
d. 持久性(Durability)
事務處理結束後,對數據的修改就是永久的
熟悉 mysql 數據庫四種事務隔離級別:
1. read uncommitted(RU)讀未提交:
一個事務中,可以讀取到其他事務未提交的變更
2. read committed(RC)讀已提交:
一個事務中,可以讀取到其他事務已經提交的變更
3. repetable read,(RR)可重複讀:
一個事務中,直到事務結束前,都可以反覆讀取到事務剛開始看到的數據,不會發生變化
4. serializable(串行讀):
即便每次讀都需要獲得表級共享鎖,每次寫都加表級排它鎖,兩個會話間讀寫會相互阻塞。
個人建議:對於交易類系統的網站,大家儘量使用事務級別比較高的RR;對於一些門戶類網站大家使用RC就可以了。
Innodb 的鎖,默認三種鎖算法:
- record;
- Gap lock;
- next-key lock
默認鎖算法是 next-key lock 間隙鎖保證不會出現幻讀現象。
數據庫字符集
先學會查看數據庫的字符集:
如果想保證不會出現中文亂碼的情況發生,必須滿足以下三點:
1、連接終端必須UTF8
2、操作系統必須UTF8
3、數據庫必須UTF8
三者統一就不會出現中文亂碼的問題
——數據庫權限問題的管理
1、權限申請流程要設置規範,合理.
2、測試和正式環境都要嚴格控制數據庫的寫權限,禁止分配 create,alter 這樣的權限給開發人員。並且讀權限和外業務服務分離.
3、領導需要權限時,問清目的,發郵件說明。儘量都由DBA全權管理
4、特權賬號 all privileges 必須由DBA人員控制
5、單庫單用戶,禁止給我一個用戶賬號管理多個庫。
6、只讀賬號 select,可以後期配合主從架構中read_only 一起使用
7、禁止 root 用戶作為遠程連接用戶使用
第四部分:尊貴鉑金篇
DBA 人員,如果不能保證數據的完整性,一切操作都是徒勞無功。所以備份的重要性可想而知。雖然備份不能帶來業務上的提升,還會增加我們的成本。但是沒有數據的完整性,無法保證我們線上業務的正常運行。是數據損壞時最後的一個救命稻草。
備份按方法分:冷備和熱備
冷備:數據庫關掉,影響業務。系統級別的文件 copy(PS:現在這種基本被廢棄了)
熱備:數據庫在線備份,不影響現有業務的進行。
在熱備裡面又分為:
1. 邏輯備份
a. mysqldump
b. mydumper
c. mysqlpump(mysql 5.7才出現)
2. 裸文件備份
物理底層去 copy 文件,工具是 percona-xtrabackup
按內容又可以分為:全量備份、增量備份
生產中最常用的兩種方法:
- mysqldump
- xtrabackup
mysqldump 參數詳解:
備份數據庫:
數據庫崩潰恢復原理介紹:Innodb 維護了一個 redo log,它記錄著 Innodb 所有數據的真實修改信息,當數據庫重啟過程中,redo log 會應用所有已經提交的事務進行前滾,並把所有未提交的事務進行回滾,來保證宕機那一時刻的數據完整性。
XtraBackup 在備份的時候並不鎖定表,而是一頁一頁地複製 InnoDB 的數據,與此同時,XtraBackup 還有另外一個線程監視著 transactions log,一旦 log 發生變化,就把變化過的 log pages 複製走。在全部數據文件複製完成之後,停止複製 logfile。
常用命令:
增備原理分析:
在完整備份和增量備份文件中都有一個文件 xtrabackup_checkpoints 會記錄備份完成時檢查點的LSN。在進行新的增量備份時,XtraBackup 會比較表空間中每頁的 LSN 是否大於上次備份完成的 LSN,如果是,則備份該頁,並記錄當前檢查點的 LSN。
7月20日的增備信息
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
——日誌文件:
1、錯誤日誌 error log:對 mysql 啟動,運行,關閉過程進行了記錄。
2、全量日誌 general log:查詢日誌記錄了所有對 mysql 數據庫請求的信息,不論這些請求是否得到了正確的執行。
3、二進制日誌 binlog:記錄了對數據庫執行更改的所有操作。但是並不包括 select 和 show 這類操作。
4、中繼日誌 relay log:主從同步,從庫需要把主庫傳遞過來的日誌,記錄到自己的 relay log 裡面。
5、慢查詢日誌 slow log:運行時間超過某值的所有 sql 語句都記錄到慢查詢日誌文件中。
——對數據庫的表設計也要學習清楚
數據類型的選擇,主要參考官方文檔:
https://downloads.mysql.com/docs/licenses/mysqld-5.7-com-en.pdf
——數據碎片的整理
產生碎片的原因:
- 主要是因為對大表進行刪除操作;
- 其次隨機方式插入新數據,可能導致輔助索引產生大量的碎片;
整理碎片的方法:
- 備份數據表,導入導出,刪除舊錶
- 執行 alter table table_name engine=innodb;
——收集統計信息
保證統計信息的準確性,才能確保我們的 sql 執行計劃準確。收集方法:
- 重啟 mysql 服務
- 遍歷 tables 表
——學習分區表
分區表的種類:
1、range
2、list
3、hash
4、key
——學習對索引的認識
大致分為:
1、如何查看數據庫中索引:show index from table_name;
2、學會查看數據庫索引的選擇性:select count(distinct c1)/count(*) from table_name; 選擇性越高,越適合創建索引
3、創建索引的過程中,學會查看執行計劃。內功心法:先看 type 值,再看 key,再看 rows,最後看 extra;
4、瞭解創建索引的好處
a、提高數據檢索效率
b、提高聚合函數效率
c、提高排序效率
d、個別時候可以避免回表
e、減少多表關聯時掃描行數
f、主鍵、唯一索引可以作為約束
——對事務的學習
先要知道事務的四大特性(ACID):
a. 原子性(Atomicity)
事務的原子性是指事務中包含的所有操作要麼都做,要麼都不做,保證數據庫是一致的
b. 一致性(Consistency)
一致性是指數據庫在事務操作前和事務處理後,其中的數據必須都滿足業務規則約束.
c. 隔離性(Isolation)
隔離性是數據庫允許多個併發事務同時對數據進行讀寫和修改的能力,隔離性可以防止多個事務併發執行時由於交叉執行而導致數據的不一致.
d. 持久性(Durability)
事務處理結束後,對數據的修改就是永久的
熟悉 mysql 數據庫四種事務隔離級別:
1. read uncommitted(RU)讀未提交:
一個事務中,可以讀取到其他事務未提交的變更
2. read committed(RC)讀已提交:
一個事務中,可以讀取到其他事務已經提交的變更
3. repetable read,(RR)可重複讀:
一個事務中,直到事務結束前,都可以反覆讀取到事務剛開始看到的數據,不會發生變化
4. serializable(串行讀):
即便每次讀都需要獲得表級共享鎖,每次寫都加表級排它鎖,兩個會話間讀寫會相互阻塞。
個人建議:對於交易類系統的網站,大家儘量使用事務級別比較高的RR;對於一些門戶類網站大家使用RC就可以了。
Innodb 的鎖,默認三種鎖算法:
- record;
- Gap lock;
- next-key lock
默認鎖算法是 next-key lock 間隙鎖保證不會出現幻讀現象。
數據庫字符集
先學會查看數據庫的字符集:
如果想保證不會出現中文亂碼的情況發生,必須滿足以下三點:
1、連接終端必須UTF8
2、操作系統必須UTF8
3、數據庫必須UTF8
三者統一就不會出現中文亂碼的問題
——數據庫權限問題的管理
1、權限申請流程要設置規範,合理.
2、測試和正式環境都要嚴格控制數據庫的寫權限,禁止分配 create,alter 這樣的權限給開發人員。並且讀權限和外業務服務分離.
3、領導需要權限時,問清目的,發郵件說明。儘量都由DBA全權管理
4、特權賬號 all privileges 必須由DBA人員控制
5、單庫單用戶,禁止給我一個用戶賬號管理多個庫。
6、只讀賬號 select,可以後期配合主從架構中read_only 一起使用
7、禁止 root 用戶作為遠程連接用戶使用
第四部分:尊貴鉑金篇
DBA 人員,如果不能保證數據的完整性,一切操作都是徒勞無功。所以備份的重要性可想而知。雖然備份不能帶來業務上的提升,還會增加我們的成本。但是沒有數據的完整性,無法保證我們線上業務的正常運行。是數據損壞時最後的一個救命稻草。
備份按方法分:冷備和熱備
冷備:數據庫關掉,影響業務。系統級別的文件 copy(PS:現在這種基本被廢棄了)
熱備:數據庫在線備份,不影響現有業務的進行。
在熱備裡面又分為:
1. 邏輯備份
a. mysqldump
b. mydumper
c. mysqlpump(mysql 5.7才出現)
2. 裸文件備份
物理底層去 copy 文件,工具是 percona-xtrabackup
按內容又可以分為:全量備份、增量備份
生產中最常用的兩種方法:
- mysqldump
- xtrabackup
mysqldump 參數詳解:
備份數據庫:
數據庫崩潰恢復原理介紹:Innodb 維護了一個 redo log,它記錄著 Innodb 所有數據的真實修改信息,當數據庫重啟過程中,redo log 會應用所有已經提交的事務進行前滾,並把所有未提交的事務進行回滾,來保證宕機那一時刻的數據完整性。
XtraBackup 在備份的時候並不鎖定表,而是一頁一頁地複製 InnoDB 的數據,與此同時,XtraBackup 還有另外一個線程監視著 transactions log,一旦 log 發生變化,就把變化過的 log pages 複製走。在全部數據文件複製完成之後,停止複製 logfile。
常用命令:
增備原理分析:
在完整備份和增量備份文件中都有一個文件 xtrabackup_checkpoints 會記錄備份完成時檢查點的LSN。在進行新的增量備份時,XtraBackup 會比較表空間中每頁的 LSN 是否大於上次備份完成的 LSN,如果是,則備份該頁,並記錄當前檢查點的 LSN。
7月20日的增備信息
7月21日的增備信息
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
——日誌文件:
1、錯誤日誌 error log:對 mysql 啟動,運行,關閉過程進行了記錄。
2、全量日誌 general log:查詢日誌記錄了所有對 mysql 數據庫請求的信息,不論這些請求是否得到了正確的執行。
3、二進制日誌 binlog:記錄了對數據庫執行更改的所有操作。但是並不包括 select 和 show 這類操作。
4、中繼日誌 relay log:主從同步,從庫需要把主庫傳遞過來的日誌,記錄到自己的 relay log 裡面。
5、慢查詢日誌 slow log:運行時間超過某值的所有 sql 語句都記錄到慢查詢日誌文件中。
——對數據庫的表設計也要學習清楚
數據類型的選擇,主要參考官方文檔:
https://downloads.mysql.com/docs/licenses/mysqld-5.7-com-en.pdf
——數據碎片的整理
產生碎片的原因:
- 主要是因為對大表進行刪除操作;
- 其次隨機方式插入新數據,可能導致輔助索引產生大量的碎片;
整理碎片的方法:
- 備份數據表,導入導出,刪除舊錶
- 執行 alter table table_name engine=innodb;
——收集統計信息
保證統計信息的準確性,才能確保我們的 sql 執行計劃準確。收集方法:
- 重啟 mysql 服務
- 遍歷 tables 表
——學習分區表
分區表的種類:
1、range
2、list
3、hash
4、key
——學習對索引的認識
大致分為:
1、如何查看數據庫中索引:show index from table_name;
2、學會查看數據庫索引的選擇性:select count(distinct c1)/count(*) from table_name; 選擇性越高,越適合創建索引
3、創建索引的過程中,學會查看執行計劃。內功心法:先看 type 值,再看 key,再看 rows,最後看 extra;
4、瞭解創建索引的好處
a、提高數據檢索效率
b、提高聚合函數效率
c、提高排序效率
d、個別時候可以避免回表
e、減少多表關聯時掃描行數
f、主鍵、唯一索引可以作為約束
——對事務的學習
先要知道事務的四大特性(ACID):
a. 原子性(Atomicity)
事務的原子性是指事務中包含的所有操作要麼都做,要麼都不做,保證數據庫是一致的
b. 一致性(Consistency)
一致性是指數據庫在事務操作前和事務處理後,其中的數據必須都滿足業務規則約束.
c. 隔離性(Isolation)
隔離性是數據庫允許多個併發事務同時對數據進行讀寫和修改的能力,隔離性可以防止多個事務併發執行時由於交叉執行而導致數據的不一致.
d. 持久性(Durability)
事務處理結束後,對數據的修改就是永久的
熟悉 mysql 數據庫四種事務隔離級別:
1. read uncommitted(RU)讀未提交:
一個事務中,可以讀取到其他事務未提交的變更
2. read committed(RC)讀已提交:
一個事務中,可以讀取到其他事務已經提交的變更
3. repetable read,(RR)可重複讀:
一個事務中,直到事務結束前,都可以反覆讀取到事務剛開始看到的數據,不會發生變化
4. serializable(串行讀):
即便每次讀都需要獲得表級共享鎖,每次寫都加表級排它鎖,兩個會話間讀寫會相互阻塞。
個人建議:對於交易類系統的網站,大家儘量使用事務級別比較高的RR;對於一些門戶類網站大家使用RC就可以了。
Innodb 的鎖,默認三種鎖算法:
- record;
- Gap lock;
- next-key lock
默認鎖算法是 next-key lock 間隙鎖保證不會出現幻讀現象。
數據庫字符集
先學會查看數據庫的字符集:
如果想保證不會出現中文亂碼的情況發生,必須滿足以下三點:
1、連接終端必須UTF8
2、操作系統必須UTF8
3、數據庫必須UTF8
三者統一就不會出現中文亂碼的問題
——數據庫權限問題的管理
1、權限申請流程要設置規範,合理.
2、測試和正式環境都要嚴格控制數據庫的寫權限,禁止分配 create,alter 這樣的權限給開發人員。並且讀權限和外業務服務分離.
3、領導需要權限時,問清目的,發郵件說明。儘量都由DBA全權管理
4、特權賬號 all privileges 必須由DBA人員控制
5、單庫單用戶,禁止給我一個用戶賬號管理多個庫。
6、只讀賬號 select,可以後期配合主從架構中read_only 一起使用
7、禁止 root 用戶作為遠程連接用戶使用
第四部分:尊貴鉑金篇
DBA 人員,如果不能保證數據的完整性,一切操作都是徒勞無功。所以備份的重要性可想而知。雖然備份不能帶來業務上的提升,還會增加我們的成本。但是沒有數據的完整性,無法保證我們線上業務的正常運行。是數據損壞時最後的一個救命稻草。
備份按方法分:冷備和熱備
冷備:數據庫關掉,影響業務。系統級別的文件 copy(PS:現在這種基本被廢棄了)
熱備:數據庫在線備份,不影響現有業務的進行。
在熱備裡面又分為:
1. 邏輯備份
a. mysqldump
b. mydumper
c. mysqlpump(mysql 5.7才出現)
2. 裸文件備份
物理底層去 copy 文件,工具是 percona-xtrabackup
按內容又可以分為:全量備份、增量備份
生產中最常用的兩種方法:
- mysqldump
- xtrabackup
mysqldump 參數詳解:
備份數據庫:
數據庫崩潰恢復原理介紹:Innodb 維護了一個 redo log,它記錄著 Innodb 所有數據的真實修改信息,當數據庫重啟過程中,redo log 會應用所有已經提交的事務進行前滾,並把所有未提交的事務進行回滾,來保證宕機那一時刻的數據完整性。
XtraBackup 在備份的時候並不鎖定表,而是一頁一頁地複製 InnoDB 的數據,與此同時,XtraBackup 還有另外一個線程監視著 transactions log,一旦 log 發生變化,就把變化過的 log pages 複製走。在全部數據文件複製完成之後,停止複製 logfile。
常用命令:
增備原理分析:
在完整備份和增量備份文件中都有一個文件 xtrabackup_checkpoints 會記錄備份完成時檢查點的LSN。在進行新的增量備份時,XtraBackup 會比較表空間中每頁的 LSN 是否大於上次備份完成的 LSN,如果是,則備份該頁,並記錄當前檢查點的 LSN。
7月20日的增備信息
7月21日的增備信息
可以看出 7月20日 的結束 lsn 號(to_lsn)是 7月21日 的開始 lsn 號(from_lsn)。
增備常用命令:
7月20日的增量文件
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
——日誌文件:
1、錯誤日誌 error log:對 mysql 啟動,運行,關閉過程進行了記錄。
2、全量日誌 general log:查詢日誌記錄了所有對 mysql 數據庫請求的信息,不論這些請求是否得到了正確的執行。
3、二進制日誌 binlog:記錄了對數據庫執行更改的所有操作。但是並不包括 select 和 show 這類操作。
4、中繼日誌 relay log:主從同步,從庫需要把主庫傳遞過來的日誌,記錄到自己的 relay log 裡面。
5、慢查詢日誌 slow log:運行時間超過某值的所有 sql 語句都記錄到慢查詢日誌文件中。
——對數據庫的表設計也要學習清楚
數據類型的選擇,主要參考官方文檔:
https://downloads.mysql.com/docs/licenses/mysqld-5.7-com-en.pdf
——數據碎片的整理
產生碎片的原因:
- 主要是因為對大表進行刪除操作;
- 其次隨機方式插入新數據,可能導致輔助索引產生大量的碎片;
整理碎片的方法:
- 備份數據表,導入導出,刪除舊錶
- 執行 alter table table_name engine=innodb;
——收集統計信息
保證統計信息的準確性,才能確保我們的 sql 執行計劃準確。收集方法:
- 重啟 mysql 服務
- 遍歷 tables 表
——學習分區表
分區表的種類:
1、range
2、list
3、hash
4、key
——學習對索引的認識
大致分為:
1、如何查看數據庫中索引:show index from table_name;
2、學會查看數據庫索引的選擇性:select count(distinct c1)/count(*) from table_name; 選擇性越高,越適合創建索引
3、創建索引的過程中,學會查看執行計劃。內功心法:先看 type 值,再看 key,再看 rows,最後看 extra;
4、瞭解創建索引的好處
a、提高數據檢索效率
b、提高聚合函數效率
c、提高排序效率
d、個別時候可以避免回表
e、減少多表關聯時掃描行數
f、主鍵、唯一索引可以作為約束
——對事務的學習
先要知道事務的四大特性(ACID):
a. 原子性(Atomicity)
事務的原子性是指事務中包含的所有操作要麼都做,要麼都不做,保證數據庫是一致的
b. 一致性(Consistency)
一致性是指數據庫在事務操作前和事務處理後,其中的數據必須都滿足業務規則約束.
c. 隔離性(Isolation)
隔離性是數據庫允許多個併發事務同時對數據進行讀寫和修改的能力,隔離性可以防止多個事務併發執行時由於交叉執行而導致數據的不一致.
d. 持久性(Durability)
事務處理結束後,對數據的修改就是永久的
熟悉 mysql 數據庫四種事務隔離級別:
1. read uncommitted(RU)讀未提交:
一個事務中,可以讀取到其他事務未提交的變更
2. read committed(RC)讀已提交:
一個事務中,可以讀取到其他事務已經提交的變更
3. repetable read,(RR)可重複讀:
一個事務中,直到事務結束前,都可以反覆讀取到事務剛開始看到的數據,不會發生變化
4. serializable(串行讀):
即便每次讀都需要獲得表級共享鎖,每次寫都加表級排它鎖,兩個會話間讀寫會相互阻塞。
個人建議:對於交易類系統的網站,大家儘量使用事務級別比較高的RR;對於一些門戶類網站大家使用RC就可以了。
Innodb 的鎖,默認三種鎖算法:
- record;
- Gap lock;
- next-key lock
默認鎖算法是 next-key lock 間隙鎖保證不會出現幻讀現象。
數據庫字符集
先學會查看數據庫的字符集:
如果想保證不會出現中文亂碼的情況發生,必須滿足以下三點:
1、連接終端必須UTF8
2、操作系統必須UTF8
3、數據庫必須UTF8
三者統一就不會出現中文亂碼的問題
——數據庫權限問題的管理
1、權限申請流程要設置規範,合理.
2、測試和正式環境都要嚴格控制數據庫的寫權限,禁止分配 create,alter 這樣的權限給開發人員。並且讀權限和外業務服務分離.
3、領導需要權限時,問清目的,發郵件說明。儘量都由DBA全權管理
4、特權賬號 all privileges 必須由DBA人員控制
5、單庫單用戶,禁止給我一個用戶賬號管理多個庫。
6、只讀賬號 select,可以後期配合主從架構中read_only 一起使用
7、禁止 root 用戶作為遠程連接用戶使用
第四部分:尊貴鉑金篇
DBA 人員,如果不能保證數據的完整性,一切操作都是徒勞無功。所以備份的重要性可想而知。雖然備份不能帶來業務上的提升,還會增加我們的成本。但是沒有數據的完整性,無法保證我們線上業務的正常運行。是數據損壞時最後的一個救命稻草。
備份按方法分:冷備和熱備
冷備:數據庫關掉,影響業務。系統級別的文件 copy(PS:現在這種基本被廢棄了)
熱備:數據庫在線備份,不影響現有業務的進行。
在熱備裡面又分為:
1. 邏輯備份
a. mysqldump
b. mydumper
c. mysqlpump(mysql 5.7才出現)
2. 裸文件備份
物理底層去 copy 文件,工具是 percona-xtrabackup
按內容又可以分為:全量備份、增量備份
生產中最常用的兩種方法:
- mysqldump
- xtrabackup
mysqldump 參數詳解:
備份數據庫:
數據庫崩潰恢復原理介紹:Innodb 維護了一個 redo log,它記錄著 Innodb 所有數據的真實修改信息,當數據庫重啟過程中,redo log 會應用所有已經提交的事務進行前滾,並把所有未提交的事務進行回滾,來保證宕機那一時刻的數據完整性。
XtraBackup 在備份的時候並不鎖定表,而是一頁一頁地複製 InnoDB 的數據,與此同時,XtraBackup 還有另外一個線程監視著 transactions log,一旦 log 發生變化,就把變化過的 log pages 複製走。在全部數據文件複製完成之後,停止複製 logfile。
常用命令:
增備原理分析:
在完整備份和增量備份文件中都有一個文件 xtrabackup_checkpoints 會記錄備份完成時檢查點的LSN。在進行新的增量備份時,XtraBackup 會比較表空間中每頁的 LSN 是否大於上次備份完成的 LSN,如果是,則備份該頁,並記錄當前檢查點的 LSN。
7月20日的增備信息
7月21日的增備信息
可以看出 7月20日 的結束 lsn 號(to_lsn)是 7月21日 的開始 lsn 號(from_lsn)。
增備常用命令:
7月20日的增量文件
注#—incremental-basedir:用來標識當前的增備從哪裡開始
7月21日的增量文件
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
——日誌文件:
1、錯誤日誌 error log:對 mysql 啟動,運行,關閉過程進行了記錄。
2、全量日誌 general log:查詢日誌記錄了所有對 mysql 數據庫請求的信息,不論這些請求是否得到了正確的執行。
3、二進制日誌 binlog:記錄了對數據庫執行更改的所有操作。但是並不包括 select 和 show 這類操作。
4、中繼日誌 relay log:主從同步,從庫需要把主庫傳遞過來的日誌,記錄到自己的 relay log 裡面。
5、慢查詢日誌 slow log:運行時間超過某值的所有 sql 語句都記錄到慢查詢日誌文件中。
——對數據庫的表設計也要學習清楚
數據類型的選擇,主要參考官方文檔:
https://downloads.mysql.com/docs/licenses/mysqld-5.7-com-en.pdf
——數據碎片的整理
產生碎片的原因:
- 主要是因為對大表進行刪除操作;
- 其次隨機方式插入新數據,可能導致輔助索引產生大量的碎片;
整理碎片的方法:
- 備份數據表,導入導出,刪除舊錶
- 執行 alter table table_name engine=innodb;
——收集統計信息
保證統計信息的準確性,才能確保我們的 sql 執行計劃準確。收集方法:
- 重啟 mysql 服務
- 遍歷 tables 表
——學習分區表
分區表的種類:
1、range
2、list
3、hash
4、key
——學習對索引的認識
大致分為:
1、如何查看數據庫中索引:show index from table_name;
2、學會查看數據庫索引的選擇性:select count(distinct c1)/count(*) from table_name; 選擇性越高,越適合創建索引
3、創建索引的過程中,學會查看執行計劃。內功心法:先看 type 值,再看 key,再看 rows,最後看 extra;
4、瞭解創建索引的好處
a、提高數據檢索效率
b、提高聚合函數效率
c、提高排序效率
d、個別時候可以避免回表
e、減少多表關聯時掃描行數
f、主鍵、唯一索引可以作為約束
——對事務的學習
先要知道事務的四大特性(ACID):
a. 原子性(Atomicity)
事務的原子性是指事務中包含的所有操作要麼都做,要麼都不做,保證數據庫是一致的
b. 一致性(Consistency)
一致性是指數據庫在事務操作前和事務處理後,其中的數據必須都滿足業務規則約束.
c. 隔離性(Isolation)
隔離性是數據庫允許多個併發事務同時對數據進行讀寫和修改的能力,隔離性可以防止多個事務併發執行時由於交叉執行而導致數據的不一致.
d. 持久性(Durability)
事務處理結束後,對數據的修改就是永久的
熟悉 mysql 數據庫四種事務隔離級別:
1. read uncommitted(RU)讀未提交:
一個事務中,可以讀取到其他事務未提交的變更
2. read committed(RC)讀已提交:
一個事務中,可以讀取到其他事務已經提交的變更
3. repetable read,(RR)可重複讀:
一個事務中,直到事務結束前,都可以反覆讀取到事務剛開始看到的數據,不會發生變化
4. serializable(串行讀):
即便每次讀都需要獲得表級共享鎖,每次寫都加表級排它鎖,兩個會話間讀寫會相互阻塞。
個人建議:對於交易類系統的網站,大家儘量使用事務級別比較高的RR;對於一些門戶類網站大家使用RC就可以了。
Innodb 的鎖,默認三種鎖算法:
- record;
- Gap lock;
- next-key lock
默認鎖算法是 next-key lock 間隙鎖保證不會出現幻讀現象。
數據庫字符集
先學會查看數據庫的字符集:
如果想保證不會出現中文亂碼的情況發生,必須滿足以下三點:
1、連接終端必須UTF8
2、操作系統必須UTF8
3、數據庫必須UTF8
三者統一就不會出現中文亂碼的問題
——數據庫權限問題的管理
1、權限申請流程要設置規範,合理.
2、測試和正式環境都要嚴格控制數據庫的寫權限,禁止分配 create,alter 這樣的權限給開發人員。並且讀權限和外業務服務分離.
3、領導需要權限時,問清目的,發郵件說明。儘量都由DBA全權管理
4、特權賬號 all privileges 必須由DBA人員控制
5、單庫單用戶,禁止給我一個用戶賬號管理多個庫。
6、只讀賬號 select,可以後期配合主從架構中read_only 一起使用
7、禁止 root 用戶作為遠程連接用戶使用
第四部分:尊貴鉑金篇
DBA 人員,如果不能保證數據的完整性,一切操作都是徒勞無功。所以備份的重要性可想而知。雖然備份不能帶來業務上的提升,還會增加我們的成本。但是沒有數據的完整性,無法保證我們線上業務的正常運行。是數據損壞時最後的一個救命稻草。
備份按方法分:冷備和熱備
冷備:數據庫關掉,影響業務。系統級別的文件 copy(PS:現在這種基本被廢棄了)
熱備:數據庫在線備份,不影響現有業務的進行。
在熱備裡面又分為:
1. 邏輯備份
a. mysqldump
b. mydumper
c. mysqlpump(mysql 5.7才出現)
2. 裸文件備份
物理底層去 copy 文件,工具是 percona-xtrabackup
按內容又可以分為:全量備份、增量備份
生產中最常用的兩種方法:
- mysqldump
- xtrabackup
mysqldump 參數詳解:
備份數據庫:
數據庫崩潰恢復原理介紹:Innodb 維護了一個 redo log,它記錄著 Innodb 所有數據的真實修改信息,當數據庫重啟過程中,redo log 會應用所有已經提交的事務進行前滾,並把所有未提交的事務進行回滾,來保證宕機那一時刻的數據完整性。
XtraBackup 在備份的時候並不鎖定表,而是一頁一頁地複製 InnoDB 的數據,與此同時,XtraBackup 還有另外一個線程監視著 transactions log,一旦 log 發生變化,就把變化過的 log pages 複製走。在全部數據文件複製完成之後,停止複製 logfile。
常用命令:
增備原理分析:
在完整備份和增量備份文件中都有一個文件 xtrabackup_checkpoints 會記錄備份完成時檢查點的LSN。在進行新的增量備份時,XtraBackup 會比較表空間中每頁的 LSN 是否大於上次備份完成的 LSN,如果是,則備份該頁,並記錄當前檢查點的 LSN。
7月20日的增備信息
7月21日的增備信息
可以看出 7月20日 的結束 lsn 號(to_lsn)是 7月21日 的開始 lsn 號(from_lsn)。
增備常用命令:
7月20日的增量文件
注#—incremental-basedir:用來標識當前的增備從哪裡開始
7月21日的增量文件
完整備份集=全備+增備1+增備2
恢復操作:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
——日誌文件:
1、錯誤日誌 error log:對 mysql 啟動,運行,關閉過程進行了記錄。
2、全量日誌 general log:查詢日誌記錄了所有對 mysql 數據庫請求的信息,不論這些請求是否得到了正確的執行。
3、二進制日誌 binlog:記錄了對數據庫執行更改的所有操作。但是並不包括 select 和 show 這類操作。
4、中繼日誌 relay log:主從同步,從庫需要把主庫傳遞過來的日誌,記錄到自己的 relay log 裡面。
5、慢查詢日誌 slow log:運行時間超過某值的所有 sql 語句都記錄到慢查詢日誌文件中。
——對數據庫的表設計也要學習清楚
數據類型的選擇,主要參考官方文檔:
https://downloads.mysql.com/docs/licenses/mysqld-5.7-com-en.pdf
——數據碎片的整理
產生碎片的原因:
- 主要是因為對大表進行刪除操作;
- 其次隨機方式插入新數據,可能導致輔助索引產生大量的碎片;
整理碎片的方法:
- 備份數據表,導入導出,刪除舊錶
- 執行 alter table table_name engine=innodb;
——收集統計信息
保證統計信息的準確性,才能確保我們的 sql 執行計劃準確。收集方法:
- 重啟 mysql 服務
- 遍歷 tables 表
——學習分區表
分區表的種類:
1、range
2、list
3、hash
4、key
——學習對索引的認識
大致分為:
1、如何查看數據庫中索引:show index from table_name;
2、學會查看數據庫索引的選擇性:select count(distinct c1)/count(*) from table_name; 選擇性越高,越適合創建索引
3、創建索引的過程中,學會查看執行計劃。內功心法:先看 type 值,再看 key,再看 rows,最後看 extra;
4、瞭解創建索引的好處
a、提高數據檢索效率
b、提高聚合函數效率
c、提高排序效率
d、個別時候可以避免回表
e、減少多表關聯時掃描行數
f、主鍵、唯一索引可以作為約束
——對事務的學習
先要知道事務的四大特性(ACID):
a. 原子性(Atomicity)
事務的原子性是指事務中包含的所有操作要麼都做,要麼都不做,保證數據庫是一致的
b. 一致性(Consistency)
一致性是指數據庫在事務操作前和事務處理後,其中的數據必須都滿足業務規則約束.
c. 隔離性(Isolation)
隔離性是數據庫允許多個併發事務同時對數據進行讀寫和修改的能力,隔離性可以防止多個事務併發執行時由於交叉執行而導致數據的不一致.
d. 持久性(Durability)
事務處理結束後,對數據的修改就是永久的
熟悉 mysql 數據庫四種事務隔離級別:
1. read uncommitted(RU)讀未提交:
一個事務中,可以讀取到其他事務未提交的變更
2. read committed(RC)讀已提交:
一個事務中,可以讀取到其他事務已經提交的變更
3. repetable read,(RR)可重複讀:
一個事務中,直到事務結束前,都可以反覆讀取到事務剛開始看到的數據,不會發生變化
4. serializable(串行讀):
即便每次讀都需要獲得表級共享鎖,每次寫都加表級排它鎖,兩個會話間讀寫會相互阻塞。
個人建議:對於交易類系統的網站,大家儘量使用事務級別比較高的RR;對於一些門戶類網站大家使用RC就可以了。
Innodb 的鎖,默認三種鎖算法:
- record;
- Gap lock;
- next-key lock
默認鎖算法是 next-key lock 間隙鎖保證不會出現幻讀現象。
數據庫字符集
先學會查看數據庫的字符集:
如果想保證不會出現中文亂碼的情況發生,必須滿足以下三點:
1、連接終端必須UTF8
2、操作系統必須UTF8
3、數據庫必須UTF8
三者統一就不會出現中文亂碼的問題
——數據庫權限問題的管理
1、權限申請流程要設置規範,合理.
2、測試和正式環境都要嚴格控制數據庫的寫權限,禁止分配 create,alter 這樣的權限給開發人員。並且讀權限和外業務服務分離.
3、領導需要權限時,問清目的,發郵件說明。儘量都由DBA全權管理
4、特權賬號 all privileges 必須由DBA人員控制
5、單庫單用戶,禁止給我一個用戶賬號管理多個庫。
6、只讀賬號 select,可以後期配合主從架構中read_only 一起使用
7、禁止 root 用戶作為遠程連接用戶使用
第四部分:尊貴鉑金篇
DBA 人員,如果不能保證數據的完整性,一切操作都是徒勞無功。所以備份的重要性可想而知。雖然備份不能帶來業務上的提升,還會增加我們的成本。但是沒有數據的完整性,無法保證我們線上業務的正常運行。是數據損壞時最後的一個救命稻草。
備份按方法分:冷備和熱備
冷備:數據庫關掉,影響業務。系統級別的文件 copy(PS:現在這種基本被廢棄了)
熱備:數據庫在線備份,不影響現有業務的進行。
在熱備裡面又分為:
1. 邏輯備份
a. mysqldump
b. mydumper
c. mysqlpump(mysql 5.7才出現)
2. 裸文件備份
物理底層去 copy 文件,工具是 percona-xtrabackup
按內容又可以分為:全量備份、增量備份
生產中最常用的兩種方法:
- mysqldump
- xtrabackup
mysqldump 參數詳解:
備份數據庫:
數據庫崩潰恢復原理介紹:Innodb 維護了一個 redo log,它記錄著 Innodb 所有數據的真實修改信息,當數據庫重啟過程中,redo log 會應用所有已經提交的事務進行前滾,並把所有未提交的事務進行回滾,來保證宕機那一時刻的數據完整性。
XtraBackup 在備份的時候並不鎖定表,而是一頁一頁地複製 InnoDB 的數據,與此同時,XtraBackup 還有另外一個線程監視著 transactions log,一旦 log 發生變化,就把變化過的 log pages 複製走。在全部數據文件複製完成之後,停止複製 logfile。
常用命令:
增備原理分析:
在完整備份和增量備份文件中都有一個文件 xtrabackup_checkpoints 會記錄備份完成時檢查點的LSN。在進行新的增量備份時,XtraBackup 會比較表空間中每頁的 LSN 是否大於上次備份完成的 LSN,如果是,則備份該頁,並記錄當前檢查點的 LSN。
7月20日的增備信息
7月21日的增備信息
可以看出 7月20日 的結束 lsn 號(to_lsn)是 7月21日 的開始 lsn 號(from_lsn)。
增備常用命令:
7月20日的增量文件
注#—incremental-basedir:用來標識當前的增備從哪裡開始
7月21日的增量文件
完整備份集=全備+增備1+增備2
恢復操作:
注# —redo-only代表只進行前滾操作
—apply-log應用日誌,保證數據的完整性
第五部分:永恆鑽石篇
給大家介紹下企業中最常使用的主流 MySQL 高可用架構;
從兩方面介紹
- 基於主從複製
- a. 雙主M-M keepalived
- b. MHA
- 基於 Galera 協議;
M-M keepalived 雙主架構:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
——日誌文件:
1、錯誤日誌 error log:對 mysql 啟動,運行,關閉過程進行了記錄。
2、全量日誌 general log:查詢日誌記錄了所有對 mysql 數據庫請求的信息,不論這些請求是否得到了正確的執行。
3、二進制日誌 binlog:記錄了對數據庫執行更改的所有操作。但是並不包括 select 和 show 這類操作。
4、中繼日誌 relay log:主從同步,從庫需要把主庫傳遞過來的日誌,記錄到自己的 relay log 裡面。
5、慢查詢日誌 slow log:運行時間超過某值的所有 sql 語句都記錄到慢查詢日誌文件中。
——對數據庫的表設計也要學習清楚
數據類型的選擇,主要參考官方文檔:
https://downloads.mysql.com/docs/licenses/mysqld-5.7-com-en.pdf
——數據碎片的整理
產生碎片的原因:
- 主要是因為對大表進行刪除操作;
- 其次隨機方式插入新數據,可能導致輔助索引產生大量的碎片;
整理碎片的方法:
- 備份數據表,導入導出,刪除舊錶
- 執行 alter table table_name engine=innodb;
——收集統計信息
保證統計信息的準確性,才能確保我們的 sql 執行計劃準確。收集方法:
- 重啟 mysql 服務
- 遍歷 tables 表
——學習分區表
分區表的種類:
1、range
2、list
3、hash
4、key
——學習對索引的認識
大致分為:
1、如何查看數據庫中索引:show index from table_name;
2、學會查看數據庫索引的選擇性:select count(distinct c1)/count(*) from table_name; 選擇性越高,越適合創建索引
3、創建索引的過程中,學會查看執行計劃。內功心法:先看 type 值,再看 key,再看 rows,最後看 extra;
4、瞭解創建索引的好處
a、提高數據檢索效率
b、提高聚合函數效率
c、提高排序效率
d、個別時候可以避免回表
e、減少多表關聯時掃描行數
f、主鍵、唯一索引可以作為約束
——對事務的學習
先要知道事務的四大特性(ACID):
a. 原子性(Atomicity)
事務的原子性是指事務中包含的所有操作要麼都做,要麼都不做,保證數據庫是一致的
b. 一致性(Consistency)
一致性是指數據庫在事務操作前和事務處理後,其中的數據必須都滿足業務規則約束.
c. 隔離性(Isolation)
隔離性是數據庫允許多個併發事務同時對數據進行讀寫和修改的能力,隔離性可以防止多個事務併發執行時由於交叉執行而導致數據的不一致.
d. 持久性(Durability)
事務處理結束後,對數據的修改就是永久的
熟悉 mysql 數據庫四種事務隔離級別:
1. read uncommitted(RU)讀未提交:
一個事務中,可以讀取到其他事務未提交的變更
2. read committed(RC)讀已提交:
一個事務中,可以讀取到其他事務已經提交的變更
3. repetable read,(RR)可重複讀:
一個事務中,直到事務結束前,都可以反覆讀取到事務剛開始看到的數據,不會發生變化
4. serializable(串行讀):
即便每次讀都需要獲得表級共享鎖,每次寫都加表級排它鎖,兩個會話間讀寫會相互阻塞。
個人建議:對於交易類系統的網站,大家儘量使用事務級別比較高的RR;對於一些門戶類網站大家使用RC就可以了。
Innodb 的鎖,默認三種鎖算法:
- record;
- Gap lock;
- next-key lock
默認鎖算法是 next-key lock 間隙鎖保證不會出現幻讀現象。
數據庫字符集
先學會查看數據庫的字符集:
如果想保證不會出現中文亂碼的情況發生,必須滿足以下三點:
1、連接終端必須UTF8
2、操作系統必須UTF8
3、數據庫必須UTF8
三者統一就不會出現中文亂碼的問題
——數據庫權限問題的管理
1、權限申請流程要設置規範,合理.
2、測試和正式環境都要嚴格控制數據庫的寫權限,禁止分配 create,alter 這樣的權限給開發人員。並且讀權限和外業務服務分離.
3、領導需要權限時,問清目的,發郵件說明。儘量都由DBA全權管理
4、特權賬號 all privileges 必須由DBA人員控制
5、單庫單用戶,禁止給我一個用戶賬號管理多個庫。
6、只讀賬號 select,可以後期配合主從架構中read_only 一起使用
7、禁止 root 用戶作為遠程連接用戶使用
第四部分:尊貴鉑金篇
DBA 人員,如果不能保證數據的完整性,一切操作都是徒勞無功。所以備份的重要性可想而知。雖然備份不能帶來業務上的提升,還會增加我們的成本。但是沒有數據的完整性,無法保證我們線上業務的正常運行。是數據損壞時最後的一個救命稻草。
備份按方法分:冷備和熱備
冷備:數據庫關掉,影響業務。系統級別的文件 copy(PS:現在這種基本被廢棄了)
熱備:數據庫在線備份,不影響現有業務的進行。
在熱備裡面又分為:
1. 邏輯備份
a. mysqldump
b. mydumper
c. mysqlpump(mysql 5.7才出現)
2. 裸文件備份
物理底層去 copy 文件,工具是 percona-xtrabackup
按內容又可以分為:全量備份、增量備份
生產中最常用的兩種方法:
- mysqldump
- xtrabackup
mysqldump 參數詳解:
備份數據庫:
數據庫崩潰恢復原理介紹:Innodb 維護了一個 redo log,它記錄著 Innodb 所有數據的真實修改信息,當數據庫重啟過程中,redo log 會應用所有已經提交的事務進行前滾,並把所有未提交的事務進行回滾,來保證宕機那一時刻的數據完整性。
XtraBackup 在備份的時候並不鎖定表,而是一頁一頁地複製 InnoDB 的數據,與此同時,XtraBackup 還有另外一個線程監視著 transactions log,一旦 log 發生變化,就把變化過的 log pages 複製走。在全部數據文件複製完成之後,停止複製 logfile。
常用命令:
增備原理分析:
在完整備份和增量備份文件中都有一個文件 xtrabackup_checkpoints 會記錄備份完成時檢查點的LSN。在進行新的增量備份時,XtraBackup 會比較表空間中每頁的 LSN 是否大於上次備份完成的 LSN,如果是,則備份該頁,並記錄當前檢查點的 LSN。
7月20日的增備信息
7月21日的增備信息
可以看出 7月20日 的結束 lsn 號(to_lsn)是 7月21日 的開始 lsn 號(from_lsn)。
增備常用命令:
7月20日的增量文件
注#—incremental-basedir:用來標識當前的增備從哪裡開始
7月21日的增量文件
完整備份集=全備+增備1+增備2
恢復操作:
注# —redo-only代表只進行前滾操作
—apply-log應用日誌,保證數據的完整性
第五部分:永恆鑽石篇
給大家介紹下企業中最常使用的主流 MySQL 高可用架構;
從兩方面介紹
- 基於主從複製
- a. 雙主M-M keepalived
- b. MHA
- 基於 Galera 協議;
M-M keepalived 雙主架構:
一般中小型公司都使用這種架構,搭建比較方便簡單;可以採用主從或者主主模式,在 master 節點發生故障後,利用 keepalived 高可用機制實現快速切換到 slave 節點。原來的從庫變成新的主庫。
但針對這個架構,個人建議以下幾點:
- 一定要完善好切換腳本,keepalived 的切換機制要合理,避免切換不成功的現象發生。
- 從庫的配置儘快要與主庫一致,不能太次;避免主庫宕機發生切換,新的主庫(原來的從庫)影響線上業務進行。
- 對於延遲的問題,在這套架構中,也不能避免。可以使用 mysql 5.7 中增強半同步完成。也可以改變架構使用 PXC,完成時時同步功能,基本上沒有延遲;
- keepalived 無法解決腦裂的問題,因此在進行服務異常判斷時,可以修改我們的判斷腳本,通過對第三方節點補充檢測來決定是否進行切換,可降低腦裂問題產生的風險。
- 採用 keepalived 這個架構,在設置兩節點狀態時,都要設置成不搶佔模式,都是 backup 狀態,通過優先級,來決定誰是主庫。避免腦裂,衝突現象發生。
- 安裝好 mysql 需要的一些依賴包;建議配置好 yum 源,用 yum 安裝 keepalived 即可。
MHA 架構:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
——日誌文件:
1、錯誤日誌 error log:對 mysql 啟動,運行,關閉過程進行了記錄。
2、全量日誌 general log:查詢日誌記錄了所有對 mysql 數據庫請求的信息,不論這些請求是否得到了正確的執行。
3、二進制日誌 binlog:記錄了對數據庫執行更改的所有操作。但是並不包括 select 和 show 這類操作。
4、中繼日誌 relay log:主從同步,從庫需要把主庫傳遞過來的日誌,記錄到自己的 relay log 裡面。
5、慢查詢日誌 slow log:運行時間超過某值的所有 sql 語句都記錄到慢查詢日誌文件中。
——對數據庫的表設計也要學習清楚
數據類型的選擇,主要參考官方文檔:
https://downloads.mysql.com/docs/licenses/mysqld-5.7-com-en.pdf
——數據碎片的整理
產生碎片的原因:
- 主要是因為對大表進行刪除操作;
- 其次隨機方式插入新數據,可能導致輔助索引產生大量的碎片;
整理碎片的方法:
- 備份數據表,導入導出,刪除舊錶
- 執行 alter table table_name engine=innodb;
——收集統計信息
保證統計信息的準確性,才能確保我們的 sql 執行計劃準確。收集方法:
- 重啟 mysql 服務
- 遍歷 tables 表
——學習分區表
分區表的種類:
1、range
2、list
3、hash
4、key
——學習對索引的認識
大致分為:
1、如何查看數據庫中索引:show index from table_name;
2、學會查看數據庫索引的選擇性:select count(distinct c1)/count(*) from table_name; 選擇性越高,越適合創建索引
3、創建索引的過程中,學會查看執行計劃。內功心法:先看 type 值,再看 key,再看 rows,最後看 extra;
4、瞭解創建索引的好處
a、提高數據檢索效率
b、提高聚合函數效率
c、提高排序效率
d、個別時候可以避免回表
e、減少多表關聯時掃描行數
f、主鍵、唯一索引可以作為約束
——對事務的學習
先要知道事務的四大特性(ACID):
a. 原子性(Atomicity)
事務的原子性是指事務中包含的所有操作要麼都做,要麼都不做,保證數據庫是一致的
b. 一致性(Consistency)
一致性是指數據庫在事務操作前和事務處理後,其中的數據必須都滿足業務規則約束.
c. 隔離性(Isolation)
隔離性是數據庫允許多個併發事務同時對數據進行讀寫和修改的能力,隔離性可以防止多個事務併發執行時由於交叉執行而導致數據的不一致.
d. 持久性(Durability)
事務處理結束後,對數據的修改就是永久的
熟悉 mysql 數據庫四種事務隔離級別:
1. read uncommitted(RU)讀未提交:
一個事務中,可以讀取到其他事務未提交的變更
2. read committed(RC)讀已提交:
一個事務中,可以讀取到其他事務已經提交的變更
3. repetable read,(RR)可重複讀:
一個事務中,直到事務結束前,都可以反覆讀取到事務剛開始看到的數據,不會發生變化
4. serializable(串行讀):
即便每次讀都需要獲得表級共享鎖,每次寫都加表級排它鎖,兩個會話間讀寫會相互阻塞。
個人建議:對於交易類系統的網站,大家儘量使用事務級別比較高的RR;對於一些門戶類網站大家使用RC就可以了。
Innodb 的鎖,默認三種鎖算法:
- record;
- Gap lock;
- next-key lock
默認鎖算法是 next-key lock 間隙鎖保證不會出現幻讀現象。
數據庫字符集
先學會查看數據庫的字符集:
如果想保證不會出現中文亂碼的情況發生,必須滿足以下三點:
1、連接終端必須UTF8
2、操作系統必須UTF8
3、數據庫必須UTF8
三者統一就不會出現中文亂碼的問題
——數據庫權限問題的管理
1、權限申請流程要設置規範,合理.
2、測試和正式環境都要嚴格控制數據庫的寫權限,禁止分配 create,alter 這樣的權限給開發人員。並且讀權限和外業務服務分離.
3、領導需要權限時,問清目的,發郵件說明。儘量都由DBA全權管理
4、特權賬號 all privileges 必須由DBA人員控制
5、單庫單用戶,禁止給我一個用戶賬號管理多個庫。
6、只讀賬號 select,可以後期配合主從架構中read_only 一起使用
7、禁止 root 用戶作為遠程連接用戶使用
第四部分:尊貴鉑金篇
DBA 人員,如果不能保證數據的完整性,一切操作都是徒勞無功。所以備份的重要性可想而知。雖然備份不能帶來業務上的提升,還會增加我們的成本。但是沒有數據的完整性,無法保證我們線上業務的正常運行。是數據損壞時最後的一個救命稻草。
備份按方法分:冷備和熱備
冷備:數據庫關掉,影響業務。系統級別的文件 copy(PS:現在這種基本被廢棄了)
熱備:數據庫在線備份,不影響現有業務的進行。
在熱備裡面又分為:
1. 邏輯備份
a. mysqldump
b. mydumper
c. mysqlpump(mysql 5.7才出現)
2. 裸文件備份
物理底層去 copy 文件,工具是 percona-xtrabackup
按內容又可以分為:全量備份、增量備份
生產中最常用的兩種方法:
- mysqldump
- xtrabackup
mysqldump 參數詳解:
備份數據庫:
數據庫崩潰恢復原理介紹:Innodb 維護了一個 redo log,它記錄著 Innodb 所有數據的真實修改信息,當數據庫重啟過程中,redo log 會應用所有已經提交的事務進行前滾,並把所有未提交的事務進行回滾,來保證宕機那一時刻的數據完整性。
XtraBackup 在備份的時候並不鎖定表,而是一頁一頁地複製 InnoDB 的數據,與此同時,XtraBackup 還有另外一個線程監視著 transactions log,一旦 log 發生變化,就把變化過的 log pages 複製走。在全部數據文件複製完成之後,停止複製 logfile。
常用命令:
增備原理分析:
在完整備份和增量備份文件中都有一個文件 xtrabackup_checkpoints 會記錄備份完成時檢查點的LSN。在進行新的增量備份時,XtraBackup 會比較表空間中每頁的 LSN 是否大於上次備份完成的 LSN,如果是,則備份該頁,並記錄當前檢查點的 LSN。
7月20日的增備信息
7月21日的增備信息
可以看出 7月20日 的結束 lsn 號(to_lsn)是 7月21日 的開始 lsn 號(from_lsn)。
增備常用命令:
7月20日的增量文件
注#—incremental-basedir:用來標識當前的增備從哪裡開始
7月21日的增量文件
完整備份集=全備+增備1+增備2
恢復操作:
注# —redo-only代表只進行前滾操作
—apply-log應用日誌,保證數據的完整性
第五部分:永恆鑽石篇
給大家介紹下企業中最常使用的主流 MySQL 高可用架構;
從兩方面介紹
- 基於主從複製
- a. 雙主M-M keepalived
- b. MHA
- 基於 Galera 協議;
M-M keepalived 雙主架構:
一般中小型公司都使用這種架構,搭建比較方便簡單;可以採用主從或者主主模式,在 master 節點發生故障後,利用 keepalived 高可用機制實現快速切換到 slave 節點。原來的從庫變成新的主庫。
但針對這個架構,個人建議以下幾點:
- 一定要完善好切換腳本,keepalived 的切換機制要合理,避免切換不成功的現象發生。
- 從庫的配置儘快要與主庫一致,不能太次;避免主庫宕機發生切換,新的主庫(原來的從庫)影響線上業務進行。
- 對於延遲的問題,在這套架構中,也不能避免。可以使用 mysql 5.7 中增強半同步完成。也可以改變架構使用 PXC,完成時時同步功能,基本上沒有延遲;
- keepalived 無法解決腦裂的問題,因此在進行服務異常判斷時,可以修改我們的判斷腳本,通過對第三方節點補充檢測來決定是否進行切換,可降低腦裂問題產生的風險。
- 採用 keepalived 這個架構,在設置兩節點狀態時,都要設置成不搶佔模式,都是 backup 狀態,通過優先級,來決定誰是主庫。避免腦裂,衝突現象發生。
- 安裝好 mysql 需要的一些依賴包;建議配置好 yum 源,用 yum 安裝 keepalived 即可。
MHA 架構:
MySQL MHA 架構:可以說是企業最流行,用的最多的架構了。一些同學也經常問我相關的問題。
既然 MHA 這麼火,那麼它有什麼優點呢?
- 故障切換時,可以自行判斷哪個從庫與主庫的數據最接近,就切換到上面,可以減少數據的丟失,保證數據的一致性
- 支持 binlog server,可提高 binlog 傳送效率,進一步減少數據丟失風險。
- 可以配置 mysql 5.7 的增強半同步,來保證數據的時時同步
當然也會有一些比較棘手的缺點:
- 自動切換的腳本太簡單了,而且比較老化,建議後期逐漸完善。
- 搭建 MHA 架構,需要開啟 linux 系統互信協議,所以對於系統安全性來說,是個不小的考驗。
PXC 架構:
作者:張甦
來源:https://blog.51cto.com/sumongodb/1950839
現在大多數人選擇放鬆自己的方式就是玩遊戲,最為突出的可能就要屬手遊”王者榮耀”。
據說這款遊戲上到70旬老者,下至小學生都玩,老張我也玩。段位低得可憐(PS:最近剛玩哈),剛剛白銀。
當時也想讓別人帶帶我,說你只要給多少錢,就能快速帶你從倔強青銅到最強王者,但最後我在裝逼和省錢的抉擇上,我選擇了省錢。我心想就玩一個遊戲,無非你就是比我玩的時間長,有技巧,有經驗嘛,但凡我多花點時間,絕對比你玩的好。
話雖這麼說,老張我也不喜歡把時間浪費在遊戲上,但我喜歡抽時間寫博文,給大家多分享知識。因為我認為技術重在交流,溝通,只有互相多學習,才能進步得更快!既然玩個遊戲都可以分段位,那麼我們所工作於技術這個領域更是層級分明。
雖然我不能教大家怎麼在遊戲中提升自己,但我可以給大家分享讓自己在數據庫領域裡面級別提升。做一個人人敬仰的大神,一個最強的王者!
MySQL 數據庫知識脈絡,大致可以分為四大模塊:
- MySQL 體系結構;
- MySQL 備份恢復;
- MySQL 高可用集群;
- MySQL 優化。
從四大模塊中,抽離7個部分給大家做分析
第一部分:倔強青銅篇
剛接觸 MySQL 數據庫的小白首先要了解,MySQL 常用操作命令以及 MySQL 各個版本的特點。從官方 5.1 到 MySQL 5.7,每個版本之間的跨度經歷了哪些功能和性能上面的提升。
新特性參考博文:
http://sumongodb.blog.51cto.com/4979448/1949800
當然在這個階段,我們也要學會如何安裝 MySQL 數據庫和一些常用命令的使用。
常用命令總結:
在這裡舉兩個典型案例,MySQL 5.6 和 MySQL 5.7 在初始化數據時候的安裝差異。
MySQL 5.6:初始化數據時需要進到家目錄的 script 目錄下
執行:
此時數據庫密碼為空。
MySQL 5.7:初始化數據時需要進到家目錄的 bin 目錄下
執行:
已然已經廢棄了使用 mysql_install_db 這個命令進行初始化數據的操作了。
注:—initialize 會自動生成密碼在 error log 裡面。如果加 —initialize-insecure 密碼為空
第二部分:秩序白銀篇
大概瞭解完 MySQL 的安裝,我們來介紹下 MySQL 的體系結構。先看下官方版本的圖:
從圖中我們可以看出:MySQL 體系結構分兩部分(mysql server 層 + mysql 存儲引擎層)
通過一條 sql 語句進入數據庫的過程細分,又可以由8個小部分組成如下圖:
1-6 都是經歷 mysql-server 層部分,7 是我們數據庫的存儲引擎層部分。因此拋出了我們要學習各個存儲引擎的區別。
這裡只介紹兩種最長使用的 Innodb 和 Myisam 區別
1、事務的支持不同(innodb支持事務,myisam不支持事務)
2、鎖粒度(innodb行鎖應用,myisam表鎖)
3、存儲空間(innodb既緩存索引文件又緩存數據文件,myisam只能緩存索引文件)
4、存儲結構
(myisam:數據文件的擴展名為.MYD myData ,索引文件的擴展名是.MYI myIndex)
(innodb:所有的表都保存在同一個數據文件裡面 即為.Ibd)
5、統計記錄行數
(myisam:保存有表的總行數,select count() from table;會直接取出出該值)
(innodb:沒有保存表的總行數,select count() from table;就會遍歷整個表,消耗相當大)
第三部分:榮耀黃金篇
想學好數據庫,就要先學習體系結構。體系結構就好比房子的地基,如果地基不穩,是蓋不了高樓的。由於在 mysql server 層各個版本之間差異不大,所以我主要研究存儲引擎層部分。我們來看下 Innodb 的體系結構圖:
我們要學會把這體系結構分成主要的三大部分:內存組成 、線程工作、磁盤存儲。
在內存組成裡面需要學習:數據庫內存模塊由 data_buffer,index_buffer,insert buffer,redo log buffer,double writer buffer 主要內存組成。
針對 Innodb 存儲引擎的三大特性有:兩次寫,自適應哈希索引,插入緩衝;
1、double write(兩次寫)作用:可以保證頁損壞之後,有副本直接可以進行恢復。
2、adaptive hash index(自適應哈希索引)作用:Innodb 存儲引擎會監控對錶上索引的查找,如果觀察到建立哈希索引可以帶來速度上的提升,則建立哈希索引。讀寫速度上也有所提高。
3、insert buffer (插入緩衝)作用:針對普通索引的插入把隨機 IO 變成順序 IO,併合並插入磁盤
——主要內存模塊→磁盤的刷新機制:
a. binlog cache-→binlog 文件
通過參數 sync_binlog 控制
這個參數是對於 MySQL 系統來說是至關重要的,他不僅影響到 Binlog 對 MySQL 所帶來的性能損耗,而且還影響到 MySQL 中數據的完整性。對於“sync_binlog”參數的各種設置的說明如下:
- sync_binlog=0,當事務提交之後,MySQL 不做 fsync 之類的磁盤同步指令刷新 binlog_cache 中的信息到磁盤,而讓 Filesystem 自行決定什麼時候來做同步,或者 cache 滿了之後才同步到磁盤。
- sync_binlog=n,當每進行 n 次事務提交之後,MySQL 將進行一次 fsync 之類的磁盤同步指令來將 binlog_cache 中的數據強制寫入磁盤。
在 MySQL 中系統默認的設置是 sync_binlog=0,也就是不做任何強制性的磁盤刷新指令,這時候的性能是最好的,但是風險也是最大的。因為一旦系統 Crash,在 binlog_cache 中的所有 binlog 信息都會被丟失。
而當設置為“1”的時候,是最安全但是性能損耗最大的設置。因為當設置為 1 的時候,即使系統 Crash,也最多丟失 binlog_cache 中未完成的一個事務,對實際數據沒有任何實質性影響。
從以往經驗和相關測試來看,對於高併發事務的系統來說,“sync_binlog”設置為 0 和設置為 1 的系統寫入性能差距可能高達5倍甚至更多。
b. redo log buffer-→redo log
通過參數 innodb_flush_log_at_trx_commit 控制
有三個參數值:
0:log buffer 將每秒一次地寫入 log file 中,並且 log file 的 flush (刷到磁盤) 操作同時進行。該模式下在事務提交的時候,不會主動觸發寫入磁盤的操作。
1:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,並且 flush (刷到磁盤) 中去,該模式為系統默認。
2:每次事務提交時 mysql 都會把 log buffer 的數據寫入 log file,但是 flush (刷到磁盤) 操作並不會同時進行。該模式下,MySQL 會每秒執行一次 flush (刷到磁盤) 操作
c. 髒頁 data_buffer—→數據文件
- 通過參數 innodb_max_dirty_pages_pct 控制:它的含義代表髒頁刷新佔 buffer_pool 的比例;個人建議調整為 25-50%;
- 日誌切換會產生檢查點 checkpoint,可以誘發對髒頁的刷新
——線程工作:
Innodb 四大 IO 線程:write thread,read thread,insert buffer thread,redo log thread
master thread 是數據庫的主線程,優先級別最高,裡面包含 1s 和 10s 對數據庫的操作。
page cleaner thread:幫助刷新髒頁的線程,5.7 版本可以增加多個。
purge thread :刪除無用 undo 頁。默認1個,最大可以調整到 32。
主要的數據文件也是我們需要學習:
參數文件:MySQL 5.6 版本 my.cnf 和 MySQL 5.7 版本的 my.cnf
這裡給大家兩個模板:老張根據生產環境上測試而出的參數。其中根據真實內存去適當調整 innodb_buffer_pool 大小就可以了。(建議物理內存的50-80%)
MySQL 5.7 版本的參數文件:
——日誌文件:
1、錯誤日誌 error log:對 mysql 啟動,運行,關閉過程進行了記錄。
2、全量日誌 general log:查詢日誌記錄了所有對 mysql 數據庫請求的信息,不論這些請求是否得到了正確的執行。
3、二進制日誌 binlog:記錄了對數據庫執行更改的所有操作。但是並不包括 select 和 show 這類操作。
4、中繼日誌 relay log:主從同步,從庫需要把主庫傳遞過來的日誌,記錄到自己的 relay log 裡面。
5、慢查詢日誌 slow log:運行時間超過某值的所有 sql 語句都記錄到慢查詢日誌文件中。
——對數據庫的表設計也要學習清楚
數據類型的選擇,主要參考官方文檔:
https://downloads.mysql.com/docs/licenses/mysqld-5.7-com-en.pdf
——數據碎片的整理
產生碎片的原因:
- 主要是因為對大表進行刪除操作;
- 其次隨機方式插入新數據,可能導致輔助索引產生大量的碎片;
整理碎片的方法:
- 備份數據表,導入導出,刪除舊錶
- 執行 alter table table_name engine=innodb;
——收集統計信息
保證統計信息的準確性,才能確保我們的 sql 執行計劃準確。收集方法:
- 重啟 mysql 服務
- 遍歷 tables 表
——學習分區表
分區表的種類:
1、range
2、list
3、hash
4、key
——學習對索引的認識
大致分為:
1、如何查看數據庫中索引:show index from table_name;
2、學會查看數據庫索引的選擇性:select count(distinct c1)/count(*) from table_name; 選擇性越高,越適合創建索引
3、創建索引的過程中,學會查看執行計劃。內功心法:先看 type 值,再看 key,再看 rows,最後看 extra;
4、瞭解創建索引的好處
a、提高數據檢索效率
b、提高聚合函數效率
c、提高排序效率
d、個別時候可以避免回表
e、減少多表關聯時掃描行數
f、主鍵、唯一索引可以作為約束
——對事務的學習
先要知道事務的四大特性(ACID):
a. 原子性(Atomicity)
事務的原子性是指事務中包含的所有操作要麼都做,要麼都不做,保證數據庫是一致的
b. 一致性(Consistency)
一致性是指數據庫在事務操作前和事務處理後,其中的數據必須都滿足業務規則約束.
c. 隔離性(Isolation)
隔離性是數據庫允許多個併發事務同時對數據進行讀寫和修改的能力,隔離性可以防止多個事務併發執行時由於交叉執行而導致數據的不一致.
d. 持久性(Durability)
事務處理結束後,對數據的修改就是永久的
熟悉 mysql 數據庫四種事務隔離級別:
1. read uncommitted(RU)讀未提交:
一個事務中,可以讀取到其他事務未提交的變更
2. read committed(RC)讀已提交:
一個事務中,可以讀取到其他事務已經提交的變更
3. repetable read,(RR)可重複讀:
一個事務中,直到事務結束前,都可以反覆讀取到事務剛開始看到的數據,不會發生變化
4. serializable(串行讀):
即便每次讀都需要獲得表級共享鎖,每次寫都加表級排它鎖,兩個會話間讀寫會相互阻塞。
個人建議:對於交易類系統的網站,大家儘量使用事務級別比較高的RR;對於一些門戶類網站大家使用RC就可以了。
Innodb 的鎖,默認三種鎖算法:
- record;
- Gap lock;
- next-key lock
默認鎖算法是 next-key lock 間隙鎖保證不會出現幻讀現象。
數據庫字符集
先學會查看數據庫的字符集:
如果想保證不會出現中文亂碼的情況發生,必須滿足以下三點:
1、連接終端必須UTF8
2、操作系統必須UTF8
3、數據庫必須UTF8
三者統一就不會出現中文亂碼的問題
——數據庫權限問題的管理
1、權限申請流程要設置規範,合理.
2、測試和正式環境都要嚴格控制數據庫的寫權限,禁止分配 create,alter 這樣的權限給開發人員。並且讀權限和外業務服務分離.
3、領導需要權限時,問清目的,發郵件說明。儘量都由DBA全權管理
4、特權賬號 all privileges 必須由DBA人員控制
5、單庫單用戶,禁止給我一個用戶賬號管理多個庫。
6、只讀賬號 select,可以後期配合主從架構中read_only 一起使用
7、禁止 root 用戶作為遠程連接用戶使用
第四部分:尊貴鉑金篇
DBA 人員,如果不能保證數據的完整性,一切操作都是徒勞無功。所以備份的重要性可想而知。雖然備份不能帶來業務上的提升,還會增加我們的成本。但是沒有數據的完整性,無法保證我們線上業務的正常運行。是數據損壞時最後的一個救命稻草。
備份按方法分:冷備和熱備
冷備:數據庫關掉,影響業務。系統級別的文件 copy(PS:現在這種基本被廢棄了)
熱備:數據庫在線備份,不影響現有業務的進行。
在熱備裡面又分為:
1. 邏輯備份
a. mysqldump
b. mydumper
c. mysqlpump(mysql 5.7才出現)
2. 裸文件備份
物理底層去 copy 文件,工具是 percona-xtrabackup
按內容又可以分為:全量備份、增量備份
生產中最常用的兩種方法:
- mysqldump
- xtrabackup
mysqldump 參數詳解:
備份數據庫:
數據庫崩潰恢復原理介紹:Innodb 維護了一個 redo log,它記錄著 Innodb 所有數據的真實修改信息,當數據庫重啟過程中,redo log 會應用所有已經提交的事務進行前滾,並把所有未提交的事務進行回滾,來保證宕機那一時刻的數據完整性。
XtraBackup 在備份的時候並不鎖定表,而是一頁一頁地複製 InnoDB 的數據,與此同時,XtraBackup 還有另外一個線程監視著 transactions log,一旦 log 發生變化,就把變化過的 log pages 複製走。在全部數據文件複製完成之後,停止複製 logfile。
常用命令:
增備原理分析:
在完整備份和增量備份文件中都有一個文件 xtrabackup_checkpoints 會記錄備份完成時檢查點的LSN。在進行新的增量備份時,XtraBackup 會比較表空間中每頁的 LSN 是否大於上次備份完成的 LSN,如果是,則備份該頁,並記錄當前檢查點的 LSN。
7月20日的增備信息
7月21日的增備信息
可以看出 7月20日 的結束 lsn 號(to_lsn)是 7月21日 的開始 lsn 號(from_lsn)。
增備常用命令:
7月20日的增量文件
注#—incremental-basedir:用來標識當前的增備從哪裡開始
7月21日的增量文件
完整備份集=全備+增備1+增備2
恢復操作:
注# —redo-only代表只進行前滾操作
—apply-log應用日誌,保證數據的完整性
第五部分:永恆鑽石篇
給大家介紹下企業中最常使用的主流 MySQL 高可用架構;
從兩方面介紹
- 基於主從複製
- a. 雙主M-M keepalived
- b. MHA
- 基於 Galera 協議;
M-M keepalived 雙主架構:
一般中小型公司都使用這種架構,搭建比較方便簡單;可以採用主從或者主主模式,在 master 節點發生故障後,利用 keepalived 高可用機制實現快速切換到 slave 節點。原來的從庫變成新的主庫。
但針對這個架構,個人建議以下幾點:
- 一定要完善好切換腳本,keepalived 的切換機制要合理,避免切換不成功的現象發生。
- 從庫的配置儘快要與主庫一致,不能太次;避免主庫宕機發生切換,新的主庫(原來的從庫)影響線上業務進行。
- 對於延遲的問題,在這套架構中,也不能避免。可以使用 mysql 5.7 中增強半同步完成。也可以改變架構使用 PXC,完成時時同步功能,基本上沒有延遲;
- keepalived 無法解決腦裂的問題,因此在進行服務異常判斷時,可以修改我們的判斷腳本,通過對第三方節點補充檢測來決定是否進行切換,可降低腦裂問題產生的風險。
- 採用 keepalived 這個架構,在設置兩節點狀態時,都要設置成不搶佔模式,都是 backup 狀態,通過優先級,來決定誰是主庫。避免腦裂,衝突現象發生。
- 安裝好 mysql 需要的一些依賴包;建議配置好 yum 源,用 yum 安裝 keepalived 即可。
MHA 架構:
MySQL MHA 架構:可以說是企業最流行,用的最多的架構了。一些同學也經常問我相關的問題。
既然 MHA 這麼火,那麼它有什麼優點呢?
- 故障切換時,可以自行判斷哪個從庫與主庫的數據最接近,就切換到上面,可以減少數據的丟失,保證數據的一致性
- 支持 binlog server,可提高 binlog 傳送效率,進一步減少數據丟失風險。
- 可以配置 mysql 5.7 的增強半同步,來保證數據的時時同步
當然也會有一些比較棘手的缺點:
- 自動切換的腳本太簡單了,而且比較老化,建議後期逐漸完善。
- 搭建 MHA 架構,需要開啟 linux 系統互信協議,所以對於系統安全性來說,是個不小的考驗。
PXC 架構:
可以實現多個節點間的數據同步複製以及讀寫,並且可保障數據庫的服務高可用及數據一致性。
PXC 基本就屬於最完美的一套架構設計理念:
- 主從同步,基本上無延遲;
- 完全兼容MySQL
- 新增節點進入到集群,部署起來很簡單。
- 服務高可用性可以保證,並且數據一致性更加嚴格;
第六部分:最強王者篇
進入到最後一個段位,在這裡知識的高樓基本已經建成,我們需要做的就是一些高級優化操作了。
可以從四個部分來考慮優化的問題:程序設計角度、系統維度、數據庫方面、硬件方向
參考老張我的博文《數據庫優化之降龍十八掌》:
http://sumongodb.blog.51cto.com/4979448/1949024
今兒老張把 MySQL 由淺到深地向各位老鐵們,介紹了一下。真的是希望大家可以抽出時間認真去閱讀下,我寫每篇文章都很用心,作為老師主要就是把知識和經驗傳遞給那些正在處於迷茫中,或者把大部分時間都浪費在玩遊戲身上的同學們。
希望這些知識對大家有幫助,大家有什麼見解,我們可以一起討論,共同進步。讓我們的生活更加充實,讓我們對技術更加熱愛!(superZS老張的王者榮耀完結)