mysql字符轉化以及亂碼原因

MySQL 技術 ITPUB 2017-03-27

mysql中存入數據時發生的編碼轉換過程：

1、在終端(Terminal，可以是bash窗口，也可以是客戶端工具如navicat)中輸入，輸入的內容由Terminal根據其自己的字符進行編碼。

2、經Terminal編碼後的二進制流被傳輸到mysql server。mysql server(mysql engine)根據參數character_set_client的字符設置來對該二進制流進行解碼。

3、解碼之後，mysql server再次根據目的表，即table的字符集來判斷是否需要字符編碼轉換。如果character_set_client的字符設置和table定義時的character設置一致，則無需字符編碼轉換。否則進行轉換，然後將轉換後的二進制流存放到數據文件(file)中去。

總結：client ------> server(engine) -----> file 需要經過三次編碼，兩次編碼轉化。

mysql中取出數據時發生的編碼轉換過程：

1、從數據文件(file)中讀出二進制數據流，將該數據流根據table定義時的character設置來進行解碼。

2、在用table character對二級制數據流進行解碼之後，在mysql engine(mysql server)中，需要根據參數character_set_client的字符集設置對解碼後的數據庫流再一次進行編碼，將編碼之後的二級制數據庫流傳輸到client端。

3、client端，即終端(Terminal)根據其自己的字符集編碼來展示查詢結果。

總結： file ------> server(engine) -----> client 需要經過三次編碼，兩次編碼轉化。

可能會有些疑問，在上面的分析中，數據都是以二進制流的方式在各個節點之間流動的。那麼為什麼需要編碼轉化了？

1、client 和 server(engine) 之間的轉換，或者說編解碼是為了對傳進來的二進制流做語法和詞法解析，否則你不會知道傳進來的是insert還是update。

2、file 和 server(engine) 之間的轉換是為了在從數據文件讀入數據後，在存儲引擎內部進行字符級別的操作。

經過以上分析，應該很快發現導致亂碼出現的原因是有以下幾種：

1、數據在存入的時候和取出的時候，編碼不一致。比如存入時用的utf8，取出時用的GBK。

2、編碼轉換不是無損編碼轉換導致亂碼出現。比如clien是utf8，mysql server中的character_set_client設置為gbk，表結構的字符集設置為utf8。這裡會有兩次編碼轉化，client到server時，utf8要轉為gbk，然後server到file時，gbk要轉為utf8。由於gbk到utf8是有損編碼轉化，導致了亂碼出現。

無損編碼轉換：假設我們要把用編碼A表示的字符X，轉化為編碼B的表示形式，而編碼B的字形集中並沒有X這個字符，那麼此時我們就稱這個轉換是有損的。

但不是任何兩種字符集編碼之間的轉換都是有損，轉換是否有損取決於以下幾點：

------被轉換的字符是否同時在兩個字符集中

------標字符集是否能夠對不支持字符，保留其原有表達形式。(比如latin1在遇到自己無法表示的字符時，會保留原字符集的編碼數據，並跳過忽略該字符進而處理後面的數據。)

因此只要客戶端，MySQL Server的character-set-client，table charset的三個字符集完全一致就可以保證一定不會有亂碼出現了。

相關推薦

'每日學點---Mysql複製表'

"複製表create table table2 select * from table1;或者mysqldump olddb table1 -u root -ppassword --add-drop-table | mysql newdb -u root -ppasswor...

MySQL 2019-09-19

'mysql單表訪問優化'

"create table single_table( id int not null auto_increment, key1 varchar(100), key2 int, key3 varchar(100), key_part1 varchar(100), key_p...

MySQL 設計 2019-09-19

'Python批量刪除mysql中千萬級大量數據'

"場景描述線上 mysql 數據庫裡面有張表保存有每天的統計結果，每天有1千多萬條，這是我們意想不到的，統計結果咋有這麼多。運維找過來，磁盤佔了 200G ，最後問了運營，可以只保留最近3天的，前面的數據，只能刪了。刪，怎麼刪？關注，轉發，私信小編“01”即可免費領取Pyt...

Python MySQL 數據庫腳本語言 2019-09-15

'「靈魂拷問」MySQL面試高頻一百問(工程師方向)'

"前言本文主要受眾為開發人員,所以不涉及到MySQL的服務部署等操作,且內容較多,大家準備好耐心和瓜子礦泉水.前一陣系統的學習了一下MySQL,也有一些實際操作經驗,偶然看到一篇和MySQL相關的面試文章,發現其中的一些問題自己也回答不好,雖然知識點大部分都知道,但是無法將...

MySQL 數據結構工程師跳槽那些事兒 2019-09-15

'面試官：在使用mysql數據庫時，遇到重複數據怎麼處理？'

"前言前段時間，很多人問我能不能寫一些數據庫的文章，正好自己在測試mysql數據庫性能的時候，出現了一個問題，也就是出現了很多重複的數據，想起來自己long long ago寫過一篇類似的，僅此就拿來總結了一下。如果你在使用mysql的時候也遇到了這個問題，希望能對你有所幫...

數據庫 MySQL SQL 文章 Redis 設計 2019-09-14

'Flink 1.9 實戰：使用 SQL 讀取 Kafka 並寫入 MySQL'

"SqlSubmit 的實現筆者一開始是想用 SQL Client 來貫穿整個演示環節，但可惜 1.9 版本 SQL CLI 還不支持處理 CREATE TABLE 語句。所以筆者就只好自己寫了個簡單的提交腳本。後來想想，也挺好的，可以讓聽眾同時瞭解如何通過 SQL 的方式...

SQL MySQL 腳本語言 JSON 2019-09-13

'請問：Redis和mysql數據怎麼保持數據一致的？'

"需求起因在高併發的業務場景下，數據庫大多數情況都是用戶併發訪問最薄弱的環節。所以，就需要使用redis做一個緩衝操作，讓請求先訪問到redis，而不是直接訪問MySQL等數據庫。這個業務場景，主要是解決讀數據從Redis緩存，一般都是按照下圖的流程來進行業務操作。讀取緩存...

Redis MySQL 數據庫 Java 技術 Java虛擬機 Tomcat Docker Nginx 2019-09-13

'我以為自己足夠了解MySQL索引，直到遇見阿里面試官……'

"相信很多人對於MySQL的索引都不陌生，索引(Index)是幫助MySQL高效獲取數據的數據結構。因為索引是MySQL中比較重點的知識，相信很多人都有一定的瞭解，尤其是在面試中出現的頻率特別高。樓主自認為自己對MySQL的索引相關知識有很多瞭解，而且因為最近在找工作面試，...

MySQL SQL 數據庫人生第一份工作數據結構 2019-09-12

'MySQL索引失效和EXPLAIN工具：你建立的索引真的起到作用了嗎？'

"在我們使用MySQL的過程中，隨著數據量越來越大，查詢顯得有些吃力，這時候就要針對查詢就行優化，針對查詢優化，通過給字段添加索引可以提高數據的讀取速度，提高項目的併發能力和抗壓能力。在上一篇我們講了給數據庫中的表添加索引，來提高它的查詢速度，但是會有另外一種情況出現，那就...

MySQL SQL 數據庫 2019-09-11

'程序員面試備戰篇：18個經典MySQL面試專題解析（乾貨分享答案）'

"1.數據庫三範式是什麼?第一範式（1NF）：字段具有原子性,不可再分。(所有關係型數據庫系統都滿足第一範式數據庫表中的字段都是單一屬性的，不可再分)第二範式（2NF）是在第一範式（1NF）的基礎上建立起來的，即滿足第二範式（2NF）必須先滿足第一範式（1NF）。要求數據庫...

MySQL SQL 程序員數據庫人生第一份工作數據庫索引紅帽公司 Debian 數據結構設計 2019-09-09

'基於MySQL Binlog的Elasticsearch數據同步實踐'

"作者介紹張坤，馬蜂窩電商研發團隊度假業務高級研發工程師。一、為什麼要做隨著馬蜂窩的逐漸發展，我們的業務數據越來越多，單純使用 MySQL 已經不能滿足我們的數據查詢需求，例如對於商品、訂單等數據的多維度檢索。使用 Elasticsearch 存儲業務數據可以很好的解決我們...

MySQL ElasticSearch JSON 設計腳本語言技術工程師電子商務 2019-09-09

'MySQL的相關函數的使用SQL實踐操作詳情，如日期函數'

"MySQL第一.SQL函數SQL數據庫有兩種函數,總數函數和數量函數1,總數函數: 計算從列中取得的值，返回一個單一的值。如下:AVG() : 返回平均值MAX() :返回最大值MIN() : 返回最小值FIRST() : 返回第一個記錄的值LAST() : 返回最後一個...

MySQL SQL Microsoft SQL Server 數據庫 2019-09-08

'Mysql賬戶管理'

"賬戶管理在生產環境下操作數據庫時，絕對不可以使用root賬戶連接，而是創建特定的賬戶，授予這個賬戶特定的操作權限，然後連接進行操作，主要的操作就是數據的crudMySQL賬戶體系：根據賬戶所具有的權限的不同，MySQL的賬戶可以分為以下幾種服務實例級賬號：，啟動了一個my...

MySQL 數據庫 Debian Python 電腦 2019-09-07

'乾貨：MySQL性能優化，in和exists'

"in和exists哪個性能更優sql腳本：上面的sql中訂單表中（orders）存在user_id，而又有用戶表（users），所以我們用orders表中user_id和user表中的id 來in 和 exists。結果1.where後面是小表（1）select co...

MySQL SQL 腳本語言 2019-09-06

'「Linux」MySQL 運維常用腳本'

"[toc]操作規範1、數據操作，必須謹慎，線上尤甚！！！ 2、線上數據操作，必須備份！備份需完整、可用，備份使用自己最容易操作回滾的方式。 3、數據操作，能修改數據解決的決不刪除 4、不確定的操作不做，不確定的命令不敲 5、如果出現問題，例如數據丟失、數據文件損壞，必須首...

MySQL SQL 腳本語言 Linux 數據庫操作系統 2019-09-05

'網站響應速度慢，這些原因不可不知？'

"服務器就好比網站的發動機，網站建設前最好能到正規的公司購買獨立穩定的服務器，保證網站的正常瀏覽速度，保證網站運營過程中穩定性，增加用戶體驗及讓搜索引擎更好的抓取，這樣才會受到用戶的親睞，更符合SEO！　　今天我們來說說網站響應速度慢的原因都有哪些。1. 網站服務器區域選定...

數據庫 MySQL 電信搜索引擎 Microsoft SQL Server 2019-08-30

'阿里大佬推薦的一本書，深刻解析MySQL 中 SQL 編程的精髓與奧祕'

"前言總會有難熬的日子，但你會感謝今日努力拼命的自己，你想要的就是你的未來;世界上所有的驚喜和好運，都是你的選擇和努力。正文本書是暢銷書《MySQL 技術內幕：InnoDB 存儲引擎》的姊妹篇，深刻揭示了 MySQL 中 SQL 編程的精髓與奧祕，能為開發者和 DBA 們...

SQL MySQL DBA MariaDB 數據庫算法 2019-08-30

'一文搞懂MySQL拼接字符串'

"本文主要介紹了MySQL中怎麼連接字符串，+的用法，concat函數的用法，concat_ws函數的用法，感興趣的小夥伴們可以參考一下。MySQL中的"+"在MySQL中可以使用加號“+”來連接兩個字符串，“+”只適合整數相加，不適合字符串。SELECT "11"+"12...

MySQL 2019-08-28

'「基於Docker編排MySql集群瘋狂實戰」視頻學習筆記'

"概要：1. Docker compose 概念與基本命令2. MySql主從架構原理3. Docker 一鍵編排MySql集群實戰講師介紹：花名：魯班曾就職於萬達、雲猴Java高級架構師、近十年開發管理經驗，擅長互聯網項目實戰。負責整體架構、會員體系建設、大促技術保障。...

Docker MySQL SQL Nginx 數據庫 Java Links Redis 技術設計 2019-08-28

'100道MySQL常見面試題總結'

MySQL 數據結構跳槽那些事兒 2019-08-26

推薦中...