Java多線程基礎——線程和線程安全

編程語言 Java 並行計算 CPU java學習與交流 java學習與交流 2017-09-12

Java多線程基礎——線程和線程安全

因為處理器主頻在硬件發展上的瓶頸，摩爾定律基本失效，現在真正起作用的是並行處理的Amdahl定律，畢竟，現在計算機的瓶頸在於存儲和通信，而不是運算本身，並行運算可以更充分地發揮運算的能力，也是提升計算機性能。

線程及其實現

進程

進程是操作系統進行資源分配調度的最小單位，各進程有獨立的系統資源（如內存、文件I/O等），互相之間不能直接訪問，很多時候，一個進程就是一個應用，多個進程也許可以併發，但是進程本身沒有併發的概念，需要藉助線程實現併發。

線程

線程是處理器調度和分配的最小單位，線程沒有自己的資源，線程既能共享所在進程的系統資源（線程私有的局部變量表來自於主內存，只為線程本身服務，輸出的結果仍然要寫回主內存），又能相對獨立地執行調度。

線程因此可以通過並行處理提升效率，但也因此會互相干擾，如果線程崩潰，就會影響所在進程的所有線程。

狀態

線程有5種狀態

New，創建後未啟動。

Runnable，Ready或Running，正等待CPU或正在執行。

Waiting/Timed Waiting，無限等待需要其他線程喚醒，限期等待會由系統自動喚醒

sleep是Native方法，由操作系統來阻塞線程，指定時間後恢復線程。

無限等待會調用wait，需要另一個線程調用notify()來通知恢復線程。

Blocked，阻塞，線程在等待鎖被另一個線程釋放出來

Terminated，線程已結束

這五種狀態的轉換關係如下：

Java多線程基礎——線程和線程安全

實現

Java用Thread實現線程，每個已經start的Thread都是一個線程，需要注意的是，Thread都是Native實現的，也就是通過操作系統，而不是JVM支持的。

在操作系統上，實現線程主要有三種方式：

1.內核線程

內核線程KLT是直接在操作系統內核上支持的，KLT和CPU之間只隔著一個調度器Thread Schedular，調度器把線程中的任務直接映射到各個CPU上。

程序一般會通過輕量級進程來使用內核線程，這是內核線程的高級接口，每個內核線程對應一個輕量級進程。

內核線程的所有操作都要在系統中調用，需要頻繁在用戶態和內核態切換，代價很高。

2.用戶線程

用戶線程完全在用戶進程中創建，不需要切換內核態，所以開銷很小，但是因為沒有系統支持，進程之間的協調、阻塞、處理器映射等，都需要自己實現，所以非常複雜。

3.用戶線程+輕量級進程

其實就是把前兩種模式混合使用。

線程安全

線程安全問題其實就是併發的正確性問題，一個線程安全的行為，既不需要額外的同步和協調，也不用考慮在runtime中的調度和交替執行，一定能返回預期的結果。

五種線程安全場景

1.不變性

最簡單最純粹的場景就是不變性，一個不可變的對象一定是線程安全的，如final。

2.絕對線程安全

絕對線程安全是不切實際的，即使是線程安全的Vector容器，也只是在方法中用了synchronized修飾，方法調用時還是需要額外同步，否則，在多線程同時remove，仍然會有Index邊界溢出的錯誤。

3.相對線程安全

一般意義上的線程安全就是相對線程安全，單獨操作是線程安全的，但是在特定情況下，還需要在調用時增加額外的同步手段。Java提供的線程安全如Vector、HashTabe、Collections.synchronizedCollection()等，都是相對線程安全。

4.線程兼容

一般意義上的不是線程安全其實是線程兼容，指的是本身並不線程安全，可以在調用時增加同步手段，實現線程安全，常見的ArrayList和HashMap都是線程安全的。

5.線程對立

一些極端情況下，無論採用什麼同步措施，都不能實現線程安全，就是線程對立，如Thread的suspend和resume，不能並行調用，很容易出現死鎖。

實現線程安全，既與代碼的編寫有關，也與虛擬機的同步和鎖有關，常見的三種線程安全實現方法為：

1.互斥同步

就是共享數據在並行運算中，同一時刻只能一個線程使用，synchronized和ReentrantLock都是互斥同步。

2.非阻塞同步

其實就是互斥同步的對立面，非阻塞同步相對樂觀，認為並行不一定導致共享數據衝突，如果真的出現爭用衝突，再做補償即可（如重試操作，比如compareAndSet(current,next)就是不斷嘗試賦值，如果current和next的值和預期不一致，就說明數據被修改了，會再次循環嘗試），sum.misc.Unsafe類就是非阻塞同步機制（ClassLoader才能直接使用，用戶只能通過Java API間接使用，如AtomicInteger），非阻塞同步依賴於硬件指令集的發展和支持。

3.無同步方案

無同步方案不是不管線程安全，而是通過其他方式實現線程安全，不需要同步。

可重入代碼

一個方向是通過代碼實現無同步，就是可重入代碼，可重入代碼在執行過程中，隨時可以中斷，轉而執行其他任務（包括遞歸該代碼本身），然後重入繼續執行，不會出現錯誤。

可重入代碼也叫純代碼，容易令人想起純函數（當然，不是同一維度），只要輸入相同的數據，就能返回相同的結果。

線程本地存儲

另一個方向是通過避免多線程的數據共享實現無同步，就是線程本地存儲，也就是把共享數據控制在一個線程內，避免衝突。

大部分使用消費隊列的模式都是線程本地存儲，這種模式會盡量在一個線程內完成消費，Android中的Handler機制，就是通過ThreadLocal對象（實際上是一個HashMap，key為對象的hashcode，value為對象本身），讓handler引用線程的Looper，Looper再依次處理自己MessageQueue中的Message，通過Message的target指向handler，實現在同一線程內處理消息隊列。

鎖的優化

多線程的重點是數據的高效共享，主要得解決競爭的問題，也就是對鎖的優化。

自旋鎖與自適應自旋

自旋針對的是線程的阻塞和恢復，因為線程的阻塞和恢復非常消耗資源，而等待的鎖可能很快就會釋放，所以在線程請求鎖失敗的時候，不立即阻塞線程，而是讓它先執行一個忙循環（自旋）。

自旋也會消耗資源，適當的自旋次數效果才最好，自適應自旋會根據以往的自旋次數，動態調整自旋次數，基本策略就是自旋後能獲得鎖，下次就可以多自旋幾次；如果自旋後沒有獲得鎖，下次就會少自旋幾次。

鎖消除

在編譯代碼時，編譯器認為某個鎖完全沒有必要，就會把鎖消除。

鎖粗化

如果虛擬機發現一串零碎的操作中，對同一個對象反覆加鎖解鎖，就會把它們合併擴展為外側的一個鎖。

輕量級鎖

絕大部分鎖在同步週期是沒有競爭的，加鎖和解鎖的操作雖然必須，但是消耗過重了，輕量級鎖就是先用輕量級的鎖來加鎖解鎖，如果同步期間沒有發生競爭，就節省了資源；如果發生了競爭，就膨脹為常規的重量級的鎖。

偏向鎖

偏向鎖和輕量級鎖都是針對無競爭情況的優化，輕量級鎖是在無競爭時消除互斥，而偏向鎖是在無競爭時消除整個同步。

逃逸的優化

根據對象的作用域，可能發生逃逸行為，如果可以確認不會發生逃逸，也能進行優化。

方法逃逸

在方法中定義個一個對象，如果可能被外部方法引用，比如作為外部方法的參數，就是方法逃逸。

如果不會發生方法逃逸，就可以在線程的棧上分配內存，這樣，在棧幀出棧時就可以回收內存，減輕GC壓力。

線程逃逸

在線程中的一個對象，如果可能被外部線程引用，比如賦值給靜態類變量或者其他線程的對象變量，就是線程逃逸。

如果不會發生線程逃逸，就可以消除同步，消除對變量的同步措施，因為在線程內部是天然有序的，不存在競爭問題。

Java多線程基礎——線程和線程安全

學習過程中遇到什麼問題或者想獲取學習資源的話，歡迎加入Java學習交流群346942462，我們一起學Java！

Java多線程基礎——線程和線程安全

線程及其實現

線程安全

鎖的優化

逃逸的優化

相關推薦