Java多線程基礎——線程和線程安全

編程語言 Java 並行計算 CPU java學習與交流 java學習與交流 2017-09-12

Java多線程基礎——線程和線程安全

因為處理器主頻在硬件發展上的瓶頸,摩爾定律基本失效,現在真正起作用的是並行處理的Amdahl定律,畢竟,現在計算機的瓶頸在於存儲和通信,而不是運算本身,並行運算可以更充分地發揮運算的能力,也是提升計算機性能。

線程及其實現

進程

進程是操作系統進行資源分配調度的最小單位,各進程有獨立的系統資源(如內存、文件I/O等),互相之間不能直接訪問,很多時候,一個進程就是一個應用,多個進程也許可以併發,但是進程本身沒有併發的概念,需要藉助線程實現併發。

線程

線程是處理器調度和分配的最小單位,線程沒有自己的資源,線程既能共享所在進程的系統資源(線程私有的局部變量表來自於主內存,只為線程本身服務,輸出的結果仍然要寫回主內存),又能相對獨立地執行調度。

線程因此可以通過並行處理提升效率,但也因此會互相干擾,如果線程崩潰,就會影響所在進程的所有線程。

狀態

線程有5種狀態

New,創建後未啟動。

Runnable,Ready或Running,正等待CPU或正在執行。

Waiting/Timed Waiting,無限等待需要其他線程喚醒,限期等待會由系統自動喚醒

sleep是Native方法,由操作系統來阻塞線程,指定時間後恢復線程。

無限等待會調用wait,需要另一個線程調用notify()來通知恢復線程。

Blocked,阻塞,線程在等待鎖被另一個線程釋放出來

Terminated,線程已結束

這五種狀態的轉換關係如下:

Java多線程基礎——線程和線程安全

實現

Java用Thread實現線程,每個已經start的Thread都是一個線程,需要注意的是,Thread都是Native實現的,也就是通過操作系統,而不是JVM支持的。

在操作系統上,實現線程主要有三種方式:

1.內核線程

內核線程KLT是直接在操作系統內核上支持的,KLT和CPU之間只隔著一個調度器Thread Schedular,調度器把線程中的任務直接映射到各個CPU上。

程序一般會通過輕量級進程來使用內核線程,這是內核線程的高級接口,每個內核線程對應一個輕量級進程。

內核線程的所有操作都要在系統中調用,需要頻繁在用戶態和內核態切換,代價很高。

2.用戶線程

用戶線程完全在用戶進程中創建,不需要切換內核態,所以開銷很小,但是因為沒有系統支持,進程之間的協調、阻塞、處理器映射等,都需要自己實現,所以非常複雜。

3.用戶線程+輕量級進程

其實就是把前兩種模式混合使用。

線程安全

線程安全問題其實就是併發的正確性問題,一個線程安全的行為,既不需要額外的同步和協調,也不用考慮在runtime中的調度和交替執行,一定能返回預期的結果。

五種線程安全場景

1.不變性

最簡單最純粹的場景就是不變性,一個不可變的對象一定是線程安全的,如final。

2.絕對線程安全

絕對線程安全是不切實際的,即使是線程安全的Vector容器,也只是在方法中用了synchronized修飾,方法調用時還是需要額外同步,否則,在多線程同時remove,仍然會有Index邊界溢出的錯誤。

3.相對線程安全

一般意義上的線程安全就是相對線程安全,單獨操作是線程安全的,但是在特定情況下,還需要在調用時增加額外的同步手段。Java提供的線程安全如Vector、HashTabe、Collections.synchronizedCollection()等,都是相對線程安全。

4.線程兼容

一般意義上的不是線程安全其實是線程兼容,指的是本身並不線程安全,可以在調用時增加同步手段,實現線程安全,常見的ArrayList和HashMap都是線程安全的。

5.線程對立

一些極端情況下,無論採用什麼同步措施,都不能實現線程安全,就是線程對立,如Thread的suspend和resume,不能並行調用,很容易出現死鎖。

實現線程安全,既與代碼的編寫有關,也與虛擬機的同步和鎖有關,常見的三種線程安全實現方法為:

1.互斥同步

就是共享數據在並行運算中,同一時刻只能一個線程使用,synchronized和ReentrantLock都是互斥同步。

2.非阻塞同步

其實就是互斥同步的對立面,非阻塞同步相對樂觀,認為並行不一定導致共享數據衝突,如果真的出現爭用衝突,再做補償即可(如重試操作,比如compareAndSet(current,next)就是不斷嘗試賦值,如果current和next的值和預期不一致,就說明數據被修改了,會再次循環嘗試),sum.misc.Unsafe類就是非阻塞同步機制(ClassLoader才能直接使用,用戶只能通過Java API間接使用,如AtomicInteger),非阻塞同步依賴於硬件指令集的發展和支持。

3.無同步方案

無同步方案不是不管線程安全,而是通過其他方式實現線程安全,不需要同步。

可重入代碼

一個方向是通過代碼實現無同步,就是可重入代碼,可重入代碼在執行過程中,隨時可以中斷,轉而執行其他任務(包括遞歸該代碼本身),然後重入繼續執行,不會出現錯誤。

可重入代碼也叫純代碼,容易令人想起純函數(當然,不是同一維度),只要輸入相同的數據,就能返回相同的結果。

線程本地存儲

另一個方向是通過避免多線程的數據共享實現無同步,就是線程本地存儲,也就是把共享數據控制在一個線程內,避免衝突。

大部分使用消費隊列的模式都是線程本地存儲,這種模式會盡量在一個線程內完成消費,Android中的Handler機制,就是通過ThreadLocal對象(實際上是一個HashMap,key為對象的hashcode,value為對象本身),讓handler引用線程的Looper,Looper再依次處理自己MessageQueue中的Message,通過Message的target指向handler,實現在同一線程內處理消息隊列。

鎖的優化

多線程的重點是數據的高效共享,主要得解決競爭的問題,也就是對鎖的優化。

自旋鎖與自適應自旋

自旋針對的是線程的阻塞和恢復,因為線程的阻塞和恢復非常消耗資源,而等待的鎖可能很快就會釋放,所以在線程請求鎖失敗的時候,不立即阻塞線程,而是讓它先執行一個忙循環(自旋)。

自旋也會消耗資源,適當的自旋次數效果才最好,自適應自旋會根據以往的自旋次數,動態調整自旋次數,基本策略就是自旋後能獲得鎖,下次就可以多自旋幾次;如果自旋後沒有獲得鎖,下次就會少自旋幾次。

鎖消除

在編譯代碼時,編譯器認為某個鎖完全沒有必要,就會把鎖消除。

鎖粗化

如果虛擬機發現一串零碎的操作中,對同一個對象反覆加鎖解鎖,就會把它們合併擴展為外側的一個鎖。

輕量級鎖

絕大部分鎖在同步週期是沒有競爭的,加鎖和解鎖的操作雖然必須,但是消耗過重了,輕量級鎖就是先用輕量級的鎖來加鎖解鎖,如果同步期間沒有發生競爭,就節省了資源;如果發生了競爭,就膨脹為常規的重量級的鎖。

偏向鎖

偏向鎖和輕量級鎖都是針對無競爭情況的優化,輕量級鎖是在無競爭時消除互斥,而偏向鎖是在無競爭時消除整個同步。

逃逸的優化

根據對象的作用域,可能發生逃逸行為,如果可以確認不會發生逃逸,也能進行優化。

方法逃逸

在方法中定義個一個對象,如果可能被外部方法引用,比如作為外部方法的參數,就是方法逃逸。

如果不會發生方法逃逸,就可以在線程的棧上分配內存,這樣,在棧幀出棧時就可以回收內存,減輕GC壓力。

線程逃逸

在線程中的一個對象,如果可能被外部線程引用,比如賦值給靜態類變量或者其他線程的對象變量,就是線程逃逸。

如果不會發生線程逃逸,就可以消除同步,消除對變量的同步措施,因為在線程內部是天然有序的,不存在競爭問題。

Java多線程基礎——線程和線程安全

學習過程中遇到什麼問題或者想獲取學習資源的話,歡迎加入Java學習交流群346942462,我們一起學Java!

相關推薦

推薦中...