因為處理器主頻在硬件發展上的瓶頸,摩爾定律基本失效,現在真正起作用的是並行處理的Amdahl定律,畢竟,現在計算機的瓶頸在於存儲和通信,而不是運算本身,並行運算可以更充分地發揮運算的能力,也是提升計算機性能。
線程及其實現
進程
進程是操作系統進行資源分配調度的最小單位,各進程有獨立的系統資源(如內存、文件I/O等),互相之間不能直接訪問,很多時候,一個進程就是一個應用,多個進程也許可以併發,但是進程本身沒有併發的概念,需要藉助線程實現併發。
線程
線程是處理器調度和分配的最小單位,線程沒有自己的資源,線程既能共享所在進程的系統資源(線程私有的局部變量表來自於主內存,只為線程本身服務,輸出的結果仍然要寫回主內存),又能相對獨立地執行調度。
線程因此可以通過並行處理提升效率,但也因此會互相干擾,如果線程崩潰,就會影響所在進程的所有線程。
狀態
線程有5種狀態
New,創建後未啟動。
Runnable,Ready或Running,正等待CPU或正在執行。
Waiting/Timed Waiting,無限等待需要其他線程喚醒,限期等待會由系統自動喚醒
sleep是Native方法,由操作系統來阻塞線程,指定時間後恢復線程。
無限等待會調用wait,需要另一個線程調用notify()來通知恢復線程。
Blocked,阻塞,線程在等待鎖被另一個線程釋放出來
Terminated,線程已結束
這五種狀態的轉換關係如下:
實現
Java用Thread實現線程,每個已經start的Thread都是一個線程,需要注意的是,Thread都是Native實現的,也就是通過操作系統,而不是JVM支持的。
在操作系統上,實現線程主要有三種方式:
1.內核線程
內核線程KLT是直接在操作系統內核上支持的,KLT和CPU之間只隔著一個調度器Thread Schedular,調度器把線程中的任務直接映射到各個CPU上。
程序一般會通過輕量級進程來使用內核線程,這是內核線程的高級接口,每個內核線程對應一個輕量級進程。
內核線程的所有操作都要在系統中調用,需要頻繁在用戶態和內核態切換,代價很高。
2.用戶線程
用戶線程完全在用戶進程中創建,不需要切換內核態,所以開銷很小,但是因為沒有系統支持,進程之間的協調、阻塞、處理器映射等,都需要自己實現,所以非常複雜。
3.用戶線程+輕量級進程
其實就是把前兩種模式混合使用。
線程安全
線程安全問題其實就是併發的正確性問題,一個線程安全的行為,既不需要額外的同步和協調,也不用考慮在runtime中的調度和交替執行,一定能返回預期的結果。
五種線程安全場景
1.不變性
最簡單最純粹的場景就是不變性,一個不可變的對象一定是線程安全的,如final。
2.絕對線程安全
絕對線程安全是不切實際的,即使是線程安全的Vector容器,也只是在方法中用了synchronized修飾,方法調用時還是需要額外同步,否則,在多線程同時remove,仍然會有Index邊界溢出的錯誤。
3.相對線程安全
一般意義上的線程安全就是相對線程安全,單獨操作是線程安全的,但是在特定情況下,還需要在調用時增加額外的同步手段。Java提供的線程安全如Vector、HashTabe、Collections.synchronizedCollection()等,都是相對線程安全。
4.線程兼容
一般意義上的不是線程安全其實是線程兼容,指的是本身並不線程安全,可以在調用時增加同步手段,實現線程安全,常見的ArrayList和HashMap都是線程安全的。
5.線程對立
一些極端情況下,無論採用什麼同步措施,都不能實現線程安全,就是線程對立,如Thread的suspend和resume,不能並行調用,很容易出現死鎖。
實現線程安全,既與代碼的編寫有關,也與虛擬機的同步和鎖有關,常見的三種線程安全實現方法為:
1.互斥同步
就是共享數據在並行運算中,同一時刻只能一個線程使用,synchronized和ReentrantLock都是互斥同步。
2.非阻塞同步
其實就是互斥同步的對立面,非阻塞同步相對樂觀,認為並行不一定導致共享數據衝突,如果真的出現爭用衝突,再做補償即可(如重試操作,比如compareAndSet(current,next)就是不斷嘗試賦值,如果current和next的值和預期不一致,就說明數據被修改了,會再次循環嘗試),sum.misc.Unsafe類就是非阻塞同步機制(ClassLoader才能直接使用,用戶只能通過Java API間接使用,如AtomicInteger),非阻塞同步依賴於硬件指令集的發展和支持。
3.無同步方案
無同步方案不是不管線程安全,而是通過其他方式實現線程安全,不需要同步。
可重入代碼
一個方向是通過代碼實現無同步,就是可重入代碼,可重入代碼在執行過程中,隨時可以中斷,轉而執行其他任務(包括遞歸該代碼本身),然後重入繼續執行,不會出現錯誤。
可重入代碼也叫純代碼,容易令人想起純函數(當然,不是同一維度),只要輸入相同的數據,就能返回相同的結果。
線程本地存儲
另一個方向是通過避免多線程的數據共享實現無同步,就是線程本地存儲,也就是把共享數據控制在一個線程內,避免衝突。
大部分使用消費隊列的模式都是線程本地存儲,這種模式會盡量在一個線程內完成消費,Android中的Handler機制,就是通過ThreadLocal對象(實際上是一個HashMap,key為對象的hashcode,value為對象本身),讓handler引用線程的Looper,Looper再依次處理自己MessageQueue中的Message,通過Message的target指向handler,實現在同一線程內處理消息隊列。
鎖的優化
多線程的重點是數據的高效共享,主要得解決競爭的問題,也就是對鎖的優化。
自旋鎖與自適應自旋
自旋針對的是線程的阻塞和恢復,因為線程的阻塞和恢復非常消耗資源,而等待的鎖可能很快就會釋放,所以在線程請求鎖失敗的時候,不立即阻塞線程,而是讓它先執行一個忙循環(自旋)。
自旋也會消耗資源,適當的自旋次數效果才最好,自適應自旋會根據以往的自旋次數,動態調整自旋次數,基本策略就是自旋後能獲得鎖,下次就可以多自旋幾次;如果自旋後沒有獲得鎖,下次就會少自旋幾次。
鎖消除
在編譯代碼時,編譯器認為某個鎖完全沒有必要,就會把鎖消除。
鎖粗化
如果虛擬機發現一串零碎的操作中,對同一個對象反覆加鎖解鎖,就會把它們合併擴展為外側的一個鎖。
輕量級鎖
絕大部分鎖在同步週期是沒有競爭的,加鎖和解鎖的操作雖然必須,但是消耗過重了,輕量級鎖就是先用輕量級的鎖來加鎖解鎖,如果同步期間沒有發生競爭,就節省了資源;如果發生了競爭,就膨脹為常規的重量級的鎖。
偏向鎖
偏向鎖和輕量級鎖都是針對無競爭情況的優化,輕量級鎖是在無競爭時消除互斥,而偏向鎖是在無競爭時消除整個同步。
逃逸的優化
根據對象的作用域,可能發生逃逸行為,如果可以確認不會發生逃逸,也能進行優化。
方法逃逸
在方法中定義個一個對象,如果可能被外部方法引用,比如作為外部方法的參數,就是方法逃逸。
如果不會發生方法逃逸,就可以在線程的棧上分配內存,這樣,在棧幀出棧時就可以回收內存,減輕GC壓力。
線程逃逸
在線程中的一個對象,如果可能被外部線程引用,比如賦值給靜態類變量或者其他線程的對象變量,就是線程逃逸。
如果不會發生線程逃逸,就可以消除同步,消除對變量的同步措施,因為在線程內部是天然有序的,不存在競爭問題。
學習過程中遇到什麼問題或者想獲取學習資源的話,歡迎加入Java學習交流群346942462,我們一起學Java!