'不瞭解這 12 個語法糖,別說你會 Java'

"

本文從 Java 編譯原理角度,深入字節碼及 class 文件,抽絲剝繭,瞭解 Java 中的語法糖原理及用法,幫助大家在學會如何使用 Java 語法糖的同時,瞭解這些語法糖背後的原理

語法糖

語法糖(Syntactic Sugar),也稱糖衣語法,是由英國計算機學家 Peter.J.Landin 發明的一個術語,指在計算機語言中添加的某種語法,這種語法對語言的功能並沒有影響,但是更方便程序員使用。簡而言之,語法糖讓程序更加簡潔,有更高的可讀性。

有意思的是,在編程領域,除了語法糖,還有語法鹽和語法糖精的說法,篇幅有限這裡不做擴展了。

我們所熟知的編程語言中幾乎都有語法糖。作者認為,語法糖的多少是評判一個語言夠不夠牛逼的標準之一。

很多人說Java是一個“低糖語言”,其實從Java 7開始Java語言層面上一直在添加各種糖,主要是在“Project Coin”項目下研發。儘管現在Java有人還是認為現在的Java是低糖,未來還會持續向著“高糖”的方向發展。

解語法糖

前面提到過,語法糖的存在主要是方便開發人員使用。但其實,Java虛擬機並不支持這些語法糖。這些語法糖在編譯階段就會被還原成簡單的基礎語法結構,這個過程就是解語法糖。

說到編譯,大家肯定都知道,Java語言中,javac命令可以將後綴名為.java的源文件編譯為後綴名為.class的可以運行於Java虛擬機的字節碼。

如果你去看com.sun.tools.javac.main.JavaCompiler的源碼,你會發現在compile中有一個步驟就是調用desugar,這個方法就是負責解語法糖的實現的。

Java 中最常用的語法糖主要有泛型、變長參數、條件編譯、自動拆裝箱、內部類等。本文主要來分析下這些語法糖背後的原理。一步一步剝去糖衣,看看其本質。

糖塊一、 switch 支持 String 與枚舉

前面提到過,從Java 7 開始,Java語言中的語法糖在逐漸豐富,其中一個比較重要的就是Java 7中switch開始支持String。

在開始coding之前先科普下,Java中的swith自身原本就支持基本類型。比如int、char等。

對於int類型,直接進行數值的比較。對於char類型則是比較其ascii碼。

所以,對於編譯器來說,switch中其實只能使用整型,任何類型的比較都要轉換成整型。比如byte。short,char(ackii碼是整型)以及int。

那麼接下來看下switch對String得支持,有以下代碼:

public class switchDemoString { public static void main(String[] args) { String str = "world"; switch (str) { case "hello": System.out.println("hello"); break; case "world": System.out.println("world"); break; default: break; } }}

反編譯後內容如下:

public class switchDemoString{ public switchDemoString { } public static void main(String args[]) { String str = "world"; String s; switch((s = str).hashCode) { default: break; case 99162322: if(s.equals("hello")) System.out.println("hello"); break; case 113318802: if(s.equals("world")) System.out.println("world"); break; } }}

看到這個代碼,你知道原來字符串的switch是通過equals和hashCode方法來實現的。還好hashCode方法返回的是int,而不是long。

仔細看下可以發現,進行switch的實際是哈希值,然後通過使用equals方法比較進行安全檢查,這個檢查是必要的,因為哈希可能會發生碰撞。因此它的性能是不如使用枚舉進行switch或者使用純整數常量,但這也不是很差。

糖塊二、 泛型

我們都知道,很多語言都是支持泛型的,但是很多人不知道的是,不同的編譯器對於泛型的處理方式是不同的。

通常情況下,一個編譯器處理泛型有兩種方式:Code specialization和Code sharing。

C++和C#是使用Code specialization的處理機制,而Java使用的是Code sharing的機制。

Code sharing方式為每個泛型類型創建唯一的字節碼錶示,並且將該泛型類型的實例都映射到這個唯一的字節碼錶示上。將多種泛型類形實例映射到唯一的字節碼錶示是通過類型擦除(type erasue)實現的。

也就是說,對於Java虛擬機來說,他根本不認識Map<String, String> map這樣的語法。需要在編譯階段通過類型擦除的方式進行解語法糖。

類型擦除的主要過程如下:

  • 1.將所有的泛型參數用其最左邊界(最頂級的父類型)類型替換。

  • 2.移除所有的類型參數。

以下代碼:

Map<String, String> map = new HashMap<String, String>; map.put("name", "hollis"); map.put("wechat", "Hollis"); map.put("blog", "www.hollischuang.com");

解語法糖之後會變成:

Map map = new HashMap; map.put("name", "hollis"); map.put("wechat", "Hollis"); map.put("blog", "www.hollischuang.com");

以下代碼:

public static <A extends Comparable<A>> A max(Collection<A> xs) { Iterator<A> xi = xs.iterator; A w = xi.next; while (xi.hasNext) { A x = xi.next; if (w.compareTo(x) < 0) w = x; } return w;}

類型擦除後會變成:

 public static Comparable max(Collection xs){ Iterator xi = xs.iterator; Comparable w = (Comparable)xi.next; while(xi.hasNext) { Comparable x = (Comparable)xi.next; if(w.compareTo(x) < 0) w = x; } return w;}

虛擬機中沒有泛型,只有普通類和普通方法,所有泛型類的類型參數在編譯時都會被擦除,泛型類並沒有自己獨有的Class類對象。比如並不存在List<String>.class或是List<Integer>.class,而只有List.class。

糖塊三、 自動裝箱與拆箱

自動裝箱就是Java自動將原始類型值轉換成對應的對象,比如將int的變量轉換成Integer對象,這個過程叫做裝箱,反之將Integer對象轉換成int類型值,這個過程叫做拆箱。

因為這裡的裝箱和拆箱是自動進行的非人為轉換,所以就稱作為自動裝箱和拆箱。

原始類型byte, short, char, int, long, float, double 和 boolean 對應的封裝類為Byte, Short, Character, Integer, Long, Float, Double, Boolean。

先來看個自動裝箱的代碼:

 public static void main(String[] args) { int i = 10; Integer n = i;}

反編譯後代碼如下:

public static void main(String args[]){ int i = 10; Integer n = Integer.valueOf(i);}

再來看個自動拆箱的代碼:

public static void main(String[] args) {
Integer i = 10; int n = i;}

反編譯後代碼如下:

public static void main(String args[]){ Integer i = Integer.valueOf(10); int n = i.intValue;}

從反編譯得到內容可以看出,在裝箱的時候自動調用的是Integer的valueOf(int)方法。而在拆箱的時候自動調用的是Integer的intValue方法。

所以,裝箱過程是通過調用包裝器的valueOf方法實現的,而拆箱過程是通過調用包裝器的 xxxValue方法實現的。

糖塊四 、 方法變長參數

可變參數(variable arguments)是在Java 1.5中引入的一個特性。它允許一個方法把任意數量的值作為參數。

看下以下可變參數代碼,其中print方法接收可變參數:

public static void main(String[] args) { print("Holis", "公眾號:Hollis", "博客:www.hollischuang.com", "QQ:907607222"); }
public static void print(String... strs){ for (int i = 0; i < strs.length; i++) { System.out.println(strs[i]); }}

反編譯後代碼:

public static void main(String args[]){ print(new String[] { "Holis", "\\\\u516C\\\\u4F17\\\\u53F7:Hollis", "\\\\u535A\\\\u5BA2\\\\uFF1Awww.hollischuang.com", "QQ\\\\uFF1A907607222" });}
public static transient void print(String strs[]){ for(int i = 0; i < strs.length; i++) System.out.println(strs[i]);
}

從反編譯後代碼可以看出,可變參數在被使用的時候,他首先會創建一個數組,數組的長度就是調用該方法是傳遞的實參的個數,然後再把參數值全部放到這個數組當中,然後再把這個數組作為參數傳遞到被調用的方法中。

糖塊五 、 枚舉

Java SE5提供了一種新的類型-Java的枚舉類型,關鍵字enum可以將一組具名的值的有限集合創建為一種新的類型,而這些具名的值可以作為常規的程序組件使用,這是一種非常有用的功能。參考:Java的枚舉類型用法介紹

要想看源碼,首先得有一個類吧,那麼枚舉類型到底是什麼類呢?是enum嗎?

答案很明顯不是,enum就和class一樣,只是一個關鍵字,他並不是一個類。

那麼枚舉是由什麼類維護的呢,我們簡單的寫一個枚舉:

public enum t { SPRING,SUMMER;}

然後我們使用反編譯,看看這段代碼到底是怎麼實現的,反編譯後代碼內容如下:

public final class T extends Enum{ private T(String s, int i){ super(s, i); } public static T values { T at; int i; T at1; System.arraycopy(at = ENUM$VALUES, 0, at1 = new T[i = at.length], 0, i); return at1; }
public static T valueOf(String s){ return (T)Enum.valueOf(demo/T, s); }
public static final T SPRING; public static final T SUMMER; private static final T ENUM$VALUES; static { SPRING = new T("SPRING", 0); SUMMER = new T("SUMMER", 1); ENUM$VALUES = (new T[] { SPRING, SUMMER }); }}

通過反編譯後代碼我們可以看到,public final class T extends Enum,說明,該類是繼承了Enum類的,同時final關鍵字告訴我們,這個類也是不能被繼承的。

當我們使用enmu來定義一個枚舉類型的時候,編譯器會自動幫我們創建一個final類型的類繼承Enum類,所以枚舉類型不能被繼承。

糖塊六 、 內部類

內部類又稱為嵌套類,可以把內部類理解為外部類的一個普通成員。

內部類之所以也是語法糖,是因為它僅僅是一個編譯時的概念。

outer.java裡面定義了一個內部類inner,一旦編譯成功,就會生成兩個完全不同的.class文件了,分別是outer.class和outer$inner.class。所以內部類的名字完全可以和它的外部類名字相同。

public class OutterClass { private String userName;
public String getUserName { return userName; }
public void setUserName(String userName) { this.userName = userName; }
public static void main(String[] args) {
}
class InnerClass{ private String name;
public String getName { return name; }
public void setName(String name) { this.name = name; } }}

以上代碼編譯後會生成兩個class文件:OutterClass$InnerClass.class 、OutterClass.class 。

當我們嘗試使用jad對OutterClass.class文件進行反編譯的時候,命令行會打印以下內容:

Parsing OutterClass.class...Parsing inner class OutterClass$InnerClass.class...Generating OutterClass.jad

他會把兩個文件全部進行反編譯,然後一起生成一個OutterClass.jad文件。文件內容如下:

public class OutterClass{ class InnerClass{ public String getName{ return name; } public void setName(String name){ this.name = name; } private String name; final OutterClass this$0;
InnerClass { this.this$0 = OutterClass.this; super; } }
public OutterClass{ } public String getUserName{ return userName; } public void setUserName(String userName){ this.userName = userName; } public static void main(String args1[]){ } private String userName;}

糖塊七 、條件編譯

—般情況下,程序中的每一行代碼都要參加編譯。但有時候出於對程序代碼優化的考慮,希望只對其中一部分內容進行編譯,此時就需要在程序中加上條件,讓編譯器只對滿足條件的代碼進行編譯,將不滿足條件的代碼捨棄,這就是條件編譯。

如在C或CPP中,可以通過預處理語句來實現條件編譯。其實在Java中也可實現條件編譯。我們先來看一段代碼:

public class ConditionalCompilation { public static void main(String[] args) { final boolean DEBUG = true; if(DEBUG) { System.out.println("Hello, DEBUG!"); }
final boolean ONLINE = false;
if(ONLINE){ System.out.println("Hello, ONLINE!"); } }}

反編譯後代碼如下:

public class ConditionalCompilation{
public ConditionalCompilation{ }
public static void main(String args[]){ boolean DEBUG = true; System.out.println("Hello, DEBUG!"); boolean ONLINE = false; }}

首先,我們發現,在反編譯後的代碼中沒有System.out.println("Hello, ONLINE!");,這其實就是條件編譯。

當if(ONLINE)為false的時候,編譯器就沒有對其內的代碼進行編譯。

所以,Java語法的條件編譯,是通過判斷條件為常量的if語句實現的。根據if判斷條件的真假,編譯器直接把分支為false的代碼塊消除。通過該方式實現的條件編譯,必須在方法體內實現,而無法在正整個Java類的結構或者類的屬性上進行條件編譯。

這與C/C++的條件編譯相比,確實更有侷限性。在Java語言設計之初並沒有引入條件編譯的功能,雖有侷限,但是總比沒有更強。

糖塊八 、 斷言

在Java中,assert關鍵字是從JAVA SE 1.4 引入的,為了避免和老版本的Java代碼中使用了assert關鍵字導致錯誤,Java在執行的時候默認是不啟動斷言檢查的(這個時候,所有的斷言語句都將忽略!)。

如果要開啟斷言檢查,則需要用開關-enableassertions或-ea來開啟。

看一段包含斷言的代碼:

public class AssertTest { public static void main(String args[]) { int a = 1; int b = 1; assert a == b; System.out.println("公眾號:Hollis"); assert a != b : "Hollis"; System.out.println("博客:www.hollischuang.com"); }}

反編譯後代碼如下:

public class AssertTest { public AssertTest { } public static void main(String args[]){ int a = 1; int b = 1; if(!$assertionsDisabled && a != b) throw new AssertionError; System.out.println("\\\\u516C\\\\u4F17\\\\u53F7\\\\uFF1AHollis"); if(!$assertionsDisabled && a == b) { throw new AssertionError("Hollis"); } else { System.out.println("\\\\u535A\\\\u5BA2\\\\uFF1Awww.hollischuang.com"); return; }}
static final boolean $assertionsDisabled = !com/hollis/suguar/AssertTest.desiredAssertionStatus;}

很明顯,反編譯之後的代碼要比我們自己的代碼複雜的多。所以,使用了assert這個語法糖我們節省了很多代碼。

其實斷言的底層實現就是if語言,如果斷言結果為true,則什麼都不做,程序繼續執行,如果斷言結果為false,則程序拋出AssertError來打斷程序的執行。

-enableassertions會設置$assertionsDisabled字段的值。

糖塊九 、 數值字面量

在java 7中,數值字面量,不管是整數還是浮點數,都允許在數字之間插入任意多個下劃線。這些下劃線不會對字面量的數值產生影響,目的就是方便閱讀。

比如:

public class Test { public static void main(String... args) { int i = 10_000; System.out.println(i); }}

反編譯後:

public class Test{ public static void main(String[] args) { int i = 10000; System.out.println(i); }}

反編譯後就是把_刪除了。也就是說編譯器並不認識在數字字面量中的_,需要在編譯階段把他去掉。

糖塊十 、 for-each

增強for循環(for-each)相信大家都不陌生,日常開發經常會用到的,他會比for循環要少寫很多代碼,那麼這個語法糖背後是如何實現的呢?

public static void main(String... args) { String strs = {"Hollis", "公眾號:Hollis", "博客:www.hollischuang.com"}; for (String s : strs) { System.out.println(s); } List<String> strList = ImmutableList.of("Hollis", "公眾號:Hollis", "博客:www.hollischuang.com"); for (String s : strList) { System.out.println(s); }}

反編譯後代碼如下:

public static transient void main(String args[]){ String strs = { "Hollis", "\\\\u516C\\\\u4F17\\\\u53F7\\\\uFF1AHollis", "\\\\u535A\\\\u5BA2\\\\uFF1Awww.hollischuang.com" }; String args1 = strs; int i = args1.length; for(int j = 0; j < i; j++) { String s = args1[j]; System.out.println(s); }
List strList = ImmutableList.of("Hollis", "\\\\u516C\\\\u4F17\\\\u53F7\\\\uFF1AHollis", "\\\\u535A\\\\u5BA2\\\\uFF1Awww.hollischuang.com"); String s; for(Iterator iterator = strList.iterator; iterator.hasNext; System.out.println(s)) s = (String)iterator.next;
}

代碼很簡單,for-each的實現原理其實就是使用了普通的for循環和迭代器。

糖塊十一 、 try-with-resource

Java裡,對於文件操作IO流、數據庫連接等開銷非常昂貴的資源,用完之後必須及時通過close方法將其關閉,否則資源會一直處於打開狀態,可能會導致內存洩露等問題。

關閉資源的常用方式就是在finally塊裡是釋放,即調用close方法。比如,我們經常會寫這樣的代碼:

public static void main(String[] args) { BufferedReader br = ; try { String line; br = new BufferedReader(new FileReader("d:\\\\hollischuang.xml")); while ((line = br.readLine) != ) { System.out.println(line); } } catch (IOException e) { // handle exception } finally { try { if (br != ) { br.close; } } catch (IOException ex) { // handle exception } }}

從Java 7開始,jdk提供了一種更好的方式關閉資源,使用try-with-resources語句,改寫一下上面的代碼,效果如下:

public static void main(String... args) { try (BufferedReader br = new BufferedReader(new FileReader("d:\\\\ hollischuang.xml"))) { String line; while ((line = br.readLine) != ) { System.out.println(line); } } catch (IOException e) { // handle exception }}

看,這簡直是一大福音啊,雖然我之前一般使用IOUtils去關閉流,並不會使用在finally中寫很多代碼的方式,但是這種新的語法糖看上去好像優雅很多呢。

反編譯以上代碼,看下他的背後原理:

public static transient void main(String args[]) { BufferedReader br; Throwable throwable; br = new BufferedReader(new FileReader("d:\\\\ hollischuang.xml")); throwable = ; String line; try { while((line = br.readLine) != ) System.out.println(line); } catch(Throwable throwable2) { throwable = throwable2; throw throwable2; } if(br != ) if(throwable != ) try { br.close; } catch(Throwable throwable1) { throwable.addSuppressed(throwable1); } else br.close; break MISSING_BLOCK_LABEL_113; Exception exception; exception; if(br != ) if(throwable != ) try { br.close; } catch(Throwable throwable3) { throwable.addSuppressed(throwable3); } else br.close; throw exception; IOException ioexception; ioexception; }}

其實背後的原理也很簡單,那些我們沒有做的關閉資源的操作,編譯器都幫我們做了。

所以,再次印證了,語法糖的作用就是方便程序員的使用,但最終還是要轉成編譯器認識的語言。

糖塊十二、Lambda表達式

關於lambda表達式,有人可能會有質疑,因為網上有人說他並不是語法糖。其實我想糾正下這個說法。

Labmda表達式不是匿名內部類的語法糖,但是他也是一個語法糖。實現方式其實是依賴了幾個JVM底層提供的lambda相關api。

先來看一個簡單的lambda表達式。遍歷一個list:

public static void main(String... args) { List<String> strList = ImmutableList.of("Hollis", "公眾號:Hollis", "博客:www.hollischuang.com");
strList.forEach( s -> { System.out.println(s); } );}

為啥說他並不是內部類的語法糖呢,前面講內部類我們說過,內部類在編譯之後會有兩個class文件,但是,包含lambda表達式的類編譯後只有一個文件。

反編譯後代碼如下:

public static /* varargs */ void main(String ... args) { ImmutableList strList = ImmutableList.of((Object)"Hollis", (Object)"\\\公\\\眾\\\號\\\:Hollis", (Object)"\\\博\\\客\\\:www.hollischuang.com"); strList.forEach((Consumer<String>)LambdaMetafactory.metafactory(, , , (Ljava/lang/Object;)V, lambda$main$0(java.lang.String ), (Ljava/lang/String;)V));}
private static /* synthetic */ void lambda$main$0(String s) { System.out.println(s);}

可以看到,在forEach方法中,其實是調用了java.lang.invoke.LambdaMetafactory#metafactory方法,該方法的第四個參數implMethod指定了方法實現。可以看到這裡其實是調用了一個lambda$main$0方法進行了輸出。

再來看一個稍微複雜一點的,先對List進行過濾,然後再輸出:

public static void main(String... args) { List<String> strList = ImmutableList.of("Hollis", "公眾號:Hollis", "博客:www.hollischuang.com"); List HollisList = strList.stream.filter(string -> string.contains("Hollis")).collect(Collectors.toList); HollisList.forEach( s -> { System.out.println(s); } );}

反編譯後代碼如下:

public static /* varargs */ void main(String ... args) { ImmutableList strList = ImmutableList.of((Object)"Hollis", (Object)"\\\公\\\眾\\\號\\\:Hollis", (Object)"\\\博\\\客\\\:www.hollischuang.com"); List<Object> HollisList = strList.stream.filter((Predicate<String>)LambdaMetafactory.metafactory(, , , (Ljava/lang/Object;)Z, lambda$main$0(java.lang.String ), (Ljava/lang/String;)Z)).collect(Collectors.toList); HollisList.forEach((Consumer<Object>)LambdaMetafactory.metafactory(, , , (Ljava/lang/Object;)V, lambda$main$1(java.lang.Object ), (Ljava/lang/Object;)V));}
private static /* synthetic */ void lambda$main$1(Object s) { System.out.println(s);}
private static /* synthetic */ boolean lambda$main$0(String string) { return string.contains("Hollis");}

兩個lambda表達式分別調用了lambda$main$1和lambda$main$0兩個方法。

所以,lambda表達式的實現其實是依賴了一些底層的api,在編譯階段,編譯器會把lambda表達式進行解糖,轉換成調用內部api的方式。

可能遇到的坑

泛型——當泛型遇到重載

public class GenericTypes {
public static void method(List<String> list) { System.out.println("invoke method(List<String> list)"); }
public static void method(List<Integer> list) { System.out.println("invoke method(List<Integer> list)"); } }

上面這段代碼,有兩個重載的函數,因為他們的參數類型不同,一個是List

泛型——當泛型遇到catch

泛型的類型參數不能用在Java異常處理的catch語句中。因為異常處理是由JVM在運行時刻來進行的。由於類型信息被擦除,JVM是無法區分兩個異常類型MyException<String>和MyException<Integer>的

泛型—當泛型內包含靜態變量

public class StaticTest{ public static void main(String[] args){ GT<Integer> gti = new GT<Integer>; gti.var=1; GT<String> gts = new GT<String>; gts.var=2; System.out.println(gti.var); }}class GT<T>{ public static int var=0; public void nothing(T x){}}

以上代碼輸出結果為:2!由於經過類型擦除,所有的泛型類實例都關聯到同一份字節碼上,泛型類的所有靜態變量是共享的。

自動裝箱與拆箱——對象相等比較

public static void main(String[] args) { Integer a = 1000; Integer b = 1000; Integer c = 100; Integer d = 100; System.out.println("a == b is " + (a == b)); System.out.println(("c == d is " + (c == d)));}

輸出結果:

a == b is falsec == d is true

在Java 5中,在Integer的操作上引入了一個新功能來節省內存和提高性能。整型對象通過使用相同的對象引用實現了緩存和重用。

適用於整數值區間-128 至 +127。

只適用於自動裝箱。使用構造函數創建對象不適用。

增強for循環

for (Student stu : students) {  if (stu.getId == 2)  students.remove(stu); }

會拋出ConcurrentModificationException異常。

Iterator是工作在一個獨立的線程中,並且擁有一個 mutex 鎖。Iterator被創建之後會建立一個指向原來對象的單鏈索引表,當原來的對象數量發生變化時,這個索引表的內容不會同步改變,所以當索引指針往後移動的時候就找不到要迭代的對象,所以按照 fail-fast 原則 Iterator 會馬上拋出java.util.ConcurrentModificationException異常。

所以 Iterator 在工作的時候是不允許被迭代的對象被改變的。但你可以使用 Iterator 本身的方法remove來刪除對象,Iterator.remove 方法會在刪除當前迭代對象的同時維護索引的一致性。

總結

前面介紹了12種Java中常用的語法糖。所謂語法糖就是提供給開發人員便於開發的一種語法而已。

但是這種語法只有開發人員認識。要想被執行,需要進行解糖,即轉成JVM認識的語法。

當我們把語法糖解糖之後,你就會發現其實我們日常使用的這些方便的語法,其實都是一些其他更簡單的語法構成的。

有了這些語法糖,我們在日常開發的時候可以大大提升效率,但是同時也要避免過渡使用。使用之前最好了解下原理,避免掉坑。

如果喜歡本篇文章,歡迎轉發、點贊、留言。關注訂閱號「Web項目聚集地」,回覆「技術博文」即可獲取更多圖文教程、技術博文。

"

相關推薦

推薦中...