導讀:很多程序員處理文本而不是數字。文本包含字符:字母、數字、標點符號、空格等。字符串是一系列字符。例如,字符串"Hello"是一個包含5個字符的序列。
作者:凱·霍斯特曼(Cay Horstmann),蘭斯·尼塞斯(Rance Necaise)
如需轉載請聯繫華章科技
01 字符串類型
你在輸出語句的介紹中已經見過字符串了,例如
print("Hello")
字符串可以保存在變量中
greeting = "Hello"
然後就可以在需要的時候像數字值一樣來訪問:
print(greeting)
字符串常量表示一個特定的字符串(例如"Hello"),就像數字常量(例如2)表示一個特定的數字一樣。在Python中,字符串常量由包含在一對單引號或雙引號中的字符序列來指定。
print("This is a string.", 'So is this.')
因為允許使用兩種界定符,Python可以很容易地在字符串中包含撇號或者引號。
message = 'He said "Hello" '
我們使用雙引號來包含字符串,因為這在很多其他編程語言中是一個通用的約定。然而,在交互式Python解釋器環境中總是使用單引號來顯示字符串。
字符串中字符的數量稱作字符串的長度。例如,"Harry"的長度是5。你可以使用Python內置函數len來計算一個字符串的長度:
length = len("World!") # 長度為6
長度為0的字符串稱作空字符串,它不包含字符,寫作:
""
或者
''
02 連接與重複
給定兩個字符串,例如"Harry"和"Morgan",你可以把它們連接成一個字符串,結果中包含兩個字符串中的所有字符,其中第一個字符串中的字符在前,第二個字符串中的字符在後。在Python中,你可以使用+運算符連接兩個字符串。例如:
firstName = "Harry"
lastName = "Morgan"
name = firstName + lastName
結果字符串為
"HarryMorgan"
如果你想在名和姓之間使用空格進行分隔該怎麼做?沒問題:
name = firstName + " " + lastName
這個語句連接了3個字符串:firstName、字符串常量" "和lastName。結果是
"Harry Morgan"
如果+運算符的左側或右側的表達式是字符串,那麼另一側的表達式也必須是字符串,否則會導致語法錯誤。你不能把字符串和數字連接到一起。
你也可以通過對一個字符串進行多次重複來產生字符串。例如,假設你需要打印一行破折線。不需要指定一個包含50個破折線的字符串常量,你可以使用*運算符來創建一個包含50個"-"字符的字符串。例如,
dashes = "-" * 50
結果是字符串
"-------------------------------------------------"
任意長度的字符串都可以使用*運算符進行重複。例如,語句
message = "Echo..."
print(message * 5)
顯示
Echo...Echo...Echo...Echo...Echo...
與字符串相乘的因子必須是整數值,並且可以出現在*運算符的任意一側,但是習慣上把字符串放在左側而整數因子放在右側。
03 轉換數字和字符串
有時候需要把數字轉換為字符串。例如,假設你需要在字符串尾部追加一個數字。你不能連接字符串和數字:
name = "Agent " + 1729 # 錯誤:只能連接字符串
因為字符串連接只能在兩個字符串之間進行,我們必須首先把數字轉換為字符串。
為了生成數字值的字符串表示,使用函數str。語句
str(1729)
把整數1729轉換為"1729",函數str解決了我們的問題:
id = 1729
name = "Agent " + str(id)
函數str也可以用來把浮點數轉換為字符串。
反過來,為了把包含數字的字符串轉換為數字值,可以使用函數int或float:
id = int("1729")
price = float("17.29")
當字符串來自於用戶輸入時,這個轉換很重要。
傳遞給函數int或float的字符串只能包含隱含類型的常量。例如,語句
value = float("17x29")
會產生運行時錯誤,因為字母"x"不是浮點數常量的一部分。
前面和後面的空白字符會被忽略:
int(" 1729 ")
仍然是1729。
04 字符串與字符
字符串是Unicode字符的序列。你可以使用字符串和位置來訪問單個字符,這個位置稱作字符的索引。
第1個字符的索引是0,第2個的索引是1,以此類推。
通過特殊的下標記號可以訪問單個字符,位置被放置在方括號中。例如,變量name定義如下:
name = "Harry"
語句
first = name[0]
last = name[4]
從字符串中提取了兩個不同的字符。第一個語句提取出字符串的第一個字符"H"並存入變量first。第二個語句提取位置4上面的字符,也就是最後一個字符,然後存入變量last。
索引值必須位於字符位置的合法範圍,否則會在運行時拋出下標越界異常。函數len可以用來確定最後一個索引,或者字符串的最後一個字符。
pos = len(name) - 1 # "Harry"的長度是5
last = name[pos] # last被設置為"y"
下面的程序演示了上面概念的用法,程序使用字符串初始化了兩個變量,一個使用你的名字,另一個使用你認為比較重要的人的,然後輸出首字母。
操作first[0]得到包含first第一個字母的字符串,second[0]獲取第二個名字的首字母。最後,使用字符串"&"連接兩個單字母的字符串得到長度為3的字符串initials(見圖2-4)。
##
# 本程序用來輸出一對首字母
#
# 設置兩個名字
first = "Rodolfo"
second = "Sally"
# 計算和顯示首字母
initials = first[0] + "&" + second[0]
print(initials)
字符串運算示例見表2-7。
05 字符串方法
在計算機編程中,對象是表示具有特定行為的值的實體。值可以很簡單,像字符串。也可以很複雜,像圖形窗口或數據文件。現在,你需要掌握適用於字符串對象的一小部分內容。
對象的行為通過方法來指定。方法和函數很類似,是執行特定任務的一系列程序指令。但是與函數不同的是,方法只能用於定義好的類型的對象,而函數則是獨立的操作。例如,你可以把upper方法應用於任何字符串,就像
name = "John Smith"
uppercaseName = name.upper() # 把uppercaseName設置為"JOHN SMITH"
注意,方法名緊跟在對象之後,並且使用一個圓點(.)分隔對象和方法名。
另一個方法lower可以用來返回一個字符串的小寫版本:
print(name.lower()) # 輸出john smith
至於什麼時候需要調用函數(例如len(name))和什麼時候調用方法(name.lower()),可能稍微有點武斷。你需要進行簡單的記憶,在打印版或者在線Python參考資料中進行查找。
像函數調用一樣,方法調用也可以有參數。例如,字符串方法replace創建一個新字符串,其中給定子字符串的每次出現都被替換為第二個字符串。下面是該方法具有兩個參數的調用:
name2 = name.replace("John", "Jane") # 把name2設置為"Jane Smith"
注意任何方法的調用都不能修改字符串的值。調用name.upper()之後,變量name的值仍然是"John Smith",該方法的調用返回大寫版本。類似地,replace方法返回替換後的新字符串,不會對原字符串做任何修改。
以下列出本節中介紹的字符串方法:
- s.lower():字符串s的小寫版本
- s.upper():字符串s的大寫版本
- s.replace(old, new):返回一個新字符串,其中子字符串old在s中的每次出現都被替換為字符串new
關於作者: 凱·霍斯特曼(Cay Horstmann) ,聖何塞州立大學計算機科學系教授,Java的倡導者,經常在開發人員會議上發表演講。他是《Java核心技術》的作者,同時也關注Python、Scala、C++等語言,為專業程序員和計算機科學專業學生編寫過數十本圖書。
蘭斯·尼塞斯(Rance Necaise) 蘭道爾夫-麥肯學院計算機科學系副教授,撰寫了《Data Structures and Algorithms Using Python》和《Python for Java Programmers》等技術書籍。
本文摘編自《Python程序設計(原書第2版)》,經出版方授權發佈。
推薦語:專為Python初學者打造的入門教材,講解清晰實用,案例豐富有趣。