在 Go 语言编程中,字符串是最基本、最常用的数据类型之一。无论是处理用户输入、读取文件内容,还是生成输出,字符串操作无处不在。为了方便开发者对字符串进行各种操作,Go 语言提供了强大的 strings 包和 strconv 包。strings 包包含了一系列函数,用于处理和操作字符串,如查找、替换、分割、拼接等。strconv 包则专注于字符串与其他基本数据类型之间的转换,使得数据处理更加简洁高效。在这篇文章中,我们将深入探讨 Go 语言中的字符串处理方法,并详细介绍 strings 包和 strconv 包的主要功能和用法,帮助您更好地掌握字符串操作技巧,提高编程效率。
文章目录
- 1、Go 语言中的字符串
- 1.1、GO 语言
- 1.2、字符串字面值
- 1.3、字符串比较和操作
- 1.4、字符串拼接
- 1.5、字符串的其他操作
- 1.6、示例:统计字节和字符
- 2、strings 和 strconv 包
- 2.1、strings 包
- 2.1.1、前缀和后缀
- 2.1.2、字符串包含关系
- 2.1.3、判断子字符串或字符在父字符串中出现的位置(索引)
- 2.1.4、字符串替换
- 2.1.5、统计字符串出现次数
- 2.1.6、重复字符串
- 2.1.7、修改字符串大小写
- 2.1.8、修剪字符串
- 2.1.9、分割字符串
- 2.1.10、拼接 slice 到字符串
- 2.1.11、从字符串中读取内容
- 2.2、strconv 包
- 2.2.1、将其他类型转换为字符串
- 2.2.2、将字符串转换为其他类型
1、Go 语言中的字符串
1.1、GO 语言
在 Go 语言中,字符串是 UTF-8 编码字符的序列。对于 ASCII 字符,每个字符占用 1 个字节,而其他字符根据需要占用 2 至 4 个字节。UTF-8 是一种广泛使用的编码格式,许多标准文本文件(如 XML 和 JSON)都采用这种编码。由于 UTF-8 编码的可变长度特性,Go 语言中的字符串也可能占用 1 到 4 个字节,这与 C++、Java 或 Python 不同(例如,Java 始终使用 2 个字节)。这种设计不仅减少了内存和硬盘空间的占用,还免去了对 UTF-8 文本进行编码和解码的繁琐操作。
字符串在 Go 中是一种值类型,且值不可变。这意味着一旦创建了字符串,就不能修改其内容。更深入地讲,字符串是字节的定长数组。
1.2、字符串字面值
Go 支持两种形式的字符串字面值:
解释字符串(Interpreted Strings):
- 使用双引号括起来。
- 转义字符会被替换,例如:\n 表示换行符,\t 表示制表符,\u 或 \U 表示 Unicode 字符,\\ 表示反斜杠本身。
示例:
var str = "Hello, World!\n"
非解释字符串(Raw Strings):
- 使用反引号括起来。
- 支持多行字符串,转义字符不会被替换,所有内容都会原样输出。
示例:
var rawStr = `This is a raw string \n`
在 Go 中,字符串是通过长度来限定的,而不是像 C/C++ 那样通过特殊字符 \0 结束。string 类型的零值是长度为零的字符串,即空字符串 ""。
1.3、字符串比较和操作
字符串可以通过常见的比较运算符(==、!=、<、<=、>=、>)按字节在内存中进行比较。可以使用 len() 函数获取字符串的字节长度:
len("hello") // 5
字符串的内容(字节)可以通过索引访问,索引从 0 开始:
var str = "hello" str[0] // 'h' str[len(str)-1] // 'o'
需要注意的是,这种索引方式只对纯 ASCII 字符串有效。对于 Unicode 字符,需要使用 unicode/utf8 包提供的方法。
1.4、字符串拼接
字符串可以使用 + 运算符拼接:
var s1 = "hello" var s2 = "world" var s = s1 + " " + s2 // "hello world"
也可以使用 += 运算符进行拼接:
var s = "hello" s += ", " s += "world!" // "hello, world!"
在循环中使用 + 进行字符串拼接并不是最高效的方法。更好的方法是使用 strings.Join() 函数,或者使用 bytes.Buffer 进行高效的字符串拼接。
1.5、字符串的其他操作
在 Go 语言中,可以将字符串视为字节(byte)的切片(slice),从而实现标准索引操作。使用 for 循环可以根据索引返回字符串中的字节。而使用 for-range 循环可以对 Unicode 字符串进行迭代操作。
此外,Go 语言提供了丰富的字符串操作函数和方法,可以在标准库的 strings 和 unicode/utf8 包中找到。例如,可以使用 fmt.Sprint(x) 来格式化生成并返回字符串。
1.6、示例:统计字节和字符
创建一个程序用于统计字符串中的字节和字符数量。例如,分析字符串 "asSASA ddd dsjkdsjs dk" 和 "asSASA ddd dsjkdsjsこん dk",并解释两者不同的原因(提示:使用 unicode/utf8 包)。
示例代码:
package main import ( "fmt" "unicode/utf8" ) func main() { str1 := "asSASA ddd dsjkdsjs dk" str2 := "asSASA ddd dsjkdsjsこん dk" fmt.Printf("String: %s\n", str1) fmt.Printf("Bytes: %d, Runes: %d\n", len(str1), utf8.RuneCountInString(str1)) fmt.Printf("String: %s\n", str2) fmt.Printf("Bytes: %d, Runes: %d\n", len(str2), utf8.RuneCountInString(str2)) }
该程序统计并输出字符串的字节数和字符(rune)数,从而展示 UTF-8 编码在处理不同字符时的差异。
2、strings 和 strconv 包
在 Go 语言中,字符串作为一种基本数据结构,有许多预定义的处理函数。strings 包用于对字符串进行主要操作,而 strconv 包用于字符串与其他类型之间的转换。
2.1、strings 包
strings 包提供了丰富的字符串操作函数,以下是一些常用操作:
2.1.1、前缀和后缀
- strings.HasPrefix(s, prefix string) bool:判断字符串 s 是否以 prefix 开头。
- strings.HasSuffix(s, suffix string) bool:判断字符串 s 是否以 suffix 结尾。
示例:
package main import ( "fmt" "strings" ) func main() { str := "This is an example of a string" fmt.Printf("T/F? Does the string \"%s\" have prefix %s? ", str, "Th") fmt.Printf("%t\n", strings.HasPrefix(str, "Th")) }
输出:
T/F? Does the string "This is an example of a string" have prefix Th? true
2.1.2、字符串包含关系
- strings.Contains(s, substr string) bool:判断字符串 s 是否包含子字符串 substr。
2.1.3、判断子字符串或字符在父字符串中出现的位置(索引)
- strings.Index(s, str string) int:返回子字符串 str 在字符串 s 中的第一个出现位置的索引,-1 表示不包含。
- strings.LastIndex(s, str string) int:返回子字符串 str 在字符串 s 中最后一次出现位置的索引,-1 表示不包含。
- strings.IndexRune(s string, r rune) int:返回字符 r 在字符串 s 中的索引。
示例:
package main import ( "fmt" "strings" ) func main() { str := "Hi, I'm Marc, Hi." fmt.Printf("The position of \"Marc\" is: %d\n", strings.Index(str, "Marc")) fmt.Printf("The position of the first instance of \"Hi\" is: %d\n", strings.Index(str, "Hi")) fmt.Printf("The position of the last instance of \"Hi\" is: %d\n", strings.LastIndex(str, "Hi")) fmt.Printf("The position of \"Burger\" is: %d\n", strings.Index(str, "Burger")) }
输出:
The position of "Marc" is: 8 The position of the first instance of "Hi" is: 0 The position of the last instance of "Hi" is: 14 The position of "Burger" is: -1
2.1.4、字符串替换
- strings.Replace(str, old, new string, n int) string:将字符串 str 中的前 n 个字符串 old 替换为字符串 new,并返回一个新的字符串。如果 n = -1,则替换所有字符串 old。
2.1.5、统计字符串出现次数
- strings.Count(s, str string) int:计算字符串 str 在字符串 s 中出现的非重叠次数。
示例:
package main import ( "fmt" "strings" ) func main() { str := "Hello, how is it going, Hugo?" manyG := "gggggggggg" fmt.Printf("Number of H's in %s is: %d\n", str, strings.Count(str, "H")) fmt.Printf("Number of double g's in %s is: %d\n", manyG, strings.Count(manyG, "gg")) }
输出:
Number of H's in Hello, how is it going, Hugo? is: 2 Number of double g’s in gggggggggg is: 5
2.1.6、重复字符串
- strings.Repeat(s, count int) string:返回一个新的字符串,该字符串由 count 次重复字符串 s 组成。
示例:
package main import ( "fmt" "strings" ) func main() { origS := "Hi there! " newS := strings.Repeat(origS, 3) fmt.Printf("The new repeated string is: %s\n", newS) }
输出:
The new repeated string is: Hi there! Hi there! Hi there!
2.1.7、修改字符串大小写
- strings.ToLower(s) string:将字符串 s 中的所有 Unicode 字符转换为小写。
- strings.ToUpper(s) string:将字符串 s 中的所有 Unicode 字符转换为大写。
示例:
package main import ( "fmt" "strings" ) func main() { orig := "Hey, how are you George?" fmt.Printf("The original string is: %s\n", orig) fmt.Printf("The lowercase string is: %s\n", strings.ToLower(orig)) fmt.Printf("The uppercase string is: %s\n", strings.ToUpper(orig)) }
输出:
The original string is: Hey, how are you George? The lowercase string is: hey, how are you george? The uppercase string is: HEY, HOW ARE YOU GEORGE?
2.1.8、修剪字符串
- strings.TrimSpace(s):剔除字符串开头和结尾的空白符号。
- strings.Trim(s, cutset):剔除字符串开头和结尾的指定字符 cutset。
- strings.TrimLeft(s, cutset):剔除字符串开头的指定字符 cutset。
- strings.TrimRight(s, cutset):剔除字符串结尾的指定字符 cutset。
2.1.9、分割字符串
- strings.Fields(s):根据空白符分割字符串,返回一个字符串切片。
- strings.Split(s, sep):根据指定的分隔符 sep 分割字符串,返回一个字符串切片。
示例:
package main import ( "fmt" "strings" ) func main() { str := "The quick brown fox jumps over the lazy dog" sl := strings.Fields(str) fmt.Printf("Splitted in slice: %v\n", sl) for _, val := range sl { fmt.Printf("%s - ", val) } fmt.Println() str2 := "GO1|The ABC of Go|25" sl2 := strings.Split(str2, "|") fmt.Printf("Splitted in slice: %v\n", sl2) for _, val := range sl2 { fmt.Printf("%s - ", val) } fmt.Println() str3 := strings.Join(sl2, ";") fmt.Printf("sl2 joined by ;: %s\n", str3) }
输出:
Splitted in slice: [The quick brown fox jumps over the lazy dog] The - quick - brown - fox - jumps - over - the - lazy - dog - Splitted in slice: [GO1 The ABC of Go 25] GO1 - The ABC of Go - 25 - sl2 joined by ;: GO1;The ABC of Go;25
2.1.10、拼接 slice 到字符串
- strings.Join(sl []string, sep string) string:将元素类型为 string 的 slice 使用分割符 sep 拼接成一个字符串。
2.1.11、从字符串中读取内容
- strings.NewReader(str):生成一个 Reader 并读取字符串中的内容,然后返回指向该 Reader 的指针。
示例:
package main import ( "fmt" "strings" ) func main() { str := "The quick brown fox jumps over the lazy dog" sl := strings.Fields(str) fmt.Printf("Splitted in slice: %v\n", sl) for _, val := range sl { fmt.Printf("%s - ", val) } fmt.Println() str2 := "GO1|The ABC of Go|25" sl2 := strings.Split(str2, "|") fmt.Printf("Splitted in slice: %v\n", sl2) for _, val := range sl2 { fmt.Printf("%s - ", val) } fmt.Println() str3 := strings.Join(sl2,";") fmt.Printf("sl2 joined by ;: %s\n", str3) }
输出:
Splitted in slice: [The quick brown fox jumps over the lazy dog] The - quick - brown - fox - jumps - over - the - lazy - dog - Splitted in slice: [GO1 The ABC of Go 25] GO1 - The ABC of Go - 25 - sl2 joined by ;: GO1;The ABC of Go;25
更多字符串操作的文档请参阅官方文档。
2.2、strconv 包
strconv 包用于字符串与其他基本数据类型之间的转换。
2.2.1、将其他类型转换为字符串
- strconv.Itoa(i int) string:将整数转换为字符串。
- strconv.FormatFloat(f float64, fmt byte, prec int, bitSize int) string:将浮点数转换为字符串,fmt 表示格式,prec 表示精度,bitSize 用于区分 float32 和 float64。
示例:
package main import ( "fmt" "strconv" ) func main() { var i int = 123 var f float64 = 3.14159 s1 := strconv.Itoa(i) s2 := strconv.FormatFloat(f, 'f', -1, 64) fmt.Printf("Integer to string: %s\n", s1) fmt.Printf("Float to string: %s\n", s2) }
输出:
Integer to string: 123 Float to string: 3.14159
2.2.2、将字符串转换为其他类型
- strconv.Atoi(s string) (int, error):将字符串转换为整数。
- strconv.ParseFloat(s string, bitSize int) (float64, error):将字符串转换为浮点数。
示例:
package main import ( "fmt" "strconv" ) func main() { var str string = "666" var anInt int var newStr string anInt, _ = strconv.Atoi(str) fmt.Printf("The integer is: %d\n", anInt) anInt += 5 newStr = strconv.Itoa(anInt) fmt.Printf("The new string is: %s\n", newStr) }
输出:
The integer is: 666 The new string is: 671
strconv 包中还包含了一些辅助变量,如 strconv.IntSize,用于获取当前平台下 int 类型的大小(位数)。
通过 strings 和 strconv 包的强大功能,Go 语言提供了丰富的字符串处理和转换工具,使得开发者能够高效地处理和转换字符串数据。
- strings.NewReader(str):生成一个 Reader 并读取字符串中的内容,然后返回指向该 Reader 的指针。
- strings.Join(sl []string, sep string) string:将元素类型为 string 的 slice 使用分割符 sep 拼接成一个字符串。
- strings.Repeat(s, count int) string:返回一个新的字符串,该字符串由 count 次重复字符串 s 组成。
- strings.Count(s, str string) int:计算字符串 str 在字符串 s 中出现的非重叠次数。
- strings.Replace(str, old, new string, n int) string:将字符串 str 中的前 n 个字符串 old 替换为字符串 new,并返回一个新的字符串。如果 n = -1,则替换所有字符串 old。
- strings.Contains(s, substr string) bool:判断字符串 s 是否包含子字符串 substr。
还没有评论,来说两句吧...