golang标准库每日一库之strings(golang 字符串操作)
myzbx 2025-06-28 15:26 3 浏览
以下为 Go语言 strings 包的深度解析,涵盖字符串切割、替换、查找等核心操作及高效处理技巧:
一、基础字符串操作
1. 字符串切割(Split)
函数 | 作用描述 | 示例 |
strings.Split(s, sep) | 按分隔符切割字符串,返回切片(包含空字符串) | Split("a,b,c", ",") → ["a", "b", "c"] |
strings.SplitN(s, sep, n) | 切割为最多n个子串(n<0时等价于Split) | SplitN("a,b,c", ",", 2) → ["a", "b,c"] |
strings.Fields(s) | 按空白字符切割(多个空格视为一个分隔符) | Fields("Go is\t fast") → ["Go", "is", "fast"] |
strings.Cut(s, sep) | 将字符串分割为前缀和后缀(Go 1.18+) | Cut("key=value", "=") → ("key", "value", true) |
示例代码:
// 切割CSV数据
csv := "Alice,30,Engineer"
parts := strings.Split(csv, ",") // ["Alice", "30", "Engineer"]
// 提取域名
url := "https://example.com/path"
prefix, suffix, found := strings.Cut(url, "://") // prefix="https", suffix="example.com/path", found=true
二、字符串替换与变形
1. 替换操作
函数 | 作用描述 | 示例 |
strings.Replace(s, old, new, n) | 替换前n次匹配(n=-1时替换全部) | Replace("no no no", "no", "yes", 2) → "yes yes no" |
strings.ReplaceAll(s, old, new) | 替换所有匹配项(等价于Replace n=-1) | ReplaceAll("Golang", "g", "G") → "GolanG" |
strings.Map(mapping func(rune) rune, s) | 对每个字符应用映射函数 | Map(unicode.ToUpper, "hello") → "HELLO" |
示例代码:
// 敏感词过滤
text := "This is a bad word"
cleanText := strings.ReplaceAll(text, "bad", "***") // "This is a *** word"
// 自定义字符转换
rot13 := func(r rune) rune {
switch {
case r >= 'A' && r <= 'Z':
return 'A' + (r-'A'+13)%26
case r >= 'a' && r <= 'z':
return 'a' + (r-'a'+13)%26
}
return r
}
fmt.Println(strings.Map(rot13, "Uryyb Jbeyq!")) // "Hello World!"
三、字符串查找与判断
1. 查找方法
函数 | 作用描述 | 示例 |
strings.Contains(s, substr) | 判断是否包含子串 | Contains("hello", "lo") → true |
strings.HasPrefix(s, prefix) | 判断是否以指定前缀开头 | HasPrefix("http://", "http") → true |
strings.HasSuffix(s, suffix) | 判断是否以指定后缀结尾 | HasSuffix("image.png", ".png") → true |
strings.Index(s, substr) | 返回子串首次出现的索引(-1表示未找到) | Index("golang", "lang") → 2 |
strings.LastIndex(s, substr) | 返回子串最后一次出现的索引 | LastIndex("go go", "go") → 3 |
示例代码:
// 文件扩展名检查
filename := "report.pdf"
if strings.HasSuffix(filename, ".pdf") {
fmt.Println("PDF文件")
}
// 快速查找优化
if strings.ContainsRune("golang@123", '@') { // 比Contains("...", "@")更高效
fmt.Println("包含特殊字符")
}
四、高效处理技巧
1. 字符串拼接优化
方法 | 适用场景 | 性能对比 |
+ 运算符 | 少量固定字符串拼接 | 每次操作产生新字符串 |
fmt.Sprintf | 需要格式化的复杂拼接 | 内存分配较多 |
strings.Builder | 高频次动态字符串拼接(推荐方式) | 零拷贝,性能最佳 |
bytes.Buffer | 需要同时处理字节和字符串的场景 | 性能接近Builder |
示例代码:
// 错误方式(产生中间垃圾)
var result string
for _, word := range []string{"Go", "is", "fast"} {
result += word + " " // 每次循环创建新字符串
}
// 正确方式(使用Builder)
var builder strings.Builder
for _, word := range []string{"Go", "is", "fast"} {
builder.WriteString(word)
builder.WriteByte(' ')
}
result := strings.TrimSpace(builder.String()) // "Go is fast"
2. 避免重复切割
// 低效做法:多次切割相同字符串
parts1 := strings.Split(s, ",")
parts2 := strings.Split(s, ":")
// 高效做法:一次切割复用结果
allParts := strings.FieldsFunc(s, func(r rune) bool {
return r == ',' || r == ':'
})
五、高级技巧与陷阱
1. 内存优化技巧
- 复用strings.Builder:
var builder strings.Builder
defer builder.Reset() // 使用后重置,避免重复创建
builder.WriteString("Header")
// ... 其他操作
- 预分配内存:
builder.Grow(1024) // 预分配缓冲区,减少扩容次数
2. 常见陷阱
- 中文字符处理:
s := "你好"
fmt.Println(len(s)) // 输出6(字节长度)
fmt.Println(utf8.RuneCountInString(s)) // 输出2(正确字符数)
- Split空字符串:
strings.Split("", ",") // 返回 [""](非空切片)
六、综合实战示例
package main
import (
"fmt"
"strings"
)
func main() {
// 日志解析
log := "ERROR|2023-08-01|user_not_found|uid=123"
// 切割层级
level, timestamp, msg, _ := strings.Cut(log, "|")
if level == "ERROR" {
// 提取键值对
key, value, _ := strings.Cut(msg, "=")
fmt.Printf("[%s] %s: %s\n", timestamp, key, value)
// 输出: [2023-08-01] uid: 123
}
// 高效构建SQL
var queryBuilder strings.Builder
columns := []string{"id", "name", "email"}
queryBuilder.WriteString("SELECT ")
queryBuilder.WriteString(strings.Join(columns, ", "))
queryBuilder.WriteString(" FROM users WHERE active = true")
fmt.Println(queryBuilder.String())
}
七、性能对比(Benchmark)
// 测试结果(Go 1.20,10000次迭代)
// +运算符: 2,120,000 ns/op
// Sprintf: 1,850,000 ns/op
// Builder: 125,000 ns/op
通过掌握这些核心方法及优化技巧,可显著提升字符串处理性能。建议:
- 优先使用strings.Builder处理动态字符串
- 对多次使用的切割结果进行缓存
- 使用ContainsRune替代遍历字符检查
- 关注字符串的不可变性带来的内存影响
相关推荐
- C语言备忘录 - 09. 数组与字符串(c语言数组字符串长度)
-
C语言支持数组数据结构,它可以存储一个固定大小的相同类型元素的顺序集合。数组都是由连续的内存位置组成。最低的地址对应第一个元素,最高的地址对应最后一个元素。一、数组定义/*定义一个一维数组数...
- Java 读取 xml 文件的五种方式(java读取xml工具类)
-
1、Java读取xml文件的五种方式在Java中读取XML文件有多种方法,这里列出五种常见的方式:DOM解析器(DocumentObjectModel):DOM是处理XML文...
- 如何获取一个APP的所有接口API和参数签名信息?
-
先给出所需的工具:步骤工具/技术抓包Charles、Fiddler、Wireshark、tcpdump反编译Jadx、JEB、Apktool动态调试Frida、IDAPro、Unidbg/Unico...
- 编辑距离算法详解:Levenshtein Distance算法
-
算法基本原理:假设我们可以使用d[i,j]个步骤(可以使用一个二维数组保存这个值),表示将串s[1…i]转换为串t[1…j]所需要的最少步骤个数,那么,在最基本的情况下,即在i等...
- RTCP协议详解(SR、RR、SDES、BYE、APP、NACK、TCC、PLI、SLI)
-
RTCP协议规范中定义了五种类型的RTCP包:接收方报告(RR)、发送方报告(SR)、源描述(SDES)、成员管理(BYE)和应用程序定义(APP)。SR:payload...
- javascript实现获取中文汉字拼音首字母
-
今天分享一个日常开发中可能会用到的一个小功能,简单说就是输入中文汉字可转换得到中文汉字拼音首字母。当然我可写不出这样的功能,源码来自于其他民间大神的分享,博主在此记录一下功能demo,方便日后复用,同...
- 记一次前端逻辑绕过登录到内网挖掘
-
前言在测试一个学校网站的时候发现一个未授权访问内网系统,但是这个未授权并不是接口啥的,而是对前端js的审计和调试发现的漏洞,这里给大家分享一下这次的漏洞的过程文章中涉及的敏感信息均已做打码处理,文...
- Node.js 是怎么找到模块的?(node.js有哪些模块)
-
大家好,我是前端西瓜哥,今天我们来看看Node.js模块查找的原理。模块种类模块有三种来源。核心模块:Node.js内置的包。比如http、fs、path;自定义模块:NPM包。比如axi...
- 细节确定成败!全网最详细的xxs夸脚本攻击以及测试方法(上)
-
XSS全称是CrossSiteScripting也是跨站脚本,他也分为三种类型存储型,反射型,DOM型。当目标网站目标用户浏览器渲染HTML文档的过程中,出现了不被预期的脚本指令并执行时,XSS就...
- 简单易懂的KMP字符串匹配算法(实现kmp字符串匹配)
-
什么是KMPKMP算法是Knuth、Morris和Pratt三人设计的线性时间字符串匹配算法。算法的核心思想是尽可能地利用已知信息,减少尝试匹配的次数,从而降低时间复杂度。要想彻底地弄懂KMP算法,需...
- golang标准库每日一库之strings(golang 字符串操作)
-
以下为Go语言strings包的深度解析,涵盖字符串切割、替换、查找等核心操作及高效处理技巧:一、基础字符串操作1.字符串切割(Split)函数作用描述示例strings.Split(s,s...
- 开源轻量级BT下载器qBittorrent 5.1.1发布:改进Wayland会话
-
IT之家6月24日消息,科技媒体9to5Linux昨日(6月23日)发布博文,报道称开源轻量级BT下载器qBittorrent发布5.1.1版本更新,主要改进支持Lin...
- 晨雾轻散时!2 道 JS 面试题细解,静享知识慢时光
-
清晨的雾气渐渐散去,阳光透过纱窗洒在桌前,泡一杯温热的蜂蜜水,让我们在这宁静的氛围里,以轻松的节奏聊聊两道JavaScript高频面试题。就像在晨光中散步,不急不躁地探索知识,让学习成为一种治愈的...
- JS 写正则表达式,判断是否为手机号
-
以下是使用JavaScript写正则表达式,判断一个字符串是否为手机号的示例代码:在上述代码中,我们定义了一个isPhoneNumber函数,该函数接收一个字符串作为参数,使用正则表达式判断该...
- 不用任何 js 库,纯前端导出数据到 Excel / CSV 文件就简单几行代码
-
最近实现的导出数据为表格的需求,不需要工具库,也不要后端实现,mark一下。js导出excel表格最近工作中又遇到了将表格数据导出为excel表格的需求,我第一时间想到的是之前我的网站上推...
- 一周热门
- 最近发表
-
- C语言备忘录 - 09. 数组与字符串(c语言数组字符串长度)
- Java 读取 xml 文件的五种方式(java读取xml工具类)
- 如何获取一个APP的所有接口API和参数签名信息?
- 编辑距离算法详解:Levenshtein Distance算法
- RTCP协议详解(SR、RR、SDES、BYE、APP、NACK、TCC、PLI、SLI)
- javascript实现获取中文汉字拼音首字母
- 记一次前端逻辑绕过登录到内网挖掘
- Node.js 是怎么找到模块的?(node.js有哪些模块)
- 细节确定成败!全网最详细的xxs夸脚本攻击以及测试方法(上)
- 简单易懂的KMP字符串匹配算法(实现kmp字符串匹配)
- 标签列表
-
- HTML 简介 (30)
- HTML 响应式设计 (31)
- HTML URL 编码 (32)
- HTML Web 服务器 (31)
- HTML 表单属性 (32)
- HTML 音频 (31)
- HTML5 支持 (33)
- HTML API (36)
- HTML 总结 (32)
- HTML 全局属性 (32)
- HTML 事件 (31)
- HTML 画布 (32)
- HTTP 方法 (30)
- 键盘快捷键 (30)
- CSS 语法 (35)
- CSS 选择器 (30)
- CSS 轮廓宽度 (31)
- CSS 谷歌字体 (33)
- CSS 链接 (31)
- CSS 定位 (31)
- CSS 图片库 (32)
- CSS 图像精灵 (31)
- SVG 文本 (32)
- 时钟启动 (33)
- HTML 游戏 (34)