strings.Contains 是最轻量安全的关键词存在性判断方案,纯字面匹配、性能高,但仅返回 bool;需预处理空格和大小写,避免空关键词导致全量匹配。
strings.Contains 做简单关键词存在性判断多数基础搜索场景只要求“某字符串是否包含关键词”,strings.Contains 是最轻量、最安全的选择。它不区分大小写,也不做正则解析,纯字面匹配,性能高且无意外行为。
注意:它只返回 bool,不提供位置或匹配次数。如果后续要高亮或分页,得换方案。
strings.TrimSpace 清除首尾空格,避免空匹配strings.ToLower),不要依赖第三方库做 case-insensitive 搜索——标准库没提供该变体strings.Contains 后不做校验就返回结果:空关键词、全空格关键词会导致匹配全部内容package mainimport ( "fmt" "strings" )
func simpleSearch(text, keyword string) bool { keyword = strings.TrimSpace(keyword) if keyword == "" { return false } return strings.Contains(strings.ToLower(text), strings.ToLower(keyword)) }
func main() { fmt.Println(simpleSearch("Go is awesome", "GO")) // true fmt.Println(simpleSearch("Hello world", " ")) // false }
strings.Index 和 strings.Fields 实现带位置与词元拆分的搜索当需要知道关键词在原文中出现的位置,或想按“词”而非“子串”匹配(比如搜 "go" 不希望匹配到 "golang"),就得组合使用 strings.Index 和 strings.Fields 或 strings.FieldsFunc。
strings.Fields 按空白符切分,适合英文;中文需配合 runes 或分词库,此处不展开。重点是:**按词匹配必须先切分再遍历,不能靠 strings.Contains 硬搞**。
立即学习“go语言免费学习笔记(深入)”;
strings.Index 返回首次出现位置,-1 表示未找到;多次调用可实现所有匹配位置收集strings.Fields 后逐个比对,记得统一大小写,否则 "Go" ≠ "go"
"go." 会被 Fields 切成 "go.",和 "go" 不等——如需干净匹配,得预处理标点(strings.Map + unicode.IsPunct)package mainimport ( "fmt" "strings" "unicode" )
func wordSearch(text, keyword string) []int { keyword = strings.ToLower(strings.TrimSpace(keyword)) if keyword == "" { return nil }
words := strings.FieldsFunc(text, func(r rune) bool { return unicode.IsSpace(r) || unicode.IsPunct(r) }) var indices []int for i, w := range words { if strings.ToLower(w) == keyword { indices = append(indices, i) } } return indices}
func main() { fmt.Println(wordSearch("I love Go! Let's go.", "go")) // [2] }
用
regexp包做灵活模式匹配(但别滥用)真正需要通配、边界控制(如 \b)、或模糊拼写时,才上
regexp。它开销明显高于strings系函数,编译正则本身就有成本,且错误配置易导致回溯爆炸(尤其是用户可控输入)。常见踩坑:直接把用户输入塞进
regexp.Compile—— 未转义的.、*、[会引发 panic 或非预期行为。
regexp.QuoteMeta 包裹用户输入的关键词,再拼进正则表达式
\b 边界符:\\b + QuoteMeta(kw) + \\b
.* 开头的模式做长文本搜索;优先考虑 FindAllStringIndex 而非 FindAllString,减少内存分配package mainimport ( "fmt" "regexp" "strings" )
func regexSearch(text, keyword string) [][]int { keyword = strings.TrimSpace(keyword) if keyword == "" { return nil } pattern :=
(?i)\b+ regexp.QuoteMeta(keyword) +\bre := regexp.MustCompile(pattern) return re.FindAllStringIndex(text, -1) }func main() { fmt.Println(regexSearch("Go and golang are different", "go")) // [[0 2]] }
实际接口中,前端通常需要:是否命中、匹配数、高亮 HTML 片段、摘要上下文。Golang 本身不内置这些,得手动组装。最容易被忽略的是 **编码安全** 和 **截断逻辑**。
html.EscapeString),再替换关键词为 ...,否则 XSS 风险text[:n] 硬截——可能在 UTF-8 字节中间切断,导致乱码;改用 utf8string 库或 strings.RuneCountInString 控制 rune 数量
库查出来的,注意 sql.NullString 的零值处理:未设置时 .String 是空字符串,但 .Valid 为 false,直接传给搜索函数会误判复杂搜索逻辑很快会超出标准库能力,比如权重排序、同义词扩展、拼音容错——这时候该考虑专用搜索引擎(如 Bleve、Meilisearch),而不是硬堆正则。