登录
首页 >  Golang >  Go问答

如何选择具有自定义单词边界的第一个字符?

来源:stackoverflow

时间:2024-04-17 20:00:35 301浏览 收藏

大家好,今天本人给大家带来文章《如何选择具有自定义单词边界的第一个字符?》,文中内容主要涉及到,如果你对Golang方面的知识点感兴趣,那就请各位朋友继续看下去吧~希望能真正帮到你们,谢谢!

问题内容

我用一系列这样的单词进行了测试用例:

{
        input:    "Halley's Comet",
        expected: "HC",
    },
    {
        input:    "First In, First Out",
        expected: "FIFO",
    },
    {
        input:    "The Road _Not_ Taken",
        expected: "TRNT",
    },

我希望用一个正则表达式来匹配这些单词的所有第一个字母,避免将 char: "_" 匹配为第一个字母并计算单词中的单引号。

目前,我有这个正则表达式适用于 pcre 语法,但不适用于 go 正则表达式包: (?

我知道 go 不支持环视,但我正在寻找一种好方法来做到这一点。

我还使用此函数来获取所有字符串的数组:re.findallstring(s, -1)

感谢您的帮助。


解决方案


处理字符类和单词边界的东西就足够了:

\b_*([a-z])[a-z]*(?:'s)?_*\b\w*

demo

用法:

package main

import (
    "fmt"
    "regexp"
)

func main() {
    re := regexp.mustcompile(`(?i)\b_*([a-z])[a-z]*(?:'s)?_*\b\w*`)
    fmt.println(re.replaceallstring("o'brian's dog", "$1"))

}

ftr,少正则表达式解决方案

package main

import (
    "fmt"
)

func main() {
    inputs := []string{"hallمرحباey's comet", "first in, first out", "the road _not_ taken", "o'brian's dog"}
    c := [][]string{}
    w := [][]string{}
    for _, input := range inputs {
        c = append(c, firstlet(input))
        w = append(w, words(input))
    }
    fmt.printf("%#v\n", w)
    fmt.printf("%#v\n", c)
}

func firstlet(in string) (out []string) {
    var inword bool
    for _, r := range in {
        if !inword {
            if ischar(r) {
                inword = true
                out = append(out, string(r))
            }
        } else if r == ' ' {
            inword = false
        }
    }
    return out
}

func words(in string) (out []string) {
    var inword bool
    var w []rune
    for _, r := range in {
        if !inword {
            if ischar(r) {
                w = append(w, r)
                inword = true
            }
        } else if r == ' ' {
            if len(w) > 0 {
                out = append(out, string(w))
                w = w[:0]
            }
            inword = false
        } else if r != '_' {
            w = append(w, r)
        }
    }
    if len(w) > 0 {
        out = append(out, string(w))
    }
    return out
}

func ischar(r rune) bool {
    return (r >= 'a' && r <= 'z') || (r >= 'a' && r <= 'z')
}

输出

[][]string{[]string{"Hallمرحباey's", "Comet"}, []string{"First", "In,", "First", "Out"}, []string{"The", "Road", "Not", "Taken"}, []string{"O'Brian's", "Dog"}}
[][]string{[]string{"H", "C"}, []string{"F", "I", "F", "O"}, []string{"T", "R", "N", "T"}, []string{"O", "D"}}

理论要掌握,实操不能落!以上关于《如何选择具有自定义单词边界的第一个字符?》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    立即学习 542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    立即学习 508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    立即学习 497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    立即学习 487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    立即学习 484次学习