登录
首页 >  文章 >  java教程

Java正则提取.com或.cn网址技巧

时间:2025-04-01 14:22:14 146浏览 收藏

本文介绍使用Java正则表达式高效提取文本中以“.com”或“.cn”结尾的网址的方法。通过`www\.\S*?(com|cn)`正则表达式,结合`Pattern`和`Matcher`类,可以精准匹配并提取目标网址。代码示例演示了如何编译正则表达式、进行匹配以及循环输出结果,实现对文本数据的快速处理。 学习此方法,您可以轻松应对各种文本信息提取需求,提升Java编程效率。

Java正则表达式如何提取以.com或.cn结尾的网址?

Java正则表达式高效提取文本信息

Java编程中,经常需要从文本中提取符合特定模式的内容。正则表达式为此提供了高效的解决方案。本文以一个案例演示如何利用Java正则表达式提取特定信息。

问题: 从包含多个网址的文本中,仅提取以“.com”或“.cn”结尾的网址。

解决方案: 使用正则表达式www\.\S*?(com|cn)匹配以“www.”开头,并以“.com”或“.cn”结尾的字符串。www\.匹配“www.”,\S*?匹配任意非空白字符(非贪婪模式),(com|cn)匹配“.com”或“.cn”。Pattern.CASE_INSENSITIVE标志确保匹配不区分大小写。

Java代码示例:

String html = "www.baidu.comwww.qq.comwww.aaa.cnwww.eee.cn";
String reg = "www\\.\\S*?(com|cn)";

Pattern pattern = Pattern.compile(reg, Pattern.CASE_INSENSITIVE);
Matcher matcher = pattern.matcher(html);
while (matcher.find()) {
    System.out.println(matcher.group());
}

输出结果:

www.baidu.com
www.qq.com
www.aaa.cn
www.eee.cn

此代码演示了如何编译正则表达式,使用Matcher类进行匹配,并循环输出匹配结果。 通过调整正则表达式,可以灵活地提取不同模式的文本信息,实现高效的文本数据处理。

今天关于《Java正则提取.com或.cn网址技巧》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>