登录
首页 >  文章 >  python教程

如何用正则匹配IP地址?四种格式详解

时间:2025-07-08 16:56:23 127浏览 收藏

还在为网络数据处理中IP地址的匹配而烦恼吗?本文为你详细解读如何使用正则表达式精准匹配四种常见IP地址格式,包括IPv4、带子网掩码的IPv4、IPv6以及IPv4映射的IPv6地址。针对每种格式,文章提供了清晰的正则表达式,并深入解析其编写逻辑,助你轻松应对日志分析、数据清洗等任务中对IP地址的提取和验证需求。无论你是网络工程师、程序员还是数据分析师,都能从本文中找到实用的解决方案,提升工作效率。掌握这些技巧,让IP地址匹配不再是难题!

本文介绍了使用正则表达式匹配四种常见IP地址格式的方法。1. IPv4地址由四组0到255之间的数字组成,每组用点分隔,例如192.168.1.1,其正则表达式为\b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\b;2. 带子网掩码的IPv4地址在IPv4基础上加了一个斜杠和数字部分,表示子网掩码位数,例如192.168.0.0/24,其正则表达式为\b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\/(3[0-2]|[12][0-9]|[0-9])\b;3. IPv6地址由8段1~4位十六进制数组成,例如简化版正则表达式为\b([0-9a-fA-F]{1,4}:){7}[0-9a-fA-F]{1,4}\b,但该表达式不支持双冒号缩写;4. IPv4映射的IPv6地址以::ffff:开头,后接IPv4地址,例如::ffff:192.168.1.1,其正则表达式为\b::ffff:((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\b。

如何使用正则表达式匹配IP地址?四种格式解析

匹配IP地址是很多网络处理任务中常见的需求,比如日志分析、数据清洗或者防火墙规则设置。正则表达式(Regex)是一个非常合适的工具来完成这个任务。但IP地址有不同格式(IPv4、带子网掩码的IPv4、IPv6等),每种写法都有不同的匹配方式。

如何使用正则表达式匹配IP地址?四种格式解析

下面介绍四种常见的IP地址格式及其对应的正则表达式写法,方便你在实际场景中灵活使用。

如何使用正则表达式匹配IP地址?四种格式解析

IPv4 地址:x.x.x.x

这是最常见的IPv4地址格式,由四组0到255之间的数字组成,每组用点分隔。例如:192.168.1.18.8.8.8

要正确匹配这类地址,不能简单地只看有没有四个数字和三个点,还要确保每个数字段在0~255之间。

如何使用正则表达式匹配IP地址?四种格式解析

正则表达式:

\b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\b

说明:

  • \b 表示单词边界,避免匹配到其他包含IP形式的字符串。
  • 每个数字段分为三类:
    • 25[0-5] 匹配250~255
    • 2[0-4][0-9] 匹配200~249
    • [01]?[0-9][0-9]? 匹配0~199(支持前导0和省略前导0的情况)
  • 最后一个分组没有点,所以单独列出

带子网掩码的IPv4地址:x.x.x.x/xx

这种格式常用于路由或配置文件中,表示一个IP地址加上子网掩码位数,例如:192.168.0.0/24

正则表达式:

\b((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\/(3[0-2]|[12][0-9]|[0-9])\b

说明:

  • / 后面的部分是子网掩码位数,取值范围是0到32
  • 所以用 (3[0-2]|[12][0-9]|[0-9]) 来限制合法范围
  • 这是在IPv4表达式基础上加了一个斜杠和数字部分

IPv6 地址:xxxx:xxxx:xxxx:xxxx:xxxx:xxxx:xxxx:xxxx

IPv6地址比IPv4复杂得多,支持缩写(如省略前导0、双冒号代替连续的0段),因此正则匹配也更复杂。

简化版正则表达式(不支持所有缩写):

\b([0-9a-fA-F]{1,4}:){7}[0-9a-fA-F]{1,4}\b

说明:

  • 每段为1~4位十六进制数(0-9和a-f,不区分大小写)
  • 总共8段,用冒号分隔
  • 该表达式不支持双冒号缩写(如 ::1),如果需要完整支持,正则会变得非常长且复杂,通常建议使用专门的库处理IPv6

IPv4映射的IPv6地址:::ffff:x.x.x.x

有时候你会看到类似 ::ffff:192.168.1.1 的地址,这是IPv6中表示IPv4地址的一种方式。

正则表达式:

\b::ffff:((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\b

说明:

  • 开头固定为 ::ffff:,后面接IPv4地址
  • 因此可以复用前面IPv4的正则部分,前面加上固定的前缀即可

基本上就这些常见格式了。根据你的具体使用场景选择合适的形式。如果你只是做基础提取,IPv4和IPv4带掩码的两种可能已经够用;如果涉及IPv6,建议配合专用库进行验证,因为正则很难覆盖所有合法缩写形式。

今天带大家了解了的相关知识,希望对你有所帮助;关于文章的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>