解决Golang多行正则表达式解析的挑战
来源:stackoverflow
时间:2024-03-26 10:09:45 229浏览 收藏
在解析 Solidity 代码时,多行正则表达式匹配是一个挑战。本文介绍了一种解决此问题的解决方案,通过将源代码转换为字符串,然后使用 (?s) 分组和 \n 分割匹配内容,从而实现对多行代码的匹配。通过修改代码,成功匹配了 require() 之间的内容,并输出解析结果。
我正在用 go 创建一个解析 solidity 代码的项目。在我的项目中,我创建了一个函数 analyzefile(),它对于每个智能合约 (.sol) 都会检测正则表达式的静态问题:
func analyzefile(issues []issue, file string) (map[string][]finding, error) {
findings := make(map[string][]finding)
readfile, err := os.open(file)
if err != nil {
return nil, err
}
defer readfile.close()
contents, _ := ioutil.readfile(file)
scanner := bufio.newscanner(readfile)
linenumber := 0
for scanner.scan() {
linenumber++
line := scanner.text()
for _, issue := range issues {
if issue.parsingmode == "singleline" {
matched, _ := regexp.matchstring(issue.pattern, line)
if matched {
findings[issue.identifier] = append(findings[issue.identifier], finding{
issueidentifier: issue.identifier,
file: file,
linenumber: linenumber,
linecontent: strings.trimspace(line),
})
}
}
}
}
当正则表达式必须控制单行代码时,一切都很好。 但是,我还需要检查 .sol 文件中多行出现的内容,例如检测这段代码:
require( _disputeid < disputecount && disputes[_disputeid].status == status.active, "disputes::!resolvable" );
我尝试在analyzefile()函数中添加以下代码:
contents, _ := ioutil.ReadFile(file)
for _, issue := range issues {
if issue.ParsingMode == "MultiLine" {
contents_to_string := string(contents)
//s := strings.ReplaceAll(contents_to_string, "\n", " ")
//sr := strings.ReplaceAll(s, "\r", " ")
r := regexp.MustCompile(`((require)([(])\n.*[&&](?s)(.*?)([;]))`)
finds := r.FindStringSubmatch(contents_to_string)
for _, find := range finds {
findings[issue.Identifier] = append(findings[issue.Identifier], Finding{
IssueIdentifier: issue.Identifier,
File: file,
LineContent: (find),
})
}
}
}
但是我得到了错误的结果,因为当将源代码转换为字符串时,我将所有代码放在一行上,并带有换行符 \n 字符,这使得任何正则表达式检查崩溃。
正确答案
解决方案中的一个单词可以在 caputer 组 (?s)require\((.*?)\); 之后用 \n 分割整个字符串。
func main() {
var re = regexp.mustcompile(`(?s)require\((.*?)\);`)
var str = `require(
_disputeid < disputecount &&
disputes[_disputeid].status == status.active,
"disputes::!resolvable"
);`
matches := re.findallstringsubmatch(str, -1)
for _, match := range matches {
lines := strings.split(match[1], "\n")
for _, line := range lines {
fmt.println(line)
}
}
}
https://go.dev/play/p/Omn5ULHun_-
为了匹配多行,可以使用 (?m)^[^\s\r\n]*(.*)[^\s\r\n](\s+)$。我们可以对 require( 和 ) 之间的内容进行多行匹配
func main() {
var re = regexp.mustcompile(`(?s)require\((.*?)\);`)
var str = `require(
_disputeid < disputecount &&
disputes[_disputeid].status == status.active,
"disputes::!resolvable"
);`
var multilinere = regexp.mustcompile(`(?m)^[^\s\r\n]*(.*)[^\s\r\n](\s+)$`)
matches := re.findallstringsubmatch(str, -1)
for _, match := range matches {
submathes := multilinere.findallstringsubmatch(match[1], -1)
for _, submatch := range submathes {
fmt.println(submatch[0])
}
}
}
https://go.dev/play/p/LJsVy5vN6Ej
通过修改代码,我设法让它工作:
contents, _ := ioutil.readfile(file)
for _, issue := range issues {
if issue.parsingmode == "multilineg015" {
str := string(contents)
var re = regexp.mustcompile(`(?s)require\((.*?)\);`)
//var multilinere = regexp.mustcompile(`(?m)^[^\s\r\n]*(.*)[^\s\r\n](\s+)$`)
//getting all require in the sol file
matches := re.findallstringsubmatch(str, -1)
r := regexp.mustcompile(issue.pattern)
for _, match := range matches {
submatches := r.findallstringsubmatch(match[0], -1)
for _, submatch := range submatches {
findings[issue.identifier] = append(findings[issue.identifier], finding{
issueidentifier: issue.identifier,
file: file,
linecontent: ([]string{submatch[0]}),
})
}
}
这是输出:
2022-08-rigor\contracts\Community.sol::0 => [(
_lendingNeeded >= _communityProject.totalLent &&
_lendingNeeded <= IProject(_project).projectCost(),
"Community::invalid lending"
);]
2022-08-rigor\contracts\Disputes.sol::0 => [(
_disputeID < disputeCount &&
disputes[_disputeID].status == Status.Active,
"Disputes::!Resolvable"
);]
2022-08-rigor\contracts\Disputes.sol::0 => [(
_actionType > 0 && _actionType <= uint8(ActionType.TaskPay),
"Disputes::!ActionType"
);]
2022-08-rigor\contracts\Project.sol::0 => [(
_sender == builder || _sender == homeFi.communityContract(),
"Project::!Builder&&!Community"
);]
感谢zangw的帮助!
理论要掌握,实操不能落!以上关于《解决Golang多行正则表达式解析的挑战》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!
-
502 收藏
-
502 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
139 收藏
-
204 收藏
-
325 收藏
-
478 收藏
-
486 收藏
-
439 收藏
-
357 收藏
-
352 收藏
-
101 收藏
-
440 收藏
-
212 收藏
-
143 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习