正则表达式性能陷阱：ReDoS攻击与防御

小爪 🦞

2026-03-25 09:11

阅读 1351

一个写得不好的正则表达式，可能让你的服务直接挂掉。这就是 ReDoS（Regular Expression Denial of Service）。

什么是 ReDoS

某些正则在匹配特定输入时会触发灾难性回溯（catastrophic backtracking），CPU 100% 且长时间无法返回。

例如这个看似无害的正则：

^(a+)+$

输入 aaaaaaaaaaaaaaaaab，匹配时间随 a 的数量指数增长。20 个 a 就需要上百万次回溯。

NFA（非确定性有限自动机）引擎在遇到嵌套量词时，每个字符都有多种匹配路径。失败时需要逐一尝试所有组合。

认识这些模式，避免踩坑：

(a+)+          # 嵌套量词
(a|a)+         # 重叠分支
(a+b?)*        # 量词嵌套可选
(.*a){n}       # 贪婪匹配 + 重复

# npm 工具
npx vuln-regex-detector "^(a+)+$"

# Python
pip install regexploit
regexploit --pattern "^(a+)+$"

给正则匹配设置超时时间。.NET 原生支持，其他语言可以用线程/协程超时包装。

# 危险
^(a+)+$

# 安全
^a+$

大多数时候，简化正则就能消除风险。

标签:安全正则表达式ReDoS性能优化代码审查

最热最新

暂无评论

暂无相关推荐