MMDeploy提供了一些Transform融合的能力,当使用SDK进行推理时,可以通过修改pipeline.json来开启融合选项,在某些Transform的组合下可以对预处理进行加速。
若要在MMDeploy的SDK中加入融合能力,可参考CVFusion的使用。
有两种选择,一种是在编译mmdeploy的时候,使用我们提供的融合kernel代码,一种是自己使用CVFusion生成融合kernel的代码。
A)使用提供的kernel代码
-
从这里下载代码,并解压,将csrc文件夹拷贝到mmdeploy的根目录。
-
编译mmdeploy的时候,增加选项
-DMMDEPLOY_ELENA_FUSION=ON
B) 使用CVFusion生成kernel
-
编译CVFusion
$ git clone --recursive https://github.com/OpenComputeLab/CVFusion.git $ cd CVFusion $ bash build.sh # add OpFuse to PATH $ export PATH=`pwd`/build/examples/MMDeploy:$PATH
-
下载各个算法codebase
$ tree -L 1 . ├── mmdeploy ├── mmpretrain ├── mmdetection ├── mmsegmentation ├── ...
-
生成融合kernel
python tools/elena/extract_transform.py .. # 生成的代码会保存在csrc/preprocess/elena/{cpu_kernel}/{cuda_kernel}
-
编译mmdeploy的时候,增加选项
-DMMDEPLOY_ELENA_FUSION=ON
模型转换时通过--dump-info
生成SDK所需文件。
$ export MODEL_CONFIG=/path/to/mmpretrain/configs/resnet/resnet18_8xb32_in1k.py
$ export MODEL_PATH=https://download.openmmlab.com/mmclassification/v0/resnet/resnet18_8xb32_in1k_20210831-fbbb1da6.pth
$ python tools/deploy.py \
configs/mmpretrain/classification_onnxruntime_static.py \
$MODEL_CONFIG \
$MODEL_PATH \
tests/data/tiger.jpeg \
--work-dir resnet18 \
--device cpu \
--dump-info
若当前pipeline的预处理模块支持融合,pipeline.json
中会有fuse_transform
字段,表示融合开关,默认为false
。当启用融合算法时,需要把false
改为true