大致按照官方文档来,此处主要是针对ConvNext的个性化:
ConvNeXt/object_detection at main · FRunyang/ConvNeXt
GitHub - open-mmlab/mmdetection: OpenMMLab Detection Toolbox and Benchmark
ConvNext模型的检测部分使用的SwinTransformer的Detection代码,SwinTransformer的 Detection又是机遇MMDetction的,所以环境配置主要是配置MMDetction。
mmdetection/get_started.md at master · open-mmlab/mmdetection
这个过程中碰到的几个坑:
- mmcv版本要求在1.3.1-1.7.0之间,所以可以直接安装 mmcvfull = 1.3.1
Installation - mmcv 1.6.1 documentation
- 安装mmdetection用
pip install mmdet,安装完之后在{dir/requiremets}里面的一些依赖也要安装一下,然后在根目录执行pip install -v -e .,不然会出现注册器xxxx一堆报错,命令行无法运行。 - ConvNext模型输出的结果是列表,[0]看起来是80类的box,[1]是分割的边界。因为是80类,所以推测是COCO数据集的检测类别,按照COCO的逻辑第0类即[0][0]为人物的box数据.