mmdetection模型测试实战：用`tools/test.py`一键可视化预测结果并保存到指定文件夹

张开发

• 2026/4/18 9:18:05 • 15 分钟阅读

分享文章

mmdetection模型测试实战：用`tools/test.py`一键可视化预测结果并保存到指定文件夹

mmdetection模型测试实战可视化预测结果与性能深度解析在计算机视觉项目的完整生命周期中模型训练只是第一步。真正考验模型实用价值的是它在真实场景中的表现。本文将带你深入掌握mmdetection框架下的模型测试全流程从基础命令解析到高级可视化技巧再到关键性能指标的深度解读。1. 模型测试的核心价值与准备工作模型测试环节常被开发者忽视但它实际上是连接研发与落地的关键桥梁。一个在测试集上表现良好的模型才能真正投入实际应用。在mmdetection框架中测试环节不仅能输出mAP等量化指标更重要的是能直观展示模型看世界的方式。测试前需要确认三个核心文件配置文件如retinanet_r50_fpn_1x_coco.py记录模型结构和训练参数训练权重如epoch_12.pth模型学习到的参数集合测试数据集通常与验证集相同需在配置文件中正确指定建议的目录结构示例project/ ├── configs/ │ └── retinanet_r50_fpn_1x_coco.py ├── work_dirs/ │ └── retinanet_r50_fpn_1x_coco/ │ └── epoch_12.pth └── results/ # 用于存放测试输出提示测试前建议使用python tools/print_config.py configs/xxx.py检查配置文件是否完整避免因路径错误导致测试失败。2. 基础测试命令全解析最基础的测试命令包含三个核心参数python tools/test.py \ configs/retinanet_r50_fpn_1x_coco.py \ work_dirs/retinanet_r50_fpn_1x_coco/epoch_12.pth \ --eval bbox这条命令会输出如下关键指标Average Precision (AP) [ IoU0.50:0.95 | area all | maxDets100 ] 0.389 Average Precision (AP) [ IoU0.50 | area all | maxDets100 ] 0.591 Average Precision (AP) [ IoU0.75 | area all | maxDets100 ] 0.421 ...2.1 可视化输出实战想要直观查看预测效果--show-dir参数是利器python tools/test.py \ configs/retinanet_r50_fpn_1x_coco.py \ work_dirs/retinanet_r50_fpn_1x_coco/epoch_12.pth \ --show-dir results/visualization生成的文件结构results/ └── visualization/ ├── img1.jpg ├── img2.jpg └── ...可视化效果要素解读边界框颜色不同类别使用不同颜色左上角标签格式为类别名置信度背景透明度低置信度预测会半透明显示2.2 关键参数对比参数作用适用场景输出位置--eval计算mAP等指标量化评估终端/stdout--show实时显示图像快速调试弹出窗口--show-dir保存可视化结果报告/演示指定目录--eval-options自定义评估参数精细分析终端/stdout3. 高级测试技巧与性能优化3.1 类别级精度分析修改mmdet/datasets/coco.py中的evaluate函数def evaluate( self, results, metricbbox, loggerNone, jsonfile_prefixNone, classwiseTrue, # 改为True proposal_nums(100, 300, 1000), iou_thrs[0.5], # 指定IoU阈值 metric_itemsNone ):修改后输出示例Classwise AP: | class | AP0.5 | |----------|--------| | person | 0.723 | | car | 0.681 | | dog | 0.542 |3.2 置信度阈值调整通过model.test_cfg控制输出质量# 在配置文件中添加 model dict( test_cfgdict( score_thr0.3, # 只显示置信度0.3的预测 nmsdict(typenms, iou_threshold0.5), max_per_img100 ) )效果对比高阈值如0.7减少误检但可能漏检低阈值如0.1检出更多目标但噪声增加3.3 多尺度测试增强在配置文件中启用多尺度测试test_pipeline [ dict( typeMultiScaleFlipAug, img_scale[(1333, 800), (1000, 600), (666, 400)], # 多尺度 flipTrue, # 水平翻转增强 transforms[ ... ] ) ]4. 测试结果分析与问题定位4.1 常见问题模式识别通过可视化结果可以识别典型问题漏检问题目标尺寸过小遮挡严重类别不平衡导致少数类识别差误检问题背景被误判为目标类别混淆如哈士奇被识别为狼定位不准边界框偏移框体过大/过小4.2 量化指标深度解读关键指标解析表指标计算公式合理范围优化方向AP0.5IoU阈值0.5时的AP0.5-0.9提高定位精度AP0.75IoU阈值0.75时的AP0.3-0.7优化边界框回归AR100每图100个提案的召回率0.6-0.9改进RPN网络4.3 测试结果可视化增强使用第三方工具生成更专业的分析图表import matplotlib.pyplot as plt # 绘制PR曲线 plt.plot(recall, precision) plt.xlabel(Recall) plt.ylabel(Precision) plt.title(Precision-Recall Curve) plt.savefig(pr_curve.png)5. 工程化测试方案5.1 自动化测试脚本创建可复用的测试脚本run_test.sh#!/bin/bash CONFIG$1 CHECKPOINT$2 OUT_DIR$3 python tools/test.py \ $CONFIG \ $CHECKPOINT \ --out ${OUT_DIR}/results.pkl \ --eval bbox \ --show-dir ${OUT_DIR}/visualization \ --eval-options classwiseTrue iou_thrs[0.5,0.75]5.2 测试报告生成使用Pandas生成结构化报告import pandas as pd df pd.DataFrame({ Class: [person, car, dog], AP0.5: [0.72, 0.68, 0.54], AP0.75: [0.51, 0.47, 0.32] }) df.to_markdown(performance_report.md)5.3 持续集成方案GitLab CI示例配置test_model: stage: test script: - python tools/test.py $CONFIG $CHECKPOINT --eval bbox artifacts: paths: - results/ expire_in: 1 week在实际项目中我发现将测试环节纳入持续集成流程可以提前发现模型退化问题。特别是在数据分布随时间变化的场景中定期测试能确保模型始终保持最佳状态。

更多文章

前端开发 2026/4/18 9:16:22

PyTorch 2.8镜像真实效果：自动驾驶场景理解+事故回放视频生成演示

PyTorch 2.8镜像真实效果：自动驾驶场景理解事故回放视频生成演示 1. 开箱即用的深度学习环境 PyTorch 2.8深度学习镜像为开发者提供了一个即装即用的强大工具包。这个经过深度优化的环境基于RTX 4090D 24GB显卡和CUDA 12.4打造，完美适配10核CPU和120GB…

张开发

前端开发 2026/4/18 9:14:15

Headscale-UI高级路由配置：子网路由与策略路由实战指南

Headscale-UI高级路由配置：子网路由与策略路由实战指南【免费下载链接】headscale-ui A web frontend for the headscale Tailscale-compatible coordination server 项目地址: https://gitcode.com/gh_mirrors/he/headscale-ui Headscale-UI作为headscale服…

张开发

前端开发 2026/4/18 9:08:17

BabelDOC终极指南：如何高效实现PDF文档的专业级双语翻译

BabelDOC终极指南：如何高效实现PDF文档的专业级双语翻译【免费下载链接】BabelDOC Yet Another Document Translator 项目地址: https://gitcode.com/GitHub_Trending/ba/BabelDOC BabelDOC是一款革命性的开源PDF文档翻译工具，专为学术研究者、技…

张开发

前端开发 2026/4/18 9:07:22

多功能窗口排列工具开发万能窗口管理软件

温馨提示：文末有资源获取方式{"功能亮点：自由定制窗口布局":"通过本软件，用户可轻松任意窗口并实现个性化排列，支持手动拖拽或数值输入精准定位，满足不同场景下的桌面管理需求。 ","批量控制…

张开发

前端开发 2026/4/18 9:03:38

基于 TextRNN 的微博四分类情感分析实战 | 完整可运行全流程教程

情感分析（Sentiment Analysis）是自然语言处理（NLP）中最经典、应用最广泛的任务之一。在社交媒体、电商评论、舆情监控等场景中，自动识别文本的情感倾向具有极高的商业价值。本文将从零开始完整实现一套基于TextRNN的微…

张开发

前端开发 2026/4/18 9:03:32

HunyuanVideo-Foley音效生成问题解决：视频上传、显存不足、音频异常

HunyuanVideo-Foley音效生成问题解决：视频上传、显存不足、音频异常 1. 引言：音效生成的价值与挑战在视频制作领域，音效是提升作品沉浸感的关键要素。传统音效制作需要专业设备和大量人工操作，而HunyuanVideo-Foley的出现改变了…

张开发

前端开发 2026/4/18 8:59:00

终极解决方案：3分钟让Figma界面全面中文化的免费高效插件

终极解决方案：3分钟让Figma界面全面中文化的免费高效插件【免费下载链接】figmaCN 中文 Figma 插件，设计师人工翻译校验项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 还在为Figma复杂的英文界面而烦恼吗？作为一名中文设计师…

张开发

前端开发 2026/4/18 8:56:04

AudioSeal Pixel Studio部署案例：广电机构AI语音新闻生成内容版权管理系统

AudioSeal Pixel Studio部署案例：广电机构AI语音新闻生成内容版权管理系统 1. 项目背景与核心价值在数字内容爆炸式增长的时代，音频内容的版权保护面临前所未有的挑战。特别是随着AI语音合成技术的普及，如何区分人工录制和AI生成的语音内容…

张开发

前端开发 2026/4/18 8:54:21

GLM-4.1V-9B-Base惊艳效果：中文长尾问题（如‘图中第三只猫在做什么’）响应实测

GLM-4.1V-9B-Base惊艳效果：中文长尾问题（如"图中第三只猫在做什么"）响应实测 1. 视觉理解新标杆：GLM-4.1V-9B-Base GLM-4.1V-9B-Base是智谱开源的一款视觉多模态理解模型，专为中文环境下的视觉理解任务优化…

张开发

前端开发 2026/4/18 8:52:36

猫抓Cat-Catch：浏览器资源嗅探扩展终极指南

猫抓Cat-Catch：浏览器资源嗅探扩展终极指南【免费下载链接】cat-catch 猫抓浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 你是否经常在网上遇到精彩的视频却无法保存…

张开发

前端开发 2026/4/18 8:51:48

Qwen3-Reranker-0.6B部署教程：Kubernetes集群中水平扩展重排序服务

Qwen3-Reranker-0.6B部署教程：Kubernetes集群中水平扩展重排序服务 1. 项目概述 Qwen3-Reranker-0.6B是一个专门为RAG（检索增强生成）场景设计的轻量级语义重排序模型。这个模型能够精准判断用户查询（Query）与文档&am…

张开发

前端开发 2026/4/18 8:51:48

Leather Dress Collection 内存优化技巧：应对C盘空间不足的模型部署方案

Leather Dress Collection 内存优化技巧：应对C盘空间不足的模型部署方案你是不是也遇到过这种情况？兴致勃勃地想部署一个像Leather Dress Collection这样的AI模型来玩玩，结果第一步就被卡住了——C盘空间不足。看着那个红色的“磁盘空间不足…

张开发

mmdetection模型测试实战：用`tools/test.py`一键可视化预测结果并保存到指定文件夹

最新文章

Ubuntu 22.04 LTS下，手把手教你配置VSCode远程开发Python项目（含离线插件安装）

5分钟搭建无人机强化学习环境：gym-pybullet-drones完全指南

Qwen3-0.6B-FP8效果展示：用非思维模式生成抖音爆款短视频口播文案脚本

SenseVoice-small-onnx多语言ASR部署教程：支持mp3/wav/m4a/flac全格式

vscode-drawio终极指南：在VS Code中轻松绘制专业图表

如何构建高精度四足机器人？OpenDog V3开源项目实战指南

推荐文章

ATCODER ABC C题解济

英雄联盟智能辅助工具League Akari：让你轻松成为游戏高手 [特殊字符]✨

同城预约上门服务系统源码：从技术架构到落地实践的深度剖析

PyTorch学习率调度器实战：从基础到高级策略全解析

python开发之路【第四章】：python程序流程控制督

跑得越慢反而越牛？你的身体其实在偷偷“扩容带宽”

相关文章

无损音乐下载与高品质音频管理：tidal-dl-ng的核心能力探索

LyricsX：让歌词如影随形的桌面歌词助手

如何利用自动化抢票工具突破大麦网90%的抢票失败率：从绝望到成功的完整指南

电子设计竞赛必备：RC、运放、TTL信号处理电路实战指南（附避坑技巧）

从RoboMaster到智能仓储：深入聊聊麦克纳姆轮底盘的那些‘坑’与最佳实践

libhv实战：从零构建一个高效的WebSocket客户端

分享文章

更多文章

PyTorch 2.8镜像真实效果：自动驾驶场景理解+事故回放视频生成演示

Headscale-UI高级路由配置：子网路由与策略路由实战指南

BabelDOC终极指南：如何高效实现PDF文档的专业级双语翻译

多功能窗口排列工具开发万能窗口管理软件

基于 TextRNN 的微博四分类情感分析实战 | 完整可运行全流程教程

HunyuanVideo-Foley音效生成问题解决：视频上传、显存不足、音频异常

终极解决方案：3分钟让Figma界面全面中文化的免费高效插件

AudioSeal Pixel Studio部署案例：广电机构AI语音新闻生成内容版权管理系统

GLM-4.1V-9B-Base惊艳效果：中文长尾问题（如‘图中第三只猫在做什么’）响应实测

猫抓Cat-Catch：浏览器资源嗅探扩展终极指南

Qwen3-Reranker-0.6B部署教程：Kubernetes集群中水平扩展重排序服务

Leather Dress Collection 内存优化技巧：应对C盘空间不足的模型部署方案