MMDetection 이란 ??
PyTorch 기반의 오픈소스 객체 탐지 도구이다.
- 1 stage 모델의 경우 Backbone, Neck, DenseHead 모듈로 이루어져 있다.
- 2 stage 모델의 경우 1 stage 모듈에서 추가로 RolHead 모듈 추가로 이루어져 있다.
주요 특징
◾ Backbone - 입력 이미지를 특징 맵으로 변형시켜 줌 (ex. VGG, ResNet, ResNeXt 등)
◾ Neck - Backbone과 Head를 연결. 특징 맵을 정제, 재구성한다. (ex. FPN)
◾ DenseHead - 특징 맵의 Dense location을 수행하는 부분이다. (ex. RPN; Region Proposal Network)
◾ RoIHead - RoI 특징을 입력으로 받아 box 분류, 좌표 등을 예측하는 부분이다.
1. Configs
MMDetection은 모듈식 설계를 사용하며, 다양한 기능을 가진 모든 모듈은 config를 통해 구성되어 있다.
1.1 Config file inheritance
⇒ 공식문서 내용으로 “dataset, model, schedule, default_runtime” 이렇게 4가지 기본 구성 요소 유형으로 이루어져 있다.
참고 문헌
'Deep Learning > 컴퓨터 비전 (CV)' 카테고리의 다른 글
SVM(Support Vetor Machine) 이란 ?? (0) | 2025.06.11 |
---|---|
학부 연구생 - Computer Vision의 종류 (0) | 2025.03.27 |
학부 연구생 - Day04: CNN 대표 아키텍처: ResNet, VGGNet, AlexNet (0) | 2025.03.10 |