-
CNN 기반 camera pose estimation의 한계영상처리/3D computer vision 2023. 2. 2. 11:02728x90
제목이 너무 단정적인가 싶은데
논문 제목 자체가 "Understanding the Limitations of CNN-Based Absolute Camera Pose Regression" 이다.
CVPR 2019 Open Access Repository
Torsten Sattler, Qunjie Zhou, Marc Pollefeys, Laura Leal-Taixe; Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2019, pp. 3302-3312 Visual localization is the task of accurate camera pose estimation in a known scen
openaccess.thecvf.com
논문의 내용을 요약하자면 아래와 같다.
1. end-to-end로 전체를 학습시킨 absolute camera pose regression (APR) 은 3D structured-based method 에 비해 성능이 많이 떨어진다.
2. APR은 training data로부터 일반적인 경우까지 일반화를 보장하기 어렵다. (보통의 학습 결과가 그렇듯...)
2. 테스트해보니, 3D structure를 통한 pose estimation보다는 image retrieval을 통한 pose approximation 수준
아무튼, camera pose regression은 end-to-end 학습으로는 성능이 잘 나오지 않는다. 라는 결론이며
3D vision에 필요한 수학적인 모델과 method들을 공부하는 것에 대한 motivation이 되겠다.
728x90'영상처리 > 3D computer vision' 카테고리의 다른 글
pyflow optical flow (0) 2023.11.01 RAFT: Recurrent All-Pairs Field Transforms for Optical Flow 돌려보기 (0) 2023.10.30 Dense Optical Flow algorithm 비교 (open cv) (2) 2023.10.15 Epipolar geometry (0) 2023.02.12 Homogeneous coordinate (0) 2023.02.02