POSE ESTIMATION11 [Paper Review] CPN 논문 이해하기 『 Cascaded Pyramid Network for Multi-Person Pose Estimation. CVPR. 2018. 』이번에 소개할 논문은 FPN 구조를 발전시켜 Multi-Person Pose Estimation Task에 적용시킨 CPN 논문이다. 이번 논문 리딩은 빠른 이해를 위해 아래의 참고자료 블로그를 한번 쭉 읽고 난 후 논문 리딩을 시작하였다. 여러 모델의 핵심 기법들을 합쳐 더 좋은 성능을 내는 모델을 만들었다는 특징을 가지며 그렇기에 논문의 내용이 그렇게 어렵지 않았다. 참고자료https://velog.io/@haejoo/Cascaded-Pyramid-Network-for-Multi-Person-Pose-Estimation-%EB%85%BC%EB%AC%B8-%EC%A0%95.. 2024. 9. 4. [Paper Review] Stacked Hourglass 논문 이해하기 『 Stacked Hourglass Networks for Human Pose Estimation. ECCV. 2016. 』이번에 소개할 논문은 Human Pose Estimation에서 성능을 높일 수 있는 방법론을 소개한 Stacked Hourglass Network 논문이다. 본 논문에서는 Pooling과 Upsampling을 통해 원하는 Joint Location의 Heatmap을 예측하는 모델을 소개한다. 언뜻보면 U-Net의 방법론과 비슷하며 AutoEncoder, VAE 등 무언가 정보를 잘 집약하고 다시 풀어주는 형태의 연구가 해당 시기에 많이 이루어진 것으로 보인다. Paperswithcodehttps://paperswithcode.com/paper/stacked-hourglass-net.. 2024. 9. 3. [Paper Review] DeepPose 논문 이해하기 『 DeepPose: Human Pose Estimation via Deep Neural Networks. CVPR. 2014. 』 지금까지 여러 Pose Estimation 논문을 읽어보았지만, 아직 Pose Estimation의 초창기 발전 과정부터 논문을 읽어오지 않았었다. 따라서 관련 논문도 준비할 겸 이번 기회에 Pose Estimation과 딥러닝이 만나기 시작한 시점부터 논문을 읽어보려 한다. 그 시작은 Pose Estimation Task에 처음으로 딥러닝 모델을 적용한 논문인 DeepPose이다. 나온지 10년이 된 논문이기에 핵심적인 부분만 빠르게 읽어보도록 하겠다.0. Abstract본 논문은 DNN(Deep Neural Network) 기반의 Regression 문제로 Pose Es.. 2024. 9. 2. [Paper Review] ViTPose 논문 이해하기 『 ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation. NeurIPS. 2022. 』Convolution 기법 이후 Vision Task에서도 좋은 성능을 내고 있던 Transformer 모델이 Human Pose Estimation에서도 좋은 성능을 낼 수 있다는 것을 보여준 논문이다. 2024년 현재에도 SOTA를 기록할만큼 좋은 성능을 보이는 모델이며 2D Human Pose Estimation의 연구가 3D나 Mesh 쪽으로 많이 이동한 현 시점에서 2D Joint만큼은 가장 잘 예측하는 모델이라는 설명을 붙일 수 있을 것 같다. 따라서 이번에는 어떻게 이 모델이 Transformer의 장점을 Human Keypoint를.. 2024. 8. 30. [Paper Review] MIPNet 논문 이해하기 『Multi-Instance Pose Networks: Rethinking Top-Down Pose Estimation. ICCV. 2021. 』여러 2D Pose Estimation 모델들을 실행하보면 은근 성능이 좋다는 걸 느낄 수 있다. 하지만, 대부분의 Pose Estimation 모델들이 성능이 확 떨어질 때가 발생하는데 이는 사람의 신체가 Occlusion 되었을 때이다. 이 경우에는 모델이 우리 신체를 전부 잡기 위해 내가 위치하지도 않은 곳에 신체가 위치해있다고 말하는 경우가 많은데, MIPNet이라는 모델은 이러한 Occlusion 문제를 해결하기 위해 등장한 모델이다. 기존 2D Human Pose Estimation에서 발생하는 Occlusion 문제를 완화하여 Occlusion 현상.. 2024. 8. 28. 이전 1 2 다음