본문 바로가기

논문 paper 리뷰41

[Paper Review] ControlNet 논문 이해하기 『 Adding Conditional Control to Text-to-Image Diffusion Models. ICCV. 2023. 』 생성 모델을 사용하여 사람 이미지를 만들다보면 드는 생각이 있다. "생성 모델을 활용하여 내가 원하는 포즈를 가진 사람의 이미지를 만들 수 있을까?" 이번 논문은 그 해답에 대한 방법을 소개하는 ControlNet 논문이다. 사실 사용자가 원하는 Condition이라는 것이 텍스트건 이미지건 잘 반영되기 쉽지 않다. ChatGPT를 쓰더라도 사람의 검토가 필요하고, 원하는 글자를 생성 이미지로 만들어달라고 하더라도 아직 완벽한 이미지를 만들지 못하는 것이 현실이다.  이러한 상황에서 Low-level의 Condition일지라도 이미지에 사용자가 원하는 정보를 반영해준.. 2024. 12. 2.
[Paper Review] RTMPose 논문 이해하기 『 RTMPose: Real-Time Multi-Person Pose Estimation based on MMPose. arxiv. 2023. 』 이번에 소개할 논문은 이전에 리뷰했던 SimCC 모델의 방법론을 활용하여, 더 빠른 속도로 모델 추론이 가능하게끔 설계한 RTMPose 논문이다. 지금까지 내가 실제 테스트를 돌려보았을 때 가장 속도와 성능의 밸런스가 좋았던 모델이었던 것 같고, 아직 논문이 Publish는 되지 않았지만, 아래 Github 링크와 같이 MMPose Framework에 녹아져 있어 학습이나 추론에 충분이 활용할 수 있는 모델이다. 정말 많은 모델에 대해 실험을 진행하였으며, 따라서 실험과 방법, 저자가 말하는 Contribution에 초점을 맞추어 논문을 읽어보려 한다. Git.. 2024. 11. 26.
[Paper Review] SimCC 논문 이해하기 『 SimCC: a Simple Coordinate Classification Perspective for Human Pose Estimation. ECCV. 2022. 』 이번에 소개할 논문은 기존 Human Pose Estimation의 Head 부분에서 주로 사용하던 Heatmap 방식을 Classification으로 다르게 해석하여 더 효율성을 높인 방법을 소개한 SimCC 논문이다. 기존 Heatmap 방식에서 발생하던 문제점을 해결하고 성능을 해결한 방식을 소개하고 있다. SimCC는 추후 변형을 통해 성능 개선을 많이 이끌어 내었으므로 꼭 주목하여 읽어볼 것! (초창기 이름은 SimDR이었다고 한다) doi : https://link.springer.com/chapter/10.1007/978.. 2024. 11. 24.
[Paper Review] HRFormer 논문 이해하기 『 HRFormer: High-Resolution Transformer for Dense Prediction. NeurIPS. 2021. 』이번에 소개할 논문은 HRNet 구조에 Transformer 기법을 적용한 HRFormer 논문이다. HRNet이 등장한 이후 전체 네트워크 동안 고해상도를 유지하는 것이 성능을 높이는 데 도움을 주었다는 것이 입증되었고, ViT 모델이 등장하며 한단계 더 발전한 기법을 활용할 수 있게 되었다. 이 논문은 이러한 2가지 성공적인 기법을 잘 믹스하여 Pose Estimation, Semantic Segmentation Task에서 특히 좋은 성능을 낼 수 있었다. 본 논문에서는 Image Classification, Pose Estimation, Semantic Seg.. 2024. 10. 8.
[Paper Review] Unbiased Data Processing for Human Pose Estimation 논문 이해하기 『 The Devil is in the Details: Delving into Unbiased Data Processing for Human Pose Estimation. CVPR. 2020. 』지금까지는 주로 성능을 높이기 위해 여러 기법들을 결합한 Pose Estimation 모델들에 대해 알아보았다. 이 모델들은 대부분 Object Detection이나 Segmentation과 같이 다른 Computer Vision Task에서 좋은 성능을 냈던 기법들을 가져와 Pose Estimation Task에 녹이는 방법을 사용하였는데, 이번에 소개할 논문에서는 Human Pose Estimation에서 성능을 높이려면 어떻게 해야할지를 먼저 고민하였다.   Devil is in the Details 라는 .. 2024. 9. 12.
[Paper Review] HigherHRNet 논문 이해하기 『 HigherHRNet: Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation. CVPR. 2020. 』HRNet이 Top-Down 모델에서 굉장히 좋은 성능을 냈다고 하면, 이번에는 HRNet의 기법을 Bottom-Up 기반의 모델에 적용시킨 HigherHRNet이 등장하였다. Bottom-Up 모델은 아무래도 시간이 빠른 대신 관절의 위치를 정확히 잡는 정확도가 문제가 되었는데 High-Representation을 사용하여 그 점을 충분히 완화한 점을 보여준 논문이다. Githubhttps://github.com/HRNet/HigherHRNet-Human-Pose-Estimation GitHub - HRNet/HigherHR.. 2024. 9. 8.