본문 바로가기

AI 공부하는 대학감자 감자소개

2025/04/011

[Paper Review] InstructDiffusion 논문 이해하기 『InstructDiffusion: A Generalist Modeling Interface for Vision Tasks. CVPR. 2024.』이 논문의 목적은 "사람의 지시에 따라 모든 Vision Task를 수행할 수 있는 모델 개발"이다. 그렇기에 이 논문의 내용은 내가 최종적으로 추구하는 딥러닝 연구분야와 결이 같다. "어떻게 하면 사람이 원하는 걸 모델이 정확히 이해하고, 사용자의 요구를 '알잘딱깔센'하게 수행하게 만들 수 있을까?"라는 질문에 대한 해답에 힌트가 되는 Multimodal 연구 중 하나라고 생각하며, 이번 논문을 읽으며 나에게도 내가 하고자 하는 연구의 방향성을 조금 더 좁힐 수 있는 계기가 되었다. 이번 논문 리뷰는 내가 가장 알고 싶은 Pose(본 논문에서는 Keypoi.. 2025. 4. 1.

이전 1 다음

최근글

인기글

태그

LG Aimers X:AI 파이썬 머신러닝 완벽 가이드 TiL D&A 딥러닝 메타러닝 SKT AI 혼공컴운 opencv 영어 회화 추천시스템 POSE ESTIMATION Today I Learned 백준

전체 방문자

Today :

Yesterday :

티스토리툴바