2025/03/261 [Paper Review] LLaVA 논문 이해하기 『Visual Instruction Tuning. NeurIPS. 2023.』새로운 연구 주제를 잡기 위해 최신 방법론들을 두루두루 공부하는 중이다. 그 중 가장 내가 연구하고 싶은 멀티모달, 특히 VLM과 관련된 논문들을 읽어보려 한다. 그 중 처음으로 정리하게 된 논문은 LLaVA으로 2년만에 6천건이 넘는 인용수를 기록하고 있는, 최근 핫한 모델을 알아보려 한다."Vision Encoder + LLM" 한국인 교수님이 집필에 참여하신 점부터 컴팩트한 제목까지, 매력이 가득한 LLaVA 논문을 이해해보자 ☺️https://github.com/haotian-liu/LLaVA GitHub - haotian-liu/LLaVA: [NeurIPS'23 Oral] Visual Instruction Tuning .. 2025. 3. 26. 이전 1 다음