분류 전체보기374 [2025.04] 1주차 Today I Learned 03/31 월1. 휴가 04/01 화1. InstructDiffusion 논문 정리https://rahites.tistory.com/383 [Paper Review] InstructDiffusion 논문 이해하기『InstructDiffusion: A Generalist Modeling Interface for Vision Tasks. CVPR. 2024.』이 논문의 목적은 "사람의 지시에 따라 모든 Vision Task를 수행할 수 있는 모델 개발"이다. 그렇기에 이 논문의 내용은 내가 최종적rahites.tistory.com 04/02 수1. Flamingo 논문 리딩2. 영어 회화 스터디 04/03 목1. 회사 내부 미팅2. VLM 관련 기술 연구- 회사 업무 관련 모델 개발 04/04 금1. YOL.. 2025. 3. 31. [25.03.26] 영어 회화 스터디 [Daily Conversation]- 우아하다elegant, graceful - 민첩한agile - 너구리raccoon, raccoon dog - 신경쓰다care, care about - 신경쓰지마never mind - 약육강식law of the jungle, survival of the fittest - 부양가족dependent - 비인간적인inhumane - 이상한사람, 괴짜freak - 좋아하다be fond of(Like 정도) - 섬뜩해지는 느낌creep (ex. give me creeps) - 매혹되다enchanted by - 내 취향이 아니다it is not my thing - 감당하다handle [오늘의 표현 정리]1. catch one's eyes: 눈길을 사로잡다2. look arou.. 2025. 3. 27. [Paper Review] LLaVA 논문 이해하기 『Visual Instruction Tuning. NeurIPS. 2023.』새로운 연구 주제를 잡기 위해 최신 방법론들을 두루두루 공부하는 중이다. 그 중 가장 내가 연구하고 싶은 멀티모달, 특히 VLM과 관련된 논문들을 읽어보려 한다. 그 중 처음으로 정리하게 된 논문은 LLaVA으로 2년만에 6천건이 넘는 인용수를 기록하고 있는, 최근 핫한 모델을 알아보려 한다."Vision Encoder + LLM" 한국인 교수님이 집필에 참여하신 점부터 컴팩트한 제목까지, 매력이 가득한 LLaVA 논문을 이해해보자 ☺️https://github.com/haotian-liu/LLaVA GitHub - haotian-liu/LLaVA: [NeurIPS'23 Oral] Visual Instruction Tuning .. 2025. 3. 26. [25.03.24] 영어 회화 스터디 [Daily Conversation]- 살을 빼다get in shape - 지속하다stick to - 한계를 뛰어넘다push my limit - 장애물stumbling block, setback - 계획을 짜다map out a plan - 뒤처지다fall behind - 원동력driving force - 우선순위에서 밀려나다take a backseat - 반대도 마찬가지다vice versa - 일관된 행동consistent action - ~에서 생기다stems from - 사기꾼fraud, scammer, con artist, swindlerhttps://described.tistory.com/206 사기꾼 영어로 - fraud, scam 포함한 총 6가지 표현들 알아보자한국어에서 "사기꾼"이라는 단어.. 2025. 3. 25. [2025.03] 4주차 Today I Learned 03/24 월1. 논문 연구 주제 잡기- 여러 Reference 들을 잡아두었고 읽어야 할 논문들을 우선적으로 파악- 어짜피 가용할 수 있는 GPU 자원을 알아야 주제를 확립할 수 있기 때문에 4월 전까지는 최대한 여러 방법론들을 파악하는 것을 우선적으로 할 예정2. LLaVA 논문 리딩 시작- 많이 읽으려 하였지만, 시작하려고 앉자마자 회사일이 들어와 우선 미뤄둠3. 영어 회화 스터디 03/25 화1. LLaVA 논문 읽기 03/26 수1. LLaVA 논문 정리https://rahites.tistory.com/382 [Paper Review] LLaVA 논문 이해하기『Visual Instruction Tuning. NeurIPS. 2023.』새로운 연구 주제를 잡기 위해 최신 방법론들을 두루두루 공부하.. 2025. 3. 25. [Paper Review] ViTAE 논문 이해하기 『ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias. NeurIPS. 2021.』Vision Task에 Transformer 모델을 활용하는 방법을 공부하다 보면, 한 가지 궁금증이 생기게 된다. 본래 Transformer 모델은 NLP에서 온 Task이기에 공간 정보에 대해 자세히 학습하지 않는데, 그렇다면 CNN과 같은 Inductive Bias를 Transformer 모델에 주입할 경우 그 성능이 더 향상 될 수 있을까? 이번에 소개할 논문은 이러한 호기심을 해결하고자 연구를 진행한 논문으로, 어떻게 기존 ViT 모델에 CNN의 주요 특징을 반영하였는 지를 중심으로 논문을 이해해 보고자 한다. 이전에 논문 리뷰를 진행했.. 2025. 3. 21. 이전 1 2 3 4 5 ··· 63 다음