본문 바로가기

분류 전체보기374

[2025.04] 1주차 Today I Learned 03/31 월1. 휴가 04/01 화1. InstructDiffusion 논문 정리https://rahites.tistory.com/383 [Paper Review] InstructDiffusion 논문 이해하기『InstructDiffusion: A Generalist Modeling Interface for Vision Tasks. CVPR. 2024.』이 논문의 목적은 "사람의 지시에 따라 모든 Vision Task를 수행할 수 있는 모델 개발"이다. 그렇기에 이 논문의 내용은 내가 최종적rahites.tistory.com 04/02 수1. Flamingo 논문 리딩2. 영어 회화 스터디 04/03 목1. 회사 내부 미팅2. VLM 관련 기술 연구- 회사 업무 관련 모델 개발 04/04 금1. YOL.. 2025. 3. 31.
[25.03.26] 영어 회화 스터디 [Daily Conversation]- 우아하다elegant, graceful - 민첩한agile  - 너구리raccoon, raccoon dog - 신경쓰다care, care about - 신경쓰지마never mind - 약육강식law of the jungle, survival of the fittest - 부양가족dependent - 비인간적인inhumane - 이상한사람, 괴짜freak - 좋아하다be fond of(Like 정도) - 섬뜩해지는 느낌creep (ex. give me creeps) - 매혹되다enchanted by - 내 취향이 아니다it is not my thing - 감당하다handle [오늘의 표현 정리]1. catch one's eyes: 눈길을 사로잡다2. look arou.. 2025. 3. 27.
[Paper Review] LLaVA 논문 이해하기 『Visual Instruction Tuning. NeurIPS. 2023.』새로운 연구 주제를 잡기 위해 최신 방법론들을 두루두루 공부하는 중이다. 그 중 가장 내가 연구하고 싶은 멀티모달, 특히 VLM과 관련된 논문들을 읽어보려 한다. 그 중 처음으로 정리하게 된 논문은 LLaVA으로 2년만에 6천건이 넘는 인용수를 기록하고 있는, 최근 핫한 모델을 알아보려 한다."Vision Encoder + LLM" 한국인 교수님이 집필에 참여하신 점부터 컴팩트한 제목까지, 매력이 가득한 LLaVA 논문을 이해해보자 ☺️https://github.com/haotian-liu/LLaVA GitHub - haotian-liu/LLaVA: [NeurIPS'23 Oral] Visual Instruction Tuning .. 2025. 3. 26.
[25.03.24] 영어 회화 스터디 [Daily Conversation]- 살을 빼다get in shape - 지속하다stick to - 한계를 뛰어넘다push my limit - 장애물stumbling block, setback - 계획을 짜다map out a plan - 뒤처지다fall behind - 원동력driving force - 우선순위에서 밀려나다take a backseat - 반대도 마찬가지다vice versa - 일관된 행동consistent action - ~에서 생기다stems from - 사기꾼fraud, scammer, con artist, swindlerhttps://described.tistory.com/206 사기꾼 영어로 - fraud, scam 포함한 총 6가지 표현들 알아보자한국어에서 "사기꾼"이라는 단어.. 2025. 3. 25.
[2025.03] 4주차 Today I Learned 03/24 월1. 논문 연구 주제 잡기- 여러 Reference 들을 잡아두었고 읽어야 할 논문들을 우선적으로 파악- 어짜피 가용할 수 있는 GPU 자원을 알아야 주제를 확립할 수 있기 때문에 4월 전까지는 최대한 여러 방법론들을 파악하는 것을 우선적으로 할 예정2. LLaVA 논문 리딩 시작- 많이 읽으려 하였지만, 시작하려고 앉자마자 회사일이 들어와 우선 미뤄둠3. 영어 회화 스터디 03/25 화1. LLaVA 논문 읽기 03/26 수1. LLaVA 논문 정리https://rahites.tistory.com/382 [Paper Review] LLaVA 논문 이해하기『Visual Instruction Tuning. NeurIPS. 2023.』새로운 연구 주제를 잡기 위해 최신 방법론들을 두루두루 공부하.. 2025. 3. 25.
[Paper Review] ViTAE 논문 이해하기 『ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias. NeurIPS. 2021.』Vision Task에 Transformer 모델을 활용하는 방법을 공부하다 보면, 한 가지 궁금증이 생기게 된다. 본래 Transformer 모델은 NLP에서 온 Task이기에 공간 정보에 대해 자세히 학습하지 않는데, 그렇다면 CNN과 같은 Inductive Bias를 Transformer 모델에 주입할 경우 그 성능이 더 향상 될 수 있을까? 이번에 소개할 논문은 이러한 호기심을 해결하고자 연구를 진행한 논문으로, 어떻게 기존 ViT 모델에 CNN의 주요 특징을 반영하였는 지를 중심으로 논문을 이해해 보고자 한다. 이전에 논문 리뷰를 진행했.. 2025. 3. 21.