본문 바로가기

전체 글369

[Paper Review] InstructDiffusion 논문 이해하기 『InstructDiffusion: A Generalist Modeling Interface for Vision Tasks. CVPR. 2024.』이 논문의 목적은 "사람의 지시에 따라 모든 Vision Task를 수행할 수 있는 모델 개발"이다. 그렇기에 이 논문의 내용은 내가 최종적으로 추구하는 딥러닝 연구분야와 결이 같다.  "어떻게 하면 사람이 원하는 걸 모델이 정확히 이해하고, 사용자의 요구를 '알잘딱깔센'하게 수행하게 만들 수 있을까?"라는 질문에 대한 해답에 힌트가 되는 Multimodal 연구 중 하나라고 생각하며, 이번 논문을 읽으며 나에게도 내가 하고자 하는 연구의 방향성을 조금 더 좁힐 수 있는 계기가 되었다. 이번 논문 리뷰는 내가 가장 알고 싶은 Pose(본 논문에서는 Keypoi.. 2025. 4. 1.
[2025.04] 1주차 Today I Learned 03/31 월1. 휴가 04/01 화1. InstructDiffusion 논문 정리https://rahites.tistory.com/383 [Paper Review] InstructDiffusion 논문 이해하기『InstructDiffusion: A Generalist Modeling Interface for Vision Tasks. CVPR. 2024.』이 논문의 목적은 "사람의 지시에 따라 모든 Vision Task를 수행할 수 있는 모델 개발"이다. 그렇기에 이 논문의 내용은 내가 최종적rahites.tistory.com 04/02 수1. 2025. 3. 31.
[25.03.26] 영어 회화 스터디 [Daily Conversation]- 우아하다elegant, graceful - 민첩한agile  - 너구리raccoon, raccoon dog - 신경쓰다care, care about - 신경쓰지마never mind - 약육강식law of the jungle, survival of the fittest - 부양가족dependent - 비인간적인inhumane - 이상한사람, 괴짜freak - 좋아하다be fond of(Like 정도) - 섬뜩해지는 느낌creep (ex. give me creeps) - 매혹되다enchanted by - 내 취향이 아니다it is not my thing - 감당하다handle [오늘의 표현 정리]1. catch one's eyes: 눈길을 사로잡다2. look arou.. 2025. 3. 27.
[Paper Review] LLaVA 논문 이해하기 『Visual Instruction Tuning. NeurIPS. 2023.』새로운 연구 주제를 잡기 위해 최신 방법론들을 두루두루 공부하는 중이다. 그 중 가장 내가 연구하고 싶은 멀티모달, 특히 VLM과 관련된 논문들을 읽어보려 한다. 그 중 처음으로 정리하게 된 논문은 LLaVA으로 2년만에 6천건이 넘는 인용수를 기록하고 있는, 최근 핫한 모델을 알아보려 한다."Vision Encoder + LLM" 한국인 교수님이 집필에 참여하신 점부터 컴팩트한 제목까지, 매력이 가득한 LLaVA 논문을 이해해보자 ☺️https://github.com/haotian-liu/LLaVA GitHub - haotian-liu/LLaVA: [NeurIPS'23 Oral] Visual Instruction Tuning .. 2025. 3. 26.
[25.03.24] 영어 회화 스터디 [Daily Conversation]- 살을 빼다get in shape - 지속하다stick to - 한계를 뛰어넘다push my limit - 장애물stumbling block, setback - 계획을 짜다map out a plan - 뒤처지다fall behind - 원동력driving force - 우선순위에서 밀려나다take a backseat - 반대도 마찬가지다vice versa - 일관된 행동consistent action - ~에서 생기다stems from - 사기꾼fraud, scammer, con artist, swindlerhttps://described.tistory.com/206 사기꾼 영어로 - fraud, scam 포함한 총 6가지 표현들 알아보자한국어에서 "사기꾼"이라는 단어.. 2025. 3. 25.
[2025.03] 4주차 Today I Learned 03/24 월1. 논문 연구 주제 잡기- 여러 Reference 들을 잡아두었고 읽어야 할 논문들을 우선적으로 파악- 어짜피 가용할 수 있는 GPU 자원을 알아야 주제를 확립할 수 있기 때문에 4월 전까지는 최대한 여러 방법론들을 파악하는 것을 우선적으로 할 예정2. LLaVA 논문 리딩 시작- 많이 읽으려 하였지만, 시작하려고 앉자마자 회사일이 들어와 우선 미뤄둠3. 영어 회화 스터디 03/25 화1. LLaVA 논문 읽기 03/26 수1. LLaVA 논문 정리https://rahites.tistory.com/382 [Paper Review] LLaVA 논문 이해하기『Visual Instruction Tuning. NeurIPS. 2023.』새로운 연구 주제를 잡기 위해 최신 방법론들을 두루두루 공부하.. 2025. 3. 25.
[Paper Review] ViTAE 논문 이해하기 『ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias. NeurIPS. 2021.』Vision Task에 Transformer 모델을 활용하는 방법을 공부하다 보면, 한 가지 궁금증이 생기게 된다. 본래 Transformer 모델은 NLP에서 온 Task이기에 공간 정보에 대해 자세히 학습하지 않는데, 그렇다면 CNN과 같은 Inductive Bias를 Transformer 모델에 주입할 경우 그 성능이 더 향상 될 수 있을까? 이번에 소개할 논문은 이러한 호기심을 해결하고자 연구를 진행한 논문으로, 어떻게 기존 ViT 모델에 CNN의 주요 특징을 반영하였는 지를 중심으로 논문을 이해해 보고자 한다. 이전에 논문 리뷰를 진행했.. 2025. 3. 21.
[2025.03] 3주차 Today I Learned 03/17 월1. 교수님 논문 미팅- Face Recognition 논문 계속 준비중2. 선형대수 공부 03/18 화1. 오전 회사 미팅2. 선형대수 공부3. 컴퓨터비전 공부 03/19 수1. 채용 박람회 부스 운영2. 선형대수 종합시험- 관련 내용은 아는데 영어를 몰라서 잘못 쓴 느낌... 03/20 목1. 컴퓨터비전 종합시험 03/21 금1. ViTAE 논문 리딩 및 정리https://rahites.tistory.com/379 [Paper Review] ViTAE 논문 이해하기『ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias. NeurIPS. 2021.』Vision Task에 Transformer 모델을 활용하는 방법을.. 2025. 3. 17.
[25.03.12] 영어 회화 스터디 [Daily Conversation]- 목표를 두다set one's sights on - 달성하다, 극복하다carry through - 집중하다zero in on - ~를 위해 노력하다work on - ~를 불러일으키다bring about - 구상하다envision - 수단method - 올바르게 나아가다stay track - 촉매제catalyst - 슬슬 생기다, 살금살금 들어가다creep in - 목록에 적혀있는 것들에 선을 그어서 줄여나가는 것(일을 하나씩 해치우다)check off - 새로 시작하다(발을 담그다)get one's feet wet in - 발목을 잡다hold one's back - 나누다break down - ~을 줄이다cutting down on - 새로운 길을 개척하다break .. 2025. 3. 13.
[25.03.10] 영어 회화 스터디 [Daily Conversation]- 정당화하다justify - 정신을 못차리다out of it - 정신차리다feel awake - 필수적인essential, crucial, mandatory, vital, necessary, indispensable - 귀찮게 굴다bug(ex. I didn't want my friends to bug me) - 나서다step in(ex. I would step in and tell someone) - 걸리다get caught(ex. If he ever got caught lying to me) - 억누르다, 감추다withhold - 무서운 일이다It's alarming - 조용히 지내다keep it low-key - 욕심greed, avarice(격식체) - 석방re.. 2025. 3. 10.
[2025.03] 2주차 Today I Learned 03/10 월1. 생성모델 활용 원하는 결과 만들기- GPU vRAM이 낮아 최신 좋은 모델을 사용하지 못해 아쉽..2. 영어회화 스터디 03/11 화1. 생성모델 활용 원하는 결과 만들기- 3일차(vRAM의 한계에 봉착...) 아직까지 좋은 결과를 위해서는 좋은 GPU가 필요하다는 것을 다시금 느낌 03/12 수1. 모션 캡처 장비 활용 테스트- Perception Neural Studio를 활용하여 움직임 측정 테스트(착용하는데 좀 익숙해진듯)2. 선형대수 복습- 졸업 시험을 위한 공부..!!3. 영어회화 스터디 03/13 목1. 정부 과제 설명회 참석- 지금까지 업무를 하면서 스쳐갔던 몇몇 정부 기관들.. 관련 발표를 들으며 내가 어떤 일을 하고 있는지 이제 정립이 되어가고 있는 느낌이랄까, 보이지.. 2025. 3. 10.
[25.03.05] 영어 회화 스터디 [Daily Conversation]- 한 몫 하다play a part in - 잘 맞는compatible with - 망치다screw it up - 개인주의individualistic ideology - 야단치다chew me out - 응원하다root for - 상황이 바뀌다the tables have turned - 생각을 바꾸다, 다시 의식을 차리다come around - 심사숙고하다mull it over - 장례를 치르다lay someone to rest → lay the prejudice to rest(편견을 종결시키다) - 뒷전으로 밀리다take a back seat - ~관계 없이, 불문하고regardless of - 관점outlook - 아마도Most likely - 기 빨리다feel dr.. 2025. 3. 5.