본문 바로가기

전체 글328

[AI Q&A] R-CNN 계열 모델 정리하기 Object Detection을 공부하다 보면 가장 먼저 배우는 모델이 바로 R-CNN이다. 처음 이 모델에 대해 접했던 건 학부 3학년 정도로 핵심적인 개념과 대충 이렇구나~ 정도만 외워 넘어간 것 같은데, 지금 다시 강의를 들으며 공부해보니 내가 잘 알지 못했던 부분이 많아  나중에 또 까먹을 것이 뻔하기에 이렇게 정리해두려 한다. R-CNN 계열의 모델 디자인이 당연히 추후 개량되어 등장하였겠지만, 여기서는 가장 대표적인 R-CNN, Fast R-CNN, Faster R-CNN에 대해 정리하려 한다. 글의 흐름은 내가 이 세가지 모델을 이해한 지식의 흐름에 따랐다.우선 본격적으로 R-CNN 모델에 대해 이해하기 전, 우리는 딥러닝에서 어떻게 Object Detection이라는 Task가 이루어질 수.. 2024. 12. 26.
[2024.12] 4주차 Today I Learned 12/23 월1. 병원 돌아다니는 신세...- CES 면접 준비 12/24 화1. CES 서포터즈 면접- 한동안 영어 스피킹을 안했다고 또 입이 잘 안열린다... 미국 다녀와서 다시 시작해야겠다는 걸 다시 한번 느낌2. 원단 추천 시스템 데모 제작- Streamlit을 활용하여 데모 제작(Github Private) 12/25 수1. 메리 크리스마스~ 12/26 목1. 컴퓨터비전 R-CNN 모델 정리- 출국 전 정리하고자 했던 R-CNN 계열 모델 정보 정리. 나중에 내가 다시 봤을 때 잘 이해가 되었으면 한다.https://rahites.tistory.com/345 [AI Q&A] R-CNN 계열 모델 정리하기Object Detection을 공부하다 보면 가장 먼저 배우는 모델이 바로 R-CNN이다. .. 2024. 12. 23.
[Book Review] 소년이 온다 소년이 온다저자 : 한강출판 : 창비 발행 : 2014. 05. 19. 이 책을 구입한 것은 지난 11월 초 쯤이었다. 10월에 있었던 두바이 박람회와 중간고사, 논문 제출로 이어지는 바쁜 일정을 마무리한 후 마음에 조금의 여유가 생겨 올해 노벨 문학상을 수상하신 한강 작가님의 작품을 읽어보려 하였다. 학부생 시절 "한국 문학의 이해"라는 수업을 들으며 한 학기동안 10편이 넘는 국내 단편 소설을 읽은 적이 있었는데, 그 이후로 거의 3년 만에 한국 문학을 읽은 것 같다. 평소에 논문을 꽤 읽어서 그런지 책을 오랜만에 읽음에도 집중하는데 큰 어려움은 없었고, 시간이 날 때마다 퇴근 후 침대에 누워 한 두 챕터씩 읽어 나갔다. 책의 시작은 동호의 이야기로 시작된다. 그리고는 정대, 은숙 등 동호의 주변 인.. 2024. 12. 22.
[2024.12] 3주차 Today I Learned 12/16 월1. 기계학습 시험 공부- 전체 범위2. 메타러닝 공부- AutoAugment- Hyperparameter Optimization 12/17 화1. 기계학습 기말고사2. 컴퓨터비전 공부- CNN Methods 12/18 수1. 컴퓨터비전 공부- 전체 범위2. 메타러닝 공부- Continual Learning- In-Context Learning 12/19 목1. 컴퓨터비전 기말고사- 무난하게 본 듯2. 메타러닝 공부- 전체 범위 12/20 금1. 메타러닝 기말고사- 외운 부분에서 대부분 나와 잘 작성한 것 같다.2. 밀린 회사 업무 및 CES 준비- 종강했으니 기분좋게 연말 작업 진행!! 12/21 토1. 휴식 및 병원 12/22 일1. 2024. 12. 16.
[메타러닝] 4. Bayesian Meta-Learning 이번에 정리할 내용은 Bayesian Meta-Learning이다. 많이 다뤄본 Bayesian과 관련된 내용이며 추후 내가 이 글을 다시 보았을 때 어떤 내용이 있었는지 간단하게 짚고 넘어갈 수 있도록 핵심 위주로 작성해보도록 하겠다.1. Bayesian Learning일반적으로 우리가 Bayes' Rule을 왜 사용하는지를 생각해보면 Posterior를 바로 알기 어려워 Prior와 Likelihood만으로 이를 계산하려 하거나, 사용하려는 데이터가 작기 때문에 불확실성이 커서 Stochastic Model을 사용하는 것이 큰 이유이다. 모델의 파라미터를 확률분포로 계산하여 데이터에서 얻은 정보와 Prior를 결합하며 학습하는 과정을 거친다.  Bayesian Modeling 과정에서는 Latent .. 2024. 12. 16.
[메타러닝] 3. Meta Reinforcement Learning 이번에 알아볼 내용은 Meta Reinforcement Learning에 관한 내용이다.  강화학습을 이전에 공부해본 적이 없어서 기본적인 강화학습에 대한 내용을 가볍게 정리하고 넘어가도록 하겠다.1. Reinforcement Learning강화학습은 Agent가 Environment와 상호 작용을 수행하며 최적의 Policy를 학습하는 방법이다. 강화학습의 목표는 Agent가 Reward를 최대화하도록 학습시키는 것이다.Agent: 학습을 수행하는 주체, Environment와 상호작용하며 행동을 수행함Environment: Agent가 행동을 수행하고 Reward를 받는 곳State: Agent가 현재 위치한 Environment의 상태를 나타내는 정보Action: Agent가 State에서 선택할 .. 2024. 12. 16.
[메타러닝] 2. Meta-Learning Methods 메타러닝의 방법론은 크게 3가지로 나눌 수 있다. (1) Model-based(2) Metric-based(3) Optimization-based 이번 시간에는 이 방법론들에 대해 중요한 부분들만 특징적으로 알아보도록 하자1. Model-Based Meta-LearrningModel-Based Meta-Learning은 학습 알고리즘 자체를 Model로써 설계하여 새로운 Task에 대한 빠른 Adaptation과 일반화를 가능하게 하는 방법론이다. 다시말하면 Model 자체가 새로운 Task에 빠르게 적응할 수 있는 매커니즘을 학습한다는 의미이다. 여기서 말하는 매커니즘이란 특정 메타 파라미터일 수도 있고, 정보를 담고 있는 특정 형태의 무언가 일 수 있다. 그렇다면 당연하게도 모델링을 얼마나 잘하는지가.. 2024. 12. 13.
[메타러닝] 1. Meta-Learning이란? 벌써 2024년 2학기도 마지막을 바라보고 있다.  이번 학기를 마무리 하며 수강한 메타러닝 수업의 내용을 정리해 보려 한다(기말고사도 준비할겸..). 정말 정말 핵심만을 기록하고 내가 이해한 바를 정리해 보려 한다.메타러닝(Meta-Learning)이란?메타러닝은 일반적으로 "Learning to Learn" 이라는 말로 표현되며, 모델이 새로운 과제나 환경에 더 빠르고 효율적으로 적응할 수 있도록 돕는 기술이다.  일반적으로 딥러닝에서 사용하는 학습이 Data를 기반으로 학습을 진행한다면, 메타러닝에서는 Task를 기반으로 학습을 진행한다.   vs Meta-Learning>Transfer Learning은 특정 Task에서 학습된 모델을 다른 Task에 적용하는 방법이지만, Meta-Learning.. 2024. 12. 13.
[2024.12] 2주차 Today I Learned 12/09 월1. ControlNet PPT 완성 완료 및 녹화2. 책 읽기- 오랜만에 봐서 이전까지 내용 다시 보기- 5장(미래에서 바라보는 과거의 사건, 트라우마를 가지고 있는 주인공을 보며 3년 전에 읽었던 이순원 작가의 이 떠오른다.) ※ 오블완 챌린지 당첨..!! 치킨 한 마리 잘 먹겠습니다 :)https://notice.tistory.com/2686?t_src=tistory_pc_notice [이벤트] 오블완 챌린지의 경품 당첨자를 발표합니다 🎉안녕하세요. 티스토리 팀입니다.가 종료된 후에도 꾸준히 #오블완 해주시는 블로거 분들을 볼 수 있었는데요.2025년까지 딱 22일 남은 지금! 한 해가 이렇게 흘러가는 게 아쉽다면notice.tistory.com 12/10 화1. 원단 추천 시스템 .. 2024. 12. 9.
[Paper Review] ControlNet 논문 이해하기 『 Adding Conditional Control to Text-to-Image Diffusion Models. ICCV. 2023. 』 생성 모델을 사용하여 사람 이미지를 만들다보면 드는 생각이 있다. "생성 모델을 활용하여 내가 원하는 포즈를 가진 사람의 이미지를 만들 수 있을까?" 이번 논문은 그 해답에 대한 방법을 소개하는 ControlNet 논문이다. 사실 사용자가 원하는 Condition이라는 것이 텍스트건 이미지건 잘 반영되기 쉽지 않다. ChatGPT를 쓰더라도 사람의 검토가 필요하고, 원하는 글자를 생성 이미지로 만들어달라고 하더라도 아직 완벽한 이미지를 만들지 못하는 것이 현실이다.  이러한 상황에서 Low-level의 Condition일지라도 이미지에 사용자가 원하는 정보를 반영해준.. 2024. 12. 2.
[2024.12] 1주차 Today I Learned 12/02 월1. ControlNet 논문 리딩 및 리뷰 작성 완료https://rahites.tistory.com/333 [Paper Review] ControlNet 논문 이해하기『 Adding Conditional Control to Text-to-Image Diffusion Models. ICCV. 2023. 』 생성 모델을 사용하여 사람 이미지를 만들다보면 드는 생각이 있다. "생성 모델을 활용하여 내가 원하는 포즈를 가진 사람의 이rahites.tistory.com2. CES 2025 Showcase 관련 디자인 제작- 샘플 이미지(스케치) 제작 및 견적 확인 -> 생각보다 모델링 가격이 비싸 판넬 정도로 진행할 예정 12/03 화1. ControlNet 발표 자료 제작- PPT로 논문 발표 .. 2024. 12. 2.
[잡동사니] CPU, GPU, GPGPU, NPU 요즘 유튜브를 보다보면 자주 보이는 쇼츠가 있다. 바로 아래와 같이 Nvidia에서 CPU와 GPU의 차이를 보여주는 시연 영상인데, 이걸 보고 나니 예전에는 잘 이해하지 못했던 CPU와 GPU의 차이를 가볍게 작성해 보려 한다(간혹 보이는 GPGPU와 NPU에 대한 설명은 덤이다). 예시 영상https://youtube.com/shorts/FNZTu2iHmR0?si=58W_px8DOXhOpAGU1. CPU(Centralized Processing Unit)컴퓨터의 중심 프로세서로 일반적인 계산 작업을 처리한다. 다양한 작업을 수행할 수 있으며 직렬 처리에 최적화되어 한 번에 하나의 작업을 빠르게 처리할 수 있다. https://rahites.tistory.com/283 [혼공컴운] 4. CPU의 작동 .. 2024. 11. 27.