본문 바로가기
TIL

[2024.08] 2주차 Today I Learned

by rahites 2024. 8. 5.

08/05 월

1. StableDiffusion 논문 정리

- StableDiffusion 논문 정리 및 개념 확인(추후 정리 예정)

2. 데이터 수도라벨링 마무리

-  DataLabeler 툴을 사용하여 마무리

 

08/06 화

1. 포즈 관련 연구 계획 잡기

- 앞으로 회사에서 진행할 프로젝트와 함께 준비할 수 있는 포즈 연구 주제를 잡음(Occlusion)

2. Gradio 데모 제작

- 이전에 만들어둔 Streamlit 대비 Gradio로 데모를 만들었을 때의 UI 성능 확인

3. 혼공컴운

- 4장 정리

 

08/07 수

1. Streamlit-YOLO 데모 제작

- Ultralytics 라이브러리와 Streamlit을 이용하여 Streamlit으로 내가 제작한 pt 파일에 맞는 Detection Inference를 보여주는 UI를 제작

- 기존에 공개되어있는 오픈 소스를 활용하여 그다지 어렵지 않게 진행하였다.

2. CivitAI 활용 방법 정리

- 기존에 1차적으로 정리해둔 내용을 조금 더 디테일하게 추가하였다.

3. 혼공컴운

- 4장 정리 마무리

 

08/08 목

1. Streamlit-YOLO 데모 제작 마무리

- Streamlit Cloud를 활용하여 Streamlit 데모를 배포해봤지만 Streamlit 서버에서 제공해주는 사양이 낮아 속도가 많이 느림...

- UI나 기능적인 부분에 있어서는 어느정도 구현이 마무리 되었지만, 목표로 하는 Task에 대한 모델 pt가 성능이 낮아 이를 먼저 개선하려 한다.

2. Selenium을 이용한 웹 이미지 크롤링

- 오랜만에 Selenium을 사용하여 구글 이미지 크롤링을 진행하였다. 생각보다 많은 오류가 났지만, F12로 클래스명, Xpath 등을 확인해가며 코드를 수정해 나가며 원하는 시간 전에 툴을 만들 수 있었다. 이전(몇년 전)에 진행하였을 때는 크롬 드라이버를 현재 브라우저에 맞게 설치하여 실행하였었는데 Selenium이 업데이트되어 그럴 필요가 없다고 한 점이 인상적이었다.

 

08/09 금

1. StableDiffusion에 대한 이해

- 이미지 원본에 Noise를 주고 이를 그대로 복원하는 과정을 학습하는 방법론은 DDPM에서 제안하였다. Stable Diffusion은 VAE와 U-Net을 활용하여 Latent Vector에서 Noise를 주고 이를 복원하는 과정을 학습하는 방법론을 제안한 것!

- Input이 VAE의 Encoder를 통과하여 Latent Vector -> U-Net을 N번 반복하며 Latent Vector에서 noise를 주며 DDPM의 방법론을 활용 -> VAE의 Decoder를 통해 이미지를 생성

2. 데이터 크롤링 수집 및 추가 라벨링

- 프로젝트 수행에 부족한 이미지를 크롤링 및 라벨링 하여 데이터를 구축

 

08/10 토

1. 영어 회화 스터디

- 다시 시작하는 영어 회화 스터디!!

2. 혼공컴운

- 5-1장 정리

 

08/11 일

1. 혼공컴운

- 5-2장 정리

'TIL' 카테고리의 다른 글

[2024.08] 3주차 Today I Learned  (0) 2024.08.12
[2024.08] 1주차 Today I Learned  (0) 2024.07.29
[2024.07] 4주차 Today I Learned  (0) 2024.07.22

댓글