본문 바로가기
TIL

[2024.03] 3주차 Today I Learned

by rahites 2024. 3. 18.

03/18 월

1. 최적화 이론 수업

- 복습 꼭 필요 할 듯

2. YOLOv9 Inference

- 서버에 환경 구축 및 데이터 정제하여 구동

 

03/19 화

1. HRNet 논문 리딩

2. Video가 Input으로 들어가는 딥러닝 모델 구조 구상

- 동영상 데이터의 경우 각 영상 별 Sequence 길이가 다른데 모델에 넣을 때 어떻게 처리를 할 것인가...

- 고정 Sequence로 변환하는 방법 or 동적 배치로 활용하는 방법 등이 있을텐데 동적으로 처리할 수 있는 방법론을 찾으려 함

- 계속해서 구글링 하기...

 

03/20 수

1. 선형대수 수업 및 퀴즈

2. Video가 Input으로 들어가는 딥러닝 모델 구조 구상

- I3D 모델을 활용하여 길이가 다른 비디오 Input을 처리할 수 있다는 정보

- 초기 Video Recognition 모델에서 등장한 모델로 Conv3D와 Optical Flow를 활용

- 이를 발전시켜 기존에 사용하려던 Task에 녹여보도록 Flow를 구상

https://arxiv.org/abs/1705.07750

 

Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

The paucity of videos in current action classification datasets (UCF-101 and HMDB-51) has made it difficult to identify good video architectures, as most methods obtain similar performance on existing small-scale benchmarks. This paper re-evaluates state-o

arxiv.org

 

03/21 목

1. 회사 업무 위주

 

03/22 금

1. Wider Face 데이터 셋 확인

- Bounding Box 시각화

- YOLOv9 모델에 넣기 위해 x1, y1, w, h로 되어있는 라벨을 center_x, center_y, w, h로 변경

2. Action Classification

- I3D 모델 코드 분석

https://github.com/Rahites/pytorch-i3d

 

GitHub - Rahites/pytorch-i3d

Contribute to Rahites/pytorch-i3d development by creating an account on GitHub.

github.com

- I3D가 등장한 논문 리딩

3. Video Classification

- 진행하려던 Task에 맞게 Zero Base로 코드 하나하나씩 작성

- Dynamic한 Frame 수와 Image Shape를 처리할 수 있는 방법 고안

4. 최적화 이론 공부

 

03/23 토

1. 투빅스 스터디 참여

- RNN / LSTM / Attention / Transformer

2. 최적화 이론 공부

- Vanilla Analysis

- Lipschitz Continuity

- Smoothness

 

03/24 일

1. HRNet 논문 리뷰 작성

2. 최적화 이론 공부

- Vanilla Analysis

- Lipschitz Continuity

- Smoothness

'TIL' 카테고리의 다른 글

[2024.03] 4주차 Today I Learned  (0) 2024.03.25
[2024.03] 2주차 Today I Learned  (0) 2024.03.11
[2024.03] 1주차 Today I Learned  (0) 2024.03.04

댓글