논문 paper 리뷰41 [X:AI] YOLO 논문 이해하기 『 You Only Look Once : Unified, Real-Time Object Detection. 2016. 』 0. Abstract - Object Detection의 새로운 접근 방식인 YOLO를 제안 - 기존 Object Detection에 사용하던 classifier 방식을 공간적으로 분리된 bounding box와 관련된 클래스 확률에 대한 regression 문제로 재정의 - 전체 detection pipeline이 단일 네트워크인 end-to-end 방식 - YOLO 모델의 속도가 매우 빠름 1. Introduction - 사람은 이미지를 잠깐 보더라도 이미지 안에 어떤 물체가 있고, 어디에 있는지, 어떻게 상호작용하고 있는지를 파악할 수 있다. 이렇게 빠르고 정확한 사람의 시각시스.. 2022. 7. 19. [X:AI] MobileNet 논문 이해하기 『 MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications. 2017. 』 0. Abstract - depthwise separable convolution을 사용한 간소화된 아키텍처를 제안한다. - latency와 accuracy를 효율적으로 상호 조정하는 2가지 글로벌 하이퍼파라미터를 소개한다. - 이는 ImageNet 분류에서 우수한 성능을 보이고 object detection, finegrain classification(세분화 분류), face attributes, large scale geo-localization에서 MobileNet의 효과를 시연해 보았다. 1. Introduction - Mobil.. 2022. 7. 18. [X:AI] SPPNet 논문 이해하기 SPPNet SPPNet은 기존에 공개된 R-CNN의 단점을 극복하고자 소개된 논문이다. R-CNN은 Selective Search를 사용하였음에도 각 Region Proposal마다 분류를 실행하기에 속도가 비교적 오래걸리고, 여러 Region Proposal들을 모델이 요구하는 고정 Input size에 맞추기 위해 Cropping이나 Warping을 사용하기에 이미지 정보가 손실될 수 있다는 단점을 가진다. 또한 CNN, SVM, Bounding Box 선형 회귀까지 3개의 모델로 이루어져 있어 복잡한 구조를 가지며 Multi-stage로 구성되어 있어 SVM의 학습 결과가 CNN을 업데이트 할 수 없다. SPPNet은 여러 R-CNN의 단점 중 Cropping이나 Warping을 사용하지 않고 .. 2022. 7. 7. [X:AI] Xception 논문 이해하기 『 Xception: Deep Learning with Depthwise Separable Convolutions. 2017. 』 - Inception 모듈은 feature를 추출할 때 1x1, 3x3, 5x5 등 다양한 크기의 필터를 이용해 Convolution(합성곱) 연산을 수행한다. 여러가지 크기의 필터를 이용해 feature를 추출하기 때문에 의미있고 다양한 feature를 추출할 수 있다. - Inception 모듈은 개념적으로 Convolution 방식과 유사하지만 더 적은 매개 변수로 더 많은 표현을 학습할 수 있다. - 논문의 저자는 Inception 모듈이 1x1 컨볼루션을 통해 채널 간 상관관계(cross-channel correlations)를 살펴보고, 3x3 or 5x5 컨볼루션.. 2022. 7. 6. [X:AI] Seq2Seq 논문 이해하기 『Sequence to Sequence Learning with Neural Networks. 2014. 』 0. Abstract - 기존의 DNN은 레이블이 지정된 큰 훈련 세트에서는 잘 작동이 되지만 시퀀스에 매핑할 때 사용할 수 없다. (매핑하다 : 하나의 값을 다른 값으로 대응시킨다) - 다층 LSTM(Long Short-Term Memory)을 사용하여 입력 시퀀스를 고정 차원 벡터에 매핑하고 다른 deep LSTM을 이용하여 해당 벡터에서 target 시퀀스를 decode하는 방법을 제시할 것이다. - WMT`14 dataset을 이용해 영어에서 프랑스어로 번역 하는 작업을 수행하였고 LSTM을 이용할 때의 BLEU 점수는 34.8, SMT를 이용할 때의 점수는 33.3점이었다. - LSTM은.. 2022. 6. 30. 이전 1 ··· 4 5 6 7 다음