본문 바로가기

meta-learning7

[메타러닝] 9. In-Context Learning In-Context Learning(ICL) 이란 ICL은 모델이 별도의 파인튜닝 없이 입력 Context(Prompt)만을 기반으로 새로운 작업을 학습하는 능력을 의미한다. 즉, 예제 몇 개를 보여주었을 때 다음에 오는 질문에 대해 모델이 잘 대답할 수 있는 능력을 학습하는 방법론으로 볼 수 있다.  널리 알려진 학습 방법인 Few-shot Learning, Zero-shot Learning 등이 ICL 방법론에 포함되며, 전체 모델을 다시 학습할 필요 없이 Prompt 조정만으로 다양한 문제를 해결할 수 있다는 장점이 있다. 학습 방법(Learning) Gradient DescentICL(Conditioning)학습 방식Weight를 업데이트하면서 점진적으로 학습Weight를 변경하지 않고 Conte.. 2025. 2. 15.
[메타러닝] 6. AutoAugment 이번에 알아볼 내용은 AutoAugment이다.  일반적으로 우리가 알고 있는 내용은 Data Augmentation인데, 어떻게 하면 특정 데이터에 잘 맞는 Augmentation 기법을 찾아 적용할 수 있을지를 다룬 Autoaugment 기술에 대해 알아보도록 하자.1. Data AugmentationData Augmentation이란 보유하고 있는 데이터를 여러 방법으로 변형하여 더 많은 데이터를 만들어 내는 방법으로 학습 데이터가 부족한 경우 이를 보완하기 위해 주로 사용한다. 이미지 데이터의 경우 기본적으로 사용할 수 있는 Rotate, Flip 등 외에도 아래 기법들이 존재한다.CutoutMixupCutmixAugmixText 데이터의 경우에는 Synonym Replacement, Random.. 2024. 12. 31.
[메타러닝] 5. NAS NAS(Neural Architecture Search)는 신경망 관련 공부를 해온 분들이라면 한번쯤 들어본 단어일 것이다. 신경망 구조를 자동으로 설계하고 최적화하는 기법을 의미하는 NAS는 우리가 일반적으로 성능을 높이기 위해 고정된 모델 구조를 제안하는 것과 달리 가장 높은 성능을 보이는 모델 구조를 찾아내는 것을 목적으로 한다. 나도 들어는 봤지만 자세히 알지는 못하기 때문에 조금이나마 개념을 정리하며 공부하려 한다.NAS- 주어진 Task와 Dataset에 대해 가장 최적화된 신경망 구조를 자동으로 탐색하는 기법- Layer 개수, 활성화 함수, 필터 크기 등 사용자가 일반적으로 결정하는 모델 아키텍처 요소를 결정 NAS의 사용 배경- 최근 딥러닝이 발전하며 모델 구조가 점점 복잡해지고 있음- .. 2024. 12. 22.
[메타러닝] 4. Bayesian Meta-Learning 이번에 정리할 내용은 Bayesian Meta-Learning이다. 많이 다뤄본 Bayesian과 관련된 내용이며 추후 내가 이 글을 다시 보았을 때 어떤 내용이 있었는지 간단하게 짚고 넘어갈 수 있도록 핵심 위주로 작성해보도록 하겠다.1. Bayesian Learning일반적으로 우리가 Bayes' Rule을 왜 사용하는지를 생각해보면 Posterior를 바로 알기 어려워 Prior와 Likelihood만으로 이를 계산하려 하거나, 사용하려는 데이터가 작기 때문에 불확실성이 커서 Stochastic Model을 사용하는 것이 큰 이유이다. 모델의 파라미터를 확률분포로 계산하여 데이터에서 얻은 정보와 Prior를 결합하며 학습하는 과정을 거친다.  Bayesian Modeling 과정에서는 Latent .. 2024. 12. 16.
[메타러닝] 3. Meta Reinforcement Learning 이번에 알아볼 내용은 Meta Reinforcement Learning에 관한 내용이다.  강화학습을 이전에 공부해본 적이 없어서 기본적인 강화학습에 대한 내용을 가볍게 정리하고 넘어가도록 하겠다.1. Reinforcement Learning강화학습은 Agent가 Environment와 상호 작용을 수행하며 최적의 Policy를 학습하는 방법이다. 강화학습의 목표는 Agent가 Reward를 최대화하도록 학습시키는 것이다.Agent: 학습을 수행하는 주체, Environment와 상호작용하며 행동을 수행함Environment: Agent가 행동을 수행하고 Reward를 받는 곳State: Agent가 현재 위치한 Environment의 상태를 나타내는 정보Action: Agent가 State에서 선택할 .. 2024. 12. 16.
[메타러닝] 2. Meta-Learning Methods 메타러닝의 방법론은 크게 3가지로 나눌 수 있다. (1) Model-based(2) Metric-based(3) Optimization-based 이번 시간에는 이 방법론들에 대해 중요한 부분들만 특징적으로 알아보도록 하자1. Model-Based Meta-LearrningModel-Based Meta-Learning은 학습 알고리즘 자체를 Model로써 설계하여 새로운 Task에 대한 빠른 Adaptation과 일반화를 가능하게 하는 방법론이다. 다시말하면 Model 자체가 새로운 Task에 빠르게 적응할 수 있는 매커니즘을 학습한다는 의미이다. 여기서 말하는 매커니즘이란 특정 메타 파라미터일 수도 있고, 정보를 담고 있는 특정 형태의 무언가 일 수 있다. 그렇다면 당연하게도 모델링을 얼마나 잘하는지가.. 2024. 12. 13.