본문 바로가기

AI & CS 지식23

[메타러닝] 3. Meta Reinforcement Learning 이번에 알아볼 내용은 Meta Reinforcement Learning에 관한 내용이다.  강화학습을 이전에 공부해본 적이 없어서 기본적인 강화학습에 대한 내용을 가볍게 정리하고 넘어가도록 하겠다.1. Reinforcement Learning강화학습은 Agent가 Environment와 상호 작용을 수행하며 최적의 Policy를 학습하는 방법이다. 강화학습의 목표는 Agent가 Reward를 최대화하도록 학습시키는 것이다.Agent: 학습을 수행하는 주체, Environment와 상호작용하며 행동을 수행함Environment: Agent가 행동을 수행하고 Reward를 받는 곳State: Agent가 현재 위치한 Environment의 상태를 나타내는 정보Action: Agent가 State에서 선택할 .. 2024. 12. 16.
[메타러닝] 2. Meta-Learning Methods 메타러닝의 방법론은 크게 3가지로 나눌 수 있다. (1) Model-based(2) Metric-based(3) Optimization-based 이번 시간에는 이 방법론들에 대해 중요한 부분들만 특징적으로 알아보도록 하자1. Model-Based Meta-LearrningModel-Based Meta-Learning은 학습 알고리즘 자체를 Model로써 설계하여 새로운 Task에 대한 빠른 Adaptation과 일반화를 가능하게 하는 방법론이다. 다시말하면 Model 자체가 새로운 Task에 빠르게 적응할 수 있는 매커니즘을 학습한다는 의미이다. 여기서 말하는 매커니즘이란 특정 메타 파라미터일 수도 있고, 정보를 담고 있는 특정 형태의 무언가 일 수 있다. 그렇다면 당연하게도 모델링을 얼마나 잘하는지가.. 2024. 12. 13.
[메타러닝] 1. Meta-Learning이란? 벌써 2024년 2학기도 마지막을 바라보고 있다.  이번 학기를 마무리 하며 수강한 메타러닝 수업의 내용을 정리해 보려 한다(기말고사도 준비할겸..). 정말 정말 핵심만을 기록하고 내가 이해한 바를 정리해 보려 한다.메타러닝(Meta-Learning)이란?메타러닝은 일반적으로 "Learning to Learn" 이라는 말로 표현되며, 모델이 새로운 과제나 환경에 더 빠르고 효율적으로 적응할 수 있도록 돕는 기술이다.  일반적으로 딥러닝에서 사용하는 학습이 Data를 기반으로 학습을 진행한다면, 메타러닝에서는 Task를 기반으로 학습을 진행한다.   vs Meta-Learning>Transfer Learning은 특정 Task에서 학습된 모델을 다른 Task에 적용하는 방법이지만, Meta-Learning.. 2024. 12. 13.
[AI Q&A] OKS(Object Keypoint Similarity)란? 여러 Human Pose Estimation 논문을 읽다보면 대다수의 논문들이 평가지표로 OKS(Object Keypoint Similarity)라는 계산식을 사용하는 것을 알 수 있다. 물론 나도 이미 여러번 보았으며 무엇인지 이해했었지만, 너무나도 많이 나오는 내용이다 보니 논문을 리뷰하는데에도 매번 작성할 수 없어, 한번 제대로 이해하기 쉽게 정리한 후 앞으로 나올 논문 리뷰들에 태그를 달아두려 한다.OKS(Object Keypoint Simiarity)는 HPE(Human Pose Estimation) Task에서 예측된 Keypoint와 실제 Ground Truth Keypoint가 얼마나 유사한지를 측정하는 지표이다. OD(Object Detection)에서 주로 사용하는 평가지표인 IoU(I.. 2024. 11. 22.
[혼공컴운] 9. 운영체제 시작하기 운영체제 시작하기1. 운영체제를 알아야 하는 이유지금까지는 컴퓨터 하드웨어가 어떻게 구성되어 있고, 어떤 방식으로 소통하는지에 대해 알아 보았다. 이제는 이러한 하드웨어 부품들을 관리하는 운영체제에 대해 공부해보자. 운영체제란?모든 프로그램은 하드웨어를 필요로 한다. 어떤 연산을 하기 위해서는 CPU가 필요하고, 저장을 하기 위해서는 하드 디스크가 필요하다. 이때 프로그램 실행에 마땅히 필요한 요소들을 가리켜 시스템 자원(자원)이라고 한다. 지금까지 공부한 CPU, 메모리, 입출력장치 등의 컴퓨터 부품들은 모두 자원이라고 볼 수 있다. 운영체제(Operating System)는 이러한 자원들을 실행할 프로그램에 필요한만큼 할당하고, 프로그램이 올바르게 실행되도록 돕는 특별한 프로그램이다.  운영체제도 다.. 2024. 9. 7.
[혼공컴운] 8. 입출력장치 입출력장치1. 장치 컨트롤러와 장치 드라이버컴퓨터를 이루고 있는 장치에는 본체만 있는 것이 아니다. 모니터, 키보드, 마우스 등 어쩌면 우리가 본체 성능보다 더 관심이 많기도 한 이러한 입출력 장치들을 이번 시간에는 알아보도록 하자. 이번 절에서는 특히 다양한 입출력 장치가 컴퓨터 내부와 어떻게 연결되고 소통하는지에 대해 공부한다. 장치 컨트롤러입출력 장치는 아래의 2가지 이유때문에 CPU나 메모리보다 다루기가 어렵다. 1) 너무 다양한 입출력 장치의 종류키보드, 모니터, USB 등 너무나도 많은 종류의 입출력 장치가 존재하기 때문에 정보를 주고받는 방식을 규격화하기가 어렵다. 2) 낮은 데이터 전송률일반적으로 CPU나 메모리의 데이터 전송률은 높지만, 입출력 장치의 전송률은 낮다. 여기서 전송률(Tra.. 2024. 9. 2.