전체 글334 [2024.02] 2주차 Today I Learned 02/05 월 1. HybrIK 코드 분석 HybrIK 코드를 분석하다 보니 결국 대부분의 3D Mesh 모델(Monocular 카메라 기준)이 SMPL로 귀결되는 것을 알 수 있었다. 하지만 SMPL 모델은 상업적 이용이 불가능한 라이센스를 가지고 있다... 이에 최신 3D Mesh 리서치 논문을 살펴 보았는데 대부분의 정말 대부분의 모델이 SMPL(or SMPL-X)을 베이스로 하고 있었다. 또한 상업적 이용이 가능한 모델들은 구글 리서치에서 개발한 모델로 코드가 공개되어 있지 않아 개발 활용에 어려울 것으로 보였다. 이 문제를 어떻게 해결해야 할 지.... ( ノ ゚ー゚)ノ https://arxiv.org/abs/2203.01923 Recovering 3D Human Mesh from Monocul.. 2024. 2. 5. [Git] Git Merge (Pull Request시) Github Repository에서 새 Branch를 파고 main에 코드를 합치기 위해 Pull Request를 날리면 아래와 같은 창이 보인다. Pull Request로 들어온 Commit들을 다 확인해보고 main branch에 어떤 방식으로 합칠 것인지를 선택하는 것!! 그 방법으로는 아래와 같은 3가지가 존재한다. 1. Create a merge commit : Branch를 나누었던 기록이 남도록 합치는 방법으로 모든 커밋 내용과 브랜치를 만들었던 내용을 살린채 Merge한다. -> 해당 Branch를 만들었다가 다시 합친 것으로 main에 합침 2. Squash and merge : Branch를 나누었던 기록 없이, 해당 Branch에서 만들었던 여러 커밋들의 기록 없이 모두 합쳐 하나의 .. 2024. 1. 31. [2024.02] 1주차 Today I Learned 01/29 월1. CORS 헤더 이슈 해결월요일 시작부터 받은 CORS 오류! FastAPI에 Middleware를 추가해주고 해당 URL:PORT를 열어주는 것으로 해결하였다.https://velog.io/@ohzzi/CORS-%ED%97%88%EC%9A%A9-%EC%A2%80-%ED%95%B4%EC%A3%BC%EC%84%B8%EC%9A%94 CORS 허용 좀 해주세요...☆이 글은 우아한테크코스 학습로그 공유 사이트 Prolog에 업로드한 글을 재구성한 글입니다.프론트엔드와 협업하게 되면서 생기는 가장 큰 차이점은 바로 프론트엔드와 백엔드가 각각 따로 서버velog.iohttps://fastapi.tiangolo.com/ko/tutorial/cors/ 교차 출처 리소스 공유 - FastAPIFastA.. 2024. 1. 29. [2024.01] 4주차 Today I Learned 01/22 월 1. 인천대 출장 - IR 카메라와 일반 RGB 카메라 01/23 화 1. Pose Estimation 딥러닝 모델 Inference를 통한 알고리즘 적용 - 알고리즘 개발 01/24 수 1. AWS EC2 서버 구축하는 방법 리서치 - GPU 사용시 유의사항 파악 2. 연구실 논문 발표 참석 3. 영어 회화 스터디 01/25 목 1. 포즈 관절 좌표를 가지고 각도를 계산할 수 있는 알고리즘 고안 - 두 벡터 사이의 각도를 구하는 수식 활용 2. 영어 회화 스터디 01/26 금 1. AWS EC2 서버 구축 - GPU 사용하는 P, G 인스턴스 -> AWS 문의 필요 http://aws.amazon.com/contact-us/ec2-request https://support.console... 2024. 1. 25. [2024.01] 3주차 Today I Learned 01/15 월 1. DEKR 논문 읽기 https://arxiv.org/abs/2104.02300 Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression In this paper, we are interested in the bottom-up paradigm of estimating human poses from an image. We study the dense keypoint regression framework that is previously inferior to the keypoint detection and grouping framework. Our motivation is that regres arxiv.org - HRNet.. 2024. 1. 16. [Python] Python으로 휴대폰 캠을 웹캠으로 사용해보자 웹캠이 없는 경우나 해상도가 마음에 들지 않는 경우... 우리는 휴대폰 캠을 사용해서 웹캠을 사용할 수 있다.물론 이미 만들어진 툴을 활용할 수 있지만, Ubuntu OS의 경우 빌드된 툴이 많이 없어 어려움이 존재한다!! 따라서 이번에는 휴대폰의 IP 설정을 통해 휴대폰 캠을 웹캠으로 사용하는 방법에 대해 정리해 보도록 하겠다.(구글에 검색하면 몇가지 방법이 나오지만 여기서는 같은 인터 회선을 이용하는 방법을 사용하였다) 1. IP Webcam 앱 설치위 어플리케이션을 설치 후 실행하면 휴대폰 카메라와 연결된 서버를 열 수 있다. 이 때 휴대폰 카메라와 연결된 네트워크는 연결하려는 컴퓨터와 같은 네트워크를 공유하는 상태여야 한다.1) 컴퓨터와 동일한 네트워크를 사용하는 와이파이 사용2) 모바일 데이터.. 2024. 1. 14. [2024.01] 2주차 Today I Learned 01/08 월 1. Ubuntu에서 휴대폰 캠 웹캠으로 사용(IP Camera) - Python으로 해당 IP 열어서 Camera 정보 받아오도록 - 추후 정리 예정 2. Mediapipe Face Mesh 사용해보기 01/09 화 1. 적외선 카메라 - 마커 인식 원리 리서치 https://velog.io/@ysn003/%EB%A7%A8%EB%95%85%EC%97%90-%ED%97%A4%EB%94%A9-%EB%AA%A8%EC%85%98%EC%BA%A1%EC%B3%90-4-IR-Passive-Marker-%EA%B8%B0%EB%B0%98-%EC%8B%A4%EC%A0%84-%EC%B4%AC%EC%98%81%ED%95%98%EA%B8%B0 맨땅에 헤딩 모션캡쳐 #4: IR Passive Marker 기반 실.. 2024. 1. 8. [2024.01] 1주차 Today I Learned 01/01 월 🌞 Happy New Year!!! 🌞 1. 투빅스 Seamless 논문 확인 https://arxiv.org/abs/2312.05187 Seamless: Multilingual Expressive and Streaming Speech Translation Large-scale automatic speech translation systems today lack key features that help machine-mediated communication feel seamless when compared to human-to-human dialogue. In this work, we introduce a family of models that enable end-to-end express.. 2024. 1. 1. [캡스톤디자인] 시각장애인을 위한 한국어 시각 정보 질의응답 연구 # 본 프로젝트는 '2023-2 산업 AI : 캡스톤디자인 수업' 과제로 제출한 프로젝트임을 명시합니다. ( 2023.09.07 ~ 2023.12.21 ) 주제 시각장애인을 위한 한국어 시각 정보 질의응답 연구 : 시각 정보와 한국어 언어모델을 활용하여 팀원 이예진 방법 1. 국내 시각장애인의 일상생활 향상에 도움이 될 수 있는 VQA(Visual Questionn Answering) 모델을 만들고자 함 2. 기존 공개된 모델과 데이터들을 리서치, 활용할 수 있는 모델과 데이터를 선정(방법론 및 데이터 적합성 검토) 3. 멀티모달 모델링을 통해 주어진 조건 하에서 기존 모델의 성능을 뛰어넘는지 확인 코드 정리(GitHub) https://github.com/Rahites/VQA-KoreanBlind Gi.. 2023. 12. 31. [Ubuntu] Ubuntu 22.04 Chrome 업그레이드 Ubuntu에서 크롬을 사용할 때마다 현재 사용하고 있는 Chrome 버전이 Out-of-data되었다고 Relaunch가 필요하다는 알림이 계속 뜨는 것이 신경쓰여서 바로 업그레이드를 진행하였다. deb파일을 다시 받아서 진행해야 하나..? 하고 검색을 하였지만, 생각보다 간단하게 terminal 명령어를 통해 업그레이드 할 수 있었다. # Package Updatesudo apt-get update# Upgradesudo apt-get --only-upgrade install google-chrome-stable 여기서 --only-upgrade는 내가 지정한 패키지만 업그레이드 해준다고 한다. 해당 명령어를 사용해 chrome 뿐만 아니라 다른 패키지 또한 필요시 업그레이드를 진행하면 될 것 같다. 2023. 12. 31. [Jupyter] UsageError: Line magic function "%%capture" not found. ipynb 파일로 매직커맨드를 실행하다 다음과 같은 오류가 발생하였다. UsageError: Line magic function `%%capture` not found. 해결 대부분의 매직 커맨드에서 발생하는 오류로 매직 커맨드는 해당 셀의 가장 윗단에 위치한 채로 실행이 되어야 한다. (주석이 있어서 괜찮을거라 생각했으나 주석보다도 상단에 위치하도록 순서를 변경하니 잘 작동하였다.) %%capture # 주석 ~~~ 참고로 %%capture의 역할은 다음과 같다. ChatGPT의 답변 %%capture는 주피터 노트북에서 사용되는 마법 명령어입니다. 이 명령어는 셀에서 출력되는 결과를 캡처하고 변수에 저장하는 역할을 합니다. 주로 셀의 출력을 숨기고 결과를 변수에 저장하여 나중에 사용할 때 유용합니다... 2023. 12. 27. [2023.12] 4주차 Today I Learned 12/25 월 ☃️ 크리스마스 ☃️ 1. 투빅스 평가 2. 투빅스 Seamless Inference 코드 확인 12/26 화 1. 투빅스 평가 마무리 2. Continual Learning 기법 리서치 3. 투빅스 Seamless Inference 코드 확인 Seamless 패키지 Import 중 Error : RuntimeWarning: Couldn't find ffmpeg or avconv 해결 (간단해서 따로 정리하지 않음...) sudo apt install ffmpeg 12/27 수 1. 예적금, 대출 등 금융 정보 리서치 2. Opic 입문 12/28 목 1. Seamless Expressive Inference 2. 투빅스 컨퍼런스 회의 12/31 일 1. 캡스톤 코드 정리 및 리뷰 작성 2.. 2023. 12. 25. 이전 1 ··· 9 10 11 12 13 14 15 ··· 28 다음