SKT AI 커리큘럼 학습 내용 정리
출처 : T Learning Portal (https://sharedlp.sk.com)
4. 추천 기술 : ① Contents-based Methods
- 추천 기술은 Contents-based, Collaborative Filtering, Hybrid 방식 3가지가 존재한다.
- 사용자 A가 이전에 사용한 아이템을 기반으로 가장 유사한 아이템을 추천해주는 방식
Item Profile
: Item을 표현하는 Feature들의 set ( Item을 가장 잘 표현하는 속성 정보 )
ex. 시놉시스, 장르, 감독, 배우 등등..
- 중요하게 생각하는 특정 feature에 대해서 가중치를 부여할 수 있다.
- 일반적으로 Vector 형태로 Representation되고 각각의 Item 들은 하나의 Vector 값을 가짐
User Profile
- 사용자를 표현하는 정보, 그들이 소비한 아이템을 가지고 사용자를 표현할 방법을 찾음
( 사용자가 소비한 Item Profile을 모아 이 벡터들을 Aggregation )
- 사용자가 아이템 벡터로 구성된 같은 벡터 공간에 투영되기 때문에 아이템과 유저의 관계를 직접 계산할 수 있다.
-> Near Neighbor를 계산하여 단순하게 가까이에 위치한 Item을 추천해 줄 수 있다. ( 유사 콘텐츠 추천 )
장점
(1) Cold-Start(콜드 스타트) 문제가 없다.
- Cold-Start Problem: 새로운 유저가 들어왔을 때 아직 충분한 정보가 수집된 상태가 아니기에 해당 유저에게 적절한 제품을 추천해주지 못하는 문제
(2) First-Rater(초기 평가자) 문제가 없다.
- First-Rater Problem : 어느 사용자에게도 평가받지 못한 새로운 아이템이 있을 경우에 일어나는 문제
- 다른 사람의 선호도와 관계없이 자신이 소비한 아이템을 가지고 유사한 아이템을 찾을 수 있기 때문에 위 두가지 문제가 잘 발생하지 않는다. (아이템에 대한 정보만 가지고 있더라도 추천이 가능)
- 따라서 일반적으로 서비스 초기에 Contents-based 방법을 많이 사용
(3) 설명력이 강하다.
- Item Profile, User Profile이 사람이 이해할만한 속성 정보를 활용하기 때문에 추천 결과가 사용자에게 전달되는 것에 대한 설명력이 풍부하다.
- 하지만 자신의 취향에 맞는 비슷한 Item이 계속 추천되기 때문에 novelty 관점에서 단점이 존재한다.
단점
(1) Item Profile을 구성하기 위한 Feature Selection이 어렵다.
- Feature set의 구성이 같은 도메인이더라도 서비스나 요구 사항이 달라짐에 따라 새롭게 디자인 해야 한다. ( 심지어 타 도메인일 경우 계속해서 Feature Selection 단계가 중요하게 작용 ) -> 설계 Cost가 높음
(2) 유사한 것들만 추천된다 ( Over-specialization )
- 모든 정보가 소비자에게 제공되지 않고 일부분만 계속해서 추천되는 상황 (filter bubble)
- 실질적인 서비스에서는 filter bubble을 해결하기 위한 많은 장치가 존재
'딥러닝(Deep Learning) > SKT AI Curriculum' 카테고리의 다른 글
[SKT AI 커리큘럼] 추천시스템 - 6. Collaborative Filtering - Memory based (0) | 2022.12.24 |
---|---|
[SKT AI 커리큘럼] 추천시스템 - 5. Collaborative Filtering (0) | 2022.12.21 |
[SKT AI 커리큘럼] 추천시스템 - 1, 2, 3 (1) | 2022.11.02 |
댓글