본문 바로가기
딥러닝(Deep Learning)/SKT AI Curriculum

[SKT AI 커리큘럼] 추천시스템 - 4. Contents-based Methods

by rahites 2022. 11. 11.

SKT AI 커리큘럼 학습 내용 정리

출처 : T Learning Portal (https://sharedlp.sk.com)

 

 

4. 추천 기술  : ① Contents-based Methods

- 추천 기술은 Contents-based, Collaborative Filtering, Hybrid 방식 3가지가 존재한다.

- 사용자 A가 이전에 사용한 아이템을 기반으로 가장 유사한 아이템을 추천해주는 방식

 

Item Profile

: Item을 표현하는 Feature들의 set ( Item을 가장 잘 표현하는 속성 정보 )

ex. 시놉시스, 장르, 감독, 배우 등등..

- 중요하게 생각하는 특정 feature에 대해서 가중치를 부여할 수 있다.

- 일반적으로 Vector 형태로 Representation되고 각각의 Item 들은 하나의 Vector 값을 가짐

 

User Profile

- 사용자를 표현하는 정보, 그들이 소비한 아이템을 가지고 사용자를 표현할 방법을 찾음

( 사용자가 소비한 Item Profile을 모아 이 벡터들을 Aggregation )

- 사용자가 아이템 벡터로 구성된 같은 벡터 공간에 투영되기 때문에 아이템과 유저의 관계를 직접 계산할 수 있다. 

 

-> Near Neighbor를 계산하여 단순하게 가까이에 위치한 Item을 추천해 줄 수 있다. ( 유사 콘텐츠 추천 )

 

장점

(1) Cold-Start(콜드 스타트) 문제가 없다.

- Cold-Start Problem: 새로운 유저가 들어왔을 때 아직 충분한 정보가 수집된 상태가 아니기에 해당 유저에게 적절한 제품을 추천해주지 못하는 문제

(2) First-Rater(초기 평가자) 문제가 없다.

- First-Rater Problem : 어느 사용자에게도 평가받지 못한 새로운 아이템이 있을 경우에 일어나는 문제

- 다른 사람의 선호도와 관계없이 자신이 소비한 아이템을 가지고 유사한 아이템을 찾을 수 있기 때문에 위 두가지 문제가 잘 발생하지 않는다. (아이템에 대한 정보만 가지고 있더라도 추천이 가능)

- 따라서 일반적으로 서비스 초기에 Contents-based 방법을 많이 사용

(3) 설명력이 강하다.

- Item Profile, User Profile이 사람이 이해할만한 속성 정보를 활용하기 때문에 추천 결과가 사용자에게 전달되는 것에 대한 설명력이 풍부하다.

- 하지만 자신의 취향에 맞는 비슷한 Item이 계속 추천되기 때문에 novelty 관점에서 단점이 존재한다.

 

단점

(1) Item Profile을 구성하기 위한 Feature Selection이 어렵다.

- Feature set의 구성이 같은 도메인이더라도 서비스나 요구 사항이 달라짐에 따라 새롭게 디자인 해야 한다. ( 심지어 타 도메인일 경우 계속해서 Feature Selection 단계가 중요하게 작용 ) -> 설계 Cost가 높음

(2) 유사한 것들만 추천된다 ( Over-specialization )

- 모든 정보가 소비자에게 제공되지 않고 일부분만 계속해서 추천되는 상황 (filter bubble)

- 실질적인 서비스에서는 filter bubble을 해결하기 위한 많은 장치가 존재

 

 

댓글