본문 바로가기
일상을 풍요롭게/IT공부

추천시스템 활용 현황

by Career hacker 2021. 4. 4.
반응형

추천시스템은 학계와 기업 모두에서 활발한 연구가 진행 중입니다. 추천시스템은 고객에게 구매에 필요한 정보를 제공합니다. 그 결과 고객 만족과 이익 향상 등 두 마리 토끼를 동시에 잡을 수 있습니다. 추천시스템은 상품과 고객 그리고 거래 정보를 이용해 만들어집니다. 또한 추천 문제는 크게 순위를 정하는 것과 평점을 예측하는 것 두 가지로 나눌 수 있습니다. 그럼 자세한 내용을 알아보겠습니다.

 

1. 추천시스템 연구 현황

추천시스템은 고객과 상품 또는 콘텐츠를 연결한다는 점에 정보검색과 유사합니다. 하지만 정보검색은 고객이 능동적으로 어떤 원하는 것을 탐색하는 반면, 추천시스템은 고객이 선호할만한 정보를 플랫폼에서 먼저 제공한다는 점에서 차이를 갖습니다. 

 

추천시스템은 학계와 기업 모두에서 활발한 연구가 진행되고 있는 영역입니다. 대표적으로 SIGIR, WWW, ACM RecSys, IEEE 등 다양한 학회에서 활발한 연구가 진행 중입니다. 또한, 유튜브, 넷플릭스, 왓챠, IMDB, 쿠팡, 아마존, Last.FM, 멜론 등과 같은 기업에서도 활발한 연구가 진행 중입니다.

 

대표적인 영상 콘텐츠 스트리밍 서비스 제공업체인 넷플릭스는 Netfilx Prize 추천 대회를 통해 추천시스템 연구 활성화에 힘쓰고 있습니다. 이 대회는 2006년 10월 2일에 시작했습니다. 대회 시작 이후 3년 후인 2009년 9월 21일 우승한 BellKor's Pragmatic Chaos 팀은 넷플릭스 기존 알고리즘 대비 10.6% 더 높은 추천성공률을 나타내 화제를 모았습니다.

 

2. 추천시스템을 왜 사용해야 할까?

추천시스템을 사용해야 하는 이유는 크게 다섯 가지가 있습니다. 첫 번째, 더 많은 아이템을 판매할 수 있기 때문입니다. 두 번째, 더 다양한 상품을 판매할 수 있습니다. 소비자가 보지 못한 상품을 판매함으로 소비자 만족도 및 기업 매출 향상에 기여합니다. 세 번째, 소비자 만족도가 증가합니다. 추천 서비스 경험을 통해 고객이 플랫폼에 머무는 시간이 증가하게 됩니다. 네 번째, 추천시스템을 통해 해당 플랫폼에 대한 충성도가 높아져 경쟁력이 강화됩니다. 다섯 번째, 고객이 원하는 것이 무엇인 지 알 수 있습니다.

 

3. 추천시스템은 어디에 사용될까?

1) 넷플릭스: 콘텐츠 추천

넷플릭스는 고객이 좋아하는 콘텐츠를 더 빨리 찾을 수 있도록 서비스에 접속할 때 추천 시스템을 실행합니다. 만약, 이용 정보가 없는 고객이라면 계정 생성 시 선택된 '좋아하는 콘텐츠'를 기반으로 초기 콘텐츠 추천을 수행합니다. 넷플릭스는 상품추천에 다음 세 가지 정보를 이용합니다.

 

  • 시청 기록, 다른 콘텐츠 평가 등 넷플릭스 서비스와 상호작용 정보
  • 취향이 비슷한 고객이 선호한 넷플릭스 서비스 이용 정보
  • 고객이 선호하는 장르, 카테고리, 배우, 출시연도 등 콘텐츠 관련 정보

또한 개인화 추천을 위해 주 시청 시간대, 시청 디바이스, 시청 시간 등을 고려합니다.

 

2) 인스타그램: 팔로우 추천

인스타그램은 고객이 팔로잉한 계정 유형과 피드 클릭 계정 정보를 분석합니다. 그 결과를 통해 관련 광고를 피드에 노출시켜 고객이 관심을 가질만한 광고를 볼 수 있게 합니다. 또한 어떤 계정을 팔로우할 경우 해당 계정과 유사한 계정을 분석해 추가 추천을 수행합니다. 인스타그램이 추천에 고려하는 정보는 다음과 같습니다.

 

  • 팔로잉한 계정 유형
  • 피드에서 클릭한 계정 정보

3) 쿠팡: 상품추천

쿠팡은 고객 선호 정보를 구매 목록, 상품 검색 키워드, 상품 조회 등을 기반해 추정합니다. 이때 선호 상품과 유사한 다른 상품을 추천하기도 합니다. 또한 정기배송 상품은 구매 주기 등을 고려한 추천도 수행합니다. 하지만, 쿠팡은 이미 구매한 상품임에도 불구하고 DM을 통해 구매를 권하는 경우가 빈번해 아직 넷플릭스나 아마존에 비해 추천시스템 완결성이 떨어지는 것으로 보입니다. 쿠팡이 추천에 이용하는 정보는 다음과 같습니다.

 

  • 상품 구매 정보
  • 상품 검색 키워드 정보
  • 상품 조회 정보
  • 기타 행동정보

4. 추천시스템을 이루는 데이터의 종류

1) 상품(item)

상품은 추천 대상 항목을 말합니다. 상품은 그 가치와 데이터 복잡도에 따라 구분할 수 있습니다. 예를 들면, 뉴스, 책, 영화 등은 추천 복잡도가 낮습니다. 반면, 금융 상품, 직업, 여행 등은 높은 복잡도를 갖습니다. 그 이유는 보험, 대출, 펀드는 가입여력이 존재하는지, 대출심사나 인수심사 통과가 가능할지 등 다양한 요인을 고려해야 하기 때문입니다. 또한 펀드는 투자 성향에 따라 나누어 추천해야 하고 관련 제도 및 법령에 대한 유권해석을 명확히 하는 것이 중요합니다. 상품 가치와 데이터 복잡도에 따라 구분은 다음과 같습니다.

 

  • 낮은 복잡도: 뉴스, 책, 영화 등
  • 높은 복잡도: 금융 상품, 직업, 여행 등

2) 고객(user)

여러 목적과 특징을 갖는 집단으로 행동 패턴 등으로 유저 모델링을 할 수 있습니다. 협업 필터링은 여러 아이템에 대한 평점 리스트를 생성합니다. 또한, 사회적 요인을 활용한 추천 시스템 등이 있습니다.

3) 거래(transactions)

고객과 상품 간 상호작용을 나타내는 관계 정보를 말합니다. 사용자가 인터넷에 남긴 로그에 기초한 구매, 조회, 해시택, 평점 등이 모두 거래 정보에 해당합니다. 

 

5. 추천시스템이 풀고자 하는 문제 두 가지

1) 랭킹 문제

랭킹 문제는 특정 고객이 어떤 상품을 더 좋아할지 그 순서를 예측하는 것을 목적으로 합니다. 때문에 상품에 대한 평점을 정교하게 예측하는 것은 중요하지 않습니다. 

 

2) 예측 문제

예측 문제는 고객 ×상품 조합에 대한 평점 또는 점수를 예측 문제입니다. 이 문제는 고객 ×상품 행렬의 공백을 채우는 문제와 같습니다. 가령, 고객 m명과 상품 n개가 있으면,  m×n 행렬로 표현할 수 있습니다. 이때, 행렬 값은 평점이나 점수로 채워집니다.  이 행렬에서 비어 있는 부분은 아직 구매나 평가가 일어나지 않은 것을 의미합니다. 반면, 값이 채워진 구매나 평가 이력 존재하는 것을 의미합니다. 이때 행렬의 값이 채워진 관측치(observed value)는 상품 추천 모형에 학습에 활용됩니다. 반면, 채워지지 않은 결측 값(missing value)은 모형 평가와 예측에 활용합니다.

반응형

'일상을 풍요롭게 > IT공부' 카테고리의 다른 글

The Database Environment: Data and Database  (0) 2024.01.11
What is DBMS?  (0) 2024.01.11
Retrospective for Agility  (0) 2024.01.11
추천 알고리즘의 종류  (0) 2021.04.05
추천시스템이란?  (0) 2021.04.01

댓글