[부스트캠프 AI Tech] RecSys Level 04 - 자영업자를 위한 가게 음악 추천 솔루션:Tune Your Shop(최종 프로젝트) 회고
·
AI
부스트캠퍼로서의 마지막 프로젝트최근 나의 티스토리 포스팅 대부분을 차지했던 부스트캠프가 끝났다. 8월에 만났던 팀원들과 마지막 프로젝트까지 함께한 만큼 주제에 대해 다함께 오랜 시간 고민했고, 공통적으로 이루고 싶었던 목표는 "기술적 챌린지를 통해 사용자 경험 개선"이었다.데이터셋 및 주제 선정팀 소개서 작성->기업 매칭을 거쳐 업스테이지와 연계해 비즈니스적 가치를 창출하는 AI 프로덕트를 개발하는 것을 목표로 삼았다.팀의 공통 관심사였던 콘텐츠•문화 도메인 내에서 사용자의 실제 로그 데이터를 찾아야 했고, 학습용 데이터는 플레이리스트와 유저 간의 상호작용 로그가 기록된 kaggle의 Spotify Dataset을 선정했다. 유저와 트랙 간의 상호작용 로그를 수집한 데이터셋이다.음악 청취 상호작용 데이터..
KL Divergence - 두 확률분포의 차이 계산하기
·
AI
들어가며변분 추론, Diffusion, AutoEncoder 등 딥러닝 모델에서 자주 등장하는 통계학적 개념 KL Divergence(Kullback-Leibler Divergence)에 대해 deep dive한 내용을 포스팅했다.BackgroundKL Divergence를 이해하기 위해서는 1. 정보량, 2. 정보 entropy, 3. cross-entropy의 세 가지 용어를 미리 알아야 한다. 1. 정보량수식적 정의: $I(X) = -\log_bP(X)$이산 랜덤변수 $X$에 대한 정보량을 나타낸다.정보량을 더할 때, log 함수의 additive 성질을 이용하기 때문에 log를 붙여 정의한다.로그의 밑 $b$는 태스크에 따라 정의하면 된다.확률적으로 낮은 내용(놀랄만한 내용)일수록 정보량이 많다...
[부스트캠프 AI Tech] RecSys Level 02 - Movie Recommendation KPT 회고
·
AI
Level 2 마무리부스트캠퍼가 된지 어느덧 15주가 지나, 마지막 Level(과정)만을 남겨두고 있다. 지난 포스팅에서 Lv1 첫 프로젝트 회고를 작성했고 이번 포스팅에서는 Lv2 마지막 경진대회형 프로젝트에서 진행한 작업 과정, 그리고 정신적 성장을 위한  KPT 회고까지 작성해보려 한다.이번 대회는 추천시스템 벤치마크 데이터셋인 MovieLens 데이터를 바탕으로 영화 추천 시스템을 구축해, 높은 Recall@10 값을 도출하는 것이 최종 목표이다.문제 정의/목표문제: 사용자의 영화 시청 이력을 기반으로 다음에 시청할 영화 및 좋아할 영화를 Top-K 형태로 추천해야 한다.목표: 정의한 문제의 핵심은 다음에 시청할 영화와 중간에 비어있는 timestamp에 시청했을 영화를 예측하는 것으로, seq..
[부스트캠프 AI Tech] RecSys Level 01 KPT 회고
·
AI
어느새 부스트캠프의 RecSys 도메인에 참여한 지도 7주차가 되었다.매일매일 코어타임마다 zoom에 접속해 팀원들과 공부도 하고 오피스아워나 마스터클래스를 통해 현업자 분들에게 다양한 인사이트를 공유받기도 했다. 살면서 이렇게 짧은 시간 내에 많은 것을 배우고, 다양한 사람들을 만날 수 있었던 환경도 없었다고 생각한다. 내일부터 Level 02가 시작되는데 가장 회고하기 좋은 시점인 지금 배운 것들과 느낀 것들을 이야기해보고자 한다. 학습 커리큘럼에 대해 이야기해보자면 5주 간 DL/ML의 이론과 코드에 대해 습득했고, 지난 6주차부터 팀원들과 함께 비트코인의 등락률을 예측하는 시계열 경진대회에 참가했다. 짧은 시간 내에 많은 것들을 얻었기 때문에 대회 과정에서 새로 습득한 지식들과 느낀 점 , 또 한..