Machine Learning 18
회사 상품 추천 모델 만들기 (2) 데이터를 다시 깔다, 후보풀 축소와 운영 안전 장치
첫 모델이 깨진 근본 원인 중 하나는 1.1M 상품 전체를 다루려 한 것이었다. 후보풀을 142K로 줄이는 결정과, prod DB SELECT-only 추출·시간 기반 split의 누수 가드 등 운영 안전 장치를 다룬다.
첫 모델이 깨진 근본 원인 중 하나는 1.1M 상품 전체를 다루려 한 것이었다. 후보풀을 142K로 줄이는 결정과, prod DB SELECT-only 추출·시간 기반 split의 누수 가드 등 운영 안전 장치를 다룬다.
B2B 패션 도매 사이트의 개인화 추천 모델을 만들면서 거쳤던 학습과 결정의 기록. 1편은 추천 패러다임 선택의 트레이드오프와, 첫 모델이 recall@20=0.0048로 깨졌던 진단.