[를 켜고] 간단한 상품 기반 추천 시스템 HBase를

간단한 제품 추천 시스템을 기반으로는 HBase를 카테고리 블로그 : 아키텍처

전력 산업의 웹 사이트 전반에 걸쳐, 나는 많은 제품의 권고가, 사용자의 관점에 서서 :

 

하나는, 다른 상품의 수를 볼 수있는 항목을 검색하는 다른 사용자를 보려면, 시스템 통계 검색 항목을 보려면 내 검색을 통해 최상위 순위 나 추천, 밤나무을 Dangdang :
나는 "하둡 보면 확실한 가이드", 다른 책의 무리에 의해 나에게 권장 시스템 :
 

 

하나는 내 최근 검색, 조회 상품을 통해, 나는 그것의 일부를 추천 시스템은 I 상품의 이익, Taobao의 밤나무 생각 :

나는 매우 흥미로운 느낌, 몇 가지가 있습니다 :
 
 

특히이 하둡 검색 사용자 및 궁극적으로 많은 사람들이 왜, 다운 재킷을 구입? 하둡 학습 치즈는 매우 추운거야? 또는, 북부?
 



  1. 여러 가지 하, 또 다른 문제. 디렉토리는 다음 사람의 YY 디자인 중 하나 토론 단순한 상품 추천 시스템의 HBase를 기반으로.
  2. 전적으로이 추천, HBase를 기반으로 디자인, 확인을 두 테이블의 조건에 다른 프로세스가 말을하지 않습니다 차치. 테이블의 user_item 기록 각 사용자가 항목의 모든 사용자에 대해 기록보기 item_user, 모든 상품을 볼 수 있습니다.
  3. user_item : 클러스터 및 열 항목으로는 사용자 ID 등의 공전 : 항목 ID는 다음과 같이 데이터가있다 :
  4. USER1 항목 : = 항목 1 타임 스탬프 = 1234567891, 값을 항목 ID
  5. USER1 항목 : = 항목 2 타임 스탬프 = 1234567892, 값을 항목 ID
  6. USER1 항목 : = 항목 3 타임 스탬프 = 1234567893, 값을 항목 ID
  7. 사용자 2 항목 : = item4 타임 스탬프 = 1234567894, 값을 항목 ID
  8. 사용자 2 항목 : = item5 타임 스탬프 = 1234567895, 값을 항목 ID
  9. user3    item:itemid    timestamp=1234567881, value=item1
  10. user3    item:itemid    timestamp=1234567832, value=item2
  11. user4    item:itemid    timestamp=1234567843, value=item3
  12. user4    item:itemid    timestamp=1234567854, value=item4
  13. user4    item:itemid    timestamp=1234567895, value=item5
  14. ......
  15. item_user:itemid作为行健,列簇和列为:user:userid,数据如下:
  16. item1    user:userid    timestamp=1234567891, value=user1
  17. item1    user:userid    timestamp=1234567892, value=user2
  18. item1    user:userid    timestamp=1234567893, value=user4
  19. item2    user:userid    timestamp=1234567894, value=user3
  20. item3    user:userid    timestamp=1234567895, value=user2
  21. item3    user:userid    timestamp=1234567881, value=user4
  22. item6    user:userid    timestamp=1234567832, value=user5
  23. item6    user:userid    timestamp=1234567843, value=user6
  24. item8    user:userid    timestamp=1234567854, value=user5
  25. item8    user:userid    timestamp=1234567895, value=user4
  26. ......
  27. 大概的业务是:我查看《Hadoop权威指南》(item1)时,系统从item_user表中以item1作为行健查询出所有查看过item1的用户,再分别以各userid为行健,从user_item表中查询出所有查看过的商品,最后去重、统计、排序并显示。

 

http://f.dataguru.cn/thread-33415-1-1.html

추천

출처www.cnblogs.com/shujuxiong/p/11261840.html