간단한 제품 추천 시스템을 기반으로는 HBase를 카테고리 블로그 : 아키텍처
전력 산업의 웹 사이트 전반에 걸쳐, 나는 많은 제품의 권고가, 사용자의 관점에 서서 :
하나는, 다른 상품의 수를 볼 수있는 항목을 검색하는 다른 사용자를 보려면, 시스템 통계 검색 항목을 보려면 내 검색을 통해 최상위 순위 나 추천, 밤나무을 Dangdang :
나는 "하둡 보면 확실한 가이드", 다른 책의 무리에 의해 나에게 권장 시스템 :
![](https://img2018.cnblogs.com/blog/948447/201907/948447-20190729075353793-1680743217.jpg)
하나는 내 최근 검색, 조회 상품을 통해, 나는 그것의 일부를 추천 시스템은 I 상품의 이익, Taobao의 밤나무 생각 :
![](https://img2018.cnblogs.com/blog/948447/201907/948447-20190729075411988-980214895.jpg)
나는 매우 흥미로운 느낌, 몇 가지가 있습니다 :
![](https://img2018.cnblogs.com/blog/948447/201907/948447-20190729075430373-936556960.jpg)
![](https://img2018.cnblogs.com/blog/948447/201907/948447-20190729075437113-1526229998.jpg)
![](https://img2018.cnblogs.com/blog/948447/201907/948447-20190729075443415-575325121.jpg)
특히이 하둡 검색 사용자 및 궁극적으로 많은 사람들이 왜, 다운 재킷을 구입? 하둡 학습 치즈는 매우 추운거야? 또는, 북부?
![](https://img2018.cnblogs.com/blog/948447/201907/948447-20190729075501977-2054587818.jpg)
- 여러 가지 하, 또 다른 문제. 디렉토리는 다음 사람의 YY 디자인 중 하나 토론 단순한 상품 추천 시스템의 HBase를 기반으로.
- 전적으로이 추천, HBase를 기반으로 디자인, 확인을 두 테이블의 조건에 다른 프로세스가 말을하지 않습니다 차치. 테이블의 user_item 기록 각 사용자가 항목의 모든 사용자에 대해 기록보기 item_user, 모든 상품을 볼 수 있습니다.
- user_item : 클러스터 및 열 항목으로는 사용자 ID 등의 공전 : 항목 ID는 다음과 같이 데이터가있다 :
- USER1 항목 : = 항목 1 타임 스탬프 = 1234567891, 값을 항목 ID
- USER1 항목 : = 항목 2 타임 스탬프 = 1234567892, 값을 항목 ID
- USER1 항목 : = 항목 3 타임 스탬프 = 1234567893, 값을 항목 ID
- 사용자 2 항목 : = item4 타임 스탬프 = 1234567894, 값을 항목 ID
- 사용자 2 항목 : = item5 타임 스탬프 = 1234567895, 값을 항목 ID
- user3 item:itemid timestamp=1234567881, value=item1
- user3 item:itemid timestamp=1234567832, value=item2
- user4 item:itemid timestamp=1234567843, value=item3
- user4 item:itemid timestamp=1234567854, value=item4
- user4 item:itemid timestamp=1234567895, value=item5
- ......
- item_user:itemid作为行健,列簇和列为:user:userid,数据如下:
- item1 user:userid timestamp=1234567891, value=user1
- item1 user:userid timestamp=1234567892, value=user2
- item1 user:userid timestamp=1234567893, value=user4
- item2 user:userid timestamp=1234567894, value=user3
- item3 user:userid timestamp=1234567895, value=user2
- item3 user:userid timestamp=1234567881, value=user4
- item6 user:userid timestamp=1234567832, value=user5
- item6 user:userid timestamp=1234567843, value=user6
- item8 user:userid timestamp=1234567854, value=user5
- item8 user:userid timestamp=1234567895, value=user4
- ......
- 大概的业务是:我查看《Hadoop权威指南》(item1)时,系统从item_user表中以item1作为行健查询出所有查看过item1的用户,再分别以各userid为行健,从user_item表中查询出所有查看过的商品,最后去重、统计、排序并显示。
http://f.dataguru.cn/thread-33415-1-1.html