Python은 보물 파인애플 데이터를 크롤링하고 매출을 시각적으로 분석합니다.

이 기사의 텍스트와 그림은 인터넷에서 가져온 것으로 학습 및 커뮤니케이션 목적으로 만 사용되며 상업적으로 사용되지 않습니다. 문의 사항이있는 경우 처리를 위해 당사에 문의하십시오.

다음 기사는 Zhibin의 파이썬 노트에서 발췌 한 것입니다. 저자 Zhibin

Python 크롤러, 데이터 분석, 웹 사이트 개발 및 기타 사례 자습서 동영상은 온라인에서 무료로 시청할 수 있습니다.

https://space.bilibili.com/523606542 

Python 학습 교환 그룹 : 1039645993

머리말

최근에 어떤 과일이 가장 핫한지 이야기하고 싶다면 파인애플에 대해 이야기해야합니다. "중국 파인애플 3 개 중 1 개는 Xu Wen에서 나옵니다"라는 주제로 모든 주요 플랫폼에서 뜨거운 검색이 이루어졌습니다. Xuwen 파인애플은 빠르게 소비자 시장에서 인기있는 상품이되었습니다.

Xuwen 파인애플 고속철도 개통으로 파인애플 운송 비용과 시간 비용이 크게 줄어들어 더 저렴한 가격으로 신선한 파인애플을 먹을 수 있습니다. 이 경우에도 온라인 쇼핑이 새로운 것이 아니라고 여전히 걱정하십니까?

 

데이터 수집

이 기사는 Python을 사용하여 Taobao.com에서 파인애플 1774 개의 판매 데이터를 자세히 수집하고 파인애플의 상점 이름, 제품 이름, 가격, 원산지, 판매량 및 기타 데이터를 얻습니다. 이전 기사에서 Taobao 가맹점 데이터를 소개 한 이후 수집 방법에 대해 자세히 설명합니다 (이 기사를 이해하지 않고 Requests + Cookie를 사용하여 Taobao 제품 데이터를 쉽게 얻을 수 있습니다!). 여기에서 코드를 직접 업로드합니다.

response = requests.get('https://s.taobao.com/search', headers=headers, params=params)

shangpinming = re.findall('"raw_title":"(.*?)"',response.text)
jiage = re.findall('"view_price":"(.*?)"',response.text)
fahuodi = re.findall('"item_loc":"(.*?)"',response.text)
fukuanrenshu = re.findall('"view_sales":"(.*?)人付款"',response.text)
dianpumingcheng = re.findall('"nick":"(.*?)"',response.text)

 

데이터 처리

Excel 파일을 열어 데이터를 관찰 한 결과 그림과 같이 중복 데이터가 많이 있음을 발견했습니다.

Python은 보물 파인애플 데이터를 크롤링하고 매출을 시각적으로 분석합니다.

 

일부 매장 데이터가 다른 페이지에도 존재하기 때문일 수 있습니다 .Pandas를 사용하여 데이터를 정리할 수 있지만 여기서는 반복되는 데이터, 즉 Excel과 함께 제공되는 더 간단한 방법을 사용하여 삭제할 수 있습니다. 삭제 기능이 있습니다. 그림과 같이 중복 항목 :

Python은 보물 파인애플 데이터를 크롤링하고 매출을 시각적으로 분석합니다.

 

데이터 처리 후 데이터 미리보기 :

Python은 보물 파인애플 데이터를 크롤링하고 매출을 시각적으로 분석합니다.

 

데이터 시각화

이 기사에서는 Excel을 사용하여 파인애플 데이터를 시각화합니다. Excel이 그리기 측면에서 Python보다 훨씬 낫기 때문입니다!

파인애플 가격 분포도

Python은 보물 파인애플 데이터를 크롤링하고 매출을 시각적으로 분석합니다.

 

수치에 따르면 파인애플 가격의 45 %가 30 위안 미만이고 대부분이 100 위안 미만이다. 국가 통계국이 발표 한 국민 1 인당 가처분 소득에 따르면 파인애플 자유를 실현하는 것은 매우 간단하다. .

Python은 보물 파인애플 데이터를 크롤링하고 매출을 시각적으로 분석합니다.

 

그 가게는 더 나은 판매를

Python은 보물 파인애플 데이터를 크롤링하고 매출을 시각적으로 분석합니다.

 

그림을 보면 상위 10 개 매장 중 9 개가 플래그십 매장임을 알 수 있는데, 가격이 낮을수록 사람들은 제품 품질에 더 많은 관심을 기울이는 것 같습니다.

 

가격과 판매의 관계

Python은 보물 파인애플 데이터를 크롤링하고 매출을 시각적으로 분석합니다.

 

분산 형 차트에서 우리는 가격과 판매가 기본적으로 반비례한다는 것을 알 수 있습니다. 즉, 가격이 낮을수록 판매가 높아집니다.

매장의 평판 때문일 수 있습니다.

 

중국에서 파인애플이 풍부한 곳

Python은 보물 파인애플 데이터를 크롤링하고 매출을 시각적으로 분석합니다.

 

타오바오 매장의 위치를 ​​시각화 한 결과 대부분의 매장이 광동, 하이난, 저장과 같은 해안 지역에 집중되어 있다는 사실을 발견했습니다. 특히 파인애플 생산 조건을 인터넷에서 검색했습니다.

Python은 보물 파인애플 데이터를 크롤링하고 매출을 시각적으로 분석합니다.

 

판매중인 파인애플의 특성

Python은 보물 파인애플 데이터를 크롤링하고 매출을 시각적으로 분석합니다.

 

모든 상품명을 워드 클라우드 맵으로 만들었고, 워드 클라우드 맵에서 파인애플 상품 데이터의 키워드가 신선, 파인애플, 통조림, 스낵, 하이난임을 알 수 있습니다. FCL, 무료 배송 등

추천

출처blog.csdn.net/m0_48405781/article/details/115006265