실용적인 크롤러 전투 - 웨이보 댓글 데이터 시각화

소개:

데이터가 상대적으로 적을 때 데이터에서 정보를 쉽게 얻을 수 있다는 것을 우리 모두는 알고 있습니다. 하지만 데이터가 상대적으로 크면 우리가 보기가 어렵습니다. 특히 오늘날 수만 개의 데이터를 볼 때 이는 더욱 중요합니다.

다행스럽게도 컴퓨터를 사용하여 분석할 수 있으며 보다 효율적인 방법 중 하나는 데이터 시각화입니다. 데이터를 시각화함으로써 데이터가 말하게 할 수 있습니다. 이를 통해 데이터를 분석하고 데이터를 더 빨리 이해할 수 있습니다.

검토:

이전 장에 이어 우리는 이전에 Weibo 댓글을 얻기 위해 크롤러를 작성했습니다. 얻은 데이터는 다음과 같다.
여기에 이미지 설명을 삽입하세요.
여기에 이미지 설명을 삽입하세요.
위의 데이터는 실제로 육안으로 패턴을 확인하기 어렵다는 것을 알 수 있다. 동시에 이러한 데이터는 매우 직관적이지 않습니다. 그러면 데이터 시각화를 통해 이 데이터를 시각화할 수 있습니다.

다음은 우리가 크롤링한 데이터를 시각화하기 위해 pyecharts를 사용한 효과입니다.
첫 번째는 댓글 데이터에서 팬이 많은 사용자의 팬 데이터이고,
여기에 이미지 설명을 삽입하세요.
두 번째는 댓글 데이터에서 팬이 많은 사용자의 관심 데이터이며,
여기에 이미지 설명을 삽입하세요.
다음 단계는 댓글이 게시된 주소를 시각화하는 것입니다. 그림을 통해 테스트해 볼 수 있습니다. 어디를 가든 더 많은 사람들이 댓글을 읽을 것입니다. 구체적인 효과는 아래 영상을 통해 확인하실 수 있습니다.

또한, 시간 통계를 통해 어느 시간대에 댓글이 가장 많이 달렸는지를 확인하는데,
여기에 이미지 설명을 삽입하세요.
전체 댓글에서 상위 20개의 IP 주소가 발생한 횟수는 다음 표와 같습니다. 여기에서 볼 수 있듯이, 이 웨이보 댓글에는 베이징의 댓글 사용자가 가장 많습니다.
여기에 이미지 설명을 삽입하세요.
댓글 작성자의 성별에 대한 통계도 만들 수 있습니다. 다음은 웨이보 댓글의 성별 분포입니다. 마지막
여기에 이미지 설명을 삽입하세요.
은 프로필 데이터 시각화입니다. 즉, 이 웨이보에 댓글을 게시한 사용자의 개인화된 서명을 생성하고 이러한 서명 데이터에 대해 워드 클라우드 표시를 수행합니다.

여기에 이미지 설명을 삽입하세요.
댓글 데이터 시각화 동영상 소개:

실전 크롤러 전투 - 웨이보 댓글 시각화

이상이 이번에 공유된 내용의 전부입니다.
작성자의 능력의 한계로 인해 질문의 형식이 부정확할 수 있으니 양해해 주시기 바랍니다! ! !
완전한 소스코드: 실용 크롤러 전투 - 웨이보 댓글 데이터 시각화

추천

출처blog.csdn.net/public669/article/details/135445858