因为一门市场营销的课程要用旅游网站的游客评论讲NLP的一些基本知识,本来老师让我们复制粘贴评论数据的(不少于10条)。我觉得数据太少可能效果不好,自己写了个小代码自动爬。
from selenium import webdriver
import pandas as pd
import time
wd = webdriver.Chrome()
wd.get("https://www.tripadvisor.com.au/Attraction_Review-g529031-d264758-Reviews-Mount_Kosciuszko_National_Park-Thredbo_Village_Kosciuszko_National_Park_New_South_.html")
wd.implicitly_wait