【背景】
想把一些国外网站的内容批量获取后翻译成中文,存在两种实现方式:
- 是用爬虫批量爬取进dataframe后导出成excel,然后对excel进行翻译。
- 直接在具备翻译插件的网页,比如QQ浏览器上先自动让浏览器翻译,然后再爬取这些翻译后的内容。
【代码】
实现代码如下:
# 右键选择翻译
rightClick = ActionChains(driver)
position_element = driver.find_element_by_class_name("app-description__title")
rightClick.context_click(position_element).perform()
sleep(1)
pyautogui.typewrite(['down']*7)
pyautogui.typewrite(["enter"])
sleep(3)
其中用到了pyautogui的自动化包,需要先在程序开头import。
rightClick是右击动作,position_element是需要对其右击的文本对象,pyautogui.typewrite([‘down’]*7)是指出现菜单后向下移动7个选项,因为翻译在第七个项目位置。
获得翻译后网页之后,根据我之前的帖子做法,将driver的html信息传给beautiful soup,然后用soup抓取所需信息整理成需要的数据格式输出即可。