【Python】【selenium】如何自动翻译并获得页面内容

【背景】

想把一些国外网站的内容批量获取后翻译成中文,存在两种实现方式:

  1. 是用爬虫批量爬取进dataframe后导出成excel,然后对excel进行翻译。
  2. 直接在具备翻译插件的网页,比如QQ浏览器上先自动让浏览器翻译,然后再爬取这些翻译后的内容。

【代码】

实现代码如下:

    # 右键选择翻译
    rightClick = ActionChains(driver)
    position_element = driver.find_element_by_class_name("app-description__title")
    rightClick.context_click(position_element).perform()
    sleep(1)
    pyautogui.typewrite(['down']*7)
    pyautogui.typewrite(["enter"])
    sleep(3)

其中用到了pyautogui的自动化包,需要先在程序开头import。
rightClick是右击动作,position_element是需要对其右击的文本对象,pyautogui.typewrite([‘down’]*7)是指出现菜单后向下移动7个选项,因为翻译在第七个项目位置。
获得翻译后网页之后,根据我之前的帖子做法,将driver的html信息传给beautiful soup,然后用soup抓取所需信息整理成需要的数据格式输出即可。

猜你喜欢

转载自blog.csdn.net/weixin_41697242/article/details/125537644