栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

如何使用Python,Selenium和PhantomJS下载文件

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

如何使用Python,Selenium和PhantomJS下载文件

我找到了一个解决方案,并希望分享。一项要求发生了变化,我不再使用

PhantomJS
了,但
chromedriver
它与虚拟帧缓冲区毫无关系。结果相同,就可以完成工作。


您需要的是:

pip install selenium pyvirtualdisplay

apt-get install xvfb


我将Py3.5和ovh.net的测试文件与标签而不是按钮一起使用。脚本等待页面上显示,然后单击它。如果您不等待该元素并且位于异步站点上,那么您尝试单击的元素可能还不存在。下载位置是相对于脚本位置的文件夹。该脚本会检查该目录,如果文件已被第二次延迟下载。如果我没有记错的话,在下载过程中文件应该是.part,并且一旦它变成

filename
脚本中指定的.dat,就应该完成。如果关闭虚拟帧缓冲区和驱动程序,下载将无法完成。完整的脚本如下所示:

# !/usr/bin/python# coding: utf-8import osimport sysimport timefrom pyvirtualdisplay import Displayfrom selenium import webdriverfrom selenium.webdriver.support.wait import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.common.by import Byimport globdef main(argv):    url = 'http://ovh.net/files'    dl_dir = 'downloads'    filename = '1Mio.dat'    display = Display(visible=0, size=(800, 600))    display.start()    chrome_options = webdriver.ChromeOptions()    dl_location = os.path.join(os.getcwd(), dl_dir)    prefs = {"download.default_directory": dl_location}    chrome_options.add_experimental_option("prefs", prefs)    chromedriver = "./chromedriver"    driver = webdriver.Chrome(executable_path=chromedriver, chrome_options=chrome_options)    driver.set_window_size(800, 600)    driver.get(url)    WebDriverWait(driver, 30).until(EC.presence_of_element_located((By.XPATH, '//a[@href="' + filename + '"]')))    hyperlink = driver.find_element_by_xpath('//a[@href="' + filename + '"]')    hyperlink.click()    while not(glob.glob(os.path.join(dl_location, filename))):        time.sleep(1)    driver.close()    display.stop()if __name__ == '__main__':    main(sys.argv)

我希望这对以后的人有所帮助。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/468960.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号