这个答案是由以前的堆栈溢出问题,答案以及本文中的注释组成的,所以谢谢大家。
我为这个解决方案结合了selenium webdriver和python
request模块。我实质上是使用Selenium登录该站点的,从webdriver会话中复制了cookie,然后使用了request.get(url,cookies
= webdriver_cookies)来获取文件。
这是我的解决方案的要点
fp = webdriver.FirefoxProfile() fp.set_preference("browser.download.folderList", 2)fp.set_preference("browser.download.manager.showWhenStarting", False) fp.set_preference("browser.download.dir",'xx/yy') fp.set_preference('browser.helperApps.neverAsk.saveToDisk', "text/plain, application/vnd.ms-excel, text/csv, text/comma-separated-values, application/octet-stream") driver = webdriver.Firefox(fp)# selenium login pre ...driver_cookies = driver.get_cookies()cookies_copy = {}for driver_cookie in driver_cookies: cookies_copy[driver_cookie["name"]] = driver_cookie["value"]r = requests.get('url',cookies = cookies_copy)print r.text我希望这可以帮助某人



