这一事实 硒驱动 火狐 / GeckoDriver 被检测出_不依赖于任何特定的 _GeckoDriver 或 Firefox的
版本。该 网站 本身可以检测网络流量,并可以识别 浏览器客户端 ,即 Web浏览器 作为 的webdriver controled 。
根据 WebDriver-W3C Living
document
WebDriverInterface的最新编辑草稿中的
文档
,当用户代理处于远程控制(即通过Selenium控制)时,最初设置为 false* 的
标志 设置为 true 。
webdriver-active
__*
现在,该 NavigatorAutomationInformation
接口不应在上公开 WorkerNavigator
。
所以,
webdriver Returns true if webdriver-active flag is set, false otherwise.
在哪里
navigator.webdriver Defines a standard way for co-operating user agents to inform the document that it is controlled by WebDriver, for example so that alternate pre paths can be triggered during automation.
因此,最重要的是:
硒证明自己
但是,一些避免在网络抓取时被检测到的通用方法如下:
- 网站可以通过您的 显示器大小 来确定您的脚本/程序的首要属性是。因此,建议 不要 使用常规的视口。
- 如果您需要向网站发送多个请求,则需要继续更改每个请求的 用户代理 。在这里,您可以找到有关在Selenium中更改Google Chrome用户代理的方法的详细讨论。
- 为了模拟 人类一样 的行为,你可能需要甚至超越脚本执行减慢WebDriverWait和expected_conditions诱导
time.sleep(secs)
。在这里您可以找到有关如何在python中休眠Webdriver毫秒的详细讨论



