RPA和爬虫的区别

爬虫是一种按照一定的规则，自动地抓取网络上信息的程序或者脚本。而RPA也可以操作WEB浏览器，自动从网页上抓取数据或图片，这一点和爬虫类似，那么RPA和爬虫有什么区别呢？

技术原理

RPA是通过模拟人的方式在系统UI上进行操作，点击鼠标，复制粘贴，打开文件或执行数据采集等等。

爬虫通常是使用 python脚本语言通过发送http请求或者直接操作网页等方式获取数据，抓取的数据量有时非常庞大，甚至可以达到几千万上亿的数据量。

适合场景

RPA应用场景更加广泛，可以在企业各个部门使用，如财务部门，人事部门，采购部门或市场部门等均可使用，主要是通过RPA自动化来减少人工的重复性操作。在具体的操作层面上，RPA可以实现自动化打开邮件，下载附件，登陆网站和系统，读取数据库，复制、粘贴和移动文件，读取或写入表格数据，网页数据抓取等等。日常工作中，它能帮助员工自动收集资料，整理表格，处理数据甚至收发邮件。总之，企业中的有固定规则的重复性的工作都可以由RPA来实现自动化。

爬虫主要用于网络上的数据采集，工作场景具有局限性，因此主要应用在数据采集的场景，通常采用接口或暴力破解的方式爬取、解析网页内容以获取资料，采集效率高，同时会对后台造成巨大负担，因此会被反爬虫机制禁止。

合规性

RPA的核心是“模拟人的操作”，所以它对系统的操作也如一个人在系统上的正常操作一般，不会对系统造成任何影响。RPA已经在银行、证券、保险、物流、政府机构等各个领域投入使用。

爬虫的合规性要视具体情况而定，由于多用在数据采集上，爬虫涉及到的工作很容易会侵害到个人隐私和企业的数据安全，始终存在争议。而不当使用更会直接造成法律风险，甚至是严重的法律后果。

RPA之家（www.rpazj.com）是中国具有影响力的RPA垂直交流社区，社区汇聚了RPA领域的各类从业人员。其中包括RPA开发工程师、售前工程师、业务分析师、架构师、运维工程师、项目管理、项目负责人、企业高管、HR等多种角色。社区提供了各种丰富的教程、资讯、文章、问答、招聘、活动、项目等供大家一起交流和成长。

RPA和爬虫的区别

Python相关栏目本月热门文章