源码地址

概述
前言

统计结果

爬虫技术分析

爬虫代码实现

爬虫分析实现

后记

预告

前言
多图预警、多图预警、多图预警。秋招季，毕业也多，跳槽也多。我们的职业发展还是要顺应市场需求，那么各门编程语言在深圳的需求怎么呢？工资待遇怎么样呢？zone 在上次写了这篇文章之后【用Python告诉你深圳房租有多高】，想继续用 Python 分析一下，当前深圳的求职市场怎么样？于是便爬取了某钩招聘数据。以下是本次爬虫的样本数据：

本次统计数据量为 4658 ，其中某拉钩最多能显示 30 页数据，每页 15 条招聘信息，则总为：

30 x 15 = 450

首页爬取跳过一页，则为 435 条，故数据基本爬完。其余不够数量的语言为该语言在深圳只有这么多条招聘信息。

统计结果
各语言平均工资
其中

精准推荐

自然语言

机器学习

Go 语言

图像识别

独领风骚啊！！！平均工资都挺高的。区块链炒得挺火的，好像平均薪资并没有那么高。我统计完之后，感觉自己拖后腿了，
ma 的！！！要删库跑路了！

平均工资计算方式：

最高值与最低值，求平均数，如图薪资则为：

(10k + 20k)/2 = 15k

最后，再总体求平均数。
公司福利词云
看福利还是挺丰富的，带薪休假、下午茶、零食、节假日。

公司发展级别排行
总体由 A 轮向 D 轮缩减，大部分公司不需要融资，嗯，估计是拿不到资本融资，但是自家人又有钱的。

各语言工作年限要求与学历要求
看看你的本命语言的市场需求怎么样？你达标了吗？其中三至五年的攻城狮职位挺多的，不怕找不到工作。还有一个趋势是，薪资越高，学历要求越高高。看来学历还是挺重要的。

Java
Java 作为一门老牌编程语言，有些要求还是挺高的。为数不多的，有要求 5 - 10 年的。从总体来看，基本与学历没有太大的关联，只要技术到家就行。

Python
Python 作为近年来被追捧的语言，主要是其发展方向众多，AI 、web 后端、运维、爬虫等。其入门要求也不是特别高，基本上本科学历就能胜任多数工作，AI 就要另当别论了。

C 语言
C 语言，也作为一门老牌编程语言。嗯，怎么感觉新一届的程序员越来越少学 C 语言了呢？

机器学习
是的，这一次感受到了学历的重要性了，硕士要求占了一大半呢！！我这个渣渣二本是入不了这行了。但工作年限要求没有非常高。

图像识别
图像识别薪资也高，学历要求也相对高一点。

自然语言
果然，稀缺人才薪资都高，但这次它还是伴有学历门槛的，所以说要时刻都抱着学习的心态呀。

区块链
区块链概念刚火爆的时候，感觉大街小巷都在讨论区块链啊？公众号随处都能看到区块链的字眼，随着一些区块链的暴雷，这概念好像有稍微平静下来的感觉。不过从薪资来看，好像也没有非常高。但是为学历还是有点要求的。

Go 语言
Go 语言的需求量还是挺大的，为学历号位有那么点要求。

PHP
PHP 是世界上最好的编程语言，不解释！！！

Android
这两年 Android 趋于饱和，在加上小程序与 H5 的冲击，稍微平稳下来了。不过在视频、音频处理方面厉害的话，还是很吃香的。对学历基本没什么要求。

iOS
同 Android 类似，不过比 Android 先饱和了。学历方面，基本没什么要求。

web 前端
web 前端平均工资，比我预期的少了。看来会数据分析还是有好处的，其职位基本本科就能胜任。

精准推荐
精准推荐薪资贼高啊，可能是和推荐商品有关，商品推荐出去了，买到钱了，你说薪资能不高吗？但是，这行业对学历还是有一定要求的。

爬虫技术分析
请求库：selenium

HTML 解析：BeautifulSoup、xpath

词云：wordcloud

数据可视化：pyecharts

数据库：MongoDB

数据库连接：pymongo

爬虫代码实现

看完统计结果之后，有没有跃跃欲试？想要自己也实现以下代码？以下为代码实现。
对网页右击，点击检查，找到一条 item 的数据：

数据库存储结构：

{
    "_id" : ObjectId("5b8b89328ffaed60a308bacd"),
    "education" : "本科",# 学习要求
    "companySize" : "2000人以上",# 公司人数规模
    "name" : "python开发工程师",# 职位名称
    "welfare" : "“朝九晚五,公司平台大,发展机遇多,六险一金”",# 公司福利
    "salaryMid" : 12.5,# 工资上限与工资下限的平均数
    "companyType" : "移动互联网",# 公司类型
    "salaryMin" : "10",# 工资下限
    "salaryMax" : "15",# 工资上限
    "experience" : "经验3-5年",# 工作年限
    "companyLevel" : "不需要融资",# 公司级别
    "company" : "XXX技术有限公司"# 公司名称
}

由于篇幅原因，以下只展示主要代码：

# 获取网页源码数据
# language => 编程语言
# city => 城市
# collectionType => 值：True/False  True => 数据库表以编程语言命名   False => 以城市命名
def main(self, language, city, collectionType):
    print(" 当前爬取的语言为 => " + language + "  当前爬取的城市为 => " + city)
    url = self.getUrl(language, city)
    browser = webdriver.Chrome()
    browser.get(url)
    browser.implicitly_wait(10)
    for i in range(30):
 selector = etree.HTML(browser.page_source)  # 获取源码
 soup = BeautifulSoup(browser.page_source, "html.parser")
 span = soup.find("div", attrs={"class": "pager_container"}).find("span", attrs={"action": "next"})
 print(
     span)  # 下一页
 classArr = span['class']
 print(classArr)  # 输出内容为 -> ['pager_next', 'pager_next_disabled']
 attr = list(classArr)[0]
 attr2 = list(classArr)[1]
 if attr2 == "pager_next_disabled":#分析发现 class 属性为  ['pager_next', 'pager_next_disabled'] 时，【下一页】按钮不可点击
     print("已经爬到最后一页，爬虫结束")
     break
 else:
     print("还有下一页，爬虫继续")
     browser.find_element_by_xpath('//*[@id="order"]/li/div[4]/div[2]').click()  # 点击下一页
 time.sleep(5)
 print('第{}页抓取完毕'.format(i + 1))
 self.getItemData(selector, language, city, collectionType)# 解析 item 数据，并存进数据库
    browser.close()

爬虫分析实现

# 获取各语言样本数量
def getLanguageNum(self):
    analycisList = []
    for index, language in enumerate(self.getLanguage()):
 collection = self.zfdb["z_" + language]
 totalNum = collection.aggregate([{'$group': {'_id': '', 'total_num': {'$sum': 1}}}])
 totalNum2 = list(totalNum)[0]["total_num"]
 analycisList.append(totalNum2)
    return (self.getLanguage(), analycisList)

# 获取各语言的平均工资
def getLanguageAvgSalary(self):
    analycisList = []
    for index, language in enumerate(self.getLanguage()):
 collection = self.zfdb["z_" + language]
 totalSalary = collection.aggregate([{'$group': {'_id': '', 'total_salary': {'$sum': '$salaryMid'}}}])
 totalNum = collection.aggregate([{'$group': {'_id': '', 'total_num': {'$sum': 1}}}])
 totalNum2 = list(totalNum)[0]["total_num"]
 totalSalary2 = list(totalSalary)[0]["total_salary"]
 analycisList.append(round(totalSalary2 / totalNum2, 2))
    return (self.getLanguage(), analycisList)

# 获取一门语言的学历要求（用于 pyecharts 的词云）
def getEducation(self, language):
    results = self.zfdb["z_" + language].aggregate([{'$group': {'_id': '$education', 'weight': {'$sum': 1}}}])
    educationList = []
    weightList = []
    for result in results:
 educationList.append(result["_id"])
 weightList.append(result["weight"])
    # print(list(result))
    return (educationList, weightList)

# 获取一门语言的工作年限要求（用于 pyecharts 的词云）
def getExperience(self, language):
    results = self.zfdb["z_" + language].aggregate([{'$group': {'_id': '$experience', 'weight': {'$sum': 1}}}])
    totalAvgPriceDirList = []
    for result in results:
 totalAvgPriceDirList.append(
     {"value": result["weight"], "name": result["_id"] + "  " + str(result["weight"])})
    return totalAvgPriceDirList

# 获取 welfare 数据，用于构建福利词云
def getWelfare(self):
    content = ''
    queryArgs = {}
    projectionFields = {'_id': False, 'welfare': True}  # 用字典指定
    for language in self.getLanguage():

 collection = self.zfdb["z_" + language]
 searchRes = collection.find(queryArgs, projection=projectionFields).limit(1000)
 for result in searchRes:
     print(result["welfare"])
     content += result["welfare"]
    return content

# 获取公司级别排行（用于条形图）
def getAllCompanyLevel(self):
    levelList = []
    weightList = []
    newWeightList = []
    attrList = ["A轮", "B轮", "C轮", "D轮及以上", "不需要融资", "上市公司"]
    for language in self.getLanguage():
 collection = self.zfdb["z_" + language]
 # searchRes = collection.find(queryArgs, projection=projectionFields).limit(1000)
 results = collection.aggregate([{'$group': {'_id': '$companyLevel', 'weight': {'$sum': 1}}}])
 for result in results:
     levelList.append(result["_id"])
     weightList.append(result["weight"])
    for index, attr in enumerate(attrList):
 newWeight = 0
 for index2, level in enumerate(levelList):
     if attr == level:
  newWeight += weightList[index2]
 newWeightList.append(newWeight)
    return (attrList, newWeightList)

后记
总体就分析到这里了，如果你也想看看你所在的城市的薪资标准与市场需求，欢迎后台骚扰。如果人数多，我就专门写下你所在的城市的分析。

预告
最近写了挺多关于 Python 的文章，但是这是一个后端公众号啊，所以接下来准备写写后端相关的。最近微服务概念炒得挺火的，但网络好像都没找到什么实实在在的项目来学习，刚好我前段时间用 Python 与 Node.js 写了下微服务，所以下面会写微服务相关的文章。敬请期待！

往期好文：
python 数据可视化利器 plus
Python 数据库骚操作 – MongoDB
推荐几款提高体验与效率的 Chrome 插件神器
python 实现二叉树的深度&&广度优先遍历
用Python告诉你深圳房租有多高

秋招季，用Python分析深圳程序员工资有多高？

概述
前言

统计结果

爬虫技术分析

爬虫代码实现

爬虫分析实现

后记

预告

Java
Java 作为一门老牌编程语言，有些要求还是挺高的。为数不多的，有要求 5 - 10 年的。从总体来看，基本与学历没有太大的关联，只要技术到家就行。

Python
Python 作为近年来被追捧的语言，主要是其发展方向众多，AI 、web 后端、运维、爬虫等。其入门要求也不是特别高，基本上本科学历就能胜任多数工作，AI 就要另当别论了。

C 语言
C 语言，也作为一门老牌编程语言。嗯，怎么感觉新一届的程序员越来越少学 C 语言了呢？

机器学习
是的，这一次感受到了学历的重要性了，硕士要求占了一大半呢！！我这个渣渣二本是入不了这行了。但工作年限要求没有非常高。

图像识别
图像识别薪资也高，学历要求也相对高一点。

自然语言
果然，稀缺人才薪资都高，但这次它还是伴有学历门槛的，所以说要时刻都抱着学习的心态呀。

Go 语言
Go 语言的需求量还是挺大的，为学历号位有那么点要求。

PHP
PHP 是世界上最好的编程语言，不解释！！！

Android
这两年 Android 趋于饱和，在加上小程序与 H5 的冲击，稍微平稳下来了。不过在视频、音频处理方面厉害的话，还是很吃香的。对学历基本没什么要求。

iOS
同 Android 类似，不过比 Android 先饱和了。学历方面，基本没什么要求。

web 前端
web 前端平均工资，比我预期的少了。看来会数据分析还是有好处的，其职位基本本科就能胜任。

精准推荐
精准推荐薪资贼高啊，可能是和推荐商品有关，商品推荐出去了，买到钱了，你说薪资能不高吗？但是，这行业对学历还是有一定要求的。

爬虫技术分析
请求库：selenium

HTML 解析：BeautifulSoup、xpath

词云：wordcloud

数据可视化：pyecharts

数据库：MongoDB

数据库连接：pymongo

后记
总体就分析到这里了，如果你也想看看你所在的城市的薪资标准与市场需求，欢迎后台骚扰。如果人数多，我就专门写下你所在的城市的分析。

Python相关栏目本月热门文章

秋招季，用Python分析深圳程序员工资有多高？

概述 前言 统计结果 爬虫技术分析 爬虫代码实现 爬虫分析实现 后记 预告

Java Java 作为一门老牌编程语言，有些要求还是挺高的。为数不多的，有要求 5 - 10 年的。从总体来看，基本与学历没有太大的关联，只要技术到家就行。

Python Python 作为近年来被追捧的语言，主要是其发展方向众多，AI 、web 后端、运维、爬虫等。其入门要求也不是特别高，基本上本科学历就能胜任多数工作，AI 就要另当别论了。

C 语言 C 语言，也作为一门老牌编程语言。嗯，怎么感觉新一届的程序员越来越少学 C 语言了呢？

机器学习 是的，这一次感受到了学历的重要性了，硕士要求占了一大半呢！！我这个渣渣二本是入不了这行了。但工作年限要求没有非常高。

图像识别 图像识别薪资也高，学历要求也相对高一点。

自然语言 果然，稀缺人才薪资都高，但这次它还是伴有学历门槛的，所以说要时刻都抱着学习的心态呀。

Go 语言 Go 语言的需求量还是挺大的，为学历号位有那么点要求。

PHP PHP 是世界上最好的编程语言，不解释！！！

Android 这两年 Android 趋于饱和，在加上小程序与 H5 的冲击，稍微平稳下来了。不过在视频、音频处理方面厉害的话，还是很吃香的。对学历基本没什么要求。

iOS 同 Android 类似，不过比 Android 先饱和了。学历方面，基本没什么要求。

web 前端 web 前端平均工资，比我预期的少了。看来会数据分析还是有好处的，其职位基本本科就能胜任。

精准推荐 精准推荐薪资贼高啊，可能是和推荐商品有关，商品推荐出去了，买到钱了，你说薪资能不高吗？但是，这行业对学历还是有一定要求的。

爬虫技术分析 请求库：selenium HTML 解析：BeautifulSoup、xpath 词云：wordcloud 数据可视化：pyecharts 数据库：MongoDB 数据库连接：pymongo

后记 总体就分析到这里了，如果你也想看看你所在的城市的薪资标准与市场需求，欢迎后台骚扰。如果人数多，我就专门写下你所在的城市的分析。

Python相关栏目本月热门文章

概述
前言

统计结果

爬虫技术分析

爬虫代码实现

爬虫分析实现

后记

预告

Java
Java 作为一门老牌编程语言，有些要求还是挺高的。为数不多的，有要求 5 - 10 年的。从总体来看，基本与学历没有太大的关联，只要技术到家就行。

Python
Python 作为近年来被追捧的语言，主要是其发展方向众多，AI 、web 后端、运维、爬虫等。其入门要求也不是特别高，基本上本科学历就能胜任多数工作，AI 就要另当别论了。

C 语言
C 语言，也作为一门老牌编程语言。嗯，怎么感觉新一届的程序员越来越少学 C 语言了呢？

机器学习
是的，这一次感受到了学历的重要性了，硕士要求占了一大半呢！！我这个渣渣二本是入不了这行了。但工作年限要求没有非常高。

图像识别
图像识别薪资也高，学历要求也相对高一点。

自然语言
果然，稀缺人才薪资都高，但这次它还是伴有学历门槛的，所以说要时刻都抱着学习的心态呀。

Go 语言
Go 语言的需求量还是挺大的，为学历号位有那么点要求。

PHP
PHP 是世界上最好的编程语言，不解释！！！

Android
这两年 Android 趋于饱和，在加上小程序与 H5 的冲击，稍微平稳下来了。不过在视频、音频处理方面厉害的话，还是很吃香的。对学历基本没什么要求。

iOS
同 Android 类似，不过比 Android 先饱和了。学历方面，基本没什么要求。

web 前端
web 前端平均工资，比我预期的少了。看来会数据分析还是有好处的，其职位基本本科就能胜任。

精准推荐
精准推荐薪资贼高啊，可能是和推荐商品有关，商品推荐出去了，买到钱了，你说薪资能不高吗？但是，这行业对学历还是有一定要求的。

爬虫技术分析
请求库：selenium

HTML 解析：BeautifulSoup、xpath

词云：wordcloud

数据可视化：pyecharts

数据库：MongoDB

数据库连接：pymongo

后记
总体就分析到这里了，如果你也想看看你所在的城市的薪资标准与市场需求，欢迎后台骚扰。如果人数多，我就专门写下你所在的城市的分析。