开智学堂:北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像。

本文来自微信公众号“开智学堂”(ID:openmindclub),作者 林夏(公号“纸箱之神的中二病世界”)

裁员、996 的背景下,互联网工作者该何去何从?

我写 Python 爬虫从智联招聘、前程无忧、Boss 直聘采集了 20000 多条信息(2019 年 4 月末采集的),对这些职位从薪资待遇、行业分布、地理位置分布等角度做了分析,试图参考开智学堂(ID:OpenMindClub)陈虎平老师在第三届开智大会上的主题演讲:《城市演化与人生设计》中的理论,找出互联网从业者相对集中的热门城区,为大家选择就业城市、选择居住地提供一个参考依据。

选取了两个有代表性的岗位,分别是新媒体运营和 Python(工程师),新媒体代表着市场营销方向的工作,Python 是现在最火的编程语言,代表着技术类的工作。

先看一下每个职位的数量:

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

对职位数量和人口数据取对数,做线性回归拟合,绘图。

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

为什么要取对数呢,因为每个城市的规模不一样啊,放在一起比较稍微显得有点不公平啊。

广州为什么新媒体类的职位那么多?我猜可能的原因是一些做贸易的商业公司对这一类职位有需求,而并不是专业做内容的公司。

每个城市的平均薪资怎么样?

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

可以明显看到,技术类工作的工资远高于非技术类工作。

下面是每个城市的详细信息。

1、北京

新媒体:

下图中每个红色的小点代表一家正在招聘新媒体运营的互联网企业。

黄色部分是地铁线路。

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

用 QGIS 统计每个小方格内点的个数,然后用色块标出公司最密集的区域,颜色越深越密集。对北京熟悉的同学能看的出来这些地方是哪里吗?

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

薪资待遇:

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

箱线图的读法(如下图),科普:

中位数就是中间值,上四分位数就是前 25% 的值,下四分位数就是前 75% 的值。

上图中的异常值,并不是有问题的数据,而是一些工资超过平均线很多的【新媒体运营总监】职位,加油吧同学们!

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

行业关键词:

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像注:做词云的时候去除了【互联网】、【电子商务】、【计算机软件】这三个关键词,因为我从这三个词得不到任何有用的信息,我做词云是想要判断细分领域,这个公司是做旅游的还是亲子教育的?是做服装的还是做地产的?(以下皆同)

可见北京的教育培训行业与影视文化传播行业是非常火的。

Python:

直接上图,不废话了。

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

有发现传说中的西二旗吗?

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

2、上海

新媒体:

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

发现吗?上海新媒体编辑需求最多的地方并不是张江,而是靠近市中心的徐家汇。说明这样的职位是越来越下沉了,而不是仅仅局限于科技公司。

一大波总监向我们袭来,不过普通的岗位工资是真的低,前 25% 的水平才刚刚过万……

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

行业关键词,教育培训依旧火爆,然后还有快消品、会展公关、法律等……

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像Python:

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

可以看出,技术类的岗位才接近张江。

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

Python 的工资就是高于新媒体编辑。

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像我有个朋友问我说,我是做教育行业的新媒体编辑,并且以后一直准备在上海做教育行业,应该住在哪里比较好?(因为可能还会换工作)

那我们把教育行业的新媒体岗位数据筛选出来看一下吧!

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

可以看出,徐家汇、田林,对她来说都是很好的选择。

3、广州

新媒体:

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

珠江新城,你猜对了吗?

薪资比较低。知乎上有个话题:「为什么感觉在中国月入过万很普遍?」并不普遍,在广州做新媒体编辑很大概率破不了万。

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

现在为啥不管哪个城市教育培训行业都这么火?这是裁员 + 996 逼的大家苦练内功了么……

然后我还看到了大大的「快速消费品」五个字。

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

Python:

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

不是在珠江新城了哦,靠近黄浦大道中。

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

4、深圳

新媒体:

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

福田区车公庙,深圳我不熟,为什么历史选择了那里?

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

深圳的工资比广州的高,看出来没有。

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

贸易进出口……深圳的关键词

Python:

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

技术岗位和市场岗位很重叠啊,那一块可真是个宝地呀。

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

5、杭州

新媒体:

我只能说,真的很抱歉,杭州我没有找到地铁图,只有非常熟悉杭州的朋友,对着行政区边界图才能看的出来了。

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

东南面最红的那个点接近滨江区西兴地铁站,我在地图上找到的,那儿是有名的梦想小镇吗?

我也不懂,没去过杭州,这次标出的所有的点都是根据数据生成的,没有主观因素在里面,只是觉得从前的梦想小镇挺有名的。

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

行业关键词有纺织、皮革、服装……教育培训依旧火爆……

Python:

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

上面那个深蓝色的点是西溪,是程序员聚集地。

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

6、写在后面

通过做词云,我发现每个城市的产业结构的不一样。拿新媒体来说,同样的岗位,可能北京更多的是偏向影视文化传媒,杭州偏向服装贸易,深圳偏向进出口贸易,广州一大堆快消品,上海……抱歉我没看出什么特别明显的特点。那么,做内容的小伙伴,是否应该根据每个城市不同的产业结构特点,选择属于自己的城市呢?而不是凭借一个简单的概念,「XX 城是互联网一线城市」这样。

这次采集数据,做图,让我对中国的互联网行业的就业情况有了一个新的认知,各位小伙伴也可以参考这样的方法,规划自己的就业城市和居住地。

本文出处:开智学堂,链接:微信ID:openmindclub,采用「CC BY-SA 4.0 CN」协议转载学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请联系「我们」处理。

发表评论

登录后才能评论

联系我们

如有建议:>>给我留言 大数据交流群: 统  计  学 数据分析网-统计学 商业智能 数据分析网-商业智能 数据挖掘 数据分析-数据挖掘 数据产品 数据分析网-数据产品

QR code