采集了20000条招聘信息,我做了一幅北上广深杭的互联网行业画像

林夏rhythm 开智学堂

img

「裁员、996 的背景下,互联网工作者该何去何从?」这是来自开智校友林夏的发问,你的答案是什么?如果你面对这样的情况,会采取哪些行动?林夏同学通过写 Python 爬虫,从三个招聘网站中采集了 20000 多条数据,对北京、上海、广州、深圳、杭州五大城市新媒体运营和 Python 两大岗位进行了全方位的分析,结果如何?来看看他的分析吧。

作者丨林夏

本文转载自微信公众号「纸箱之神的中二病世界」已获原作者授权

开智学堂(http://www.OpenMindClub.com)

img

裁员、996 的背景下,互联网工作者该何去何从?

我写 Python 爬虫从智联招聘、前程无忧、Boss 直聘采集了 20000 多条信息(2019 年 4 月末采集的),对这些职位从薪资待遇、行业分布、地理位置分布等角度做了分析,试图参考开智学堂(ID:OpenMindClub)陈虎平老师在第三届开智大会上的主题演讲:《城市演化与人生设计》中的理论,找出互联网从业者相对集中的热门城区,为大家选择就业城市、选择居住地提供一个参考依据。

选取了两个有代表性的岗位,分别是新媒体运营和 Python(工程师),新媒体代表着市场营销方向的工作,Python 是现在最火的编程语言,代表着技术类的工作。

先看一下每个职位的数量:

img

对职位数量和人口数据取对数,做线性回归拟合,绘图。

img

img

为什么要取对数呢,因为每个城市的规模不一样啊,放在一起比较稍微显得有点不公平啊。

广州为什么新媒体类的职位那么多?我猜可能的原因是一些做贸易的商业公司对这一类职位有需求,而并不是专业做内容的公司。

每个城市的平均薪资怎么样?

img

可以明显看到,技术类工作的工资远高于非技术类工作。

下面是每个城市的详细信息。

1、北京

新媒体:

下图中每个红色的小点代表一家正在招聘新媒体运营的互联网企业。

黄色部分是地铁线路。

img

用 QGIS 统计每个小方格内点的个数,然后用色块标出公司最密集的区域,颜色越深越密集。对北京熟悉的同学能看的出来这些地方是哪里吗?

img

薪资待遇:

img

箱线图的读法(如下图),科普:

中位数就是中间值,上四分位数就是前 25% 的值,下四分位数就是前 75% 的值。

上图中的异常值,并不是有问题的数据,而是一些工资超过平均线很多的【新媒体运营总监】职位,加油吧同学们!

img

行业关键词:

img

注:做词云的时候去除了【互联网】、【电子商务】、【计算机软件】这三个关键词,因为我从这三个词得不到任何有用的信息,我做词云是想要判断细分领域,这个公司是做旅游的还是亲子教育的?是做服装的还是做地产的?(以下皆同)

可见北京的教育培训行业与影视文化传播行业是非常火的。

Python:

直接上图,不废话了。

img

img

有发现传说中的西二旗吗?

img

img

2、上海

新媒体:

img

img

发现吗?上海新媒体编辑需求最多的地方并不是张江,而是靠近市中心的徐家汇。说明这样的职位是越来越下沉了,而不是仅仅局限于科技公司。

一大波总监向我们袭来,不过普通的岗位工资是真的低,前 25% 的水平才刚刚过万……

img

行业关键词,教育培训依旧火爆,然后还有快消品、会展公关、法律等……

img

Python:

img

img

可以看出,技术类的岗位才接近张江。

img

Python 的工资就是高于新媒体编辑。

img

我有个朋友问我说,我是做教育行业的新媒体编辑,并且以后一直准备在上海做教育行业,应该住在哪里比较好?(因为可能还会换工作)

那我们把教育行业的新媒体岗位数据筛选出来看一下吧!

img

可以看出,徐家汇、田林,对她来说都是很好的选择。

3、广州

新媒体:

img

img

珠江新城,你猜对了吗?

薪资比较低。知乎上有个话题:「为什么感觉在中国月入过万很普遍?」并不普遍,在广州做新媒体编辑很大概率破不了万。

img

现在为啥不管哪个城市教育培训行业都这么火?这是裁员 + 996 逼的大家苦练内功了么……

然后我还看到了大大的「快速消费品」五个字。

img

Python:

img

img

不是在珠江新城了哦,靠近黄浦大道中。

img

img

4、深圳

新媒体:

img

img

福田区车公庙,深圳我不熟,为什么历史选择了那里?

img

深圳的工资比广州的高,看出来没有。

img

贸易进出口……深圳的关键词

Python:

img

img

技术岗位和市场岗位很重叠啊,那一块可真是个宝地呀。

img

img

5、杭州

新媒体:

我只能说,真的很抱歉,杭州我没有找到地铁图,只有非常熟悉杭州的朋友,对着行政区边界图才能看的出来了。

img

img

东南面最红的那个点接近滨江区西兴地铁站,我在地图上找到的,那儿是有名的梦想小镇吗?

我也不懂,没去过杭州,这次标出的所有的点都是根据数据生成的,没有主观因素在里面,只是觉得从前的梦想小镇挺有名的。

img

img

行业关键词有纺织、皮革、服装……教育培训依旧火爆……

Python:

img

img

上面那个深蓝色的点是西溪,是程序员聚集地。

img

img

6、写在后面

通过做词云,我发现每个城市的产业结构的不一样。拿新媒体来说,同样的岗位,可能北京更多的是偏向影视文化传媒,杭州偏向服装贸易,深圳偏向进出口贸易,广州一大堆快消品,上海……抱歉我没看出什么特别明显的特点。那么,做内容的小伙伴,是否应该根据每个城市不同的产业结构特点,选择属于自己的城市呢?而不是凭借一个简单的概念,「XX 城是互联网一线城市」这样。

这次采集数据,做图,让我对中国的互联网行业的就业情况有了一个新的认知,各位小伙伴也可以参考这样的方法,规划自己的就业城市和居住地。

PS:

林夏同学求职中,想做偏向数据的市场运营工作。如果您愿意推荐工作,可以联系他个人微信,ID:yzhc1990。

**图片来源:微信公众号「纸箱之神的中二病世界」