分析简书的推荐专题

第一篇:简书在Twitter、豆瓣、微博上的活动

简书推荐专题
推荐专题

为什么分析简书推荐专题

一开始并没有想到去分析简书推荐专题,我要分析简书平台的大部分文章和用户信息,爬取数据的思路不是太复杂,即爬取所有热门专题下的文章和订阅者信息,并且和官方的数据(比如100万)大致进行比较,存储用MongoDB,数据处理用pandas,可视化用Tableau。

简书用户数

你现在读到了这篇文章,也就证明我爬取大部分文章和用户信息的想法没有实现,当然技术上做过小范围尝试,没有遇到困难,简书的xhr请求的网址很有意思,可以试试看。
从运营的角度来看,现在爬取大部分文章和用户信息,我还找不到一个好的分析思路,不想为了爬数据而爬数据。在看到推荐专题这一栏目时,发现文章数目和关注人数都十分惊人,而且他们的创建者都是简书官方。猜测如果对推荐专题进行分析,可以获悉简书平台的大致倾向和创作状况

爬虫概述

爬取的内容:专题名称,概述,文章数目,关注者人数,管理员
编程语言:Python
可视化分析:Tableau

注:不要看数据量少,就觉得爬取很简单,这个爬虫很锻炼爬虫技能的,而且有点难度,不信的话试试看

简书—UGC社区

简书是一个UGC社区,我现在充当双重角色:内容供应者(我写文章)和内容消费者(我也看文章)。如果在简书平台的每一个用户都是一个信息体的话,简书在做什么呢?它在用多种方式完成两个信息体之间的沟通,避免信息孤岛

  • 搜索和推荐

搜索和推荐

  • 订阅更新提醒和简友圈

订阅更新提醒和简友圈

可是搜索、推荐、订阅更新提醒和简友圈这些功能并不是什么特色,我喜欢逛论坛,也当过一些论坛的版主,简书提供的功能几乎是大型社区都必备的,那么简书的特色是什么?会吸引到哪些人?为什么ta们会来简书写作

从水平社区来看,简书和知乎都是覆盖面很广泛的UGC社区,就目前而言,知乎和简书是不同的产品,知乎的结构以问题来组织,简书的结构以文章来组织,两个产品有不同的组织思路,满足用户的需求也不同。可是知乎的专栏也是以文章来组织的,而且知乎上不同领域专家群体庞大,完全就是简书的竞品

从垂直社区来看,以CSDN为例,它是一个IT社区。CSDN结合了文章和问题的组织方式,文章的组织方式体现在博客上,问题的组织方式体现在论坛和问答上。每一个有口碑的垂直社区,专家就在其中,这个可是一个挖掘核心用户的好地方,如果它的活跃用户转移到简书,那么简书中的垂直专题就可以做得更好,但是回到原来的问题,简书有什么吸引ta们的地方吗?在IT领域创作方面,有什么地方可以做得比博客园、CSDN等更好地满足用户需要呢?

简书中的推荐专题

概况

简书推荐专题:62个
简书推荐专题总关注人数:约为2千5百万(没有去重)
简书推荐专题总文章数:约为120万(没有去重)

简书推荐专题的创建者都是官方人员,所以这些专题很有分析意义。
专题创建者

专题管理员分析

专题的创建者是官方人员,专题的管理员总不能只是一个官方人员。大约1/3专题的管理员人数为2人,散文专题的管理员人数最多,为15人。除了官方人员以外,其余人员是这些专题的核心用户了。
管理员人数分布

找到这些用户,ta们的行为更值得关注
专题的管理员
(注:保护用户隐私,用户名进行模糊化处理)

推荐专题说明的问题


收录-关注-管理员人数

以收录文章数和关注人数的中位数将图形分为4个象限,很明显分布在第1象限的专题是简书比较有优势的方向,第1象限专题方向也就回答了简书吸引哪些用户的问题。

  • 收录的文章数多:这个方向的用户多,创作的人多,内容供给丰富
  • 关注的人数多:这个方向的用户多,内容需求大
  • 管理员人数多:这个方向的活跃用户多

这三个因素互相联系和影响。

目前可以开发第2象限和第4象限的专题方向,如何开发呢?

  • 第2象限:文章多,消费少,可以去垂直社区宣传,让更多的内容消费者进来,相对容易
  • 第4象限:需求大,文章少,去垂直社区找活跃用户来简书创作,相对困难

第3象限专题数量最多,专题方向发掘难度最大,消费和创作都是双低,值得思考的是简书这个平台具备良好的创作环境去开发这些方向吗?将单个方向进行分析,它们的垂直社区做得怎么样?简书可以做出哪些亮点?

目前的推荐专题

以下完全是个人看法(很主观)
我关注了很多推荐的专题,也往有些专题投稿,但是这些专题每日推送文章数量基本超过99+,这种推送文章打开率能有多高呢?每天推送这么多文章难道不是一种打扰?文章多到让人不敢看了,多到让人想取消关注。

官方做的这些推荐专题的目的是什么?这种知识的组织形式很糟糕

(注:官方组织的这些推荐专题,对于爬虫的话,是一个极好的切入点)

总结

简书的用户特点偏文艺,这个和豆瓣有点像,怪不得它不弄一个简书贴吧,而打造了一个豆瓣小站,:)

这篇文章提了很多问题,以后进行深入分析后再来回答。解答这些问题需要很多数据支撑。我要慢慢熟悉一下业务,如果不熟悉业务,就没有分析思路,没有分析思路,那么爬什么数据呢

下一篇的分析文章需要弄明白简书的盈利模式后再写,没有弄清楚盈利,就看不清楚运营

待更新

您的支持将鼓励我继续创作!