# 社科院是如何精确统计出微博用户的平均收入的？

By [ggig](https://paragraph.com/@ggig) · 2022-10-13

---

据社科院透露：

为了让数据更加精准，社科院的调研团队通过三个途径获得7万样本：其中有来自中国互联网信息中心的实时监测数据，样本量4万左右；而数据提供方缔元信公司提供2万左右，还有1万样本量来自于社科院的调查。

我个人认为，同一数据公司在两次调查在方法上不会有多少区别，因此下面介绍了缔元信在另一份社交化媒体数据调查报告上的方法，应该仍然有价值。

\========================

社科院委托的第三方线上调查数据公司名叫缔元信（Dratio）。《中国新媒体发展报告(2013)》在京发布 缔元信提供数据支持

根据它最近发布的研究报告（可以在这里下载到：社会化媒体发展趋势研究报告），看起来他总共收回了线上问卷将近1000份，数据来源的描述是这样的：

问卷调查在这里可以找到：社会化媒体用户研究有奖调研，只要第一题选择了微博或微信其中之一就可作答，最后问到了答卷人的性别、年龄、学历、职业、收入。这样他就获得了这样一批答卷人的收入情况。

问卷调查最重要的问题就是代表性，即回答问卷的人能不能代表你想要了解的对象群体。不幸的是，代表性问题也是最难解决的问题之一。

有代表性的问卷对象一定要从一个有代表性的总体库中抽取出来，比如常住人口库，户籍人口库。抽取的方法还比较简单，困难的是要保证回答的人也能有代表性。当拒访或瞒报发生在某些特定的人群上时，问卷就不具有代表性了，比如高收入人群几乎必然会拒答有关收入的问题，高学历的人群又对隐私问题特别保留。我们在面对这类情况时，也只能是提高一点奖励，让调查员变得更formal一些，多回访几次来表现调查的诚意，以此尽量避免代表性的缺失。

那么大家可以看看，这样一份建立在自愿填写基础上的问卷是否能对整个微博群体有代表性呢？大家可以自己总结，我就不一一列举了。

\*\*\*\*\***下面是吐槽时间**\*\*\*\*\*

信不信我把奖励从运动水壶改成老年复合维生素这报告就会变成“老年人是微博的绝对主体和最活跃用户群”？

---

*Originally published on [ggig](https://paragraph.com/@ggig/2L4PjhG9SfKFuwNXFSxI)*