/ EN / FR
发布时间: 2022-03-30 浏览数量:0

本文建立在关于如何利用大数据来产生社会经济和人口统计估计的越来越多的研究的基础上,并提供给这些研究。 它的结果表明,当给定足够的基本事实时,可以更好地解释 CDR 数据集中的许多潜在偏差来源。 


从一个简单的对数模型开始,将呼叫者的数量与人口普查中的人口数据相关联,该研究在人口普查中寻找在模型始终高估或低估人口规模的地区具有相似值的其他变量。 该模型是表明考虑样本选择偏差是可能的第一步,并且可以在多个方向上扩展。 这项工作有望帮助激发人口统计学家和其他社会科学家对发挥大数据潜力和产生发展估计的方法的兴趣阿