Editsprings@163.com (周一至周日,9:00-23:00) | (周一至周日,9:00-23:00)

艾德思:数据隐私用户规模与企业存亡来自三十万款应用的证据

论文润色 | 2019/06/26 10:33:09  | 253 次浏览

  数据隐私无疑是近来热点.然而, 至少在"真金白银'这一层面,保障个体数据隐私的意义,尚未得到充分理解 :问用户他们在不在意隐私,答案是山呼海啸般的"在意';然而,当场景变得稍微切实,用户回复便开始变得"莫衷一是'.在实验室里,他们对隐私的估值"忽高忽低';在现实选择中,他们的反应多不一致,"漠然'反而是更常见的表现.

  如此现状不能让人满意.不夸张地说:对数据隐私领域的监管与合规而言," 现实中个体是否在意隐私 ',是亟需回答的基础问题之一.深深关切,抑或不以为意,各自指向两条泾渭分明的路径.幸运的是,在即将刊于顶级期刊Management Science的研究中,借助对三十万应用的定量分析,Kummer和Schulte给出了一个斩钉截铁的回答: 他们在意 .

  具言之,论文做了这么一些事:首先,2012年4至10月间, 两位作者爬取了安卓应用商店中几乎所有应用的信息,涉及约三十万款应用 .2014年,他们再次爬取前述信息.爬取的信息包括且不限于: 下载量/类别/索取权限/评级/大小/版本/开发者信息/应用描述 ,等等;其次, 作者定量分析了"敏感数据'收集状况对应用下载量及存续的影响 .

  怎样界定" 敏感数据 '?原文如此操作: 既纳入Sarma等学者已经广泛接受的"敏感数据'定义 , 又涵盖同类别应用中收集频率低于平均值的数据 .采取后者的原因如下:若同类别应用较少收集特定数据,此数据与应用功能多无必要关联.同时,论文还收集了以下两种指标:谷歌对"有害权限'的定义;及400名随机抽取参与者对"敏感数据'的定义[1].

  作者首先作了一些直观的统计,结论有两类:其一, 相比收费应用,免费应用中收集敏感数据的现象更为频繁 ;或者说, "收集隐私的多寡',确已成为另一个维度上的价钱 .实际中,只有 7% 的收费应用会收集同类别应用不常收集的数据;在免费应用中,这一数字是 25% .收费应用平均索取 个涉及敏感数据的权限;对免费应用,这一数字高至 .

  下列事实印证了上述发现.具体而言,在全样本中,作者找出496对满足以下条件的应用:功能层面完全相同,但又区分"收费'及"免费'两个版本.接着,比较配对应用内/"收费'与"免费'版本索取权限的差异,有以下结果: 在约40%的配对样本中,"免费'版本索取更多与隐私数据相关的权限;几乎没有"收费'版本索取更多权限的例子[2] .

 

  图1 将应用下载量对收集数据类型回归得到的结果.纵轴:数据类型;横轴,收集特定类型数据对下载量的影响,小方格是估得系数,横线是置信区间.方格愈近右侧,则收集此类信息对下载量的影响愈大

  将应用下载量对收集数据类型回归,即得另一结论:其二, "是否收集特定类别敏感信息'这一点,与应用下载数量间存在显著的负相关 .如上图所示,无论是借通讯网络数据获取粗略的位置,还是由GPS获取精确位置,抑或采集通讯录信息,再到读取短信/电话等数据,以上都与应用下载量间存在负相关.其中,后两类行为造成的负面影响尤其大.

  后续,借助严格的计量分析,论文"坐实'了上述两类结论.一方面,与上文呼应,分析 控制了类别/评级/大小/版本/开发者信息/应用描述等诸多变量 .另一方面,为解决遗漏变量/价钱与隐私数据内生决定等问题,论文进一步采取以下三类估计方式:其一,采用多个 工具变量 ;其二,采用 带应用固定效应的模型设定 ;其三,用 配对样本估计 .

  估计所得与直观统计一致: 敏感数据,堪比真金白银 .对开发者而言,隐私与金钱的权衡存在: 相比不收集任何敏感信息的应用,至少收集一项敏感信息的应用,免费概率要高 .这一权衡在用户层面同样存在: 每多收集一项敏感数据,应用的下载量都将因此下降约10% .无论是否用配对样本估计,还是采取何种敏感数据指标,结论均稳健.

  以下结论同样值得关切: 是否收集敏感数据,影响到应用在2012-2014年的发展状况 .简言之,控制各因素后, 相比那些不收集敏感数据的应用,收集敏感数据的应用仍然存续的概率要低4-8% ; 只考虑那些仍然存活的应用,后者的用户增速也显著慢于前者 .原文还发现: 应用的用户基数[2]大,则隐私影响相对较小;用户规模小,则相应影响尤其突出 .

  总之,凭倚恢宏的数据规模及扎实的分析方式,本文印证了以下结论: 当今社会,隐私就是"真金白银';拿走隐私,需要付出代价 . 应用开发者考虑这一点,在收集隐私与应用定价间权衡;用户考虑这一点,离弃那些侵犯敏感数据的应用;对隐私的关切程度,甚或决定一款应用的成长与兴衰 .监管/用户和企业,或许都可从这篇论文读出相应的裨益.

  [1] 参与者抽取及相应调查均在MTurk平台上进行.

  [2] 相应数据来自Alexa.

  文献来源:Kummer, Michael,and Patrick Schulte. "When private information settles the bill: Money andprivacy in Google's market for smartphone applications." Forthcoming,Management Science.

 

 

更多科研论文服务,动动手指,请戳 论文润色投稿期刊推荐论文翻译润色论文指导及修改论文预审

语言不过关被拒?美国EditSprings--专业英语论文润色翻译修改服务专家帮您!

上一篇:【严正申明】关于我公司网站被恶意抄袭严正声明

下一篇:艾德思:SCI论文发表前七步

特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。

凡注明来源为“EditSprings”的论文,如需转载,请注明来源EditSprings并附上论文链接。

最热论文