大数据数据垄断带来的隐患

大数据带来的隐患:数据垄断

在信息爆炸的社会,受众往往需要花费大量的时间和精力对海量信息进行筛选。但借助移动互联网和社交媒体提供的丰富数据资源(如用户的地理位置、关系网络、兴趣图谱等信息)和日益精准的挖掘分析技术,媒体可以了解受众的心理、需求和行为习惯,提供更符合受众需求的个性化内容服务和广告营销。这样的精准传播会加深受众好感,提高用户忠诚度。

过去遥不可及的梦想,在大数据时代已经实现。最深刻的革命不在外部世界,而在人类思维领域。

人类思维的转向:人类的态度、情绪和行为都可以转变成数据进行分析和预测。

人类内心隐藏的欲望、需求和情感是否可以被辨别和预测?这是心理学家、行为学家和哲学家心中一个由来已久的谜题,而大数据时代的统计学家和数据挖掘专家已经做出了积极乐观的回答。现在,“情感分析”和“预测模型”的应用已经越来越好了。企业和媒体已经可以通过“情绪分析”来确定用户在社交媒体上的态度,Twitter甚至在2012美国大选期间,每天定量跟踪用户推文和评论的关键词,计算出“政治指数”来判断民意。

大数据技术使人类的态度、情绪、行为和其他以前被认为难以测量的方面变成了用于分析和预测的数据。日常生活中的可量化维度从未被如此彻底地发掘和利用,数学模型也在更广泛的领域受到关注。以前统计分析强调因果关系,现在大数据研究更注重相关性。对因果关系的讨论往往不够全面,但对相关性的把握可以更有效。从“为什么”的问题到对“什么”的追求,这说明人类对于探索和认识世界有了更丰富的思路。

也许最极端的结论来自复杂网络的全球权威阿尔伯特-拉斯洛·巴拉巴西。在一本书里,他宣称人类的行为是93%可预测的:“当我们将我们的生活数字化、公式化和模型化时,我们会发现我们都非常相似。我们都很有爆发力,也很有规律。看起来很随意,很偶然,但却极其容易预测。”“爆发”是指人的工作、娱乐等活动时断时续,会在短时间内突然爆发,然后几乎陷入沉寂。人的行为不是随机的小概率事件,而是意向作用下的非常规突变行为。

不管芭芭拉·巴西的理论是否赢得了主流知识,这些发现至少表明,除了技术,大数据时代向人类展示了越来越具有启发性的世界观和历史观。

大数据时代的隐忧:数据垄断的困境

首先,数据的可访问性并不能使其使用合乎道德。大数据为监测和预测人们的生活提供了极大的便利,但个人隐私也暴露在无形的“第三只眼”之下。无论是电商、搜索引擎还是微博等互联网服务商,对用户的行为数据进行挖掘分析,获取商业利益,不可避免地威胁到普通人的隐私。以前人们认为网络的匿名性可以避免个人信息的泄露。但在大数据时代,数据的交叉核对会让匿名失效。很多数据的收集并不是有目的的,但是随着技术的飞速进步,这些数据最终在个人不知情的情况下被开发出新的用途。而且大数据的使用还可能预测和控制人类的潜在行为,在缺乏有效的伦理机制的情况下,可能导致对公平、自由、尊严等人类价值的践踏。

其次,更大的数据并不总是更好的数据。对数据的盲目依赖会导致思维和决策的僵化。当越来越多的东西被量化后,人们更容易陷入只关注数据的误区。关于数据在何时何地有意义的争议,不再局限于标准化考试能否衡量学生素质的讨论,而是延伸到了更广阔的领域。另一方面,如果企业乃至政府在决策过程中滥用数据或出现分析失误,将严重损害人民群众的安全和利益。如何避免成为数据的奴隶,成为一个亟待解决的问题。

第三,对大数据的有限访问造成了新的垄断和数字鸿沟。谁可以访问大数据?出于什么目的?在什么情况下?有什么样的限制?大量数据积累的同时,也存在数据垄断的困境。一些企业或国家为了维护自身利益而拒绝信息的流动,不仅浪费了数据资源,也阻碍了创新的实现。和互联网时代的数字鸿沟一样,大数据的应用也存在准入和技能的双重鸿沟。数据的挖掘和使用主要限于那些有计算机开发和使用背景的专业人士,这就意味着谁会有优势,谁会被打败,以及由此带来的“谁的权力更大”的拷问。

大数据时代,数据所有者是否会平等交换数据,促进数据分析的标准化,如何将数据公开与知识产权保护结合起来,不仅关系到政府政策,也与企业的未来规划息息相关。