3.数据类型多样(Variety)
区别于其他海量数据挖掘的特征,大数据的多样性可划分为两层含义。一是数据来源多样化,包括系统数据、设备日志、文件系统等等。二是数据结构的多样化,结构化数据,非结构化数据。
4.数据价值巨大(Value)
数据的价值决定了我们做数据分析的必要性。数据有价值才能产出更多的价值!通常情况下,我们处理的数据集能够带来巨大经济利润和社会价值。正如阿里花费巨资提高推荐系统的准确性,进而提高平台的交易量,创造更高的交易利润。从社会价值的角度上来说,天气,地质灾害,打击犯罪等多应用大数据进行数据的收集和整理,通过分析数据,提升预测信息的准确性,为群众提供更便利的生活,保障民众的生命财产安全,创造更多的社会价值。
5.数据处理复杂(Complexity)
数据的处理复杂想必很好理解。数据在满足上述的四则特征的前提下,想要对数据进行分析和处理,自然是一项非常庞大的工程。
举个最简单的例子,我国的人口的平均年龄计算,就是一项相当困难的数据处理工程。数据时时更新,数据量极大,高达14亿条,还有许多客观变量因素掺杂其中,想要最大的还原数据的真实性,得到最客观性的结果不是一般的难。可见,大数据的数据处理复杂的特点!