简单的来说大数据基本定义是,可以按字面理解就是大量的数据,大数据的关键在于这些大量数据中所包含的信息,而在于基于它之上所进行的一系列的分析活动,比如分类汇总、趋势预测、数据挖掘等等,从而产生有价值的信息,帮助我们去洞察过去和预测未来。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。
什么是大数据的4V特点?
例如:网购
Volume(大量):用户进行网上购物,都能够形成一系列随时更新的数据,数据规模空前庞大,其中隐藏的价值也远远超出大部分人的预期。
Variety(多样):网上购物可以买很多东西,比如家具用品、数码产品等等。大数据的结构也和网购一样复杂,仅仅以文件类型为例,就有图片、文字、声音、视频等等,还有各种非结构化数据,所以在利用这些资源之前,需要把他们进行分类、处理等。
Value(价值):网上购物买的商品,有贵的,也有便宜的。比如贵的MacBook 电脑、便宜的毛巾等。在实际应用中,大数据可以用于提升优化企业的管理效率,发现新的商业机会,也能够对事物的发展做出准确的分析、预测等等。
Velocity(高速):大数据分析要快,这就要求我们要能对整个数据进行快速的扫描、筛选、处理。别人已经在实施,你整理出来就没有任何意义了。
所以,大数据从字面上理解就是海量的数据,技术上它包括这些海量数据的采集,过滤,清洗,存储,处理,查看等等部分,每一个部分包括一些大数据的相关技术框架来支持。