前言
在我的理解中大数据就是建立在两个基础之上 一个是庞大的数据库用来做数据的精准分析 另外一个无疑就是建立在数据之上的算法层了 大数据不需要过于严谨,也不能过于宽松 过于严谨会导致信息缺失,造成数据遗漏 过于宽松会导致数据精度不达标,造成产品体验差
什么是大数据
大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。百度百科给出的介绍是这样的,同时大数据还具备以下五个特征大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。在信息网络越来越发达的今天,大数据无疑是不可缺少的就拿某音来说,可能你自己都不知道你自己喜欢哪些内容,但是它却可以精准的给你推送出来在某音的背后依靠的是庞大的数据,那些数据从哪里来的呢?都是用户操作所产生的,算法层通过产生的数据进行推送内容在通过计算不断的矫正内容的质量保证内容用户能够喜欢