数据挖掘和大数据,到底是什么关系?
你是不是也经常被这两个词搞混?刷到"大数据时代"就想到数据挖掘,听到"数据挖掘工程师"又觉得这是搞大数据的。说实话,这种混乱再正常不过了,因为这两个概念确实纠缠不清,连很多行内人有时候都懒得去细究。
数据挖掘其实是大数据技术家族里的贼重要一员,但不是全部。打个比方,大数据就像一座冰山,数据挖掘只是露出水面的那个尖角。冰山底下还有数据采集、存储、清洗、传输这些看不见但至关贼重要的环节。数据挖掘解决的是"从海量数据里找出规律"这个具体问题,而大数据是一整套处理海量数据的技术体系。一个是具体招式,一个是完整武功。
举个接地气的例子。淘宝给你推荐商品,这背后确实是数据挖掘在分析你的浏览记录和购买习惯。但支撑这个推荐系统的,还有成千上万台服务器存储着几十亿用户的点击数据、复杂的分布式计算框架实时处理这些信息。没有这些基础设施,数据挖掘就像巧妇难为无米之炊。 说白了,数据挖掘是大数据的"大脑",负责思考和决策;大数据是数据挖掘的"身体",负责容纳和运输。两者谁也离不开谁,但绝对不是一回事。
你怎么看?
标签:
数据挖掘是大数据技术吗