大数据到底分几种?一文搞懂数据类型不迷糊
怎么说呢,你的手机每天产生多少数据?从早起刷的短视频,到中午点的外卖,再到晚上记录的步数——这些看似平常的行为,其实对应着完全不同类型的数据。很多人搞大数据,连基础分类都弄不清,怎么可能用好它?
大数据主要分为三大类。结构化数据就是整齐排列的表格,像Excel里的用户信息、银行交易记录,规矩得很。半结构化数据有点"半吊子",比如网页上的JSON格式,既有规律又带点自由发挥。非结构化数据最野,图片、视频、语音、文本统统归它管,占企业数据量的80%以上却最难分析。
举个接地气的例子。你去超市购物,结账小票是结构化数据;你在社交媒体上发的"这家超市真挺香的"加配图,就是非结构化数据;而超市会员系统里你那不太规整的消费偏好标签,则是半结构化数据。三类数据各有各的玩法,混在一起处理就是灾难。
搞技术的都知道,选错数据类型等于选错工具。结构化数据用传统数据库就行,非结构化数据得上AI和深度学习,半结构化数据则需要专门的NoSQL方案。不是数据越多越好,是分类越清楚越值钱。
你平时接触的数据大多是哪一类?是规规矩矩的表格,还是乱七八糟的聊天记录?留言聊聊,看看你是不是也活在数据的海洋里!
标签:
大数据类型有哪几种