【大数据的主要特征是什么 什么是大数据时代】
01.什么是大数据?数据是对客观事实进行记录的一种符号,可以是数字、文字,也可以是图片、音频、视频 。大数据是指无法在一定时间范围内用常规软件进行捕捉、管理和数据的数据集合 。
大数据具有"5V"特点,即数据量大、数据多样性、价值密度低、增长速度快、数据质量低 。
大数据时代强调数据的全部,而不是局部的样本数据 。由于大数据的价值密度低,我们要接受这种模糊和不精确性 。通过对数据的研究,发现以前不曾发现的联系,而不是像小数据时代,先通过假设,然后再用数据来验证 。也就是说,在大数据时代,对相关性的重视程度要强于因果性 。
02.什么是结构化和非结构化数据?结构化数据是适合用二维表格展现的数据 。每一行是一条记录,每一列是不同的字段 。
以电商网站为例,用户信息就可以用结构化数据来存储 。每位用户就是一条记录,而每位用户又有姓名、性别、地址、手机、邮箱等字段,这样就形成了一个二维表格 。
非结构化数据不适合用二维表格来展现,比如文档、图片、音频、视频等 。非结构化数据的格式多样,难以标准化和理解,因此在存储、检索、利用上都需要更加有效的方法和技术 。
03.什么是数据库?数据库从字面意思来看就是存储数据的地方,但数据的存储不是杂乱无章的,而是按照一定的规则来存储的,具有可共享和便于管理的特点 。数据库被视为电子化的文件柜 。用户可以对数据库中的数据进行增、删、改、查等操作 。
数据库可分为关系型数据库、非关系型数据库、数据仓库等类型 。
04.什么是关系型数据库?关系型数据库是指使用关系模型来组织数据的数据库 。关系模型可以简单理解为二维表格模型,以行和列的形式存储数据,因此适合存储结构化数据 。关系型数据库就是由多个二维表格及其之间的关系组成的数据库 。
常见的关系型数据库有MySQL、SQL Server、PostgreSQL、Oracle等 。
以电商网站为例,除了用户信息之外,还要记录产品信息和订单信息 。为简化起见,每个订单只包含一种产品 。产品包括名称、价格、图片、介绍等字段,订单包括所属用户、相关产品、订购数量、订单价格、下单时间等字段 。一个用户拥有一个或多个订单,而一个产品也会属于一个或多个订单,这样就建立了用户、订单和产品之间的关系 。
05.什么是非关系型数据库?相对关系型数据库而言,非关系型数据库抛弃了固定的二维表格结构,存储机制灵活,比如键值对、文档、图形等格式都可以进行存储 。
常见的非关系型数据库有Redis、MongoDB、Cassandra等 。
性能是非关系型数据库最大的优势 。由于关系型数据库中的关系模型会占用掉90%的硬件资源及计算时间,对于有大量不需要关系功能的数据处理,非关系型数据库的性能是非常高的 。
另一方面,正是由于缺少数据表之间的关系,非关系型数据库很难在多个表之间做非常复杂的数据查询 。
06.什么是时序数据库?时序数据库是一类特殊的非关系型数据库,全称是时间序列数据库 。经研究发现,机器设备、传感器、系统日志等产生的数据有如下明显的特征:
数据是时序的,即按照一定时间顺序生成;
推荐阅读
- 糖炒栗子里面的黑色颗粒是什么
- 足球里面的德比 德比什么意思
- 适合pubg的免费加速器 绝地求生什么加速器好
- besos besos是什么意思
- 保险送的代驾怎么使用
- 为什么家里的网连上却不能用
- 几种家常菜的正确煮法
- 经典的湖南菜式
- 教你如何做出好吃的猪肝
- 枇杷能生津