大数据学习笔记

目录

前言

一、概述

二、云计算技术

2.1：结构化数据与非结构化数据

三、 Hadoop是什么

3.1：Hadoop的一些基本概念

3.2：Hadoop原理漫画

3.3：Hadoop技术选型

四、Hadoop的安装(伪分布式)

4.1：Hadoop 2.6.2完全分布式搭建

4.2：Hadoop 2.7.2完全分布式

4.3：Hadoop组件

4.4：SSH免密钥登录

五、Hive

5.1:Hive1.1.1的安装

5.2:Hive 2.1.0的安装

5.3:Hive的数据导入导出

5.4:Hive数据类型和文件格式

5.5:Hive的存储架构与HQL语法

5.6:Hive的模式设计与事务性

5.7:Hive综合案例实战

5.8:Hive的开发

5.9:Hive的安全

5.10：Hive FAQ

第 6 章：Sqoop

6.1、Sqoop2的安装

6.2、Sqoop1的安装

6.3、Sqoop1综合实例

6.4、Sqooq2综合实例

6.5、DataX性能对比

第 7 章：HBASE

7.1、HBASE的伪分布安装与分布式安装

7.2、HBASE常用的Shell命令

7.3、HBASE与传统数据库的区别

7.4、HBASE 安装疑难杂症

7.5、Hive与Hbase的区别

7.6、HBASE基于Java开发

7.7、整合SQL引擎层

7.8、HBASE 数据迁移

7.9、通过PutAPI的方法来导出数据

7.10、使用管理工具

7.11、Hbase 数据备份及恢复

第 8 章：Spark 基于YARN的部署方案

Hadoop与Spark的区别

第 9 章：离线安装Cloudera Manager 5和CDH5(5.2.3)

9.1、ubuntu14.04下关于CDH5离线安装教程

9.2、Transwarp Manager的安装

9.3、Inceptor-SQL使用

Transwarp Manager的安装

Inceptor-SQL使用

本文档使用 V型知识库发布

5.9:Hive的安全

2017年09月05日 09:16 | 2864次浏览

一概述

在了解Hive的安全机制之前,我们需要首先清楚Hadoop的安全机制以及Hadoop的历史,Hadoop起源于Apache Nuch的子项目.在那个时代以及整个早期原型时代,功能性需要比安全性需求优先级要高.分布式系统的安全问题要比正常情况下更加复杂,因为不同机器上的多个组件需要相互进行通信.

Hadoop的安全性近期有了许多变化,其中主要是对Kerberos安全认证的支持,还包括其他一些问题的修复.Kerberos允许客户端和服务器端相互认证.客户端的每次请求中都会带有凭证(ticket)信息.在TaskTracker上执行的任务(task)都是由执行任务(job)的用户来执行的.用户无法通过设置hadoop.job.ugi属性的值来模拟其他人来执行任务.为了达到这个目的,所有的Hadoop组件从头到尾都要使用kerberos安全认证.

Hive在Hadoop引入Kerberos支持之前就已经存在了,而且Hive目前还没有完全和Hadoop的安全改变相融合.例如,Hive元数据存储链接可能是直接连接到一个JDBC数据库或者通过Thrift进行链接,这些都是要用用户身份进行各种操作.像HiverService这样的基于Thrift的组件还是要冒充他人来执行.Hadoop的文件用户权限模型(也就是对于一个文件分为用户组和其他3层权限)和很多其他数据库中用户权限模型具有很大的差异,数据库中通常是对使用字段级别进行授权和权限回收操作来进行权限控制的.

小说《我是全球混乱的源头》

感觉本站内容不错，读后有收获？小额赞助,鼓励网站分享出更好的教程

上一篇：5.8:Hive的开发下一篇：1.1、超文本和超链接

^