2025年虚拟机安装详细教程linux（虚拟机安装linux步骤）

大家好，我是讯享网，很高兴认识大家。

Linux虚拟机Hive基本安装详细步骤（具体步骤请下滑到第三点）

一、为什么要在虚拟机中安装Hive？

二、Hive是什么？

三、Hive基本安装

1、下载安装

2、上传jar包

3、解压

4、添加环境变量

 5、解决jar包冲突

6、初始化元数据库

四、元数据配置

 1、将 mysql 拷贝到 lib 下

2、 mysql-connector-java-5.1.27-bin.jar 下载

 3、上传jar包，方法同上编辑

4、配置hive元数据支持为mysql

5、编辑插入 hive-site.xml 

6、登录mysql 

 7、初始化元数据库

五、Hive启动检测

 1、编写启动脚本

 2、启动脚本执行赋权

3、配置 hive 日志路径 

4、hive启动检测

1.学习和实验：虚拟机提供了一个相对封闭和独立的环境，允许开发人员和学生在不影响其主要操作系统的情况下学习和实验Hive。这使得可以轻松地建立、测试和调整Hive集群，以便更好地理解其工作原理。2.开发和调试：虚拟机环境可用于本地开发和调试Hive查询、数据处理流程和其他大数据任务。这种方式可以节省与在实际大数据集群上开发和调试相关任务相关的成本和时间。3.演示和培训：虚拟机可以用于演示Hive和其他大数据工具的功能，以便在培训和演示中提供更好的学习体验。它们可以帮助教育机构、培训机构和企业培训师向学员和员工展示如何使用Hive。4.离线使用：有些情况下，网络连接可能不稳定或不可用，虚拟机中安装的Hive集群允许用户在没有网络连接的情况下继续工作。5.版本控制：通过使用虚拟机，您可以轻松创建和管理不同版本的Hive集群，以便测试和比较各个版本的功能和性能。6.隔离和安全性：虚拟机提供了一种将Hive环境隔离到虚拟容器中的方式，从而降低潜在的安全风险，因为虚拟机可以在隔离的环境中运行。

Hive 是一种开源的数据仓库工具，Hive 提供了一种基于 Hadoop 的数据仓库基础设施，允许用户查询和分析大规模的数据集，通常用于大数据处理和分析任务。

Hive的关键特点及概念：

1.SQL-Like 查询语言：Hive 使用类似于 SQL 的查询语言，称为 Hive QL（HQL），允许用户以熟悉的方式查询数据。2.数据存储和管理：Hive 使用 Hadoop 分布式文件系统（HDFS）来存储和管理数据。它可以处理多种数据格式，包括文本、JSON、Parquet 等，同时提供表、分区和分桶等数据组织结构。3.元数据存储：Hive 使用元数据存储来维护有关数据的结构信息，包括表的模式、列名和数据位置等。用户可以轻松地创建、修改和查询表，而无需深入了解数据的物理存储方式。4.扩展性和可编程性：Hive 是可扩展的，允许用户编写自定义函数和用户定义的聚合函数（UDF 和 UDAF），以便在查询中执行自定义操作。这增加了 Hive 的功能和适用性。5.作业调度和优化：Hive 通过内置的查询优化器来优化查询计划，以提高查询性能。它还可以与 Hadoop 集群管理工具（如 YARN）一起使用，以实现作业调度和资源管理。6.集成生态系统：Hive紧密集成了大数据生态系统中的其他工具，如 Hadoop MapReduce、Spark、Tez 等。这允许用户在不同的大数据工具之间进行无缝切换，根据任务的需求选择合适的工具。

1、下载安装

（打开下载地址后，如下图点击 apache-hive-3.1.2-bin.tar.gz 下载） 

hive虚拟机安装教程虚拟机启动hive_Hive
讯享网

2、上传jar包

进入tage文件夹下 rz  或者直接拖入（下面方法为直接拖入）

hive虚拟机安装教程虚拟机启动hive_Hive_02

ll 查看压缩包是否存在

hive虚拟机安装教程虚拟机启动hive_hive虚拟机安装教程_03

3、解压

hive虚拟机安装教程虚拟机启动hive_硬件架构_04

解压之后回到  server  文件夹下查看是否成功

hive虚拟机安装教程虚拟机启动hive_Hive_05

为了方便，我们给他改一个名字，方便我们之后使用

（下面运行是因为我已经改了一次名字，所以没有.tar.gz后缀，你们第一次运行就复制上面的命令就好啦） 

hive虚拟机安装教程虚拟机启动hive_硬件架构_06

建立软链接

hive虚拟机安装教程虚拟机启动hive_hive_07

hive虚拟机安装教程虚拟机启动hive_硬件架构_08

4、添加环境变量

 回车之后按键盘上的  i  键，在最下面输入一下内容：

hive虚拟机安装教程虚拟机启动hive_硬件架构_09

 输入完毕后按 Esc 键输入:wq 回车就保存好啦！

hive虚拟机安装教程虚拟机启动hive_linux_10

:wq表示，保存并退出。如果只按:q,则是只退出不保存。:q!表示强制退出。

 添加完环境变量后一定要记得更新环境变量

hive虚拟机安装教程虚拟机启动hive_hive虚拟机安装教程_11

在 Linux 系统中，环境变量是一些系统级别的变量，用于存储系统的配置信息和用户的个性化设置。/etc/profile 是一个系统级别的 shell 脚本文件，用于设置系统级别的环境变量。当用户登录系统时，/etc/profile 会被自动执行一次，从而设置系统级别的环境变量。但是，如果在当前终端会话中修改了环境变量，而没有重新加载 /etc/profile，那么这些修改不会生效。此时，可以使用 “source /etc/profile” 命令重新加载 /etc/profile，使得当前终端会话中的程序可以使用最新的环境变量配置。