新增数据源

 

新增 Hive 数据源

更新时间 2023-09-06

数据源是大数据工作台用于数据处理的出入口。本小节主要介绍如何新增 Hive 数据源。

前提条件

数据源需要在网络连通的前提下才能进行数据同步,详情请参见网络连通方案

操作步骤

  1. 登录管理控制台。

  2. 选择产品与服务 > 大数据服务 > 大数据工作台,进入大数据工作台概览页面。

  3. 在左侧导航选择工作空间,进入工作空间页面。

  4. 选择工作空间所在区域后,在目标工作空间点击数据源管理,进入数据源管理页面。

  5. 点击新增数据源,进入新增数据源页面。

  6. 选择 Hive 数据源类型,进入配置数据源页面。

    1. 配置数据源基本信息。

      参数 参数说明
      数据源连接方式 当前仅支持连接串模式,即通过 IP、端口、用户名密码进行连接。
      数据源名称 新增数据源的名称,您可以自定义。
      数据源描述 新增数据源的描述信息,您可以自定义。
      配置基本信息
    2. 配置数据源连接信息。

      参数 参数说明
      主节点地址(NameNode 节点地址) 格式为 hdfs://ip:port。
      Hive 元数据库的 JDBC URL(IP 地址:端口/Database) JDBC 连接信息,格式为 jdbc:hive2://ip:port/database。
      安全验证 您可以选择是否开启安全验证。
    3. 开启安全验证:选择用户名密码登录,还需要输入用户名密码
    4. 关闭安全验证:选择匿名登录
    5. 用户名(User Name) 数据库用户名。当安全验证选择用户名密码登录时需要配置该参数。
      密码(Password) 数据库密码。当安全验证选择用户名密码登录时需要配置该参数。
      Hadoop 高级配置 Hadoop 相关的高级参数,比如 HA 配置。当安全验证方式选择匿名登录时可以配置该参数。
    6. 集群 HA 模式时需要填写 core-site.xml 及 hdfs-site.xml 中的配置。
    7. 开启 kerberos 时需要包含 kerberos 相关配置。
    8. 配置 Hive 数据源连接信息
  7. 展开数据源可用性测试,点击开始测试,测试数据源的可用性。

    也可以在数据源添加成功后,点击数据源操作列的可用性测试测试可用性。

  8. 点击新增,开始新增数据源。

这篇文档解决了您的问题吗?
0
0