集群管理

 

查看集群信息

更新时间 2023-09-06

本章节介绍如何查看集群相关信息。

前提条件

已创建共享集群(HPC 集群)或者专属集群(EHPC 集群)。

操作步骤

  1. 登录 QingCloud 管理控制台。

  2. 选择产品与服务 > 计算 > 高性能计算 HPC,进入高性能计算 HPC集群管理页面。

    view_cluster_1

  3. 用户在当前页面可以查看集群相关状态。

    状态 状态说明
    创建中、安装中、初始化中 集群创建期间的状态,正在构建集群的登录节点、管控节点、计算节点,进行调度器、域账号服务等程序的安装,无需用户干预,预计 5 ~ 8 分钟。
    活跃 集群创建完毕处于可用状态。注意:这是集群唯一可以正常使用的状态。
    异常 可提交工单,技术支持团队会提供相应协助。
    已停止 集群节点已经停止服务,集群不计费,只收少量硬盘费用。
    删除中 集群在停机释放过程中。
  4. 点击已创建完成的集群名称/ ID,进入指定集群的详细信息页面。

    view_cluster_2

集群详情说明

基本信息

  • HPC 集群
  • 参数 参数说明
    集群名称 集群的名称
    集群 ID 集群 ID 是云平台自动分配的 HPC 集群唯一标识。
    集群状态 集群的状态。
    付费类型 集群的扣费规则,包年包月按月进行资源的统一扣费;
    按需付费为按小时进行扣费,详细内容可到费用中心进行查看。
    集群版本 集群的版本信息。
    集群描述 用户对集群的描述。
    申请时间 申请集群的时间。
  • EHPC 集群
  • 参数 参数说明
    集群名称 集群的名称
    集群 ID 集群 ID 是云平台自动分配的 HPC 集群唯一标识。
    集群状态 集群的状态。
    付费类型 集群的扣费规则,包年包月按月进行资源的统一扣费;
    按需付费为按小时进行扣费,详细内容可到费用中心进行查看。
    集群版本 集群的版本信息。
    公网 IP 该集群登录节点绑定的公网 IP,通过此 IP 地址可以登录到集群的登录节点进行远程操作。
    另外,可以在公网 IP 详情页面,查看流量的监控及计费情况等。
    防火墙 集群安全的保证,系统自动构建默认防火墙。
    若绑定公网 IP 系统会自动给所有节点绑定默认防火墙。
    集群描述 集群的描述。
    申请时间 申请集群的时间。

    应用信息

  • HPC 集群
  • 参数 参数说明
    登录节点 登录节点的类型以及登录节点的 CPU 、内存。
    调度器 天云 AIP 调度器。集群默认安装的调度器,请通过工单或者您的客户经理提需求。
  • EHPC 集群
  • 参数 参数说明
    部署方式 标准计算或者精简计算
    调度器 Slurm,集群默认安装的调度器,请通过工单或者您的客户经理提需求
    域账号服务 Idap
    镜像 CentOS 7.6

    存储信息

    参数 参数说明
    共享目录 共享目录
    NAS 挂载点 NAS 挂载点

    扣费信息

    点击扣费信息中的查看详情,可查询到当前集群的各类型节点的集群扣费信息以及队列、作业提交扣费信息的详细内容。

    view_cluster_billing

    作业列表

    点击已创建的集群,进入集群详细信息作业列表页面。

    view_cluster_3

    参数 参数说明
    作业名称/ ID 作业的名称和ID。
    状态 作业当前状态,包括正在运行、排队中、运行结束、失败、暂停以及未知。
    所属队列 作业所属的队列。
    核心数 运行作业的核心数。
    运行时长 作业运行的时长。
    总计耗时 总计耗时。
    用户名 提交该作业的用户的名称。
    创建时间 创建作业的时间。
    更新时间 作业状态更新的时间。
    操作 支持针对当前作业可进行的操作:查看详情、重新提交作业和删除。

    节点列表

  • HPC 集群
  • 点击已创建完成的 HPC 集群,进入集群详细信息节点列表页面。

    view_cluster_4_1

    参数 参数说明
    节点名称/ID 节点的名称和 ID.
    状态 节点的状态。
    节点类型 节点的类型,HPC 集群中只包含登录节点。
    配置 节点的配置。
    IP 节点的 IP 地址。
    操作 节点监控
    绑定公网 IP,详细操作请参见节点绑定公网 IP
    重启
    WebSSH,详细操作参见远程连接配置
    删除
  • EHPC 集群
  • 点击已创建完成的 EHPC 集群,进入集群详细信息节点列表页面。

    view_cluster_4_2

    参数 参数说明
    节点名称/ID 节点的名称和 ID。
    状态 节点的状态。
    节点服务状态 节点的服务状态。
    节点类型 节点的类型。
    配置 节点的配置。
    所属队列 节点所属队列
    IP 节点的 IP 地址。
    操作 节点监控
    绑定公网 IP,详细操作请参见节点绑定公网 IP
    重启。
    WebSSH,详细操作参见远程连接配置
    删除

    队列管理

  • HPC 集群
  • 点击已创建完成的 HPC 集群,进入集群详细信息队列管理页面。

    view_cluster_5_1

    参数 参数说明
    队列名称/ ID 队列的名称和 ID。
    类型 共享队列或专属队列。
    物理队列名称 物理队列的名称。
    队列规格 当前队列的规格,只统计计算节点不包含登录和管控节点。
    计费模式 包年包月或按需计费。
    自动续费/续费周期 仅针对包年包月的计费模式,用户可自定义是否自动续费以及续费周期。
    申请时间 当前队列申请的时间。
    操作 点击查看详情支持查看当前队列的详细信息。
  • EHPC 集群
  • 点击已创建完成的 EHPC 集群,进入集群详细信息队列管理页面。 view_cluster_5_2

    参数 参数说明
    队列名称/ ID 队列的名称和 ID。
    队列规格 当前队列的规格,只统计计算节点不包含登录和管控节点。
    申请时间 当前队列申请的时间。
    操作 点击查看详情支持查看当前队列的详细信息。
    点击编辑,可对队列名称进行修改。
    删除当前队列。
    队列内节点信息 显示计算节点的 ID、名称、状态,除此之外,点击操作内的移除可将相应的计算节点从当前队列中删除。

    用户

    点击已创建完成的 HPC 或 EHPC 集群,进入集群详细信息用户页面。

    view_cluster_6

    参数 参数说明
    用户名 用户名称。
    创建时间 当前队列的规格,只统计计算节点不包含登录和管控节点。
    挂载点 当前队列申请的时间 。
    操作 支持重置密码和删除用户。

    租赁信息

    仅针对 HPC 集群,点击已创建完成的 HPC 集群,进入集群详细信息租赁信息页面。

    view_cluster_7

    根据不同的计费模式其统计的基本信息不尽相同,详情如下所示:

  • 包年包月计费模式
  • 参数 参数说明
    实例名称 / ID 具体收费的实例名称以及 ID
    计费实例类型 登录节点集群、提交作业等实际所用的资源
    付费价格/购买周期 包年包月的具体费用以及购买周期
    开始计费时间 计费开始的时间
    计费到期时间 购买周期截止时间
  • 按需计费模式
  • 参数 参数说明
    实例名称 / ID 具体收费的实例名称以及 ID
    计费实例类型 登录节点集群、提交作业等实际所用的资源
    定价 每小时的费用
    开始计费时间 计费开始的时间
    这篇文档解决了您的问题吗?
    0
    0