联 系 我 们
售前咨询
售后咨询
微信关注:星环科技服务号
更多联系方式 >
9.1.2 升级常见问题
更新时间:8/6/2024, 4:51:18 AM
重启容器后服务组件全部都挂掉
社区版组件服务依赖于全局服务,因此在所有组件都挂掉的情况下请优先处理全局服务:License Server、Aquila、Guardian
  1. 全局服务

    • 用户可以按序依次启动或批量全部启动:

      global service start
      global service start 2
      global service start 3
  2. 集群服务

    • 一键启动

      或按序Zookeeper → HDFS → YARN → Hyperbase → quark

      service start 1
      service start 2
      service start 3
8180 Manager页面问题
8180 Manager页面打开后无反应

【问题描述】

QA 8180.1

【解决办法】

清楚缓存,重新刷新

8180 Manager页面显示拒绝访问

【问题描述】

QA24.9

【问题根因】

在启动新的容器时,环境还有正在运行的其他容器,端口未释放,导致启动新容器时端口冲突。即使后续有停止其他容器,但是此时manager自启动已失败,所以无法访问。

【解决办法】

在启动新容器之前,请再次务必确保环境上没有正在运行的其他开发版产品容器。
  1. 进入容器

    docker ps
    docker exec -it <containerid> bash
    复制
  2. 查看manager服务状态

    systemctl status transwarp-manager-db
    复制
  3. 重启manager服务

    systemctl restart transwarp-manager-db
    复制
某个服务启动失败
常规排查步骤

关于某个服务启动失败的常规排查步骤:

  1. 重试当前task,看能否启动成功

  2. 返回服务主界面,选择重启服务,看能否启动成功

  3. 通过 systemctl list-units | grep <组件名>,查找服务角色对应的service

  4. 通过 systemctl status <service_name> 查看服务角色状态

  5. 查看服务日志,看是否有明显报错

  6. 若无日志生成,通过journalctl -u <service_name> 查看服务启动日志,看是否有明显报错

端口冲突导致

【问题描述】

安装过程中您可能会遇到启动某个服务失败,比如zookeeper启动失败。

【排查思路】

进入容器内部,查看/var/log下的日志。该目录下存有TDH各服务组件的日志,当服务启动失败或遇到不可用等问题,可在此目录下查看对应服务的日志。

QA24.1

比如本示例是Zookeeper启动失败,因此查看/var/log/zookeeper1/zookeeper.log即可。

QA24.2

根据日志显示:“Address already in use”。该信息表示端口已被占用,页面有时可以显示出具体涉及的端口。 如果没有显示,可以通过下述方式确认冲突的端口信息。

  1. 查看是哪个服务哪个角色启动报错

  2. 登录manager页面查看这个服务/角色对应有哪些端口配置

  3. 通过netstat -nalp | grep <目标端口> 查看是否占用

  4. 修改端口配置到一个没被占用的端口,配置服务重启服务。

注意,由于zookeeper是基础服务,后续该服务配置更改有记录会导致quark不可用,因此zookeeper恢复正常后也需要重新配置quark并重启quark
QA24.3
QA24.4
QA24.5
QA24.5.1
QA24.6
QA24.7
QA24.8