
重启容器后服务组件全部都挂掉
社区版组件服务依赖于全局服务,因此在所有组件都挂掉的情况下请优先处理全局服务:License Server、Aquila、Guardian |
-
全局服务
-
用户可以按序依次启动或批量全部启动:
-
-
集群服务
-
一键启动
或按序Zookeeper → HDFS → YARN → Hyperbase → quark
-
8180 Manager页面问题
8180 Manager页面打开后无反应
【问题描述】

【解决办法】
清楚缓存,重新刷新
8180 Manager页面显示拒绝访问
【问题描述】

【问题根因】
在启动新的容器时,环境还有正在运行的其他容器,端口未释放,导致启动新容器时端口冲突。即使后续有停止其他容器,但是此时manager自启动已失败,所以无法访问。
【解决办法】
在启动新容器之前,请再次务必确保环境上没有正在运行的其他开发版产品容器。 |
-
进入容器
docker ps docker exec -it <containerid> bash
复制 -
查看manager服务状态
systemctl status transwarp-manager-db
复制 -
重启manager服务
systemctl restart transwarp-manager-db
复制
某个服务启动失败
常规排查步骤
关于某个服务启动失败的常规排查步骤:
-
重试当前task,看能否启动成功
-
返回服务主界面,选择重启服务,看能否启动成功
-
通过 systemctl list-units | grep <组件名>,查找服务角色对应的service
-
通过 systemctl status <service_name> 查看服务角色状态
-
查看服务日志,看是否有明显报错
-
若无日志生成,通过journalctl -u <service_name> 查看服务启动日志,看是否有明显报错
端口冲突导致
【问题描述】
安装过程中您可能会遇到启动某个服务失败,比如zookeeper启动失败。
【排查思路】
进入容器内部,查看/var/log下的日志。该目录下存有TDH各服务组件的日志,当服务启动失败或遇到不可用等问题,可在此目录下查看对应服务的日志。

比如本示例是Zookeeper启动失败,因此查看/var/log/zookeeper1/zookeeper.log即可。

根据日志显示:“Address already in use”。该信息表示端口已被占用,页面有时可以显示出具体涉及的端口。 如果没有显示,可以通过下述方式确认冲突的端口信息。
-
查看是哪个服务哪个角色启动报错
-
登录manager页面查看这个服务/角色对应有哪些端口配置
-
通过netstat -nalp | grep <目标端口> 查看是否占用
-
修改端口配置到一个没被占用的端口,配置服务重启服务。
注意,由于zookeeper是基础服务,后续该服务配置更改有记录会导致quark不可用,因此zookeeper恢复正常后也需要重新配置quark并重启quark |






