9 社区版产品升级手册-9.1 社区版开发版升级教程-9.1.2 升级常见问题-TDH Community Edition-星环科技

星环大数据基础平台社区版

文档搜索

9.1.2 升级常见问题

更新时间：8/6/2024, 4:51:18 AM

重启容器后服务组件全部都挂掉

社区版组件服务依赖于全局服务，因此在所有组件都挂掉的情况下请优先处理全局服务：License Server、Aquila、Guardian

全局服务
- 用户可以按序依次启动或批量全部启动：
集群服务
- 一键启动
  
  或按序Zookeeper → HDFS → YARN → Hyperbase → quark

8180 Manager页面问题

8180 Manager页面打开后无反应

【问题描述】

【解决办法】

清楚缓存，重新刷新

8180 Manager页面显示拒绝访问

【问题描述】

【问题根因】

在启动新的容器时，环境还有正在运行的其他容器，端口未释放，导致启动新容器时端口冲突。即使后续有停止其他容器，但是此时manager自启动已失败，所以无法访问。

【解决办法】

在启动新容器之前，请再次务必确保环境上没有正在运行的其他开发版产品容器。

进入容器

docker ps
docker exec -it <containerid> bash复制

查看manager服务状态

systemctl status transwarp-manager-db复制

重启manager服务

systemctl restart transwarp-manager-db复制

某个服务启动失败

常规排查步骤

关于某个服务启动失败的常规排查步骤：

重试当前task，看能否启动成功
返回服务主界面，选择重启服务，看能否启动成功
通过 systemctl list-units | grep <组件名>，查找服务角色对应的service
通过 systemctl status <service_name> 查看服务角色状态
查看服务日志，看是否有明显报错
若无日志生成，通过journalctl -u <service_name> 查看服务启动日志，看是否有明显报错

端口冲突导致

【问题描述】

安装过程中您可能会遇到启动某个服务失败，比如zookeeper启动失败。

【排查思路】

进入容器内部，查看/var/log下的日志。该目录下存有TDH各服务组件的日志，当服务启动失败或遇到不可用等问题，可在此目录下查看对应服务的日志。

比如本示例是Zookeeper启动失败，因此查看/var/log/zookeeper1/zookeeper.log即可。

根据日志显示：“Address already in use”。该信息表示端口已被占用，页面有时可以显示出具体涉及的端口。如果没有显示，可以通过下述方式确认冲突的端口信息。

查看是哪个服务哪个角色启动报错
登录manager页面查看这个服务/角色对应有哪些端口配置
通过netstat -nalp | grep <目标端口> 查看是否占用
修改端口配置到一个没被占用的端口，配置服务重启服务。

注意，由于zookeeper是基础服务，后续该服务配置更改有记录会导致quark不可用，因此zookeeper恢复正常后也需要重新配置quark并重启quark

上一篇：9.1.1 升级步骤下一篇：9.2 社区版升级教程

本页导航

重启容器后服务组件全部都挂掉
8180 Manager页面问题
- 8180 Manager页面打开后无反应
- 8180 Manager页面显示拒绝访问
某个服务启动失败
- 常规排查步骤
- 端口冲突导致

大数据基础平台

大数据云平台

数据库

数据开发工具

智能分析工具

AI基础设施平台

软硬一体产品

金融解决方案

交通解决方案

医疗解决方案

教育解决方案

能源解决方案

制造业解决方案

政府解决方案

运营商解决方案

重启容器后服务组件全部都挂掉

8180 Manager页面问题

8180 Manager页面打开后无反应

8180 Manager页面显示拒绝访问

某个服务启动失败

常规排查步骤

端口冲突导致

咨询热线