搭建tdh平台

1、卸载tdh平台(见tdh集群卸载文件夹)

在manager节点执行chmod +x uninstall.sh (非root用户执行sudo chmod +x uninstall.sh)开始卸载TDH。

uninstall.sh读取manager安装的节点和服务信息,将uninstall_community_agent_template.sh渲染成uninstall_community_agent_instance.sh,然后在agent节点上执行。

注: manager节点需要到agent节点去执行uninstall_community_agent_instance.sh脚本,需要agent节点的密码,所以可以提前配置manager到agent节点的无秘钥登录。
注意: 使用该卸载脚本后如果再次安装TDH5.1.2以下版本请为docker手动分配磁盘分区。

uninstall.sh有如下参数可选:

(1) --keepdata 默认是false,不保留数据,如果想保留数据, uninstall.sh --keepdata=true
(2) --nodes 指定节点进行删除,用法是uninstall.sh --nodes=hostname1

(3) --nopasswd 指定使用无秘钥登录方式登录各节点进行卸载,uninstall.sh --nopasswd
(4) --user=* 指定无秘钥登录用户名,如 uninstall.sh --nodes=transwarp

(5) --sshkey=* 指定无秘钥登录的私钥文件,如uninstall.sh --sshkey=/etc/transwarp/transwarp-id_rsa

2、第一次搭建

选择网卡这项选择错误的网卡

搭建tdh平台

添加完节点后点击下一步时报错 “ACTIVE NODES ARE :LIST()”,无法进行下一步

搭建tdh平台

2、第二次搭建

又使用脚本卸载集群重装,执行完后本应该重新开始,但是未安装manager仍能访问到web页面,且在install manager时提示地址占用

无奈根据下面解决方法将进程kill掉,然后重新安装。

无法启动的原因确定是因为50010端口被占用,此端口是datanode需要的一个端口。

接下来就要查看这个端口被什么进程占用:

netstat -anp | grep 50010

这个进程的具体信息:
ps -ef | grep 12779

此时已基本确认问题,确认这个进程的内容,根据情况,先将这个进程关闭,停止相关的程序或者kill 12779