记录踩坑记录
1. 准备3台服务器master,node1,node2 2. 每个节点分别设置对应主机名hostnamectl set-hostname master hostnamectl set-hostname node1 hostnamectl set-hostname node23. 修改hosts
# 所有节点都修改 hosts vim /etc/hosts node1的私网ip node1 node2 的私网ip node2 master的私网ip master4. 关闭 SELinux
# 所有节点关闭 SELinux setenforce 0 sed -i --follow-symlinks 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/sysconfig/selinux5. 防火墙关闭
# 所有节点防火墙关闭 systemctl stop firewalld systemctl disable firewalld6. 添加安装源(所有节点)
# 添加 k8s 安装源 cat <7. 安装所需组件(所有节点)kubernetes.repo [kubernetes] name=Kubernetes baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64 enabled=1 gpgcheck=1 repo_gpgcheck=0 gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg EOF mv kubernetes.repo /etc/yum.repos.d/ # 添加 Docker 安装源 yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo
yum install -y docker-ce yum install -y kubelet-1.23.6-0 kubeadm-1.23.6-0 kubectl-1.23.6-0 --disableexcludes=kubernetes # k8s安装的是1.23.6的版本,因为用的是aliyun的源,最新版本(1.24.0)的镜像有问题,也可以安装其他版本,建议在1.23.0及以上版本,也测试过1.21.0版本,坑可能更多一些。8.启动 kubelet、docker,并设置开机启动(所有节点)
systemctl enable kubelet systemctl start kubelet systemctl enable docker systemctl start docker8.修改 docker 配置(所有节点)
# kubernetes 官方推荐 docker 等使用 systemd 作为 cgroupdriver,否则 kubelet 启动不了 cat <9.用 kubeadm 初始化集群(仅在主节点跑)daemon.json { "exec-opts": ["native.cgroupdriver=systemd"], "registry-mirrors": ["https://ud6340vz.mirror.aliyuncs.com"] } EOF mv daemon.json /etc/docker/ # 重启生效 systemctl daemon-reload systemctl restart docker
# 初始化集群控制台 Control plane # 失败了可以用 kubeadm reset 重置 # 主节点配置需要2核及以上,不够就热升级一下。 kubeadm init --image-repository=registry.aliyuncs.com/google_containers # 记得把 kubeadm join xxx 保存起来 # 忘记了重新获取:kubeadm token create --print-join-command # 复制授权⽂件,以便 kubectl 可以有权限访问集群 # 如果你其他节点需要访问集群,需要从主节点复制这个⽂件过去其他节点 mkdir -p $HOME/.kube cp -i /etc/kubernetes/admin.conf $HOME/.kube/config chown $(id -u):$(id -g) $HOME/.kube/config # 在其他机器上创建 ~/.kube/config ⽂件也能通过 kubectl 访问到集群
可能出现的报错及解决方法集合:
报错1
msg=”getting status of runtime: rpc error: code = Unimplemented desc = unknown service runtime.v1alpha2.RuntimeService”
解决方法:
rm /etc/containerd/config.toml systemctl restart containerd
报错2
[preflight] Running pre-flight checks
[WARNING SystemVerification]: this Docker version is not on the list of validated versions: 20.10.3. Latest validated version: 19.03
error execution phase preflight: [preflight] Some fatal errors occurred:
[ERROR FileContent–proc-sys-net-bridge-bridge-nf-call-iptables]: /proc/sys/net/bridge/bridge-nf-call-iptables contents are not set to 1
[preflight] If you know what you are doing, you can make a check non-fatal with --ignore-preflight-errors=...
To see the stack trace of this error execute with --v=5 or higher
解决方法:
echo "1" >/proc/sys/net/bridge/bridge-nf-call-iptables10.安装⽹络插件,否则node是NotRead状态(master)
# 很有可能国内⽹络访问不到这个资源,或者科学上⽹把⽂件下载下来,拷⻉进服务器 kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
完结!



