从零开始入门 K8s | 手把手带你理解 etcd

在 v3 版本中 etcd 提供了一套全新的 API,重新实现了更高效的一致性读取方法,并且提供了一个 gRPC 的 proxy 用于扩展 etcd 的读取性能。

K8s Controller工作机制剖析

Controller是我们在讨论K8s过程中难以绕开的一环,本文将结合源码对K8s中Controller的工作机制做一个深入的剖析,具体涉及List & Watch机制、Event-handling、工作队列等多个概念。

写给大家看的“不负责任” K8s 入门文档

为了解决分布式改造过程中的各种问题,引入了一系列的中间件,类似hsf、tddl、tair、diamond、metaq 等,在艰难的业务架构改造后,我们成功的把 all in one 的 java 应用拆分成了多个小应用,重走了一遍当年阿里中间件发展和去 IOE 的道路。

K8s版本升级教程(1.21-1.22)

博客内容涉及 k8s版本升级,环境是通过kubeadm安装的,所以升级方式是否可用与生产环境未知。应用新的 CoreDNS 和 kube-proxy 清单,并强制创建所有必需的 RBAC 规则。

一文读懂 K8s 持久化存储流程

VolumePlugins 有 in-tree 和 out-of-tree 两种;External Provioner:External Provioner 是一种 sidecar 容器,作用是调用 Volume Plugins 中的 CreateVolume 和 DeleteV

万字详文:腾讯万级K8s集群背后etcd稳定性及性能优化实践

最后我们面对万级K8s集群数, 千级的etcd集群数, 10几个版本分布,其中不少低版本包含重要的潜在可能触发的严重bug, 我们还需要投入大量工作不断优化我们的etcd平台,使其更智能、变更更加高效、安全、可控, 同时数据安全也至关重要,目前腾讯云TKE托管集群我们已经全面备份,独立集群的用户后续将引导通过应用市场的etcd备份插件开启定时备份到腾讯云对象存储COS上。

K8s集群CPU使用率高达100%,详细排查过程

问题背景我们发现客户的Kubernetes集群环境中所有的worker节点的Kubelet进程的CPU使用率长时间占用过高,通过pidstat可以看到CPU使用率高达100%。本文记录下了本次问题排查的过程。

不使用 K8s API,如何直接修改 etcd 数据?

本文探讨了不使用 Kubernetes API,直接在 etcd 中处理数据的可能性,并在真实的 K8s 集群上成功测试了所有步骤。

从零开始入门 K8s | 详解 K8s 容器基本概念

作者 | 阿里巴巴高级开发工程师 傅伟“未来的软件一定是生长于云上的”这是云原生理念的最核心假设。而所谓“云原生”,实际上就是在定义一条能够让应用最大程度利用云的能力、发挥云的价值的最佳路径。

灵活、高效的云原生集群管理经验:用 K8s 管理 K8s

作者 | 淮右、临石导读:单 K8s 集群为用户提供了 Namespace 级别的隔离能力,理论上支持不超过 5K Node、15W Pod。