引言
ByConity是一个由字节跳动开源的云原生数据仓库引擎,采用存储计算分离的架构,实现了读写分离和弹性扩缩容。这款引擎支持多个关键功能特性,如资源隔离、无感扩缩容、高性能和数据的强一致性等。该架构确保读写操作不会相互影响,同时使计算资源和存储资源解耦,两者可以按需独立扩缩容,实现资源高效利用。ByConity适用于多租户环境,支持多租户资源隔离功能,保证不同租户之间不会互相影响。另外,ByConity采用主流的OLAP引擎优化技术,如列存储、向量化执行、MPP执行和查询优化等,为用户提供优异的读写性能。
ByConity存储计算分离架构
为了让大家更好的理解需要部署的组件,这里简单介绍下ByConity的架构。想更深入了解请参考另一篇文章《谈谈ByConity存储计算分离架构和优势》(https://mp.weixin.qq.com/s/FNaC3RTr7BxBZbditTJxRw)。ByConity的存储计算分离架构主要分为三层:共享服务层、计算层和云存储层。共享服务层是所有查询的入口,主要组件是Cloud Service和Metadata Storage,它会对查询进行解析和优化,并负责一些服务、组件和事务的管理和元数据的管理。计算层是计算资源组,主要组件是Virtual Warehouse(VW),包括Read VW和Writer VW。云存储层是分布式统一存储系统,ByConity所有的数据都存储在这一层,在计算层进行查询时,会从云存储层中读取数据,具体实现可以采用各种云存储服务,如HDFS、S3等。此外,ByConity还包括TSO、Daemon Manager、Resource Manager、后台任务和服务发现等共享服务组件,为整个系统提供稳定的支持和管理。
图1 ByConity三层技术架构
ByConity如何在Kubernetes上部署和操作
Kubernetes是一个开源的容器编排平台,可以自动管理和部署容器化应用程序,并提供高可用性和弹性的部署模式。将ByConity部署在Kubernetes上,可以享受Kubernetes提供的可伸缩性、高可用性、负载均衡、容错性等,同时简化管理和部署的过程。下面将给大家详细介绍下,如何在Kubernetes上部署ByConity。
硬件配置:
用户需要部署和购买自己的Kubernetes集群,且要求在不影响测试性能前提下的最低硬件配置如下表:
同时,我们也给出一个生产环境下建议的硬件配置,供大家参考:
工具安装:
本地安装Kubernetes命令行工具kubectl,用于管理Kubernetes集群
本地安装用于管理Kubernetes应用程序的包管理工具helm
本地安装byconity-deploy代码:
配置存储
为了获得最佳的 TCO(https://en.wikipedia.org/wiki/Total_cost_of_ownership) 和性能,本地存储最好与 ByConity Server 和 Worker 一起使用。
ByConity Server 和 Worker 的存储仅用于磁盘缓存,可以随时删除它们。
您可以使用 OpenEBS local PV (https://openebs.io/docs/concepts/localpv)等存储.
配置helm
可以从安装的byconity-deploy的目录复制./chart/byconity/values.yml文件,并进行修改适配,需要修改的地方如下:
storageClassName
timezone
replicas for server/worker
hdfs storage request
部署ByConity集群
等待Pod启动:
完成部署,启动client:
测试ByConity集群
执行一些SQL语句测试:
手动更新ByConity集群
这里举例说明如何增加新的计算组(Virtual Warehouse),假如用户希望增加两个计算组,5个副本用户读取(my-new-vw-default )2个副本用户写入(my-new-vw-write )。
更新用户的values.yaml文件
使用新的value.yml文件,执行helm upgrade
在Byconity中运行执行DDL语句 CREATE WAREHOUSE 创建新的计算组
测试新的计算组
在Kubernetes上无感扩缩容
无感扩缩容是指在系统运行过程中,通过动态调整计算和存储资源的分配,以满足业务需求,同时不影响系统的正常运行和服务质量的一种扩容方式。无感扩缩容的目的是为了提高系统的可用性和可靠性,同时降低系统维护和运营的成本。下面介绍下如何利用Kubernetes对ByConity集群进行无感扩缩容:
1.部署ByConity集群:利用上面步骤在用户的Kubernetes集群上部署ByConity
2.设定负载阈值:用户需要设定负载阈值,即当ByConity集群负载达到一定程度时需要进行扩容操作。可以通过Kubernetes Horizontal Pod Autoscaler(HPA)对象进行设定,设置CPU使用率或内存使用率等指标作为负载阈值。例如,可以设置当ByConity集群的CPU使用率达到80%时,自动进行扩容操作。
3.自动触发扩容:当ByConity集群负载达到设定的负载阈值时,Kubernetes HPA会自动触发扩容操作,增加ByConity节点数量以满足业务需求。例如,当ByConity集群的CPU使用率达到80%时,Kubernetes HPA会自动增加节点数量,保证ByConity集群的性能和可用性。Kubernetes会根据预设的规则和算法,自动增加或减少节点数量,并调整负载均衡策略,以保证系统的高性能和高可用性。
4.动态调整资源:Kubernetes会根据实际负载情况,动态调整计算和存储资源的分配,以保证系统的高性能和高可用性。Kubernetes会自动将负载均衡地分配到不同的ByConity节点上,同时保证数据的一致性和可靠性。
5.实时监控和报警:可以通过Prometheus等监控工具,实时监控ByConity集群负载和资源使用情况,当出现异常情况时会自动触发报警机制,通知管理员进行处理。
总结
总之,将ByConity部署在Kubernetes上,可以享受Kubernetes提供的可伸缩性、高可用性、负载均衡、容错性等,同时简化管理和部署的过程,同时ByConity可以利用Kubernetes进行无感扩缩容对用户带来的价值包括:
提高系统的可用性和可靠性:无感扩缩容可以根据实际负载情况动态调整计算和存储资源的分配,保证系统始终能够满足业务需求,避免因系统资源不足而导致的系统宕机或服务中断。
提高系统的灵活性和可扩展性:无感扩缩容可以根据业务需求动态地增加或减少计算或存储资源,不需要进行系统停机或重启,从而提高了系统的灵活性和可扩展性。
降低系统维护和运营成本:无感扩缩容可以自动调整系统资源,减少了系统管理员和运营人员的工作量,降低了系统维护和运营的成本。
同时ByConity也提供多种其他部署方式,欢迎社区开发者使用,并给我们提issue:
单机版本方式:https://github.com/ByConity/byconity-docker
物理机部署模式:https://github.com/ByConity/ByConity/tree/master/packages
源代码编译方式: https://github.com/ByConity/ByConity#build-byconity
加入我们
ByConity社区拥有大量的用户,同时是一个非常开放的社区,我们邀请大家和我们一起讨论共建,在Github上建立了issue:https://github.com/ByConity/ByConity/issues/26,也可以加入我们的飞书群、Slack或者Discord参与交流。
文章来源:网络