中国金属材料流通协会,欢迎您!

English服务热线:010-59231580

搜索

会员动态|腾讯云最新内核级突破,事关所有云用户

腾讯云——中国金属材料流通协会互联网与数字化专委会常务理事单位

IOMMU、写时复制、即时克隆、嵌套虚拟化…
虚拟化技术,确实挺抽象。
但只要你还在做云计算,就绕不开它。
今天,讲三个故事,汇报我们在虚拟化领域的新突破。
第一项突破:虚拟化开销“挤水分”
每台虚拟机,想要管理物理机上的硬件,都要通过硬件寄存器。这是一种非常小的快速存储空间,每个指令被执行前,就短暂存储在这里。
有些寄存器很敏感,比如模型特定寄存器(MSR)。如果允许虚拟机直接访问,可能产生安全风险:假如恶意软件劫持了一台虚拟机去访问寄存器,可能导致所有虚拟机崩溃。
万一有人进配电室,把总闸断了怎么办?业界往往通过拦截-模拟的代理访问方式,让虚拟机“以为”它直接访问了寄存器,其实没有。
这种代理访问,虽然安全,但每次都会让虚拟机产生等待,增加不少虚拟化开销和延迟。


公寓楼里的每个房间都装了独立的电表和电闸,确实安全、准确,但每次抄表都得敲遍所有房间。不仅打断住户本来的作息,也带来额外的人工开销。

能不能装个集中式电表,显示每个房间的用电量?AMD Guest PerfMonV2就是这样的一台集中式电表

这次,腾讯云设计的 PMU improvement 特性,让Perf技术能在虚拟机环境中运行,虚拟机也能获得物理机级别的性能监控,同时降低了性能监控单元的虚拟化成本、提升准确性。
目前,这项技术已经被开源社区接收,并得到业界的广泛认可和测试。我们的SA2、SA3等多款云服务器,已经用上了这项技术。今后,它也会被直接用在AMD Zen4平台的所有虚拟化场景中。
云计算走到今天,虚拟化开销的“水分”已经挤了好几轮。对单台虚拟机而言,这种优化看似微不足道。但在大规模应用中,这些死抠开销的细微改进有着聚沙成塔的价值。
面向新场景新问题,我们将继续突破技术障碍,让虚拟化开销的数字无限逼近0。
第二项突破:热迁移,空中换引擎
过往,通过热迁移让旧的虚拟机迁移到新代次的cpu上,虚拟机内部新的cpu特性并不会立即跟随更新。尤其是那些需要始终在线、不能重启的业务,无法感知新特性。
如果不能重启,它们可能很久都无法使用新代次CPU的性能特性,只能不断打“实时补丁”,负担越来越重。


小区锅炉房虽然升级了,但每个房间如果不掀开地板、重铺地暖,就没法体验到供暖系统的性能改进。时间长了,还会产生跑冒滴漏问题。

如何“空中换引擎”?腾讯云研发的调度器hybrid vCPU model,通过热插拔技术和动态分发调度算法,让虚拟机能实时切换 vCPU 型号。虚拟机无需离线的情况下,就能第一时间用上物理机的最新特性,并保持高可用性和可靠性。
第三项突破:虚拟化,小到装进兜里
如今,云计算的形态越来越多,离用户越来越近,这需要虚拟机技术更加“小快灵”:比如,在边缘端,虚拟化需要快速启动,马上就接计算需求;在容器里,本来池子就小,留给虚拟化的空间就更少。
“螺蛳壳里做道场”,资源分配和性能优化是关键问题。我们将cloud-hypervisor技术应用于云计算场景,开发了一款名为Cube的轻量级虚拟化产品。
Cube 的一个特点是快。我们针对快照方案,做了全技术栈的深度优化,并提出多项关键功能。


如果说传统的虚拟化是个大木箱, Cube就是小纸袋。

过往,获取一台云服务器,需要数十秒的等待时间。基于Cube,从用户请求到获取一台实际可用的虚拟机只需 100 毫秒。
Cube 的另一个特点是轻。为了用更小的虚拟化消耗,更大限度地发挥性能和硬件资源,我们对主机OS、虚拟化和虚拟机OS做了全套优化。
从主机OS层面的精细化进程和资源分配调度,到虚拟化层面的轻量磁盘存储和高并发网络方案,再到虚拟机OS层面的自研高性能内核、容器应用深度定制。
这些优化,让Cube能把虚拟机装到更小的场景里,提供高性能、低开销的解决方案。
图片
上面的故事,是我们在虚拟化技术上的其中三项新突破。
7年来的每届全球虚拟化顶级峰会KVM Forum,都有我们的身影。今年,我们再次贡献了来自中国企业的唯一一项“核心突破”,以及30项patch
透过层层隔离的复杂环境抽丝剥茧,我们希望虚拟化开销更低、性能更强。也希望每一个人不必搞懂这些深度抽象的底层技术,就能把云用好。


返回列表