可能导致虚拟基础设施崩溃的5件事
现在您已经转移到虚拟基础架构并且已经接受了软件定义的所有内容的概念,您必须更少关注架构,而更多地关注服务交付。遗憾的是,当您开始在虚拟基础架构上放置工作负载时,您和您的客户会发现应用程序和服务的性能显着下降。什么架构师和系统管理员我们必须意识到,一切都在纸上运作,但真正的工作负载和真实用户经常会改变你的观点并让你回到绘图板上来制定一个新的行动计划。即使在软件定义的世界中,支持这种抽象的底层硬件,从硬件到软件,在性能方面通常都有自己的想法。虚拟基础架构有五个关键领域可能会遇到性能问题:存储,计算,网络,工作负载平衡和蔓延。
软件 - 定义一切
正在申请专利的网络和存储技术,在一个企业云中集成了计算,虚拟化和SaaS管理。
立即见证Ignite的力量。
存储滞后
虚拟化最令人抱怨的性能问题之一是存储滞后。所有存储滞后问题的解决方案是SSD和全闪存阵列。该解决方案的问题是成本。然而,虚拟化的承诺是降低计算成本,而不是增加计算成本。因此,暂时将全闪存阵列留在桌面上作为“不错的选择”选项,并查看一些实用且价格合理的存储滞后分辨率。
VMware针对解决存储性能问题提供了以下建议:
将ESXi LUN与非ESXi LUN 分开
启用读取缓存和写入缓存
负载平衡磁盘I / O.
持续监控,重新设计和调整
系统管理员还应考虑将应用程序存储与操作系统存储分开,以减轻磁盘I / O争用。虚拟化管理员还应该将某些工作负载配置为彼此分离,而不是允许他们通过自动分布式资源调度(DRS)自由移动。
约束计算资源
计算资源,CPU和内存通常在管理员超额订阅时面临虚拟化环境中的约束。通过为虚拟机(VM)创建标准并坚持使用,可以轻松避免过度订阅。超额订阅的原因是创建虚拟机的管理员,没有标准,或者试图模仿虚拟系统迁移的物理环境的管理员。请记住,未充分利用的容量是虚拟化环境的主要驱动因素之一。大多数空闲物理系统购买了多个多核 CPU,数十GB内存和太字节存储带来了从物理到虚拟的这种转变。
通过P2V流程将物理机转换为虚拟机通常是确定软件定义基础架构中废物来源的罪魁祸首。通过P2V转换发生的迁移很少反映Microsoft和VMware等供应商提出的最佳规模调整标准建议。
正确调整VM大小并防止浪费容量需要标准,监视,平衡和更新,以确保基础架构利用率保持最佳。
网络延迟
对于在虚拟系统中经常被忽略的标准物理系统,网络流量的逻辑和物理分离是最佳实践。例如,在标准物理硬件上,企业通常配置管理网络,备份网络,以及可能连接到数据库服务器的各种专用网络,当然还有存储网络。管理员必须通过使用VLAN和单独的物理网络将这种做法转移到虚拟系统,以承载不同的流量流。
实时迁移/ VMotion,备份,数据,管理和存储应在单独的物理和逻辑网络上传输。任何重叠都会导致网络限制,以及期望从应用程序和桌面快速响应网络的不满意用户。
VMware建议以下内容来优化网络吞吐量:
将每个物理网卡分配给端口组和vSwitch。
使用单独的NIC来处理不同的流量。
如果丢弃的数据包有问题,请增加vNetwork驱动程序环缓冲区。
验证所有NIC是否以全双工模式运行。
将所有NIC设置为最大容量。
使用VMXNET 3 NIC驱动程序。
在vSwitch上平衡VM。
向主机添加更多物理网卡。
在每个VM上安装VMware Tools。
在大多数网络中,网络延迟相对不常见,特别是如果管理员将网络分离为孤立的流量流。许多VM可以共享单个网络接口而不会饱和。但网络延迟确实发生了。问题是,“为什么会出现网络延迟?”网络延迟最常发生在实时迁移/ VMotion网络上,其中具有大内存分配的VM从一个物理主机移动到另一个物理主机。正确的VM 内存分配和专用网络有助于降低迁移过程中出现瓶颈的机会。网卡绑定,安装最新驱动程序,优化物理网卡设置有助于防止出现瓶颈。
Microsoft为Hyper-V和VM提供以下准则:
在支持VMQ的物理网卡上启用VMQ。
不要使用自动专用IP寻址。
安装最新的NIC驱动程序。
为所有网络设备启用Jumbo Frames。
删除未使用的协议
首先在绑定顺序中设置管理NIC。
在分配到网络之前创建NIC团队。
不要与主机操作系统共享虚拟交换机NIC。
创建冗余网络路径,尤其是实时迁移网络。
网络接口并非都是相同的。某些NIC存在一些已知问题,管理员可以通过选择不同的NIC或彻底研究文档并对其设置进行适当更改来避免这些问题。管理员还应特别注意确保所有网络设备上的所有网络设置都匹配。例如,管理员应将所有1 Gb NIC设置为1 Gb,全双工并匹配交换机上的这些设置。
工作量不平衡
工作负载平衡与硬件无关,也与软件无关,但它是虚拟基础架构中存在的问题。当太多特定类型的工作负载收集到单个主机系统上时,会发生工作负载不平衡。例如,如果太多的VM 聚集到同一主机上,那么具有高CPU利用率的 VM 会对彼此的性能产生负面影响。对于内存密集型工作负载以及高磁盘I / O应用程序和工作负载,您可以观察到相同的效果。
工作负载平衡需要管理员的额外思考和计划。默认DRS算法并不总是最好。管理员必须相应地研究工作负载并分配和负载平衡。他们还必须制定防止虚拟机聚集的规则。例如,在十个主机系统的集群中,管理员可以为自平衡工作负载设置规则。保守设置将确保VM不会移动,除非主机的资源在一段时间内保持受限。过于积极地设置迁移可能会增加性能,从而增加迁移网络的网络延迟。此外,管理员可以而且应该设置排除某些VM在同一主机上登陆的规则。
虚拟机蔓延
虚拟机蔓延会导致虚拟环境中出现问题,包括许可问题,空间限制,资源浪费以及合法使用VM的中断。发生蔓延是因为配置新VM只需要一个VM模板和几次鼠标点击。物理机器蔓延有内置控件,但虚拟机通常没有。未充分利用的物理系统使IT专业人员能够接受虚拟化,但同样的专业人员会造成过度配置虚拟机的浪费,为各种目的创建虚拟机,并且永远不会从磁盘和库存中删除未使用的虚拟机。
VMware建议采用减少,重用和回收策略来防止蔓延。首先,减少未经授权和过度配置的VM的数量,其治理类似于管理器在配置物理机时所使用的数量。解决方案是将VM请求放入包含请求和批准的治理流程中,以便VM通过审核流程来保证VM 权限,许可证跟踪和生命周期管理。
其次,管理员可以为新工作负载重新部署VM,而不是让VM通过正常且冗长的退役过程。这是计划的重用部分。通常,这些短期使用虚拟机有足够的资源分配给他们作为另一个短期使用系统参与或作为完整的生产工作量继续生活。VM已经分配了CPU,内存,磁盘,网络和许可,因此在现有VM上重复使用这些工作是有意义的。
最后,非活动和废弃虚拟机的回收可帮助企业恢复在测试或生产工作负载中使用的浪费容量。重新获得这种能力的过程是手动的。回收要求管理员对当前使用的系统执行审核,回收已放弃的资源以及手动删除孤立的磁盘。管理员必须花费大量时间来确定废弃VM的价值。它可以证明更好的时间和资源投资回报,可以简单地删除虚拟机,将许可证返回到许可证池,以及将空间重新分配给实时工作负载。
结论
拥抱虚拟化的诸多好处也意味着企业必须接受虚拟化的缺点。除非通过治理,审计和政策进行适当控制,否则虚拟化通常被认为是浪费容量的灵丹妙药,因此会增加浪费。平衡网络带宽,计算容量和存储性能需要警惕并遵守管理程序制造商建议的最佳实践。虽然虚拟化的目标是减少硬件支出,降低电力成本,更有效地使用容量,以及更好地利用计算资源,但问题仍然存在。虽然虚拟化确实为这些问题提供了解决方案,但它并没有消除硬件本身的潜在问题:管理容量。