1 月 052013
 

计划停机和非计划停机(计划外停机)会对业务连续性产生影响,同时,传统高可用性解决方案开销大,难以实施和管理。

减少计划停机时间
由于 VMware 环境中的工作负载无需中断服务即可动态移动到不同的物理服务器或基础存储器,所以,通过vSphere 中的 VMware vMotion 和 Storage vMotion 功能,组织可以减少计划的停机时间。管理员可以快速而完整地执行透明的维护操作,无需强制调度不方便的维护时间段。

防止非计划停机时间

vSphere 中内置的关键容错功能可以避免出现硬件或应用程序故障所导致的非计划停机时间。

共享存储器
通过在共享存储器(如光纤通道、iSCSI SAN 或 NAS)上存储虚拟机文件来消除单一故障点。可以使用 SAN 镜像和复制功能将虚拟磁盘的更新副本保留在灾难恢复站点。
网络接口绑定
允许单个网卡发生故障。
存储多路径
允许存储路径发生故障。 Continue reading »

1 月 052013
 

在使用容错之前,必须满足以下群集要求。

主机证书检查功能已启用。

至少有两台通过容错认证的主机运行相同的容错版本号或主机内部版本号。

ESX/ESXi 主机可以访问相同的虚拟机数据存储和网络。

配置了容错日志记录和 vMotion 网络。

VMware HA 群集已创建并启用。

在使用容错之前,必须满足以下主机要求。

主机上的处理器必须来自与容错兼容的处理器组。

主机必须获得 VMware 容错许可。

主机必须已通过容错认证。

在配置每台主机时,都必须在 BIOS 中启用硬件虚拟化 (HV)。

在使用容错之前,必须满足以下虚拟机要求。

没有不受支持的设备连接到虚拟机。

虚拟机必须存储在虚拟 RDM 或厚置备的虚拟机磁盘 (VMDK) 文件中。如果虚拟机存储在精简置备的 VMDK
文件中,则在尝试启用容错时将会出现一则指示必须转换 VMDK 文件的消息。要执行该转换,必须关闭
虚拟机。

容错错误消息

文件系统上虚拟机磁盘的未使用磁盘块尚未擦除。要支持容错等功能需要执行此操作。

已尝试在已启动的虚拟机上打开容错,该虚拟机具有厚格式的磁盘,磁盘属性为 Lazy Zero。对于类似的虚拟机,无法在其已启动时启用容错。请关闭虚拟机,然后打开容错并重新启动虚拟机。此操作会在虚拟机重新启动时更改其磁盘格式。如果虚拟磁盘较大,则打开容错可能需要一些时间。

不兼容的功能一定不能与容错虚拟机一起运行。

虚拟机文件必须存储在共享存储器上。可接受共享的存储解决方案包括光纤通道、(硬件和软件)iSCSI、
NFS 和 NAS。

只有带有单个 vCPU 的虚拟机才能与容错功能兼容。

虚拟机必须在一个受支持的客户机操作系统上运行。

容错虚拟机不支持以下 vSphere 功能。

快照。在虚拟机上启用容错前,必须移除或提交快照。此外,不可能对已启用容错的虚拟机执行快照。

Storage vMotion。不能为已启用容错的虚拟机调用 Storage vMotion。要迁移存储器,应当先暂时关闭容
错,然后再执行 Storage vMotion 操作。在完成迁移之后,可以重新打开容错。

链接克隆。不能在为链接克隆的虚拟机上启用容错,也不能从启用了容错的虚拟机创建链接克隆。

VMware Consolidated Backup (VCB)。不能使用 VCB、用于数据保护的 vStorage API、VMware Data
Recovery 或需要使用虚拟机快照(如 ESX/ESXi 所执行的那样)的类似备份产品来备份启用了容错的虚拟机。
要以这种方式备份容错虚拟机,首先必须禁用容错,然后在执行备份后重新启用容错。基于存储阵列的快
照不影响容错。

1 月 042013
 

das.isolationaddress[…]

设置为了确定主机是否与网络隔离而要 ping 的地址。只有当未从群集内的任何其他主机接收到检测信号时才 ping 此地址。如果未指定,则使用管理网络的默认网关。此默认网关必须是可用的可靠地址,以便主机可以确定它是否与网络隔离。可以为群集指定多个隔离地址(最多 10 个):das.isolationaddressX,其中 X = 1-10。通常每个管理网络应指定一个隔离地址。如果指定的地址太多,则进行隔离检测所需的时间将会较长。

das.usedefaultisolationaddress

默认情况下,VMware HA 使用控制台网络的默认网关作为隔离地址。此属性指定是否使用此默认设置 (true|false)。

das.failuredetectiontime

更改主机监控的默认故障检测时间。默认为 15000 毫秒(15秒)。这是主机未从其他主机接收到任何检测信号时在声明其出现故障前等待的时间段。

das.failuredetectioninterval
更改 VMware HA 主机间的检测信号时间间隔。默认情况下,每 1000 毫秒(1 秒)发生一次。

das.isolationshutdowntimeout

关闭虚拟机之前,系统等待虚拟机关机的时间段。只有在主机的隔离响应为“关机”时,此选项才适用。默认值为 300 秒。

das.slotmeminmb

定义内存插槽大小的最大限制。如果使用此选项,则插槽大小小于该值,或是小于群集内任何已启动虚拟机的最大内存预留以及内存开销。

das.slotcpuinmhz

定义 CPU 插槽大小的最大限制。如果使用此选项,则插槽大小小于该值,或是小于群集内任何已启动虚拟机的最大 CPU预留。

das.vmmemoryminmb

定义在没有指定虚拟机内存预留或者内存预留为零时,分配给虚拟机的默认内存资源值。用于“群集允许的主机故障数目”接入控制策略。如果未指定任何值,则默认值为 0MB。

das.vmcpuminmhz

定义在没有指定虚拟机 CPU 预留或者 CPU 预留为零时,分配给虚拟机的默认 CPU 资源值。用于“群集允许的主机故障数目”接入控制策略。如果未指定任何值,则默认值为 256MHz。

das.iostatsinterval
更改虚拟机监控敏感度的默认 I/O 统计间隔。默认值为 120(秒)。可以设置为大于等于 0 的任何值。设置为 0 会禁用检查。

如果更改以下任一高级属性的值,则必须先禁用 VMware HA,再重新启用它,更改才会生效。
das.isolationaddress[…]
das.usedefaultisolationaddress
das.failuredetectiontime
das.failuredetectioninterval
das.isolationshutdowntimeout

vmware-ha-advanced

vSphere可用性指南 v4.1