HPUX MCSG双机配置笔记-gagagixi-ChinaUnix博客

日常总结的笔记，比较杂乱，有兴趣的同学将就着看吧。

使用 cmquerycl 命令指定要包括在群集中的节点集，并生成群集配置文件的

模板。节点名称不能超过 31 个字节。下面是此命令的一个示例：

# cmquerycl -v -C /etc/cmcluster/clust1.config -n ftsys9 -n ftsys10

在包含多个节点、网络或与群集相连接的磁盘的较大、较复杂的配置中，

cmquerycl 命令可能需要几分钟的时间才能完成。为加快配置过程，可以使

用 -k 和 -w 选项，使命令直接返回所选择的信息：

-k 消除一些磁盘探测，并且不返回有关潜在群集锁卷组和锁物理卷的信息。

-w local 指定进行本地网络探测，这种情况下，只验证每个节点内部接口之

间的 LAN 连接。

-w full 指定进行整个网络探测，这种情况下，将验证群集中所有节点上所

有 LAN 接口之间的实际连接。这是缺省值。

-w none 跳过网络查询。如果最近检查过网络，该选项将节省时间。

有关详细信息，请参考 cmquerycl(1m) 的联机帮助页。

cmquerycl -v -C /etc/cmcluster/cmclconfi.ascii -n sgsimis -n sgsimis1

cmcheckconf -v -C /etc/cmcluster/cmclconfi.ascii

cmapplyconf -v -C /etc/cmcluster/cmclconfi.ascii

cmruncl -v

118 sgsbpkg1

50 sgsbpkg2

mkdir /etc/cmcluster/sgsbpkg1

cd /etc/cmcluster/sgsbpkg1

cmmakepkg -v -p pkg.conf

cmmakepkg -v -s sgsbpkg1.cntl

cmcheckconf -v –P sgsbpkg1.conf

cmapplyconf -v –P sgsbpkg1.conf

mkdir /etc/cmcluster/sgsbpkg2

cd /etc/cmcluster/sgsbpkg2

cmmakepkg -v -p sgsbpkg2.conf

cmmakepkg -v -s sgsbpkg2.cntl

cmcheckconf -v –P sgsbpkg2.conf

cmapplyconf -v –P sgsbpkg2.conf

执行下列步骤进行非滚动软件升级：

1. 暂停群集中的所有节点：

cmhaltcl -f

2. 如有必要，请将群集中的所有节点升级到 HP-UX 新发行版。（有关详细信息，请参阅“运行

滚动升级” （第 312 页）中的第 3 步）。

3. 将群集中的所有节点升级到 Serviceguard 新发行版（有关详细信息，请参阅“运行滚动升级”

（第 312 页）中的第 3 步）。

4. 重新启动群集：

cmruncl

要暂停其上正在运行程序包的节点，请使用 -f 选项。如果正在运行的程序包可以切换到代管节

点上，那么程序包将进行切换并在代管节点上启动。例如，以下命令将导致示例配置中在 ftsys9

节点上运行的Serviceguard 守护程序暂停，并将在 ftsys9 节点上运行的程序包移动到代管节

点。-v（详细）选项可输出下列消息：

cmhaltnode -f -v ftsys9

通过执行每个程序包控制脚本中的暂停指令，可以暂停运行在节点 ftsys9 上的任何程序包。节

点 ftsys9 将暂停，而程序包将在代管节点上启动。

cmrunnode -n ftsys9

测试群集：

? 建立客户端连接。

? 提供一个正常的系统负载。

? 在第一个节点上暂停程序包，将其转移到第二个节点上：

cmhaltpkg pkg1

cmrunpkg -n node2 pkg1

cmmodpkg -e pkg1

? 将程序包移回。

cmhaltpkg pkg1

cmrunpkg -n node1 pkg1

cmmodpkg -e pkg1

? 使其中一个系统失败。例如，关闭节点 1 的电源。确保程序包在节点 2 上启动。

? 重复上述步骤，由节点 2 故障切换回节点 1。

验证群集配置

在 ServiceguardManager 中，可以单击“检查”按钮来验证配置。

如果您通过命令行编辑了一个 ASCII群集配置文件，请使用下列命令验证该

文件的内容：

# cmcheckconf -k -v-C /etc/cmcluster/clust1.config

这两种方法都会检查下列内容：

? 网络地址和连接。

? 群集锁连接（如果正在配置锁磁盘）。

? 群集和程序包配置参数的有效性。

? 名称的唯一性。

? 命令行中指定的脚本是否存在及其权限。

? 指定的所有节点是否都在同一个心跳线子网中。

? 是否指定了错误的配置文件名。

? 是否可以访问所有节点。

? 是否指定了唯一的 CLUSTER_NAME、HEARTBEAT_INTERVAL 和

AUTO_START_TIMEOUT。

? 程序包运行和暂停脚本超时值是否小于 4294 秒。

? NODE_TIMEOUT 值至少是 HEARTBEAT_INTERVAL 值的两倍。

AUTO_START_TIMEOUT变量的值是否 >=0。

? 心跳线网络的最低要求。群集必须配置下列之一：一个心跳线 LAN 和一

个备用心跳线 LAN ；两个心跳线LAN ；一个心跳线 LAN 和一个 RS232

连接；或一个无本地 LAN切换的心跳线网络，并配有一个主 LAN（配置

为至少两个接口的链路聚合）。

? 至少指定了一个 NODE_NAME。

? 每个节点均连接到每个心跳线网络。

? 所有心跳线网络都是相同类型的 LAN。

? 指定的网络接口设备文件是有效的 LAN 设备文件。

? 如果配置了串行 (RS-232) 心跳线，群集中的节点将不会多于两个，每个节

点的串行 (RS232)端口连接将不会多于一个。

?VOLUME_GROUP 项当前未标记为“群集可识别的”。

? 如果使用的是 CVM 3.5 磁盘存储，则只有一个已配置的心跳线子网。

如果群集处于联机状态，则此检查过程还会验证是否满足配置中的特定更改

所需的所有条件。

注释使用 -k 选项意味着 cmcheckconf 只检查在ASCII 文件中标识的至 LVM 磁

盘的磁盘连接。忽略 -k选项（缺省行为）意味着 cmcheckconf 测试所有节

点上所有 LVM 磁盘的连接。使用 -k选项可以明显加快命令的执行速度。

各类参数

FAILOVER_POLICY。如果希望 Serviceguard 尝试按节点所列顺序启动（或

重新启动）程序包，请输入 CONFIGURED_NODE。如果希望 Serviceguard 在

当前所运行程序包数量最少的节点上重新启动失败的程序包，请输入

MIN_PACKAGE_NODE（仅限故障切换类型的程序包）。

? FAILBACK_POLICY。如果程序包的主节点发生故障，您希望 Serviceguard

能在主节点恢复运行时将程序包故障切换回主节点，请输入 AUTOMATIC。

如果不希望 Serviceguard 将程序包移回主节点，请输入 MANUAL（仅限故

障切换程序包）。

? NODE_NAME。输入群集中各个节点的名称，每个名称占一行。对于所有

群集节点，请使用“*”通配符（对于系统多节点程序包，必须指定

NODE_NAME *）。

? AUTO_RUN。对于故障切换程序包，输入 YES 以允许Serviceguard 在第一

个可用节点上启动程序包，并允许在其失败后稍后再自动重新启动它。输

入 NO 以禁止 Serviceguard 自动启动程序包（对于系统多节点程序包，必

须输入 YES）。

? LOCAL_LAN_FAILOVER_ALLOWED。输入 YES 以允许将程序包 IP 地址切换

到备用 LAN，输入 NO 以禁止程序包地址进行本地切换（对于多节点程序

包及系统多节点程序包，必须输入 NO）。

? NODE_FAIL_FAST_ENABLED。如果输入 YES，则当程序包在节点上发生失

败时，该节点将被暂时，并发生控制转移。这可防止 Serviceguard 重复尝

试在该节点上启动程序包，从而防止重复失败。对于系统多节点程序包，

必须将它设置为 YES。

RUN_SCRIPT 和 HALT_SCRIPT。指定程序包控制脚本的路径名（在下一

节介绍）。不提供缺省值。

TIMEOUT：对于运行和暂停脚本，输入在 Serviceguard 确认失败之前它应

该尝试完成脚本所用的秒数。如果为暂停脚本设置了超时值，则此值必须

大于所有暂停脚本超时值的总和。

SCRIPT_LOG_FILE（可选）可以为运行和暂停脚本指定放置日志消息的

位置。如果未指定路径， Serviceguard 将创建一个文件，并将“.log”附

加到每个脚本路径后面，然后在该文件中放置消息。

? STORAGE_GROUP。指定程序包将使用的 CVM 存储组的名称。每个存储组

（CVM 磁盘组）占一行。请注意勿将 CVM 存储组输入到群集 ASCII 配置

文件中。

锁盘

设置锁盘

可使用 cmquerycl -L 来创建定义锁 LUN 的群集配置文件。

? 如果所有节点上的锁 LUN 的路径名都是相同的，可使用如下命令：

cmquerycl -C $SGCONF/config.ascii -L /dev/dsk/c0t1d1 -n <节点1> -n

<节点2>

? 如果某些节点上的锁 LUN 的路径名不相同，则必须在每个节点上指定路径；例如（在一行

上指定所有路径）：

cmquerycl -C $SGCONF/config.ascii -n <节点1> -L /dev/dsk/c0t1d1 -n

<节点2> -L /dev/dsk/c0t1d2

如果锁盘上没有锁盘的标志，可用以下命令将锁盘标志重新写到锁盘上（建议和客户另外约时间）。

# cd /etc/cmcluster

# cmcheckconf -C CONF -P pkg1/conf ...

确认原集群的配置文件还是可用的

# 备份原配置文件

# cmhaltcl -f

# cmdeleteconf -f

# vgchange -a y vglock (cluster lock VG)

# cmapplyconf -C CONF -P pkg1/conf ...

# vgcfgbackup vglock

# vgchange -a n vglock

# cmruncl

1. If the cluster lock disk path is still correct, and if a vgcfgbackup

was performed on the lock VG after the cluster was created (using

cmapplyconf), a vgcfgrestore command of this form will restore

the cluster lock structure:

# vgcfgrestore -n vglock /dev/rdsk/cxtxdx

2. 使用cminitlock工具（不影响cluster的up状态）

Command usage: cminitlock [-v] [-t] vg_name pv_name

-t Test the cluster lock only.

-v Verbose output.

3. 重新派发。

对于老版本，The cluster must be halted for cmapplyconf to install the cluster lock

structure.

4. 新版本的MC/SG，可以使用cmdisklock。

If you restore or recreate the volume group for the lock disk and you need

to re-create the cluster lock (for example if no vgcfgbackup is available),

you can run cmdisklock to re-create the lock.

cmdisklock reset /dev/rdsk/cxtxdx

cmdisklock checks that the specified device is not in use by LVM, VxVM,

ASM, or the file system, and will fail if the device has a label marking it

as in use by any of those subsystems.

cmdisklock -f overrides this check.

CAUTION You are responsible for determining that the device is not being used by

any subsystem on any node connected to the device before using

cmdisklock -f. If you use cmdisklock -f without taking this

precaution, you could lose data.

附录：

Determine if a disk has a cluster lock structure loaded.

Perform the command on a cluster lock disk. An example of this command follows:

# echo '0x2084?4D' | adb /dev/dsk/c0t2d0

2084: 1 4194145 1010590466 256

^ ^^^ ^^^ ^^^

(lock flag) (lock location) (clusterID) (activation/

1=initialized, configured mode)

0=uninitialized

The 1 in the second column indicates that this disk is a cluster lock disk.