VMware / Microsoft 製品はこう使う。

好きなことを好きに描く.

ESXi5.x以降で運用中にデータストアをアンマウントするときはきちんとした手順でお願いします。

ESXiを運用していると、Storage 側で仮想ボリュームを切り出したり、
コピーしたり、スナップショットを取得したり、
いろいろなことをしながら運用すると思います。

あるあるかなと思います。

その中でたまにオペレーションミスか勘違いなのかはわかりませんが、
データストアをきちんとアンマウントせずに、Storage側でボリュームを削除したり、
アンマウントする前にStorage側からESXi ホストにボリュームを
見せないように設定変更してしまったりして、人為的ミスによって障害が起こることが少なくありません。

 

そのため、今回はきちんとアンマウントする方法をご紹介します。

 

「40GB-Store」をアンマウントしたいと思います。

f:id:japan-vmware:20161207010249p:plain

 

データストアを右クリックし、「アンマウント」をクリックします。

f:id:japan-vmware:20161207010404p:plain

 

チェックが入ります。「OK」をクリックします。

f:id:japan-vmware:20161207010456p:plain

 

タスクが完了するとグレーアウトします。
ここまででオワリと思いがちですが、まだ作業は残っています。

f:id:japan-vmware:20161207011043p:plain


「デバイス」をクリックします。

f:id:japan-vmware:20161207011232p:plain


上記でアンマウントしたデータストアと対応する デバイスを右クリックし、
「分離」をクリックします。

f:id:japan-vmware:20161207011324p:plain

 

チェックが入ります。

f:id:japan-vmware:20161207011720p:plain

 

グレーアウトしました。

f:id:japan-vmware:20161207012415p:plain

 

ここまでがきちんとしたESXiアンマウント作業になります。

このあと、Stoarge側からESXiに対してボリュームを見せないように設定変更しすることになります。

 

■きちんとした作業をしないといけない理由

きちんとESXiからボリュームをアンマウントせずにStorage側から、
ボリュームを見せないようにしたり、ボリュームを削除してしまったりすると、
ESXiホストは、存在しないLUN(ボリューム)を探し続けている状況になります。

ESXiホストは、存在しないLUNを探し続けている状況が続くと、
APD(All Path Down)やPDL(Permanent Device Loss)が起き、
いずれはすべてのデータストアが見れない状況となったりします。


この状況は、VMware KB 2081089 の内容が該当します。

 

vSphere 5.x での永続的なデバイスの損失 (PDL) と全パス ダウン (APD) (2081089)
http://kb.vmware.com/kb/2081089

私が書いた過去のエントリだと ↓ になります。

ESXi の APD(All-path-Down)はご存知でしょうか。 - 自由人なエンジニアの備忘録

 
APDになるとvmkernel.log にこんなログが出たりします。
2015-XX-XXT1X:01:38.488Z cpu2:329XX)ScsiDevice: 4195: Device naa.6000eb3XXXXXXXXXXXXXXXXXX is Out of APD; token num:1
2015-XX-XXT1X:01:38.489Z cpu2:329XX)StorageApdHandler: 912: APD Exit for ident [naa.6000eb3XXXXXXXXXXXXXXX]!

また、ESXiホストが存在しないLUNを探し続けると連携している
その他のプロセスにも影響が出てきたりもします。

そのため、ESXi上にはvCenter とやり取りを行う vpxa というプロセスが存在しますが、きちんと動作しなくなり、vCenterから見ると [応答なし] になったり、
SSHログインができなくなったり、いろいろなところで不可解な挙動が発生します。

 

このような自体にならないよう注意を払って作業をしてほしいところです。

 

もし、間違えて何もESXi側で操作をしないままStorage 側でボリュームを削除してしまったら、
早い段階でESXiの再起動を実施することをお勧めします。
存在しないLUNを探し続けている状況は、ESXiホストを再起動することで解消するためです。再起動時に存在しないパス(正常に接続されないパス)はクリアされます。

 

障害がなくなることを祈ります!