この記事はopenSUSE Advent Calendar 2020 11日目の記事です。
みなさんこんにちは、HalNi こと Harukaと申します。
MegaRAIDやmdRAIDでのRAIDは、構成ディスクのSMART値の中にある”WHEN_FAILED”のフラグが立った場合にディスクの切り離し・リビルドを行います。
しかしSMART値で言うところのC7や05、代替処理保留中のセクタ数や代替処理済のセクタ数が他のHDDでもカウントアップしていた場合、リビルド中に他のHDDが飛んでストレージがお亡くなりになることも起こり得ます(起こった)
HDDの早期交換を行うためにも、各ディスクの詳細を把握したい場合、直接ディスクのSMART値を読みに行く必要があります
しかし、以前cazydiskinfoを用いてディスクのSMART値を簡単に閲覧する方法を書きましたが、この方法ではMegaRAIDに接続されているHDD・SSDのSMART値は確認できません 汗
(本家?のCrystalDiskInfoは v8.4.0 でMegaRAIDに対応済み)
この場合、smartmontools を使用してSMART値を確認すれば解決できます。
smartmontools はHDDが提供しているSMART情報を取得するツールですが、オンボードSATAコントローラと同じ感覚でMegaRAIDに繋がっているHDDのSMART値も取得できます。
検証環境:
Supermicro X10SLL-F
MegaRAID 9266-8i
openSUSE Leap 15.2
おうちの検証(にも使う)環境
おうちサーバは大部分がopenSUSEで稼働しています