ハードディスクの安定性や寿命を判断するのに役立つ MTBFとAFRについて解説したいと思います。Seagateさんの「信頼性指標を理解する」というレポートが詳しいのでそれを元にアレンジを加えています。
Mean Time Between Failure(MTBF) 平均故障間隔とは?
MTBFはハードディスクの故障率の目安として使用されています。HDDのカタログをみている時にMTBF100万時間!とか書かれているのを目にされるかもしれまえん。
この時 MTBFはよく誤解されます。 たとえば、ここにMTBFが100万時間と記載されているHDDがあったとしましょう。
一見 「こりゃすごい。100年以上ドライブを動作させることができるぞ!」と思ってしまいそうですが、そんなに動きません。
一体どういうことでしょうか?
MTBFの計算方式
MTBFというのは 大量のHDDを動かして その合計時間をエラー数で割って出します。
例えば1000台のドライブを1000時間動かして、そのうち5台で故障が発生したとします。すると計算式は1000×1000÷5となりMTBFは20万時間となります。
一見問題なさそうですが、実はMTBFが計測されるのは HDDの初期不良が終わって、まともに稼働している時に 測定されるのです。
グラフをみて下さい、縦軸にHDDの故障率 横軸に時間をとっています。
最初の場合は初期不良が多いわけです。(赤点線)しかし時間がたつにつれ 初期不良を起こすHDDは少なくなります。
緑色の線はランダムで起こる故障です。これは一定です。
最後に黄色い線です、時間が経ってドライブが摩耗し始めると、故障率は再び増加していきます。いわゆる寿命です。故障率はこの3つのラインの合計(青線)です。
合計の故障率は風呂釜みたいな形になります。
重要なのは MTBFは ちょうど風呂釜の底の期間だけで 故障が出た回数だけを計測するという事です。初期不良と寿命による故障の割合はだいぶ減っています。
ですのでMTBFはHDDの寿命を示すというよりも、稼働し始めたら、どれくらい安定して動くのかという目安として役立ちます。
ただ、もちろん数値が長いほうが故障が少ないので 品質は良いです。
AFR(Annualized Failure Rate):年間故障率
それでは寿命をみるのに何が役立つのか。
それがAFR(年間故障率)です。
最近のストレージメーカーはMTBF情報に加えて、AFRの情報を公開している事が多いです。
MTBFとAFR。2つの指標は似ていますが、AFRは、1年間のうちに故障する確率を見積もったものなので寿命判断の役に立ちます。
AFRはHDDの返品数を調べて、そこから年間 これくらいになるよねという予想値で計算します。
返品されたHDDのうち 落下など 強い衝撃を受けて壊れたHDDや、間違って取り扱われたHDDは数に含まれません。
AFRは年間の故障率なので、どれくらいの期間 稼働できるか予想するのに役立ちます。
Backblaze社がHDDのAFRを公開してくれているので、故障率の低いHDDを探す時の参考になります。
まとめです。
・MTBFだけで寿命判断は難しい。
・MTBFだけでなく AFRを調べると 寿命判断の参考になりやすい
ご視聴ありがとうございました