サーバー調達品質の復号化 – 安定性要求編
Allion Labs / James Ou 本連載企画ではサーバー調達における品質の三大要件は、品質基盤(仕様要件)、ユーザーエクスペリエンス(性能要件)、メンテナンス費用(安定性要件)等の3つの側面に対応しているかどうかを解説していきたいと思います。前回の仕様要求編でユーザーシナリオから仕様要求、直面する課題とテスト効率できるテストツールを紹介しました。今回では、サーバーの安定性のニーズについて説明します。 サーバーを安定稼働するには、信頼性テスト用のウォークインチャンバー(Walk-in Chamber)が欠かせない 5G、AI、クラウドコンピューティング、クラウドOTT (Over-the-top) などのアプリケーションサービスの台頭により、これらのアプリケーションは、サーバー自体、つまり高速且つ大容量のハードウェアを基礎としています。高速とは、CPUの動作速度、GPUの動作速度、高速ネットワーク伝送速度またはストレージメディアへのアクセス速度等を指し、高容量とは、メモリ容量やストレージメディアの容量をそれぞれ表しています。 これらの高速アプリケーション関連サービスが継続して生まれていることから、サーバーの消費電力も増加の一途を辿っており、以前は2KWほどの電力消費量が一般的だったのが、現在ではサーバー1台あたり10KWを超えています。高速化と高消費電力化に伴う主な問題は、熱エネルギーの発生と速度の不安定性であるため、サーバーの安定性ニーズとして、温度あるいは温湿度の信頼性テストが特に重要視されています。 従来のサーバー信頼性テストはスタンドアロン方式で実施されていましたが、新しいアプリケーションの導入とコンセプトの変更により、アプリケーションレベルからサーバー信頼性テストが求められるようになりました。アプリケーションレベルの信頼性テストと従来のスタンドアロンの信頼性テストは、両方とも動作温度の最高温度と最低温度の設定条件が同じですが、サーバーグループのアーキテクチャと、シミュレーションされたアプリケーションサービスを実行するストレステストソフトウェアが最大の違いです。 アーキテクチャのアプリケーションレベルでのサーバーグループは、通常ラック(Rack)単位で構築され(複数のサーバーが組み込まれた状態で)、ラックの高さも初期の42Uから現在の48Uや、より新しい52Uまでであり、また数量も1から3までとさまざまです。上記の高電力消費とラック数等の条件を組み合わせると、信頼性テストに使用されるウォークインチャンバー(Walk-in Chamber)には、非常に高いしきい値要件が課せられます。まず、冷却能力はラックサーバー全体が生成する総熱量を上回らなければならないこと、次に内部の空間がラック全体に収まる必要があること、最後に、運搬重量はラックサーバー全体の総重量を満たす必要があります。 [...]