Category Archives: Main-Procurement Quality Consultancy

サーバー調達品質の復号化 – 安定性要求編

Allion Labs / James Ou 本連載企画ではサーバー調達における品質の三大要件は、品質基盤(仕様要件)、ユーザーエクスペリエンス(性能要件)、メンテナンス費用(安定性要件)等の3つの側面に対応しているかどうかを解説していきたいと思います。前回の仕様要求編でユーザーシナリオから仕様要求、直面する課題とテスト効率できるテストツールを紹介しました。今回では、サーバーの安定性のニーズについて説明します。 サーバーを安定稼働するには、信頼性テスト用のウォークインチャンバー(Walk-in Chamber)が欠かせない 5G、AI、クラウドコンピューティング、クラウドOTT (Over-the-top) などのアプリケーションサービスの台頭により、これらのアプリケーションは、サーバー自体、つまり高速且つ大容量のハードウェアを基礎としています。高速とは、CPUの動作速度、GPUの動作速度、高速ネットワーク伝送速度またはストレージメディアへのアクセス速度等を指し、高容量とは、メモリ容量やストレージメディアの容量をそれぞれ表しています。 これらの高速アプリケーション関連サービスが継続して生まれていることから、サーバーの消費電力も増加の一途を辿っており、以前は2KWほどの電力消費量が一般的だったのが、現在ではサーバー1台あたり10KWを超えています。高速化と高消費電力化に伴う主な問題は、熱エネルギーの発生と速度の不安定性であるため、サーバーの安定性ニーズとして、温度あるいは温湿度の信頼性テストが特に重要視されています。 従来のサーバー信頼性テストはスタンドアロン方式で実施されていましたが、新しいアプリケーションの導入とコンセプトの変更により、アプリケーションレベルからサーバー信頼性テストが求められるようになりました。アプリケーションレベルの信頼性テストと従来のスタンドアロンの信頼性テストは、両方とも動作温度の最高温度と最低温度の設定条件が同じですが、サーバーグループのアーキテクチャと、シミュレーションされたアプリケーションサービスを実行するストレステストソフトウェアが最大の違いです。 アーキテクチャのアプリケーションレベルでのサーバーグループは、通常ラック(Rack)単位で構築され(複数のサーバーが組み込まれた状態で)、ラックの高さも初期の42Uから現在の48Uや、より新しい52Uまでであり、また数量も1から3までとさまざまです。上記の高電力消費とラック数等の条件を組み合わせると、信頼性テストに使用されるウォークインチャンバー(Walk-in Chamber)には、非常に高いしきい値要件が課せられます。まず、冷却能力はラックサーバー全体が生成する総熱量を上回らなければならないこと、次に内部の空間がラック全体に収まる必要があること、最後に、運搬重量はラックサーバー全体の総重量を満たす必要があります。 [...]

サーバー調達品質の復号化–品質検証のための3つの要件

Allion Labs / James Ou アリオンは、サーバー業界およびアプリケーションシナリオ関連をテーマとした記事をシリーズで作成し、専門コンサルタントの観点から詳細に分析を加え、メーカーや業界の調達部門、クラウドサービス企業等を支援し、より多くの製品が結びつく市場情報とデータを入手してきました。 品質検証の3大要件:仕様、パフォーマンス、安定性 一般的な企業のコンピュータールームやクラウドサービス会社にとって、サーバー製品は最も重要なハードウェアインフラストラクチャであり、調達部門にとっても非常に複雑で難しい製品でもあります。高い単価に加え、様々なアプリケーションシナリオに基づき、それぞれに適合するハードウェアの仕様を策定する必要があります。更に困難なのは、その仕様やパフォーマンス及び安定性が、出荷受入時或いは量産時のサンプリング検査において、要件を満たしているかどうかを確認することです。 しかしながら、サーバー製品の仕様やパフォーマンス、安定性の検証は、企業の品質管理部門や一般的な外部テストラボでは実行できません。これらの検証は、ハードウェアと電気信号の品質の確認、サーバー運用における様々なシナリオパフォーマンス評価、異なる環境条件下での運用安定性をカバーしており、これらの関連するテスト設備とテスト機能分野はそれぞれ異なります。次に、これら3つの要件を検証するために必要な設備と機能について説明します。 サーバーの品質検証–高いスペックを持つ技術ラボがカギ サーバーはIT業界における様々な高い技術仕様を統合した製品であるため、ハードウェアの電気信号品質を検証する際、テクノロジーの最前線にあるラボにしかそのニーズを満たすことができません。 例えば、サーバーの特徴である高速信号と高スループットのデータ伝送について、業界の最新の技術仕様はPCIe Gen5および800G高速イーサネットであり、スループットはそれぞれ63GB /秒(x16)および112GB/秒です。高速信号ボードの設計上の欠陥がある場合、データ通信の速度が低下したり、消費電力が増加したりすることがあります。更にはシステムがランダムに再起動する可能性もあり、サーバーの動きが遅いあるいはフリーズなどの障害が起こると、ユーザー満足度を低下させるだけでなく、最悪の場合、財産の損失、火事といった様々な過失を引き起こす恐れがあります。 このような高速電気信号を測定するには、50/70GHzオシロスコープと32GbpsのBERTを使用し、且つ様々なフォームファクタのテストフィクスチャを使用する必要があり、技術的なハードルは非常に高くなります。 [...]