Tag Archives: 冷却

冷却ファンがあってもシステムは継続的に発熱することを知っていますか?

Allion Labs  技術の成長に伴い、データの保存、計算、送信などがますます増えています。したがって、高密度のデータセンターやサーバーの設置は、ビジネスインフラストラクチャーや国家インフラストラクチャーにとって非常に重要です。IoT(モノのインターネット)、クラウドストレージ、ビッグデータの利用、人工知能、5Gなどの分野の急速な発展に伴い、データセンターの構築と需要もますます増大するでしょう。そして、データセンターは年間を通して稼働し、高密度の廃熱が発生します。これらの廃熱は、各ラックのいくつかのサーバーによって主に生成されます。効果的に熱を放散しないと、システムが過熱して正常に動作しなくなる可能性があります。そのため、データセンターのサーバーのパフォーマンスの安定性にとって、ファンや水冷を使用して熱を放散させることは非常に重要です。 サーバーファンが過熱した場合の潜在的なリスク 高温環境で長時間動作すると、サーバーファンに使用されるプラスチック材料が熱によって脆くなり、破損する可能性があります。ファンの効率が低下すると、サーバーの冷却効率に影響し、内部コンポーネントが過熱し、コンポーネントが損傷します。コンポーネントの損傷は、サーバーの正常な動作を妨げる可能性があり、データの損失やシステムのクラッシュを引き起こすことがあります。この結果、アプリケーションサービスの中断、顧客データの損失など、ユーザーエクスペリエンスにネガティブな影響を与える可能性があります。 事例説明 アリオンの多年にわたる実験経験に基づき、以下の実際のケースを説明します。  背景  製品が長時間の信頼性検証を行っていると、ファンは回転し続けていますが、そのプラスチック材料は脆くなり、裂け目が現れました。そのため、ファンが動作していても、このような現象を問題と見なしました。  アリオンの3つの主要な解決策  アリオンは、サーバーファンの信頼性検証に関する豊富なプロジェクト経験を有しており、サービスを提供するための解決策を設計しました。 15個のファンを同時にテストできるモジュール式のファン専用テストフィクスチャを独自に設計および開発しました。 また、アリオンは、15個のファンを3つのグループに仮想化し、それぞれがFull power modeまたはPower [...]

サーバーの冷却効果が不十分?専門家がおすすめする方法はコレ!(その3)

Allion Labs  前回の記事「サーバーの冷却効果が不十分?専門家がおすすめする方法はコレ!(その2)」では、アリオンがサーバーの冷却テストを行うのをどのように支援し、テスト結果をもとにどのように改善と評価を行うかについて説明しました。 この記事では、冷却構造にある3つのキーポイントの1つであるGPUエアガイドに焦点を当て、サーバーの冷却に与える影響について紹介します。 近年、サーバーの冷却方式は主に「空冷式」と「液体冷却式」を採用しています。空冷式は空気の対流に依存しますが、液体冷却式は熱を運び去るために流体の流れを利用します。空冷システムでは、特にエアフローを効果的に導くためにエアダクトを慎重に設計する必要があり、これは全体の冷却性能にとって極めて重要です。サーバーの開発中、お客様は通常、初期バージョンのエアダクトを提供して冷却の初期検証を行い、テストデータに基づいてエアダクトを修正します。 事例説明 GPUの吸気口からの冷却エアフローの分散が不均一である(予定された経路は赤い矢印で示されていますが、一部のエアフローは青い矢印で示された側から漏れる可能性があります)、これはマシンの冷却効率の低下を引き起こし、それにより筐体内の温度が上昇し、関連部品の高温による正常な動作の問題が発生する可能性があります。 エアガイドにバッフルを追加し、その後検証を行うことで、この改善策の実現可能性をテストデータの分析によって確認できます。検証結果が得られると、お客様はこの変更を後続のエアガイド設計に活用し、サーバーの冷却効率をさらに向上させます。このような効果的な冷却技術の最適化は、安定した動作条件を維持するだけでなく、サーバーの全体的な性能と信頼性を向上させます。 アリオンのサーバー冷却アーキテクチャへの関心は、長期的な安定した環境を提供するテストだけでなく、タイムリーなフィードバックにも反映されています。冷却アーキテクチャに問題や懸念がある場合、当社は即座にこれらの情報をお客様にフィードバックし、可能性のある課題の解決を支援します。 また、当社は改善プロセスに積極的に参加し、多年にわたる豊富な経験を活かして、お客様に実用的な提案を行っています。これには、さまざまな冷却アーキテクチャの検証を短期間で完了し、改善ソリューションの実装が製品の生産サイクルに影響を与えないようにすることが含まれます。アリオンはお客様に高品質の冷却ソリューションを迅速かつ効果的に提供し、製品の製造プロセスを妨げることなく、彼らが優れたサーバー製品を自信を持って発売できるようにします。この積極的な姿勢は、技術革新への取り組みだけでなく、お客様のニーズに対する迅速な対応を示しています。 アリオンは豊富な経験だけでなく、関連設備と環境を完備しています。13KWから65KWまでの熱負荷を持つさまざまなサーバー冷却要件に適したウォークインチャンバーを備えており、単一機、複数機、およびキャビネット構成の冷却検証サービスを提供できます。 1. 13KW Walk-in Chamber [...]

サーバーの冷却効果が不十分?専門家がおすすめする方法はコレ!(その2)

Allion Labs  前回の記事では、サーバーの冷却効果がシステムの安定性に非常に重要であることに触れ、冷却効果に対してアリオンが提供するサポートとサービスについて説明しました。 今回は、アリオンの評価方法を詳しく説明するとともに、テストで発見された問題と改善されたデータについても、具体的な例を挙げて説明します。 AIサーバーの冷却構造にある3つの重要なポイント: 1. GPUエアガイド:異なるGPUエアガイド構造を試し、サーバーの吸気量を集中させ、GPUの冷却効果を高めます。 2. GPUトレイ:GPUトレイの構造を変更し、出力面積の大きさがGPUの冷却に及ぼす影響の程度を検証します。 3. CPUエアガイド:CPUエアガイドの隙間を閉じて空気の流れを集中させ、CPUの冷却効果を検証します。 アリオンの専門家チームがまず現状をヒアリングし、実際に冷却構造を確認したうえで、温度監視用の熱電対ポイントの配置を行います。配置が完了したら、加圧プログラムの実行と温度データの収集を開始します。加圧プロセスには、さまざまな部品の加圧(例:GPUまたはCPU)や加圧の程度(例:30%〜100%)があります。同時にファンの回転速度を制御したり、人為的にファンに故障を発生させ、さまざまなシナリオをシミュレーションして関連データを収集して分析し、突発的な状況が発生しても、サーバーが冷却の安定性を維持できるようにします。 事例紹介 プロジェクトの一例を挙げると、アリオンは、このプロジェクトについて2つの冷却構造のデータ収集を試み、分析した結果、冷却構造1のパフォーマンスが想定通りだったことを確認しました。テスト結果は以下の図のとおりです。 データ収集の過程で、PSUの配置ポイントで熱電対データを収集したところ、温度の曲線が中心に近いほど温度が高くなるのではなく、2つのポイントが逆の状態を示すという異常な現象も発見しました。分析およびお客様との協議の結果、実際の原因は熱風の逆流によるものであり、発生場所はPSU近くのケース側面または隙間であることが判明しました。データ情報とその過程は以下のとおりです。 改善前PSU温度異常:中心に近いTemperature_2の温度が、外側のTemperature_1よりも低い 可能な原因:機構設計による蓄熱/熱の逆流などの冷却問題が原因と考えられます。 改善後、システムのPSU温度は正常になりました:PSU中心のTemperature_3の温度 [...]

サーバーの冷却効果が不十分?専門家がおすすめする方法はコレ!

Allion Labs  今年はAI技術に関する話題が絶えず、関連する利用サービスが次々に登場しています。AIのトレンドはすでに明確な方向性があり、AIサーバーの出荷量が急速に増加しています。AIサーバーは非常に高い計算能力を持つ一方で、それに伴って大量の熱エネルギーが発生するため、冷却効果は非常に重要な問題です。AIサーバーだけに限らず、IntelやAMDのCPUスペックも絶えず向上しているため、非AI用途のサーバーでも冷却の問題は軽視できない潜在的な問題となっています。 それでも、現在の液体冷却技術には、高い構築コスト、筐体、レール、水路、データセンターなどの項目で再設計しなければならず、メンテナンススタッフも再訓練が必要になるなど、克服すべき課題がまだたくさんあるため、現在市場に出荷されているサーバーの主流は、依然として空冷方式を採用しているのがほとんどです。 ワンストップのカスタマイズコンサルティングサービスで、サーバーの冷却効果を劇的に改善 サーバーの冷却性能は空冷放熱構造と冷却材によって決まります。冷却性能が不十分な場合、サーバーの温度は上昇し続け、コンピュータルームのエアコン温度を効果的に下げることができなければ、過熱によるサーバーの速度低下や強制シャットダウンなどの保護措置が起動します。 保護措置が有効になると、外部からの影響により利用サービスのパフォーマンスが低下し、ユーザーが反応の遅さを感じたり、さらには強制シャットダウンなどによってサービスが中断してしまうなど、ユーザーエクスペリエンスが低下してしまいます。 サーバーの冷却性能の評価において、アリオンは豊富な経験と専門的な技術チームを備えており、加えてさまざまな冷却構造の構築およびデータ収集をサポートし、色々な冷却材の包括的な分析と評価をお客様に提供することができます。サーバー製品のさまざまなニーズに応じて、アリオンはカスタマイズされたコンサルティングサービスをワンストップで提供し、機構、電気、高周波分野を組み合わせるなど、環境テスト項目をカバーしています。この他にも、サービスプロセス中に、製品のさまざまなシステムインターフェース、コマンド操作、ソフトウェアの更新、ハードウェアの交換といったテストの詳細についても、関連する技術力と実行経験を持っているだけでなく、関連するテストの提案とコンサルティングを提供し、お客様のさまざまなニーズに応えることができます。 事例紹介 プロジェクトの一例を挙げると、アリオンはお客様の冷却材の交換をサポートし、収集したデータを整理してお客様に提供し、お客様はそのデータを通じて冷却モジュールの最適な組み合わせを選択することができました。さまざまな冷却材のデータを収集した結果、CPUの最大温度差は5度に達することが判明し、これにより、さまざまな材料によって冷却性能に及ぼす影響に違いが出ることをお客様にご理解いただけました。 また、下の図で示したプロジェクトのように、冷却構造の選定、微調整、冷却材の選択を行った結果、アリオンはサーバー全体の温度を約9.3度下げ、お客様が要求していた基準を達成することができました。 Faster、Easier、Better ― 最も信頼できるサーバー検証コンサルタント アリオンはIT分野で30年以上のテスト検証経験を積み重ね、数千万もの検証データベースを構築してきました。包括的なスマートテストのアドバイスとその分析により、アリオンは総合的なテストソリューションを提供し、お客様が製品の品質を厳格に管理し、より短時間で、より正確な方法で製品品質を向上させるお手伝いをします。  Faster ー より迅速  アリオンは、多種多様な仕様の大型ウォークインサーモスタットも含め豊富なテスト環境と機器設備が備えています。熱負荷は13KW〜65KWまで、内部のスペースはサーバー1台から48Uラック3台まで対応しており、いずれも自由にお選びいただけます。 [...]