[UCS ME] UCS M142 CPU 及び CPU Heatsink 交換手順

ドキュメント

2016/04/22 - 04:39
1月 8th, 2016
User Badges:
  • Cisco Employee,

[交換時にオーダーが必要なツール]

Scenario 1 : Heatsinkを再利用する場合

 - Heat sink cleaning kit (UCSX-HSCK=)
 - Thermal grease kit (UCS-CPU-GREASE3= [白いキャップ])
 - Intel CPU Pick-n-Place tool for E3 CPUs (UCS-CPU-E3-PNP=)

Scenario 2 : Heatsinkを交換する場合

 - Heat sink (UCS-HS-E3-M4-F=)
 - Heat sink cleaning kit (UCSX-HSCK=)
 - Intel CPU Pick-n-Place tool for E3 CPUs (UCS-CPU-E3-PNP=)

 ※本作業には、以下のページのアニメーションも有用ですので、ご参照ください。
  Video: Removing and Installing a CPU and Heat Sink on an Intel Xeon Processor E5-2600 Series
  http://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/hw/e5-2600/Build_EP.html


[作業手順]

- お客様作業 (FE作業前)
1. 該当サーバーおよび同カートリッジ内のもう一方のサーバーの両方をシャットダウンし、電源を停止します。

1-1. UCS Manager にログインします。
1-2. Equipment タブ に移動し、 Chassis -> Chassis<該当の番号> -> Cartridges -> Cartridge <該当の番号> -> Servers -> Server <該当の番号> に移動します。
1-3. 現在の状態をFault Summary欄にて確認します。【作業後の状態と比較するためメモしておきます】
1-4. 右側の画面の Actions より、Shutdown Server を実行します。
1-5. Gracefully shutdown OS にチェックが入っている事を確認し OK をクリックします。

1

1-6. Overall Status が Power Off となっている事を確認します。

2


- FE作業
2. 交換前の確認作業
2-1. UCS Manager の Equipment タブ に移動し、 Chassis -> Chassis<該当の番号> -> Cartridges -> Cartridge <該当の番号> -> Servers -> Server <該当の番号> に移動します。

2-2. 右側の画面の Serial: より交換対象のシリアル番号が正しい事を確認します。

2-3. 該当サーバーを選択し、右の画面の Overall status 等のステータスを確認します。

2-4.該当サーバーの Faults タブの内容を確認します。

Faults の Code を記録するか、画面のキャプチャを取得しておいて下さい。交換終了後、これらの Faults が消えている事を確認します。Faults Code F0479/F0283 の VIF がダウンしているというエラーについては、OSが起動してない状態で記録されます。よって交換後、OSが起動してない状態でこれらの Faults が出力されることは正常な状態となります。

3. 該当カートリッジの物理的な位置を確認するために、Locator LED を ON にします。
  (該当カートリッジ内のどちらか一方のサーバーに対して以下を実施します)

3-1. UCS Manager の Equipment タブ に移動し、 Chassis -> Chassis<該当の番号> -> Cartridges -> Cartridge <該当の番号> -> Servers -> Server <該当の番号> に移動します。
3-2. 右の画面の Actions より、"Turn on Locator LED" を実行します。

6
3-3. OK をクリックします。
3-4. Locator LED が以下のようになっている事を確認します。

7
3-5. 目視で Locator LED が青く光っている事を確認し、交換対象のカードリッジの場所を特定します。


4.   該当サーバーおよび同カートリッジ内のもう一方のサーバーの両方に適用されているサービスプロファイルを Disassociate します。

4-1. UCS Manager の Equipment タブ に移動し、 Chassis -> Chassis<該当の番号> -> Cartridges -> Cartridge <該当の番号> -> Servers -> Server <該当の番号> に移動します。
4-2. Service Profile: から適用済みのサービスプロファイルをクリックし、新しいウィンドウを立ち上げます。この際、後にサービスプロファイルを適用しなおす必要があるため、サービスプロファイル名をメモしておきます。

8
4-3. 新しいウィンドウの Actions から "Disassociate Service Profile" を実行します。

9
4-4. はい、をクリックします。
4-5. Overall Status: が Unassociated になっている事を確認します。
10

4-6. 上記4-1.~4-5.を同カートリッジ内のもう一方のサーバーに対しても行います。

5.   該当カートリッジを Decommission します。

5-1. UCS Manager の Equipment タブ に移動し、 Chassis -> Chassis<該当の番号> -> Cartridges -> Cartridge <該当の番号> -> Servers -> Server <該当の番号> に移動
5-2. 右の画面の Actions より、"Server Maintenance" を実行します。
5-3. ポップアップウィンドウより、Decommission を選択し、OKを実行します。

11
5-4. はい、をクリックします。
5-5. OK、をクリックします。
5-6. 以下の画面のように、Server <該当の番号> に  マークがついている事を確認します。
12
 


6.   該当カートリッジをシャーシから引き抜きます。

6-1. 交換作業に備えて静電対策を行って下さい(静電マットの上にサーバーを置く、静電リストバンドを装着しアースを取る等)。
6-2. カートリッジパワーLED(真ん中のLED)がオレンジもしくは消灯している事を確認します。

6-3. カートリッジ左上のイジェクトレバーを手前に引き、カートリッジを引き抜きます。


 


7.   該当カートリッジの天板を開けます。この時点で確実に静電対策を実施して下さい。

7-1. 以下の図を参考に天板を開けます。

①のボタンをおしながら、②の方向に天板を引っ張ります。

 


8. 交換するCPUの位置を確認します。

    [ 前面側がCPU2(Server 2)、奥側がCPU1(Server 1)になります ]

9. プラスドライバーを使用し、交換するCPUに載っているHeatsinkの3本のネジ(下図①)を緩め、
  垂直に持ち上げて外します。
  Heatsinkを傷つけないよう、3本のネジを順番に少しづつ緩めていきます。
  下図、③のレバーをラッチより外し、④のCPUカバーを開きます。
 

10. CPUをソケットから外します。
  a. 事前にPick-n-Place ツールのリリースボタン(②)を押してから、
    CPUの上にPick-n-Place ツールをセットします。
    この時、三角マーク(③)の向きを
CPUソケットと合わせるようにセットします。
  b. ラッチレバー(①)をツマみ、CPUを掴みます。
  c. ツールごとCPUを真上に引き上げ、CPUソケットから外します。
  d. ツールを逆さにしCPU裏面を上に向け、再度リリースボタン(②)を押し、
    ツールからCPUを外します。 CPUは帯電防止シート上に置きます。
 

 

11. CPU, Heatsinkから付着した古いグリースを除去します。
  a. CPUとHeatsinkを同時に交換した場合、クリーニングキットは必要ありません。
  b. CPUのみ交換した場合、Heatsinkを再利用するため、クリーニングキットを使用して
    Heatsinkに付着したグリースを除去してください。
  c. Heatsinkのみ交換した場合、CPUをツールから一旦外し、クリーニングキットを使用して付着したグリースを
    除去してください。

  <注意>
  交換用カートリッジに装着する際、CPUのピンにグリースが付着していないことを確認してください。
  ピンにグリースが付着していると、CPUが認識されず、サーバが起動出来ない原因となります。
  詳しい情報は下記弊社資料をご参照ください。

   - UCS CPU サーマルグリースの除去と塗布
    https://supportforums.cisco.com/ja/document/12327486


<新しいCPUの取り付け>
 交換前に、以下の記事のように、CPUに刻印されているCPU型番を確認し、
 交換前のものと同じであることを目視確認してください。
 https://supportforums.cisco.com/ja/document/110446

12. 新CPUをツールに装着します。
  a. 新しいCPUを上記9 d.で逆さにしたツールに三角のレジストレーションマークを合わせるようにハメ込みます。
  b. ラッチレバー(上図①)をツマみ、CPUを掴みます。
 

13. CPUをCPUソケットに搭載します。
  a. ツールの三角マークの位置をソケットと合わせ、CPUをソケットに搭載します。
  b. リリースボタンを押し、CPUをソケットに装着します。
  c. CPUカバー、ラッチを締めます。(下図①→②)

14. Heatsinkを搭載します。
  a. CPUにグリースを塗布し、その上からHeatsinkを搭載します。(下図③)
    詳細は以下の記事を参照してください。
     - UCS CPU サーマルグリースの除去と塗布
      https://supportforums.cisco.com/ja/document/12327486

    ※Heatsinkを交換する際は、グリースの塗布は不要です。
  b. 方向を間違えないようにHeatsinkを搭載し、ネジを順番に少しづつ締めます。(下図④)
 

15. カートリッジの天板を元に戻します。

16. 元のシャーシのスロットにカートリッジを設置し直します。

17.   Re-Acknowledge を実施します。

17-1. となっているサーバーを選択し、"Re-Acknowledge Slot" を実行、はい、をクリックします。
15


17-2. OK、をクリックします。

この際、UCS Manager の該当スロットが以下のように Discovery になっている事を確認します。
16
Re-Acknowledge プロセスの進捗については FSM タブからも確認できます。
Re-Acknowledge プロセスについては10分以上かかることもございます。

17
正常に Re-Acknowledge が終了すると以下のように Overall Status が Unassociated になり、且つ Fault Summary にエラーが出力されてない状態となります。

18

18.  該当サーバーおよび同カートリッジ内のもう一方のサーバーの両方に適用されていたサービスプロファイルを associate します。

18-1. UCS Manager の Equipment タブ に移動し、 Chassis -> Chassis<該当の番号> -> Cartridges -> Cartridge <該当の番号> -> Servers -> Server <該当の番号> に移動します。
18-2. 右側の General タブより、"Associate Service Profile" を選択します。
18-3. 4-2. でメモしておいたサービスプロファイルを選択し、OK をクリックします。
18-4. リブートが発生するという内容の警告がでるが、はい、を選択します。

21
18-5. OK、をクリックします。
18-6. UCS Manager の右側の画面より、General タブを選択、Status Detail の Assoc State: が Associated になっている事を確認します。
18-7. Fault Summary でエラーが発生してない事を確認します。
    【1-3.でメモした状態と比較し、作業前以外のFaultが出力されていないことを確認します】
22

18-8. 上記18-1.~18-7.を同カートリッジ内のもう一方のサーバーに対しても行います。


[作業後]

- FE作業
1. UCS Manager にログインします。
  UCSMのEquipmentタブ 配下、該当サーバーを選択します。
   (Equipment タブ に移動し、 Chassis -> Chassis<該当の番号> -> Cartridges -> Cartridge <該当の番号> -> Servers -> Server <該当の番号> )
  右画面Inventoryタブ配下のCPUsタブを選択します。
  Overall status,Operability等 ステータスを確認します。



- お客様作業 (FE作業後)

2. 該当サーバーにて、OSをブートさせます。
  Equipment タブ に移動し、 Chassis -> Chassis<該当の番号> -> Cartridges -> Cartridge <該当の番号> -> Servers -> Server <該当の番号> に移動します。
  右画面 GeneralタブのAction項目内 Boot Server をクリック、確認画面で「OK」をクリック)
23

3. OSレベルの動作確認を実施します。




[参考資料]

UCS M142 のLEDについて


 ①  Cartridge Identification LED

・青 位置特定機能が実行中
・消灯 位置特定機能がOFF

 ②  Server 1 Power LED

・緑 CPUサブシステムがメインパワーモードで動作中
・オレンジ CPUサブシステムがスタンバイモードで動作中

 ③ Server 1 Health LED

・緑 正常な状態
・オレンジ カードリッジに何らかの障害が発生している状態

 ④ Server 2 Power LED

・緑 CPUサブシステムがメインパワーモードで動作中
・オレンジ CPUサブシステムがスタンバイモードで動作中

 ⑤ Server 2 Health LED

・緑 正常な状態
・オレンジ カードリッジに何らかの障害が発生している状態


 - Cisco UCS M-Series Modular Servers - Install and Upgrade Guides
   - Cisco UCS M142 Cartridge Service Note

Loading.

アクション

このドキュメントについて