シスコサポートコミュニティ
キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 

2/16 Webcast "速習! 実例に基づくUCSトラブルシューティングとその勘所" Q&Aドキュメント

資料ダウンロード   ディスカッションに参加する   録画を観る   QAを読む

Q1.今回の実戦で解析されたtechnical support fileを入手することは可能でしょうか?

実例ということで、お客様システムで使用されているNode name, IP/MAC/WWN等の情報が含まれておりますため、スライドでは伏せるべき箇所はマスキングしておりますが、全てマスキングしての提供は難しいため、申し訳ございませんが提供することが出来ません。

Q2.(P.34)カタログとは何ですか?

パーツの詳細情報が格納されているファイルです。カタログにないパーツが搭載されていると、そのパーツの詳細な情報がUCSM上で表示されません。スライドでもリンクを紹介しておりますが、以下の記事もご参照ください。

Q3.(P.35)Board ControllerのFirmwareとは何ですか?

マザーボードのFirmwareになります。

Q4.78ページの図の中にあるBPとは何でしょうか?

Backplane の略となります。Midplane と呼ばれることもあります。
UCSブレードサーバはフロントから、IOMはリアから中央にある同じBackplaneに接続されます。
両者間の通信は、プリント基板であるBackplane上のパターン回路を通じて行われます。

Q5.TCAMとは何ですか

Ternary CAM の略となります。L3スイッチやルータ、MDS等のルーティングが必要なプロダクトで使用されます。簡単に言ってしまえば、MDSであれば「○○というデバイスに行くまでには、これら経路を通る手段があり、その際、Band Width などからこれぐらいのコストが必要となる」 といったルーティングのための情報などが入っているメモリとなります。 今回の事例では、MDSへPLOGIしてきたvHBAが一旦オフラインになった際、そのエントリーはdatabaseから削除したがカウント数をdecrement(減少)させられず、増える一方となってしまったことで、見かけ上、MDSのTCAMテーブルがこれ以上のエントリーの登録が出来ない状況に陥ったことが問題の発端となります。

Q6.以下のコマンドに関する説明がそれぞれ欲しいです。
P113
$ grep "" discarding a stimulus"" svc_sam_dme.log|wc -l
25370
P123
$ grep DOWN syslog|grep lif6|wc -l
1261

[P113のコマンド]
まず、grepコマンドでsvc_sam_dme.logファイルの中から""discarding a stimulus""というキーワードを含む行を抽出します。その後、パイプを通して、この結果に対し、WCコマンドというWord Count コマンドを使い、-lオプションを付けてこの行数(ライン数)を数えます。 結果、25370もの行に""discarding a stimulus""というキーワードが載っていたということになります。

[P123のコマンド]
まず、grepコマンドでsyslogファイルの中から""DOWN""というキーワードを含む行を抽出します。更に、この中からlif6というキーワードを含む行を絞り込みます。最後に、WCコマンドに-lオプションを付け、この行数をカウントしております。
集計の結果、1261の行に、""DOWN""と""lif6""が2つとも含まれており、「ログに載っていたlif6のダウンが発生した回数は1261回」だと理解できます。

Q7.116ページ のコマンドがよく分かりません。
$ grep "Send fault SNMP trap:" svc_sam_dme.log|awk '{print $15}'|sort|uniq -c|sort -rn
26 dn=sys/chassis-1/blade-3/fabric-A/path-1/vc-1075
25 dn=sys/chassis-3/blade-7/fabric-B/path-1/vc-837
<以下、省略>

まず、grepコマンドでsvc_sam_dme.logファイルの中から"Send fault SNMP trap:"というキーワードを含む行を抽出します。
これをパイプに通し、awkコマンドで処理をさせます。awkは、スペースで区切られた○番目の要素に対して操作をしたい場合に使用します。この場合、print &15 で、15番目の要素を表示し、次から続くsortで一旦辞書順に並び替えを行い、uniq -c で先頭に重複している行を一纏めにし、重複した行数を先頭に付加しています。
最後に、sort -rn (r=降順, n=数値は数値として扱ってソート)で重複が多い行順にソートをし直しています。

Q8.P116ページのような確認をするために、どのようなツールを使用していますか?

Cygwinを使用しております。
https://www.cygwin.com/

Q9.49ページの CPUのuncore部とは何でしょうか?

CPUはコアとアンコアに分かれます。コアは、デュアル・クアッドコア などと呼ばれるように、実行エンジンであり、アンコアはそれ以外となります。
アンコアには、CPUのキャッシュやメモリコントローラ、最近のものですと、PCIeコントローラなどが搭載されております

Q10.78ページのG_Portとは、どのようなポートでしょうか?

G-Port = Generic port の略です。
EポートもしくはFポートとして接続可能なファイバチャネルスイッチの汎用(Generic)ポートで、Gポートは、スイッチポートの初期化時に動作モードを決定することができます。対向のNポートに接続された場合はFポートとなり、Eポートに接続された場合はEポートとなります。

Q11. 今回、SANネットワークに関する事例を頂きましたが、UCSのネットワークに関するトラブルシュートは開催していただけるのでしょうか。

今回は、時間の制約、及び比較的最近発生した障害の事例ということで、私の記憶に新しく、良い事例がありましたSANネットワークの事例につて紹介しましたが、機会があれば、例えば次回のWebcast、他のトレーニング機会で私や他のUCSサポートチームメンバーがトレーニングする機会を設けられたらと思っております。

Q12. ページ16と22において、VICのtech-supportは電源をonにしないと取れないということですが、電源onにせずにどうにか取れないでしょうか。

残念ながら取れません。
VICは、スタンバイパワーではイニシャライズのシーケンスが走りません。VICのtech-supportが必要となる場合は、サーバへのEtherネットワーク、SANネットワークが繋がらないケースですので、イニシャライズ後にIOMやSAN/Ether switch 側からVIC上に作成されたvNICやvHBAなどの仮想インタフェースが確認できるか、vNICやvHBAがMAC-Address-table やFLOGI database、FCNSに登録されているか否かを確認することが切り分けには必要ですので、いずれにせよ、電源をonにした状態で生の情報を取得することが重要となります。

94
閲覧回数
0
いいね!
0
コメント