キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 

ACE: passdetect interval が期待通りに動作しない

2013年04月10日(初版)

TAC SR Collection
主な問題 probe failed を検知した後、passdetect interval x passdetect count 経過するよりも前に probe が up となる。
原因

ACE は probe に成功している間は、interval で設定された値を probe の送信間隔として使用します。 (default:120秒)

ACE が probe に失敗している間は、passdetect interval を probe の送信間隔として使用します。 (default:300秒)

passdetect count の default 値は 3 なので、probe が down してから up となるまで 300秒 x 3回 = 15分程度かかるように見えますが、下記のようなタイミングで probe の送信/応答があれば最短 11 分 59 秒で up となります。

00:00:00 probe 送信 ->応答なし

00:00:01 1 秒後 down を検知(open timeout:1秒) -> probe DOWN

00:02:00 probe 送信(interval:120秒) -> 応答あり

00:07:00 probe 送信(passdetect interval:300秒) -> 応答あり

00:12:00 probe 送信(passdetect interval=300秒) -> 応答あり probe UP

これは、ACE が probe の intervalpassdetect interval を切り替えるタイミングに依存しています。

ACE は、probe 送信時に、次の probe を送信するまでの間隔を決定します。 上記例では 00:00:00 に送信する時点では probe が up であるため、120 秒後に probe を送信するようタイマをセットします。 そのため、00:02:00 に probe が送信されます。 この時は、probe が down であるため、300 秒後に probe を送信するようタイマをセットします。 この結果 ACE が probe down を検知してから 11 分 59 秒後に probe が UP となります。

解決策

この動作は ACE 実装上期待通りの動作となります。

Configuring Health Monitoring に下記のような記載があります。 ここでは、probe が down から up に戻った直後の動作について書かれていますが、up から down になった場合も同様の実装になっています。

After a probe recovers and its state changes to Success, the ACE uses the passdetect interval before sending the next probe. For subsequent successful probes, the ACE uses the interval as configured by the interval command.

備考

バージョン履歴
改訂番号
1/1
最終更新:
‎04-10-2013 01:59 PM
更新者:
 
タグ(2)