インスタンスの増減と操作について
Coatiは定期的(30分毎)に一度リソースの自動検出を実施しています。
インタンスが増減したときの動作は、下記のとおり監視設定の”新しくインスタンスを検出したときのふるまい”の指定に依存します。
- 監視対象にする
- 新しく検出したインスタンスを自動的に監視対象に加えます。
- 監視対象にしない
- 新しく検出インスタンスは監視対象に加えられません。新しく検出したインスタンスを監視対象に加える場合は、監視設定のメニューから対象インスタンスを選択し、監視のチェックボックスを有効にしてださい。
注記:
障害の回復を行っている最中にインスタンスの削除を実行した場合、イベント通知メールが送られたり、イベントの履歴が残る場合がありますが、そのような状態でもCoatiの動作上の問題はありません。この現象を回避するには、インスタンスの削除を実施する前に、対象のインスタンスをCoatiの監視対象から外してください。操作後、次回の監視のタイミングで監視対象から外れますので、インスタンスの削除は3分経過してから実施してください。
監視対象サービスの追加
監視対象とするサービスの選択方法は、前述の「サービス設定」画面でご紹介した通りですが、OSに新たなサービスを追加した場合は、その情報は「サービス設定」画面にはすぐには反映されません。
この場合も、定期的に行うリソース自動検出機能により、追加されたサービスの存在がCoatiによって認識され、監視対象に加えるかどうかを選択することが可能となります。標準では監視対象として認識されますので、監視したくない場合は「サービス設定」画面で監視対象からチェックを外してください。また追加したサービスをすぐにCoatiに認識させるためには、左ペインの「リソースの検出」ボタンをクリックしてください。
監視対象インスタンスの操作方法
- インスタンスの停止
- インスタンスを停止させる場合は、特別な操作は必要ありません。停止したインスタンスは自動的に監視対象から外れます。但し、監視の最中にインスタンスの停止が行われた場合、中途半端に回復処理が実行される可能性があります。特に問題となることはありませんが、このような状況を完全に回避するには、インスタンスを停止する前に監視対象から外して、数分後にインスタンスの停止を行ってください。
- インスタンス再起動手順
- インスタンスの再起動も上記の停止処理と同様に特別な操作は不要です。ただし、再起動処理を行っている最中に監視が行われることを回避するのであれば、上記の停止と同様に、再起動前に監視対象から外してください。再起動後に監視を再開するには、手動で監視対象に加えていただく必要があります。
- インスタンス削除手順
- インスタンスの削除についても、特別な操作は不要ですが、削除処理中の監視の実行を回避するのであれば、前述の停止と同様に、削除前に監視対象から外してください。
回復失敗時の対応
Coatiがサービスを自動で復旧できなかった場合は、そのインスタンスのステータスを「回復失敗」にセットし、以降のサービス状態を確認しません。この状態で「監視対象の個別設定」画面を参照すると、「監視」と「回復」のチェックボックスが外れた状態になっています。監視を再開するには、「監視対象の個別設定」画面上で、「監視」と「回復」のチェックボックスを有効にしてください。
監視対象インスタンスとの通信障害について
Coatiはインスタンスとの通信にSSMエージェント(AWS Systems Manager エージェント)を利用しています。もし、SSMの利用ができなくなった場合は、Coatiは監視・復旧を継続できなくなるため、SSM利用不可検知メールを送信します。検知メールを受け取った場合は、インスタンスのSSMの接続を確認してください。CoatiはSSMの接続を確認でき次第、監視を自動的に再開します。なお、ユーザー自身がインスタンスの電源をオフにした・SSMを停止した場合でも、検知メールが届きますが、特別に必要な作業はありません。SSM利用不可検知メールが不要な場合、「通知設定」画面で「SSM利用不可」のチェックボックスのチェックを外すことで、通知をオフにすることができます。
コマンド実行不可の状態について
SSMが利用可能であるにも関わらず、Coatiの監視・復旧および検知のコマンドが正常に実行できない状態を、Coatiは「コマンド実行不可」の状態とみなします。この状態になった場合、Coatiは監視・復旧を継続できなくなるため、コマンド実行不可の検知メールを送信します。検知メールを受け取った場合は、お客様の環境をご確認ください。コマンド実行不可メールが不要な場合、「通知設定」画面で「コマンド実行不可」のチェックボックスのチェックを外すことで、通知をオフにすることができます。
上記のようにCoatiはインスタンス内のSSMエージェントを利用してOSのコマンドを発行し、監視対象のサービスの状態を取得するため、SSMエージェントの状態を正確に取得することはできません(SSMエージェントを利用したOSコマンドの実行に失敗した、ということのみがわかります)。Coatiの運用はSSMが正常に動作していることに依存しているため、CloudWatchなどを利用してSSMの状態監視を行い、正常な状態を保つことを推奨致します。
インスタンスの状態遷移
次の図はインスタンスの状態遷移を表しています。
コメント
0件のコメント
サインインしてコメントを残してください。