今日のクラウド コンピューティング環境では、企業はインフラストラクチャの構築と管理にクラウド プラットフォームをますます利用するようになっています。クラウドリソースの効率的な利用、コストの削減、セキュリティの向上、最適化を実現するために、AWSは次のような強力なツールを提供しています。 信頼できるアドバイザー、クラウドトレイル そして クラウドウォッチ。これらのツールは、ユーザーがクラウド リソースを監視および管理するのに役立つだけでなく、リソースの最適化、コンプライアンス チェック、パフォーマンスの向上を実現できるようにインテリジェントな推奨事項と自動監視メカニズムも提供します。この記事では、これら 3 つのツールを使用してクラウド環境を最適化し、セキュリティ、コスト、パフォーマンスの面でクラウド インフラストラクチャが最適であることを確認する方法について説明します。私たちオンクラウドAIこの記事を参考に、Trusted Advisor、CloudTrail、CloudWatch を使用したクラウドの最適化について詳しく理解してください。
信頼できるアドバイザー
- AWS Trusted Advisor は、ベストプラクティスに従ってリソースを構成するのに役立つカスタムクラウドエキスパートのようなものです。
- Trusted Advisor は AWS 環境を調査し、コスト削減、システムのパフォーマンスと信頼性の向上、セキュリティギャップの解消につながる機会を特定します。
コスト最適化チェック
- 使用率の低い Amazon EC2 インスタンス: 過去 14 日間に実行されていた Amazon Elastic Compute Cloud (Amazon EC2) インスタンスをチェックし、毎日の CPU 使用率が 10% を超えず、ネットワーク I/O が 4 日以上 5 MB を超えない場合に警告します。
- 使用率の低い Amazon EBS ボリューム: Amazon Elastic Block Store (Amazon EBS) ボリュームの構成をチェックし、ボリュームが使用率の低い場合は警告します。
- 関連付けられていない Elastic IP アドレス: 実行中の Amazon Elastic Compute Cloud (Amazon EC2) インスタンスに関連付けられていない Elastic IP アドレス (EIP) をチェックします。
- Amazon RDS アイドル DB インスタンス: アイドル状態になっていると思われる DB インスタンスがないか、Amazon Relational Database Service (Amazon RDS) 設定を確認します。データベース インスタンスが長期間接続されていない場合は、インスタンスを削除してコストを削減できます。
パフォーマンスチェック
- 使用率の高い Amazon EC2 インスタンス: 過去 14 日間に実行されていた Amazon Elastic Compute Cloud (Amazon EC2) インスタンスをチェックし、毎日の CPU 使用率が 4 日以上 90% を超えた場合に警告します。
- EC2 セキュリティ グループ内のルール数が多すぎる: Amazon Elastic Compute Cloud (EC2) セキュリティ グループごとに、ルール数が多すぎるかどうかを確認します。セキュリティグループに多数のルールが含まれている場合、パフォーマンスが低下する可能性があります。
- 過剰に使用されている Amazon EBS マグネティックボリューム: Amazon Elastic Block Store (EBS) マグネティックボリュームが過剰に使用されているかどうかを確認し、より効率的な構成からメリットが得られる可能性があります。
セキュリティチェック
- セキュリティグループ – 特定のポートへの無制限アクセス: 特定のポートへの無制限アクセス (0.0.0.0/0) を許可するセキュリティグループのルールをチェックします。
- Amazon EBS パブリックスナップショット: Amazon Elastic Block Store (Amazon EBS) ボリュームスナップショットの権限設定をチェックし、スナップショットがパブリックとしてマークされている場合に警告します。
- AWS CloudTrail ログ: AWS CloudTrail の使用状況を確認します。 CloudTrail は、アカウントで行われた AWS API 呼び出しに関する情報をログに記録することで、AWS アカウントアクティビティの可視性を向上させます。
フォールトトレランスチェック
- Amazon EBS スナップショット: Amazon Elastic Block Store (Amazon EBS) ボリュームのスナップショットの経過時間 (使用可能または使用中) を確認します
- Amazon EC2 アベイラビリティゾーンバランス: リージョン内のアベイラビリティゾーン全体にわたる Amazon Elastic Compute Cloud (Amazon EC2) インスタンスの分散を確認します。
- Amazon RDS バックアップ: Amazon RDS DB インスタンスの自動バックアップを確認します
- Amazon RDS マルチ AZ: 単一のアベイラビリティゾーンにデプロイされた DB インスタンスを確認する
- Amazon S3 バケットのログ記録: Amazon Simple Storage Service (Amazon S3) バケットのログ記録設定を確認します
サービス制限チェック
- EBS アクティブスナップショット: 使用量が EBS アクティブスナップショットの制限を超えていないか確認します 80%
- EC2 Elastic IP アドレス: 使用量が EC2 Elastic IP アドレス制限 80% を超えていないか確認する
- RDS DBインスタンス: 使用量がRDS DBインスタンスの制限である80%を超えていないか確認します。
- VPC: 使用量が VPC 制限を超えていないか確認する 80%
- VPC インターネットゲートウェイ: 使用量が VPC インターネットゲートウェイの制限を超えていないか確認する 80%
アマゾンクラウドトレイル
- AWS CloudTrail は、AWS アカウントのガバナンス、コンプライアンス、運用およびリスク監査に役立つ AWS サービスです。
- ユーザー、ロール、またはAWSサービスによって実行されたアクションは、CloudTrailにイベントとして記録されます。
- AWSアカウントを作成すると、CloudTrailが有効になります
- あなたは識別できます
- 誰が、あるいは何が、どのような行動をとったか
- 使用されたリソース
- 事件発生時刻
- AWS アカウントのアクティビティを分析して対応するために役立つ追加の詳細
- 各エリアは5つのルートを作成できる(増加はできない)
クラウド トレース イベント
- CloudTrail のイベントは、AWS アカウントでのアクティビティの記録です。
- このアクティビティは、CloudTrail によって監視できるユーザー、ロール、またはサービスによって実行されるアクションです。
- CloudTrail に記録できるイベントには 2 種類あります。
- 経営活動
- データイベント
- デフォルトでは、トレースは管理イベントをログに記録しますが、データ イベントはログに記録しません。
- CloudTrail はすべての AWS サービスをログに記録するわけではありません。一部のAWSサービスでは、すべてのAPIとイベントのログ記録が有効になっていません
経営活動
- 管理イベントは、AWS アカウント内のリソースに対して実行された管理操作に関する情報を提供します。これらの操作はコントロールプレーン操作とも呼ばれます
- 例
- デバイスの登録
- ルーティングデータルールの構成
データイベント
- データ イベントは、リソース上またはリソース内で実行されたリソース操作に関する情報を提供します。これらの操作は、データ プレーン操作とも呼ばれます。
- データイベントは通常、大量のアクティビティです
- 例
- 証跡を作成すると、Amazon S3 オブジェクトレベルの API アクティビティ データ イベントはデフォルトで無効になります。 CloudTrail データイベントをログに記録するには、アクティビティを収集するサポートされているリソースまたはリソースタイプを証跡に明示的に追加する必要があります。
インサイト活動
- CloudTrail Insights イベントは、AWS アカウント内の異常なアクティビティをキャプチャします。
- Insights イベントを有効にし、CloudTrail が異常なアクティビティを検出すると、Insights イベントはトレイルターゲットの S3 バケット内の追加のフォルダまたはプレフィックスに記録されます。
CloudTrail イベント履歴
- CloudTrail イベント履歴では、過去 90 日間の CloudTrail イベントの表示、検索、ダウンロード可能な記録が提供されます。
- この履歴を使用すると、AWS マネジメントコンソール、AWS SDK、コマンドラインツール、その他の AWS サービスで AWS アカウントによって実行されたアクションを把握できます。
暗号化
- デフォルトでは、AWS CloudTrail は Amazon S3 サーバー側暗号化 (SSE) を使用して、指定した Amazon S3 バケットに配信されるすべてのログファイルを暗号化します。
- オプションとして、AWS Key Management Service (AWS KMS) キーを使用して CloudTrail ログファイルを暗号化することで、セキュリティをさらに強化できます。
クラウド監視
- Amazon CloudWatch は、Amazon Web Services (AWS) リソースと AWS 上で実行されるアプリケーションをリアルタイムで監視します。
- CloudWatchのホームページには、使用しているすべてのAWSサービスのメトリクスが自動的に表示されます。
- CloudWatchエージェントをインスタンス/サーバーにインストールすることで、カスタムアプリケーションに関するメトリクスを表示するカスタムダッシュボードを作成することもできます。
- アラートを作成してメトリックを監視し、通知を送信したり、しきい値を超えたときに監視対象のリソースを自動的に変更したりできます。
- たとえば、Amazon EC2 インスタンスの CPU 使用率やディスクの読み取りと書き込みを監視し、このデータを使用して、増加した負荷を処理するためにさらにインスタンスを起動する必要があるかどうかを判断できます。このデータを使用して、使用率の低いインスタンスを停止し、コストを節約することもできます。
- CloudWatchを使用すると、リソースの使用率、アプリケーションのパフォーマンス、運用の健全性を包括的に可視化できます。
Cloud Watch と統合された AWS サービス
- Amazon シンプル通知サービス (Amazon SNS)
- アマゾンEC2
- 自動スケーリング
- Amazon AWS クラウドトレイル
- AWS アイデンティティおよびアクセス管理 (IAM)
Amazon Cloudwatchの仕組み
- Amazon Cloudwatchは基本的にメトリクスリポジトリです
- Amazon EC2 などの AWS サービスはメトリクスをリポジトリに保存し、それらのメトリクスに基づいて統計情報を取得します。
- 独自のカスタムメトリックをリポジトリに配置すると、それらのメトリックの統計も取得できます。
- メトリクスを使用して統計を計算し、CloudWatchコンソールでデータをグラフィカルに表示できます。
- 特定の条件が満たされたときに Amazon EC2 インスタンスを停止、開始、または終了するようにアラームアクションを設定できます。
- さらに、Amazon EC2 Auto Scaling および Amazon Simple Notification Service (Amazon SNS) アクションを自動的に開始するアラームを作成することもできます。
クラウドウォッチのコンセプト
メトリック
- メトリクスは CloudWatch の基本的な概念です。
- メトリクスは、CloudWatch に公開される時間順のデータポイントのセットを表します。
- メトリックは監視する変数、データ ポイントは時間の経過に伴うその変数の値と考えてください。
- たとえば、特定の EC2 インスタンスの CPU 使用率は、Amazon EC2 によって提供されるメトリックです。データポイント自体は、データを収集するあらゆるアプリケーションやビジネスアクティビティから取得できます。
- 一部のサービスでは、デフォルトで、Amazon EC2 インスタンス、Amazon EBS ボリューム、Amazon RDS DB インスタンスなどのリソースの無料メトリクスが提供されます。特定のリソースの詳細な監視を有効にすることもできます。
アラーム
- CloudWatchアラームを作成して、単一のCloudWatchメトリクスを監視することができます。
- アラートは、複数の期間にわたるしきい値に対するメトリックまたは式の値に基づいて、1 つ以上のアクションを実行します。
- アクションは、Amazon EC2 アクション、Amazon EC2 Auto Scaling アクション、または Amazon SNS トピックに送信される通知になります。
- CloudWatch ダッシュボードにアラームを追加して、直感的に監視することもできます。
- ダッシュボードにアラームがある場合、アラームは ALARM 状態になると赤色に変わり、そのステータスを積極的に監視できます。
- 状態の変化によりアラートがアクションを呼び出す場合、その後の動作はアラートに関連付けられたアクションのタイプによって異なります。
- アラームには次の状態があります。
- OK - メトリックまたは式は定義されたしきい値内です。
- アラート – メトリックまたは式が定義されたしきい値を超えました。
- INSUFFICIENT_DATA – アラームが開始されたばかりで、メトリックが利用できないか、メトリックにアラームの状態を判断するのに十分なデータがありません。
オンクラウドAIAWS エージェントとして、Amazon クラウド サービスの提供、Amazon クラウド サーバーの AWS 支払いのサポート、AWS 移行、AWS 運用保守ホスティングなどのサービスを提供します。関連するニーズがございましたら、お問い合わせください。オンクラウドAI。