経緯
AWS SAAを受けることにしたので、勉強メモを残していく。
主に模擬試験の復習メモ。随時更新。
経緯KinesisKinesis Data AnalyticsS3OAI(Origin Access Identity)ストレージクラスStandard-IAAmazon EFS(Elastic File Sistem)モードについてLambda料金RDSAmazon Aurora Global DatabaseAmazon EMRAthenaS3利用時の注意AWS GlueAWS Systems ManagerParameter Store
Kinesis
Kinesis Data Analytics
- Kinesis Data Stream, Firehoseの中に入っているデータを分析できるもの(らしい)
- SQL、Javaなどを使って集計・分析し、それを後続処理(Lambdaとか?)に渡せるとのこと
- Kinesis Data Analyticsには2種類ある
- Amazon Managed Service for Apache Flink
- Amazon Kinesis Data Analytics(レガシー)
- 現在、こっちは非推奨
S3
OAI(Origin Access Identity)
- S3バケットへのアクセスを制限する機能
- 「Webサイトのホスティングを行う際、CloudFrontからのみアクセスを許可する」といったことが可能
- 最近はOAC(Origin Access Control)というものが出てきていて、そっちが推奨されている
- 主な違いは3点
- 全てのS3バケットで使用可能
- AWS KMSによるS3サーバ側の暗号化をサポート
- S3に対する動的なリクエストを処理可能(PUT、DELETE)
- 主な違いは3点
ストレージクラス
Standard-IA
- 存続期間が長くあまり頻繁にアクセスされないデータ向け
- 標準(Standard)との違い
- 可用性が少し低い(99.99% vs 99.9%)
Amazon EFS(Elastic File Sistem)
モードについて
- バーストスループットモード
- ファイルシステムのサイズ拡大に合わせて、スループットが拡大する
- Lambdaのメモリサイズ指定と似た感じか
- ファイルシステムのサイズ拡大に合わせて、スループットが拡大する
- プロビジョンドスループットモード
- 保存されたデータ量とは別にスループットを割り当てできる
Lambda
料金
- 時間当たりの料金はメモリサイズに比例している
- 例) メモリ量が4倍だと、1ミリ秒あたりの料金も4倍
- 東京リージョンだとこんな感じ

VPC
AWS PrivateLink
- VPC、AWSサービス、利用者のオンプレミスネットワーク同士を安全に接続できるサービス
- これを使うとトラフィックが外部ネットワークに流れないらしい
- VPCピアリング等と異なり、IPアドレスレンジの重複等の考慮が不要で、AWS内に閉じた安全なNW接続を実現できるとのこと
Egress-only Internet Gateway
- IPv6を使用してインターネットに出たいときに使用するもの
- 内部→外部の通信は可能だが、外部→内部の通信には利用不可
- NAT GatewayのIPv6版だと思えばよい、らしい。。
RDS
Amazon Aurora Global Database
- リージョン跨ぎでDBを同期してくれる機能
- 災害対策で有効活用できる
- 1 秒の実効 RPO、1 分未満の RTO
- RPO(目標復旧時点) … 復旧しなければならないバックアップの古さ
- 例えば、毎日0時にバックアップしているが、1時に障害が起きたら、0時~1時のデータは消える
- 1秒の実行RPOは、常に1秒前のデータ復元が可能ってこと?すごい
- RTO(目標復旧時間) … インシデントが発生してから通常業務をオンラインに戻すまで「ダウンを許容できる最大時間」を指す
- 1分未満のRTOは、常に1分以内にはDBがオンライン状態に戻るってこと
Amazon EMR
- クラウドビッグデータソリューション
- Apache Spark、Apache Hive、Presto などのオープンソースフレームワークを使用して、ペタバイトスケールのデータ処理、相互分析、機械学習とかを行ったりする
Athena
S3利用時の注意
- S3上に128MB未満のファイルがあるとパフォーマンスに問題が出る可能性あり。128MB未満のファイルを作らないよう注意
AWS Glue
- マネージドETLサービス
- ETLとは「Extract/Transform/Load」の略で、分析用に様々なデータを集める際に発生する「取り出す/変換する/取り込む」というプロセスを表す
- S3上の.csvファイルをApatche Parquet, Apache ORC形式などに変換したりもできる
- これにより、容量の削減、Athenaのパフォーマンス向上を図れる
AWS Systems Manager
- AWS環境の運用効率化を行うためのサービス
- EC2インスタンスのOSパッチ適用などが簡単に自動化できたりする、らしい
Parameter Store
- AWS Systems Manager の一機能
- 設定データ管理と機密管理のための安全な階層型ストレージ
- 他サービスにアクセスする際のAPIキーは、このサービスでSecure Stringとして保存するといいらしい
- Secrets Managerと統合されているため、Secrets Manager内のシークレット取得も行える

