「AWS 認定機械学習 – 専門知識」の学習方法・勉強法・試験対策・合格体験記～ How to study for AWS Certified Machine Learning – Specialty(MLS)～

9月 30, 20206月 14, 2021AWS,AWS Certified

Amazon Web Services(AWS)は今最もシェアを拡大しているパブリッククラウドコンピューティングサービスの一つです。
そして、AWS認定とはAWSクラウドを活用する技術的な専門知識が一定以上あることを証明するAWS公式の認定資格です。

全体的なAWS認定の概要、AWS認定のメリット、主観的な難易度順位、共通する学習方法・勉強法・試験対策・合格体験記については親記事となる
AWS認定全冠を達成した学習方法・勉強法・合格体験記・資格の難易度～How to become an ALL AWS Certifications Engineer. How to study for AWS Certifications.～
を参照してください。

「AWS Certified Machine Learning – Specialty(MLS) | AWS 認定機械学習 – 専門知識」とは

「AWS Certified Machine Learning – Specialty(MLS) | AWS 認定機械学習 – 専門知識」は一言で言えばAWSクラウドの特徴を活用した高度な機械学習・深層学習環境の設計・構築・運用ができる専門知識を検証する認定と言えるでしょう。
機械学習のラーニングパスでは前提となるAWS認定の取得は特に推奨されていませんが、受験にあたってはこの分野のAWSサービスと関連知識を熟知しておく必要がある専門知識に特化した高度な認定です。

後述の＜学習リソース＞で紹介している「試験ガイド」や「Exam Readiness」を見ていただければわかっていただけると思いますが、学習しておくべきAWSサービスは「機械学習・深層学習」に関連するサービス全般にわたります。そして、多くのAWSサービスの特徴を理解した上で、さらに高度な機械学習・深層学習環境を実現するソリューションやトラブルシューティングの知識が必要とされるため数あるAWS認定の中でも難易度の高い認定と言えるでしょう。

学習リソース

以下に「AWS Certified Machine Learning – Specialty(MLS) | AWS 認定機械学習 – 専門知識」のAWS認定に関する学習リソースについて紹介します。
英語の記事や資料が多いですが専門用語中心なので比較的理解しやすいと思います。
英語が苦手な場合はChromeの右クリックで翻訳機能を使って、なんとなくわかる日本語に変換しながら学習するのも良いでしょう。
重要なのは日本語の資料に無い情報は翻訳しながらでも英語を読みすすめて必要な知識を得ることが合格に近づく鍵です。

AWS認定公式ページ(MLS)

AWS認定の公式ページには試験の内容や試験の準備に関する資料やリンクがまとめられていますので、最初にこちらを確認するようにしましょう。

試験ガイド(MLS)

まずは試験ガイドで受験するAWS認定の試験範囲とどのような内容が出題されるかを把握します。

サンプル問題(MLS)

次に試験ガイドとセットで掲載されているサンプル問題を解いて、ざっくりとした出題傾向や大まかな出題される知識の粒度を把握します。

AWSサービス別資料(AWS Black Belt Online Seminar資料)

AWSドキュメントは詳細で情報量も豊富ですが膨大な量なので、重要点をまとめた「AWSサービス別資料(AWS Black Belt Online Seminar資料)」から各サービスを学習することがおすすめです。

模擬試験

受験するAWS認定の出題傾向や重要点を確認できるため、試験直前の腕試しではなく可能な限り早い段階に受けて対策の糧とするほうが良いです。

AWSトレーニングライブラリ(デジタルトレーニング)

ほぼ全ての各認定に用意され、試験準備のための要点がまとめられている「Exam Readiness(MLS)」を受講します。
また、各サービスごとの「Introduction」や「Primer」などのキーワードで出てくるEラーニングを受けて各サービスの理解を深めます。

AWSドキュメント

AWS認定の学習の基本はAWSドキュメントを読むことです。
AWSドキュメントはボリュームが多いため、効率よく学習するには、
「ベストプラクティス(best practice)」
「トラブルシューティング(troubleshooting)」
などの重要事項を絞り込めるキーワードでドキュメント内を検索して重要事項から学習することをおすすめします。
その後、模擬試験の出題傾向から重要と思われる概念を中心に読んだり、時間の余裕があれば全体を通しで読んでいきます。

よくある質問

受験するAWS認定の分野のサービスのQ&Aの内容を学習します。

AWS ナレッジセンター

受験するAWS認定の分野のサービスのAWS ナレッジセンターの内容を学習します。実際のユーザーから最も頻繁に寄せられる質問や要望に対するQ&Aがまとめられているのでとても参考になります。

AWS Machine Learning Blog

カテゴリ別ブログで受験するAWS認定に関連するサービスの記事に一通り目を通します。

Amazon Web Services ブログ

日本語版AWS News Blogで受験するAWS認定に関連するサービスの記事(特に問題解決方法、アーキテクチャ、事例、認定が新設・改定される前にリリースされた機能追加について説明している記事)を読んでいきます。

AWS News Blog

英語版AWS News Blogで受験するAWS認定に関連するサービスの記事(特に問題解決方法、アーキテクチャ、事例、認定が新設・改定される前にリリースされた機能追加について説明している記事)を読んでいきます。

AWS Events Content

過去のAWS Summitやre:Inventの資料などを検索して受験するAWS認定の分野のサービスを学習します。特にre:InventのBreakout Sessionなどのセッションで説明されている内容は参考になります。

AWS認定対策本(MLS)

最近ではAWS認定に特化した対策本も多く出版されていますので、それらを活用して効率よく重要点を学習していくこともおすすめです。

Udemy(MLS)

また、UdemyなどのサードパーティのEラーニングサービスも余裕があれば活用します。

その他、キーワードでGoogle検索

AWSのサービス名、模擬試験でわからなかった用語、その他上記リソースを読んでも内容がわからなかったキーワードなどで検索して出てきたブログなどを参考にします。
日本語だけではなく英語で検索して英語圏のサイトから日本語サイトには無い情報を探すことも知識を増やすことにつながるためおすすめです。

重要ポイント

ここでは「AWS Certified Machine Learning – Specialty(MLS) | AWS 認定機械学習 – 専門知識」の学習過程で個人的に重要だと感じたポイントをまとめました。
重要ポイントとは言っていますが、各人の知識によって感じ方に個人差があることをご理解の上で参照してください。

Amazon S3

データレイクストレージとしてのAmazon S3の役割
https://aws.amazon.com/jp/products/storage/data-lake-storage/

Amazon Athena

Amazon AthenaでのMachine Learning(ML)の使用
https://docs.aws.amazon.com/ja_jp/athena/latest/ug/querying-mlmodel.html
Athenaでのパフォーマンスチューニング(パーティション、データの圧縮と分割、ファイルサイズ最適化、ファイル形式Apache ParquetとApache ORCの使用など)
https://aws.amazon.com/jp/blogs/news/top-10-performance-tuning-tips-for-amazon-athena/
AWS Glueとの統合
https://docs.aws.amazon.com/ja_jp/athena/latest/ug/glue-athena.html

AWS Data Pipeline

AWS Data Pipelineの概要
https://docs.aws.amazon.com/ja_jp/datapipeline/latest/DeveloperGuide/what-is-datapipeline.html

Amazon Elastic MapReduce(Amazon EMR)

Amazon EMRクラスターの設定のガイドラインとベストプラクティス(コアノードとタスクノードに使用するインスタンスタイプなど)
https://docs.aws.amazon.com/ja_jp/emr/latest/ManagementGuide/emr-plan-instances-guidelines.html
https://aws.amazon.com/jp/blogs/news/best-practices-for-running-apache-spark-applications-using-amazon-ec2-spot-instances-with-amazon-emr/

AWS Glue

AWS Lake FormationのFindMatchesによるレコードのマッチング
https://docs.aws.amazon.com/ja_jp/glue/latest/dg/machine-learning.html
https://aws.amazon.com/jp/blogs/news/matching-patient-records-with-the-aws-lake-formation-findmatches-transform/
AWS Glueがサポートしているアプリケーション(PythonとPySpark拡張機能、Scala)でのAWS Glue ETLスクリプトプログラミング
https://docs.aws.amazon.com/ja_jp/glue/latest/dg/aws-glue-programming.html
AWS Glueデータカタログについて
https://docs.aws.amazon.com/ja_jp/glue/latest/dg/populate-data-catalog.html
データカタログとETLジョブのAWS Glueトリガーを使用してサーバーレスデータレイクを構築および自動化する
https://aws.amazon.com/jp/blogs/news/build-and-automate-a-serverless-data-lake-using-an-aws-glue-trigger-for-the-data-catalog-and-etl-jobs/

Amazon Kinesis

Amazon Kinesis Data Streamsのスケーリング
https://aws.amazon.com/jp/blogs/news/under-the-hood-scaling-your-kinesis-data-streams/
Amazon Kinesis Data Streamsの入出力のスループット(シャード)計算
https://aws.amazon.com/jp/kinesis/data-streams/faqs/
https://aws.amazon.com/jp/kinesis/data-streams/pricing/
https://docs.aws.amazon.com/ja_jp/streams/latest/dev/key-concepts.html
Kinesis Data Firehoseのデータ配信先
https://docs.aws.amazon.com/ja_jp/firehose/latest/dev/basic-deliver.html
Kinesis Data Firehoseでの入力レコード形式の変換
https://docs.aws.amazon.com/ja_jp/firehose/latest/dev/record-format-conversion.html
Amazon Kinesis Data Analyticsで機械学習クエリを使用する(データ異常検出、ホットスポット検出)
https://docs.aws.amazon.com/ja_jp/kinesisanalytics/latest/dev/examples-machine.html
AWS Lambdaを使用したAmazon Kinesis Analyticsのデータ前処理
https://aws.amazon.com/jp/blogs/big-data/preprocessing-data-in-amazon-kinesis-analytics-with-aws-lambda/
https://docs.aws.amazon.com/ja_jp/kinesisanalytics/latest/dev/lambda-preprocessing.html
Amazon Kinesis Data Firehose、Amazon Athena、Amazon Redshift を使用して Apache Parquet 最適化データを分析する
https://aws.amazon.com/jp/blogs/news/analyzing-apache-parquet-optimized-data-using-amazon-kinesis-data-firehose-amazon-athena-and-amazon-redshift/

Amazon QuickSight

Amazon QuickSightでのビジュアルタイプを使用する
https://docs.aws.amazon.com/ja_jp/quicksight/latest/user/working-with-visual-types.html
Amazon QuickSightのML Insights
https://docs.aws.amazon.com/ja_jp/quicksight/latest/user/working-with-analyses.html
Amazon QuickSightでAmazon SageMaker機械学習予測を視覚化する
https://aws.amazon.com/jp/blogs/news/making-machine-learning-predictions-in-amazon-quicksight-and-amazon-sagemaker/
Amazon EMR、AWS Glue、Amazon QuickSightを使用して自動データプロファイリングおよびレポートソリューションを構築する
https://aws.amazon.com/jp/blogs/news/build-an-automatic-data-profiling-and-reporting-solution-with-amazon-emr-aws-glue-and-amazon-quicksight/

AWS Step Functions

AWS Step Functionsを使用してAmazon SageMaker、AWS Glueを管理する
https://docs.aws.amazon.com/ja_jp/step-functions/latest/dg/connect-sagemaker.html
https://docs.aws.amazon.com/ja_jp/step-functions/latest/dg/connect-databrew.html
https://aws.amazon.com/jp/blogs/news/orchestrate-amazon-redshift-based-etl-workflows-with-aws-step-functions-and-aws-glue/

Amazon Mechanical Turk

Amazon Mechanical Turkの概要
https://aws.amazon.com/jp/mturk/faqs/

Others

AWSの機械学習サービスをグラレコで解説
https://aws.amazon.com/jp/builders-flash/202003/awsgeek-sagemaker/
機械学習と感度分析を組み合わせてビジネス戦略を開発する
https://aws.amazon.com/jp/blogs/news/developing-a-business-strategy-by-combining-machine-learning-with-sensitivity-analysis/
Amazon Aurora機械学習を使用して顧客に関する洞察を得る
https://aws.amazon.com/jp/blogs/news/gain-customer-insights-using-amazon-aurora-machine-learning/

機械学習(マシンラーニング)・深層学習(ディープラーニング)の基礎知識
前述の機械学習・深層学習の基礎知識を学べるリソースなどで学習した内容。
学習の参考となる一部のキーワードを次に記載します。

教師あり学習、線形回帰、ロジスティック回帰、二項分類、マルチクラス分類、KNN、ランダムフォレスト、決定木、ブートストラップサンプリング、アンサンブル学習、バギング、ブースティング、勾配ブースティング、AdaBoost、XGBoost、サポートベクターマシン(SVM)、マージン最大化、カーネル関数、カーネルトリック、教師なし学習、k-means、エルボー法、クラスタリング(クラスター分析)、主成分分析(PCA)、トレーニングデータ、検証データ、テストデータ、交差検証、k-分割交差検証、ホールドアウト検証、ROC曲線下面積(AUC)、残差プロット、混同行列、True Positive(TP, 真陽性)、False Positive(FP, 偽陽性)、False Negative(FN, 偽陰性)、True Negative(TN, 真陰性)、正解率(accuracy)、適合率(precision)、再現率(recall)、特異率(Specificity)、F値(F-measure)、カテゴリ変数、ラベルエンコーディング、ワンホットエンコーディング、ニューラルネットワーク、単純パーセプトロン、多層パーセプトロン、入力層、隠れ層(中間層)、出力層、重み、誤差逆伝播法、勾配消失問題、活性化関数、恒等関数、シグモイド関数、tanh関数、ReLU関数、ソフトマックス関数、コスト関数、オートエンコーダ、積層オートエンコーダ、事前学習、ファインチューニング、深層信念ネットワーク、勾配降下法、偏微分、最小二乗法、最尤推定、正則化、経験的損失最小化、エポック、バッチサイズ、ミニバッチサイズ、イテレーション数、学習率、局所最適解、大域最適解、鞍点、プラトー、モーメンタム、Adagrad、Adadelta、RMSprop、Adam、偏差、標準偏差、分散、アンダーフィッティング、学習不足、高いバイアス、低いバリアンス、オーバーフィッティング、過学習、低いバイアス、高いバリアンス、L1正則化、ラッソ回帰、L2正則化、リッジ回帰、Elastic Net、ドロップアウト、early stopping、特徴量エンジニアリング、特徴量スケーリング、正規化、標準化、白色化、バッチ正規化、重みの初期化、欠損値の対応方法、リストワイズ法、ペアワイズ法、平均(中央)値代入法、多重代入法、次元削減、特徴選択、特徴抽出、t分布型確率的近傍埋め込み法(T-distributed Stochastic Neighbor Embedding, t-SNE)、線形判別分析（LDA）、確率分布、ハイパーパラメータ、ランダムサーチ、グリッドサーチ、ベイズ最適化、畳み込みニューラルネットワーク(CNN)、畳み込み層、特徴マップ、プーリング層、ダウンサンプリング、maxプーリング、avgプーリング、全結合層、不均衡データへの対応方法、データ拡張(水増し)、オーバーサンプリング、SMOTE、アンダーサンプリング、You Only Look Once(YOLO)、シングルショットマルチボックス検出器(Single Shot MultiBox Detector, SSD)、バウンディングボックス、セマンテックセグメンテーション、インスタンスセグメンテーション、転移学習、リカレントニューラルネットワーク(RNN)、LSTM、GRU、強化学習、Deep Q-Network(DQN)、深層強化学習、深層生成モデル、画像生成モデル、変分オートエンコーダ(VAE)、敵対的生成ネットワーク(GAN)、ジェネレーター、ディスクリミネーター、word2vec、seq2seq、TF-IDF、ナイーブベイズ、潜在的ディリクレ配分法(LDA)、協調フィルタリング、ニューラルチューリングマシン(NTM)、WaveNet、折れ線グラフ、散布図、箱ひげ図(ボックスプロット)、ヒートマップ、ヒストグラム、ピボットテーブル、など

References:
Tech Blog citing related sources
Reasons for Continually Obtaining All AWS Certifications, Study Methods, and Levels of Difficulty
AI and Machine Learning Glossary for AWS - Knowledge Gained While Studying for AWS Certified AI Practitioner and AWS Certified Machine Learning Engineer - Associate

AWS,AWS Certified

Posted by magtranetwork

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

「AWS Certified Machine Learning – Specialty(MLS) | AWS 認定 機械学習 – 専門知識」とは

学習リソース

重要ポイント

Amazon S3

Amazon SageMaker

Amazon Augmented AI(A2I)

Amazon Comprehend

Amazon Forecast

Amazon Lex

Amazon Personalize

Amazon Polly

Amazon Rekognition

Amazon Textract

Amazon Translate

Amazon Transcribe

AWS Deep Learning Containers

AWS DeepLens

Amazon Machine Learning

AWS Database Migration Service(AWS DMS)

AWS IoT Greengrass