お知らせ:

当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

MLパイプラインの作成

このセクションでは、前のセクションで前処理したデータセットを使用して、予測MLモデルを構築します。データセットはML Pipeline Builderへの入力となり、モデルのアーキテクチャを定義し、予測対象の列を選択できます。

MLパイプラインを作成するには:

  1. 左メニューのPipelinesコンポーネントに移動し、Create Pipelineをクリックします。 create-ml-pipeline

  2. 表示されるポップアップで、パイプラインタイプとしてPredictionを選択し、パイプライン名に「Pipeline_B」と入力し、入力データセットとしてCancer_detection_Aを選択します。今回のケースでは、ターゲット列は「diagnosis」です。モデル名はパイプライン名に基づいて自動入力されます。Create Pipelineをクリックします。 ml-pipeline-name Retrain model when the datasset is updatedは、データセットが更新されるたびに作成したパイプラインを再トレーニングするためのオプションです。詳細はperiodic-syncのドキュメントを参照してください。また、Create an Auto-generated pipeline using AutoMLは、MLパイプラインを自動的に作成するオプションです。詳細はAutoML pipelineのドキュメントを参照してください。

  3. 以下のスクリーンショットに示すように、パイプライン詳細ページが表示されます。 ml-pipeline-interface

MLパイプラインが作成されたので、ML Pipeline Builderインターフェースでノードを定義してパイプラインの設定を行います。

データ型の変換

ターゲット列の「diagnosis」にはString型のカテゴリカルデータが含まれているため、MLトレーニングの標準に合わせてエンコードする必要があります。

  1. Operationsメニューで、ML operations->Encoding->Label Encoderに移動します。Label EncoderノードをML Pipeline Builderインターフェースにドラッグ&ドロップします。Label encodingはターゲット列にのみ適用できるため、自動的に実行されます。 ordinal-encoder

この操作により、列の値がString型からInteger型に変換され、順序が維持されデータの正確性が保たれます。

ハイパーパラメータチューニング

MLモデルでは、モデルがトレーニングされるためのMLアルゴリズムの実装が必須です。このチュートリアルでは、ロジスティック分類アルゴリズムを実装して、前処理済みデータセットに最適化されたMLモデルのチューニングパラメータを設定します。

  1. Operationsメニューで、ML operations->Algorithm->Classification->Logistic Regressionを展開します。Logistic RegressionノードをPipeline Builderにドラッグ&ドロップします。ノードは自動的にDestinationノードに接続されます。Label EncoderLogistic Regressionノードを接続します。 logistic-reg

  2. Logistic Regressionノードでは、デフォルト設定のままSaveをクリックします。 logistic-reg

これで、必要なノードの接続と設定が完了しました。Executeをクリックしてパイプラインを実行し、評価とデプロイに進みます。

status-success

Execution Statsをクリックすると、各実行ステージの詳細を確認できます。

pipelineb-stats

MLパイプラインの実行が成功すると、予測モデルが作成され、Modelsセクションに表示されます。

モデル名をクリックすると、Models詳細ページでモデルの詳細を確認できます。

select-ml-pipeline

さらに、生成されたモデルの精度は、Models詳細ページのMetricsセクションで評価・確認できます。これにより、データに対するモデルの予測のパフォーマンスと有効性に関する貴重な洞察が得られます。

metrics

最終更新日 2026-02-23 18:09:41 +0530 IST