データセットのアップロード
利用可能なデータセットコネクタを使用して、Catalyst QuickMLにデータセットをアップロードしましょう。
-
Import Datasetポップアップが表示されます。Data Sourcesステップで、File Uploadに移動し、Upload Fileをクリックします。

-
データセット名はアップロードしたファイル名に基づいて自動入力されます。必要に応じて編集し、Uploadをクリックします。

データセットが正常にアップロードされます。
次に、上記の手順を繰り返して、もう一つのデータセットCancer_detection_Bをアップロードしてください。
このチュートリアルで使用するデータセットは医療・ヘルスケア分野に特化しているため、使用される用語の説明を以下に記載します。
- Patient_id: 患者のID
- Patient_name: 患者の氏名
- Diagnosis: 診断結果(M = 悪性 / B = 良性)
データセットには、乳房腫瘤の特徴に関する詳細情報も含まれています。
- radius(中心から輪郭上の点までの平均距離)
- texture(グレースケール値の標準偏差)
- perimeter(周囲長)
- area(面積)
- smoothness(半径長のローカル変動)
- compactness(perimeter^2 / area - 1.0)
- concavity(輪郭の凹部の深刻度)
- concave points(輪郭の凹部の数)
- symmetry(対称性)
- fractal dimension(海岸線近似 - 1)
これらの特徴量について、各画像の平均値、標準誤差、および最悪値(上位3つの値の平均)が算出され、mean radius、radius SE、worst radiusを含む合計30の特徴量が生成されています。
最終更新日 2026-02-23 18:09:41 +0530 IST



