一般
AutoMLを使用すると、モデルをトレーニングするための適切なMLアルゴリズムの選択、データの前処理やプロファイリング、モデルの管理など、複雑なMLトレーニングプロセスに関与することなく、トレーニングデータのセットを簡単に分析し、データセットに対する予測分析を生成できます。Catalystは必要なモデルのトレーニングを実装し、プロセス全体を自動化します。
一方、QuickMLではMLおよびデータ操作の管理をより細かく制御でき、効果的なMLモデルをエンドツーエンドで構築、テスト、デプロイ、監視できます。多数のデータ前処理および変換操作の実行、トレーニング用のMLアルゴリズムの選択、必要に応じたパイプラインの設計をすべてコーディングなしで行うことができます。
ユーザーデータはZohoで適用されるすべてのセキュリティ対策に準拠して暗号化され、安全に保存されます。アップロードされたデータは、QuickMLプラットフォームのアルゴリズムの精度向上には使用されません。ユーザーが設定した意図されたカスタマーモデルのトレーニングにのみ使用されます。
Catalystプロジェクトは、処理されるデータ間の明確な分離を提供するように設計されています。あるプロジェクトから別のプロジェクトのデータにアクセスすることはできません。
データセット
データ品質スコアは、データセットに存在する無効値と欠損値を考慮した内部メトリクスによって計算されます。
Zoho CRM Bulk APIを使用すると、同期が設定されている場合でも、最大60万レコードがQuickMLに取得されます。
データセット詳細ページのSync Frequencyドロップダウンボックスでnoneオプションを選択することで、特定のデータセットの同期オプションを編集できます。
Pipelines
はい。Add Datasetステージを使用して必要なデータセットを設定することで、1つのパイプラインで複数のデータセットを使用できます。
Data Pipelineは元のデータセットに対してデータ前処理を行い、将来のパイプライン作成のためにデータセットを再利用することを目的としています。そのため、Data Pipelineにはデータ操作のみが含まれますが、ML Pipelineにはデータ操作とML操作の両方が含まれます。
データセット詳細ページのプロファイルはデータ全体の詳細を表しますが、ソースステージのプロファイルは元のデータセットからサンプリングされたデータの詳細を表します。
いいえ。パイプラインのターゲット列が保存された後は変更できません。新しいターゲット列で実験するには、新しいMLパイプラインを作成する必要があります。
Zia機能は、一般的なユースケースを解決するために大規模なオープンソースデータセットを使用して事前トレーニングされた自社開発のML/DLモデルであり、データ前処理機能を強化するためにビルダーに統合されています。
すべてのパイプライン実行はQuickML内でキューに入れられ、非同期で処理されます。需要に基づいて実行が行われます。
場合によっては、計算コストが高い操作があり、遅延が発生する可能性があります。ただし、パイプライン実行のステータスは、実行が成功または失敗した時点でそれぞれ更新されます。
モデル
モデルは、Modelパイプラインが正常に実行された時点で自動的に作成されます。
モデルが作成されると、そのモデルとパイプラインに関連する詳細をModelsモジュールで確認できます。
エンドポイント
モデルのエンドポイントを作成すると、QuickMLプラットフォームは自動的にモデルの動作をテストおよび検証するためのREST APIエンドポイントを有効にします。これは1000回の呼び出しまで無料で使用できます。
エンドポイントの検証後、本番グレードの統合のために本番環境でアクセスできるよう公開する必要があり、使用量に応じて課金されます。
QuickMLエンドポイントを統合するために2つのモードが利用可能です。
REST API: Zoho OAuth認証済みのREST API呼び出し。
QuickML SDK: Java、Python、Node.js Catalyst SDKを使用した外部呼び出し。