Aviso:

Para brindarle información de soporte completa de manera más rápida, el contenido de esta página ha sido traducido al español mediante traducción automática. Para consultar la información de soporte más precisa, consulte la versión en inglés de este contenido.

Código Personalizado

Operaciones de Custom Code

Las operaciones de Custom Code están disponibles en acceso anticipado en todos los centros de datos. Para usar esta función, solicita acceso a través de support@zohocatalyst.com

Las operaciones de Custom Code en el pipeline de QuickML permiten a los desarrolladores insertar su propia lógica en el proceso de entrenamiento del modelo. Al implementar clases de Python proporcionadas en plantillas, los usuarios pueden personalizar cómo se transforman los datos, cómo se procesan las características e incluso definir el algoritmo de aprendizaje automático utilizado.

Esta capacidad se divide en tres componentes distintos:

  • Custom Data Transformation
  • Custom ML Transformation
  • Custom Algorithm

Cada componente desempeña un papel único en el ciclo de vida del aprendizaje automático y viene con firmas de métodos predefinidas que deben ser implementadas por el usuario.

Nota: La implementación es obligatoria para todos los métodos en la clase de plantilla.

Custom Data Transformation

Custom Data Transformation se utiliza para optimizar los datos realizando operaciones como limpieza de datos, transformación y extracción de datos sin procesar utilizando lógica personalizada. Es particularmente útil para pasos de preprocesamiento como la eliminación de columnas, conversiones de formato y escalado que deben permanecer consistentes tanto en las etapas de entrenamiento del modelo como de predicción. El código personalizado maneja requisitos complejos durante el preprocesamiento de datos y se implementa en el método transform(), que acepta y devuelve un objeto DataFrame y se ejecuta tanto durante el entrenamiento como durante la inferencia.

En el código de ejemplo a continuación, el nodo de Custom Data Transformation preprocesa los datos antes de que se utilicen para el entrenamiento o la predicción del modelo. Elimina la columna “Glucose” del conjunto de datos para asegurar que las características irrelevantes o potencialmente sesgadas no influyan en el aprendizaje o las predicciones del modelo.

customcode1.webp

Custom ML Transformation

En el ciclo de vida del desarrollo de modelos de ML, las operaciones de Custom ML Transformation se utilizan durante el paso de preprocesamiento realizando tareas de ingeniería de características específicamente adaptadas al caso de uso utilizando lógica personalizada. Estas transformaciones son ideales para manejar operaciones como la imputación de valores faltantes, la codificación de características y la normalización, donde la lógica debe aprender de los datos de entrenamiento y aplicar consistentemente la misma transformación durante la predicción. Esto se logra a través de un método fit(), que aprende los parámetros necesarios de los datos de entrenamiento, y un método transform(), que aplica esos parámetros aprendidos para preprocesar nuevos datos. Ambos métodos aceptan y devuelven un objeto DataFrame.

En el código de ejemplo a continuación, el nodo de Custom ML Transformation maneja la imputación de valores faltantes como parte del paso de preprocesamiento de datos. Durante el entrenamiento, calcula la media de cada columna numérica y la almacena. Posteriormente, durante la predicción o inferencia, rellena los valores faltantes en esas columnas usando los valores de media almacenados, asegurando consistencia entre las fases de entrenamiento y predicción.

customcode2.webp

Custom Algorithm

Te permite integrar un modelo de ML personalizado y definir su lógica de entrenamiento, predicción y evaluación. Esto ofrece control total sobre qué algoritmo se utiliza y cómo se evalúa su rendimiento. Tiene funciones fit, predict y get_evaluation_metrics. Fit se ejecuta durante el entrenamiento del modelo, predict se ejecuta durante la predicción y get_evaluation_metrics se ejecuta después del entrenamiento del modelo para generar las métricas de evaluación. Las métricas devueltas por el método get_evaluation_metrics() se mostrarán en la sección de métricas de evaluación de la página de detalles del modelo.

La operación de Custom Algorithm se refiere a la aplicación de algoritmos personalizados adaptados a casos de uso empresariales específicos. Permite a los usuarios integrar un modelo de ML personalizado y definir lógica de entrenamiento, predicción y evaluación a medida. Este enfoque ofrece control total sobre qué algoritmo se utiliza y cómo se evalúa su rendimiento. Puede verse como una mejora de los algoritmos predefinidos estándar, permitiendo la resolución de problemas de modelado únicos utilizando reglas específicas del dominio.

La operación incluye tres métodos clave:

  • fit() — se ejecuta durante el entrenamiento del modelo para aprender de los datos,
  • predict() — se ejecuta durante la predicción para generar resultados, y
  • get_evaluation_metrics() — se ejecuta después del entrenamiento para calcular y devolver métricas de evaluación.
Nota: Las métricas devueltas por get_evaluation_metrics() se muestran en la sección de evaluación de la página de detalles del modelo, soportando flujos de trabajo de evaluación de modelos personalizados.

En el código de ejemplo a continuación, el nodo de Custom Algorithm construye un modelo de ML utilizando el clasificador LightGBM. Divide el conjunto de datos de entrada en conjuntos de entrenamiento y prueba, entrena el modelo con los datos de entrenamiento y almacena la instancia del modelo entrenado. Durante la predicción, utiliza el modelo entrenado para generar resultados para datos no vistos. Después del entrenamiento, evalúa el modelo utilizando métricas de accuracy, precision, recall y F1-score, que se calculan sobre los datos de prueba y se devuelven como un diccionario para el análisis de rendimiento.

customcode3.webp

Lista de bibliotecas de Python desde las cuales se admite la importación:

numpy, scipy, pandas, xgboost, catboost, lightgbm, sklearn, tld, patsy, tensorflow, statsmodels, tldextract, huggingface_hub, sentence_transformers, imbalanced_learn, hyperopt, shap, lime, transformers, pmdarima, lightfm, LibRecommender, subseq

Última actualización 2026-03-24 17:38:39 +0530 IST