Aviso:

Para brindarle información de soporte completa de manera más rápida, el contenido de esta página ha sido traducido al español mediante traducción automática. Para consultar la información de soporte más precisa, consulte la versión en inglés de este contenido.

Conceptos Clave

Antes de aprender sobre los casos de uso y la implementación de Object Recognition, es importante comprender sus conceptos fundamentales en detalle.

Proceso de reconocimiento de objetos

El proceso de reconocimiento de objetos de Zia se puede desglosar en varias etapas:

  1. Detección de objetos: La detección de objetos implica detectar instancias de objetos semánticos en imágenes. Junto con la localización de objetos, la detección de objetos no solo puede detectar el objeto más obvio en la imagen, sino que puede detectar y localizar múltiples objetos en la misma imagen.
  2. Localización de objetos: La localización de objetos dibuja cuadros delimitadores alrededor del objeto después de que ha sido detectado. Un cuadro delimitador son las coordenadas de un borde rectangular que encierra el objeto detectado. Esto ayuda a Zia a mapear la ubicación del objeto en la imagen.
  3. Clasificación de imágenes:
    La clasificación de imágenes es parte del aprendizaje profundo, un subconjunto del aprendizaje automático, que clasifica los objetos detectados en una imagen en categorías. Zia puede identificar clases de objetos como animales, artículos cotidianos, alimentos, equipos deportivos y vehículos en una imagen. Cuando un objeto se asigna a una clase basándose en su contenido visual, Zia ejecuta algoritmos adicionales para reconocer con precisión el objeto y entregar los resultados.
  4. Reconocimiento de objetos:
    Zia descompone la clase de objeto aún más para realizar el reconocimiento semántico de entidades específicas. Combinando la detección de objetos, la localización de imágenes y la clasificación de imágenes, el objeto específico es reconocido y producido en la salida. Zia puede reconocer 80 tipos de tipos de objetos específicos, algunos de los cuales incluyen: person, car, dog, chair, traffic light, knife, umbrella, cellphone, book, cake, baseball bat, laptop, aeroplane, stop_sign, parking meter.

Todo este proceso implica dividir y conquistar, comparar los objetos detectados con las representaciones almacenadas en la memoria de la IA, e hipotetizar y probar repetidamente. Dado que un objeto puede aparecer en diferentes poses, contextos, posiciones arbitrarias y orientaciones, Zia se somete a un entrenamiento constante para generar resultados precisos.

Formato de entrada

Zia Object Recognition realiza la detección facial y el reconocimiento de atributos analizando archivos de imagen. Object Recognition soporta los siguientes formatos de archivo de entrada:

  1. .webp/.jpeg
  2. .png

Podrías proporcionar un espacio para que el usuario suba el archivo de imagen desde la memoria del dispositivo a la aplicación de Catalyst. También puedes codificar la aplicación de Catalyst para usar la cámara del dispositivo del usuario final para capturar una foto y procesar la imagen como el archivo de entrada.

Puedes consultar el formato de solicitud de la API en la documentación de la API.

El usuario debe seguir estas directrices al proporcionar la entrada, para obtener mejores resultados:

  • Evita proporcionar imágenes borrosas o corruptas.
  • Object Recognition puede reconocer mejor los objetos en una imagen si son claros, visibles y distinguibles.
  • El tamaño del archivo no debe exceder 10 MB.

Formato de respuesta

Zia Object Recognition devuelve la respuesta de las siguientes maneras:

  • En la consola
    Cuando subes una imagen de muestra en la consola, devolverá los resultados en dos formatos de respuesta:
    • Respuesta de documento: La respuesta textual muestra los tipos de objeto de todos los objetos reconocidos en la imagen, con el nivel de confianza de cada reconocimiento como valores porcentuales.
    • Respuesta JSON: La respuesta JSON contiene el tipo de objeto, las coordenadas del objeto en la imagen y la puntuación de confianza en un valor entre 0 y 1 de cada objeto que fue reconocido en la imagen. La puntuación de confianza de 0 a 1 se puede equiparar a valores porcentuales de la siguiente manera:
Nivel de confianza en porcentaje Puntuación de confianza con valores entre 0 y 1
0-9 0.0
3-9 0.0
10-19 0.0
20-29 0.0
30-39 0.0
40-49 0.01
50-59 0.12
60-69 0.23
>70 0.63
  • Usando los SDKs
    Cuando envías un archivo de imagen usando una solicitud de API, recibirás una respuesta JSON que contiene los resultados en el formato especificado anteriormente.

Puedes consultar el formato de respuesta JSON en la documentación de la API.


Última actualización 2026-03-20 21:51:56 +0530 IST