主要な概念
Object Recognitionのユースケースと実装について学ぶ前に、その基本的な概念を詳しく理解することが重要です。
Object Recognitionプロセス
Ziaのオブジェクト認識プロセスは、さまざまな段階に分けることができます。
- オブジェクト検出: オブジェクト検出は、画像内のセマンティックオブジェクトのインスタンスを検出することを含みます。オブジェクトの位置特定とともに、オブジェクト検出は画像内の最も明白なオブジェクトだけでなく、同じ画像内の複数のオブジェクトを検出して位置を特定できます。
- オブジェクトの位置特定: オブジェクトの位置特定は、オブジェクトが検出された後にバウンディングボックスを描画します。バウンディングボックスは、検出されたオブジェクトを囲む矩形の境界の座標です。これにより、Ziaは画像内のオブジェクトの位置をマッピングできます。
- 画像分類:
画像分類は、機械学習のサブセットであるディープラーニングの一部であり、画像内の検出されたオブジェクトをカテゴリに分類します。Ziaは、動物、日用品、食品、スポーツ用品、車両などのオブジェクトクラスを画像内で識別できます。オブジェクトがその視覚的コンテンツに基づいてクラスに割り当てられると、Ziaはさらにアルゴリズムを実行してオブジェクトを正確に認識し、結果を提供します。 - オブジェクト認識:
Ziaはオブジェクトクラスをさらに分解して、特定のエンティティのセマンティック認識を実行します。オブジェクト検出、画像の位置特定、画像分類を組み合わせて、特定のオブジェクトが認識され出力に生成されます。Ziaは80種類の特定のオブジェクトタイプを認識でき、その一部には以下が含まれます: person、car、dog、chair、traffic light、knife、umbrella、cellphone、book、cake、baseball bat、laptop、aeroplane、stop_sign、parking meter。
このプロセス全体は、分割統治、検出されたオブジェクトとAIのメモリに保存された表現の比較、繰り返しの仮説とテストを含みます。オブジェクトはさまざまなポーズ、コンテキスト、任意の位置、方向で表示される可能性があるため、Ziaは正確な結果を生成するために継続的なトレーニングを受けています。
入力形式
Zia Object Recognitionは、画像ファイルを分析して顔検出と属性認識を実行します。Object Recognitionは、以下の入力ファイル形式をサポートしています。
- .webp/.jpeg
- .png
デバイスのメモリからCatalystアプリケーションに画像ファイルをアップロードするためのスペースをユーザーに提供できます。また、エンドユーザーのデバイスのカメラを使用して写真を撮影し、画像を入力ファイルとして処理するようにCatalystアプリケーションをコーディングすることもできます。
APIのリクエスト形式はAPIドキュメントで確認できます。
より良い結果を得るために、入力を提供する際には以下のガイドラインに従ってください。
- ぼやけた画像や破損した画像の提供は避けてください。
- Object Recognitionは、オブジェクトが明確で見やすく、はっきりしている場合に画像内のオブジェクトをより適切に認識できます。
- ファイルサイズは10 MBを超えてはなりません。
レスポンス形式
Zia Object Recognitionは、以下の方法でレスポンスを返します。
- コンソールの場合
コンソールでサンプル画像をアップロードすると、2つのレスポンス形式で結果が返されます。
- ドキュメントレスポンス: テキストレスポンスは、画像内のすべての認識されたオブジェクトのオブジェクトタイプを、各認識のconfidence levelをパーセンテージ値とともに表示します。
- JSON response: JSON responseには、オブジェクトタイプ、画像内のオブジェクトの座標、および画像内で認識された各オブジェクトの0から1の値のconfidence scoreが含まれます。0から1のconfidence scoreは、以下のようにパーセンテージ値に換算できます。
| パーセンテージでのConfidence Level | 0から1の値のConfidence Score |
|---|---|
| 0-9 | 0.0 |
| 3-9 | 0.0 |
| 10-19 | 0.0 |
| 20-29 | 0.0 |
| 30-39 | 0.0 |
| 40-49 | 0.01 |
| 50-59 | 0.12 |
| 60-69 | 0.23 |
| >70 | 0.63 |
- SDKを使用する場合
APIリクエストを使用して画像ファイルを送信すると、上記で指定された形式の結果を含むJSON responseを受信します。
JSON responseの形式はAPIドキュメントで確認できます。
最終更新日 2026-02-23 18:09:41 +0530 IST
Yes
No
Send your feedback to us
Skip
Submit