Kõikide objektimärkuste ekstraheerimiseks API vastusest tehisintellekti valdkonnas – Google Vision API – täiustatud piltide mõistmine – objektide tuvastamine, saate kasutada API pakutavat vastusevormingut, mis sisaldab tuvastatud objektide loendit koos vastavate objektidega. piirdekastid ja usaldusskoorid. Selle vastuse sõelumisel saate soovitud objekti märkused eraldada.
API vastus koosneb tavaliselt JSON-objektist, mis sisaldab erinevaid välju, sealhulgas välja "localizedObjectAnnotations", mis sisaldab tuvastatud objekte. Iga objekti annotatsioon sisaldab teavet, nagu objekti nimi, selle piirdekasti koordinaadid ja usaldusskoor, mis näitab API usaldusväärsust tuvastamisel.
Objekti annotatsioonide eraldamiseks võite järgida järgmisi samme.
1. Parsige API vastus: alustage API-lt saadud JSON-i vastuse sõelumisega. Seda saab teha JSON-i sõelumisteegi või teie programmeerimiskeele pakutavate sisseehitatud funktsioonide abil.
2. Juurdepääs väljale "localizedObjectAnnotations": kui vastus on sõelutud, avage väljale "localizedObjectAnnotations", mis sisaldab tuvastatud objekte. See väli on tavaliselt objekti märkuste massiiv.
3. Itereeri objektimärkuste kaudu: itereeri läbi iga massiivi objekti annotatsiooni. Iga märkus tähistab pildil tuvastatud objekti.
4. Ekstraktige asjakohane teave: ekstraheerige igast objekti annotatsioonist asjakohane teave, nagu objekti nimi, piirdekasti koordinaadid ja usaldusskoor. Nendele üksikasjadele pääseb juurde iga objekti annotatsiooni eraldi väljadena.
5. Eraldatud teabe salvestamine või töötlemine: sõltuvalt teie nõudmistest saate eraldatud teabe salvestada andmestruktuuri või analüüsimiseks või muudel eesmärkidel edasi töödelda. Näiteks võite soovida salvestada objektide nimed ja nende vastavad piirdekasti koordinaadid andmebaasi või kasutada neid edasiste kujutiste mõistmise ülesannete jaoks.
Siin on ekstraheerimisprotsessi illustreerimiseks lihtsustatud näide:
python import json # Assume 'response' contains the API response in JSON format response =
{
"localizedObjectAnnotations": [
{
"mid": "/m/01g317",
"nimi": "kass",
"skoor": 0.89271355,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.1234, "y": 0.5678},
{"x": 0.5678, "y": 0.1234}
] }
},
{
"mid": "/m/04rky",
"nimi": "koer",
"skoor": 0.8132468,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.4321, "y": 0.8765},
{"x": 0.8765, "y": 0.4321}
] }
}
] }
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
Selles näites eeldame JSON-vastust, mis sisaldab kahte tuvastatud objekti: kassi ja koera. Kood analüüsib vastust, pääseb juurde väljale "localizedObjectAnnotations", itereerib läbi iga objekti annotatsiooni ja eraldab objekti nime, piirdekasti koordinaadid ja usaldusskoori. Lõpuks prinditakse välja võetud teave, kuid saate koodi muuta vastavalt oma vajadustele.
Järgides neid samme, saate tõhusalt ekstraheerida kõik objektide märkused API vastusest tehisintellekti – Google Vision API – täiustatud piltide mõistmise – objektide tuvastamise valdkonnas.
Muud hiljutised küsimused ja vastused selle kohta Täpsem piltide mõistmine:
- Millised on Google Vision API objektituvastuse eelmääratletud kategooriad?
- Milline on soovitatav lähenemisviis turvalise otsingu tuvastamise funktsiooni kasutamiseks koos teiste modereerimistehnikatega?
- Kuidas pääseme iga kategooria tõenäosusväärtustele ligi ja kuvame neid turvalise otsingu annotatsioonis?
- Kuidas saame Pythonis Google Vision API abil turvalise otsingu märkuse hankida?
- Millised on viis kategooriat, mis sisalduvad turvalise otsingu tuvastamise funktsioonis?
- Kuidas tuvastab Google Vision API turvalise otsingu funktsioon piltidelt vulgaarse sisu?
- Kuidas me saame padjateegi abil pildil tuvastatud objekte visuaalselt tuvastada ja esile tõsta?
- Kuidas saame eraldatud objektiteavet pandade andmeraami abil tabelivormingus korraldada?
- Milliseid teeke ja programmeerimiskeelt kasutatakse Google Vision API funktsionaalsuse demonstreerimiseks?
- Kuidas Google Vision API teostab objektide tuvastamist ja lokaliseerimist piltidel?
Vaadake rohkem küsimusi ja vastuseid jaotises Kujutiste täpsem mõistmine