Maamärkide teabe eraldamiseks märkuste vastuse objektist Google Vision API täiustatud piltide mõistmise funktsiooni kontekstis orientiiride tuvastamiseks peame kasutama API pakutavaid asjakohaseid välju ja meetodeid. Annotatsiooni vastuse objekt on JSON-struktuur, mis sisaldab erinevaid pildianalüüsi tulemustega seotud atribuute ja väärtusi.
Esiteks peame tagama, et API on pilti edukalt töödelnud ja vastuseobjekt sisaldab vajalikku teavet. Seda saab teha vastuseobjekti "oleku" välja kontrollimisega. Kui olek on "OK", näitab see, et pildianalüüs oli edukas ja saame jätkata orientiiri teabe väljavõtmist.
Maamärgi teabele pääseb juurde vastuseobjekti väljalt "landmarkAnnotations". See väli on annotatsioonide massiiv, kus iga märkus tähistab pildil tuvastatud maamärki. Iga orientiiri märkus sisaldab mitut atribuuti, sealhulgas asukohta, kirjeldust ja punktisummat.
Atribuut "asukoht" annab tuvastatud maamärgi piirdekasti koordinaadid. Need koordinaadid määravad pildil maamärgi asukoha ja suuruse. Neid koordinaate analüüsides saame määrata maamärgi täpse asukoha.
Atribuut "kirjeldus" annab maamärgi tekstilise kirjelduse. Seda kirjeldust saab kasutada maamärgi tuvastamiseks ja kasutajale täiendava konteksti pakkumiseks. Näiteks kui API tuvastab pildil Eiffeli torni, võib kirjelduse atribuut sisaldada teksti "Eiffeli torn".
Atribuut "skoor" tähistab API usaldusskoori orientiiri tuvastamisel. See skoor on väärtus vahemikus 0 kuni 1, kus kõrgem skoor näitab kõrgemat usaldustaset. Seda skoori analüüsides saame hinnata tuvastatud maamärgi usaldusväärsust.
Annotatsiooni vastuse objektist orientiiriteabe eraldamiseks saame korrata massiivi "landmarkAnnotations" ja pääseda juurde iga annotatsiooni asjakohastele atribuutidele. Seejärel saame seda teavet edasiseks analüüsiks või kuvamiseks vajadusel salvestada või töödelda.
Siin on Pythoni koodilõigu näide, mis näitab, kuidas eraldada annotatsiooni vastuse objektist orientiiriteave Google Cloud Vision API klienditeegi abil.
python from google.cloud import vision def extract_landmark_info(response): if response.status == 'OK': for annotation in response.landmark_annotations: location = annotation.location description = annotation.description score = annotation.score # Process the landmark information as needed print(f"Landmark: {description}") print(f"Location: {location}") print(f"Score: {score}n") else: print('Image analysis failed.') # Assuming you have already authenticated and created a client client = vision.ImageAnnotatorClient() # Assuming you have an image file 'image.jpg' to analyze with open('image.jpg', 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.landmark_detection(image=image) extract_landmark_info(response)
Selles näites võtab funktsioon „extract_landmark_info” sisendiks märkuse vastuse objekti ja kordab läbi massiivi „landmark_annotations”. Seejärel ekstraheerib ja prindib see iga annotatsiooni orientiiriteabe, sealhulgas kirjelduse, asukoha ja hinde.
Seda lähenemisviisi järgides saame orientiiriteabe tõhusalt eraldada märkuste vastuse objektist, mida pakub Google Vision API täiustatud piltide mõistmise funktsioon maamärkide tuvastamiseks.
Muud hiljutised küsimused ja vastused selle kohta Täpsem piltide mõistmine:
- Millised on Google Vision API objektituvastuse eelmääratletud kategooriad?
- Milline on soovitatav lähenemisviis turvalise otsingu tuvastamise funktsiooni kasutamiseks koos teiste modereerimistehnikatega?
- Kuidas pääseme iga kategooria tõenäosusväärtustele ligi ja kuvame neid turvalise otsingu annotatsioonis?
- Kuidas saame Pythonis Google Vision API abil turvalise otsingu märkuse hankida?
- Millised on viis kategooriat, mis sisalduvad turvalise otsingu tuvastamise funktsioonis?
- Kuidas tuvastab Google Vision API turvalise otsingu funktsioon piltidelt vulgaarse sisu?
- Kuidas me saame padjateegi abil pildil tuvastatud objekte visuaalselt tuvastada ja esile tõsta?
- Kuidas saame eraldatud objektiteavet pandade andmeraami abil tabelivormingus korraldada?
- Kuidas saame API vastusest eraldada kõik objekti annotatsioonid?
- Milliseid teeke ja programmeerimiskeelt kasutatakse Google Vision API funktsionaalsuse demonstreerimiseks?
Vaadake rohkem küsimusi ja vastuseid jaotises Kujutiste täpsem mõistmine