Tehisintellekti (AI) kontekstis ja konkreetselt Google Cloud Machine Learningi domeenis tähistatud andmed viitavad andmestikule, mis on annoteeritud või tähistatud konkreetsete siltide või kategooriatega. Need sildid on masinõppe algoritmide koolitamise põhitõde või viide. Seostades andmepunkte nende vastavate siltidega, saab masinõppemudel õppida mustreid ära tundma ja uute, seninägematute andmete põhjal ennustusi tegema.
Märgistatud andmetel on ülioluline roll juhendatud õppes, mis on masinõppes levinud lähenemisviis. Järelevalvega õppimise korral koolitatakse mudelit märgistatud andmestiku põhjal, et õppida seoseid sisendfunktsioonide ja neile vastavate väljundsiltide vahel. See koolitusprotsess võimaldab mudelil üldistada oma teadmisi ja teha täpseid ennustusi uute, seninägematute andmete kohta.
Selle kontseptsiooni illustreerimiseks vaatleme masinõppe ülesande näidet pildituvastuse valdkonnas. Oletame, et tahame luua mudeli, mis suudab liigitada loomade kujutised erinevatesse kategooriatesse, nagu kassid, koerad ja linnud. Vajame märgistatud andmekogumit, kus iga pilt on seotud selle õige sildiga. Näiteks kassi kujutis märgitaks kui "kass", koera kujutis kui "koer" ja nii edasi.
Märgistatud andmekogum koosneks piltide kogumist ja nendele vastavatest siltidest. Iga pilt oleks esindatud funktsioonide komplektiga, nagu piksliväärtused või pildist eraldatud kõrgema taseme esitused. Sildid näitaksid õiget kategooriat või klassi, kuhu iga pilt kuulub.
Koolitusfaasis esitatakse masinõppe mudel koos märgistatud andmekogumiga. See õpiks tuvastama sisendfunktsioonide ja vastavate siltide vahelisi mustreid ja seoseid. Mudel värskendaks oma sisemisi parameetreid, et minimeerida erinevust selle prognooside ja koolitusandmete tegelike siltide vahel.
Kui mudel on koolitatud, saab seda kasutada uute, seninägematute piltide ennustamiseks. Märgistamata kujutise korral analüüsiks mudel selle funktsioone ja ennustaks märgistatud andmekogumist õpitud teadmiste põhjal kõige tõenäolisemat silti. Näiteks kui mudel ennustab, et pilt sisaldab kassi, tähendab see, et ta on pildil tuvastanud mustreid, mis viitavad kassile.
Märgistatud andmed on masinõppemudelite koolitamise põhikomponent. See annab mudelile vajaliku teabe, millest õppida ja täpseid ennustusi teha. Seostades andmepunkte nende vastavate siltidega, saab mudel õppida mustreid ära tundma ja üldistada oma teadmisi nähtamatuteks andmeteks.
Muud hiljutised küsimused ja vastused selle kohta EITC/AI/GCML Google Cloud Machine Learning:
- Mis on tekst kõneks (TTS) ja kuidas see AI-ga töötab?
- Millised on masinõppes suurte andmekogumitega töötamise piirangud?
- Kas masinõpe võib anda dialoogilist abi?
- Mis on TensorFlow mänguväljak?
- Mida suurem andmekogum tegelikult tähendab?
- Millised on mõned näited algoritmi hüperparameetritest?
- Mis on ansambliõpe?
- Mida teha, kui valitud masinõppealgoritm ei sobi ja kuidas valida õige?
- Kas masinõppemudel vajab koolituse ajal järelevalvet?
- Milliseid võtmeparameetreid kasutatakse närvivõrgupõhistes algoritmides?
Vaadake rohkem küsimusi ja vastuseid rakenduses EITC/AI/GCML Google Cloud Machine Learning
Veel küsimusi ja vastuseid:
- Väli: Tehisintellekt
- programm: EITC/AI/GCML Google Cloud Machine Learning (minge sertifitseerimisprogrammi)
- Õppetund: Sissejuhatus (minge seotud õppetundi)
- Teema: Mis on masinõpe (minge seotud teema juurde)