Näites kasutatud närvivõrgu arhitektuur on edasisuunaline närvivõrk, millel on kolm kihti: sisendkiht, peidetud kiht ja väljundkiht. Sisendkiht koosneb 784 ühikust, mis vastab sisendpildi pikslite arvule. Iga sisendkihi ühik tähistab pildi piksli intensiivsuse väärtust.
Peidetud kiht koosneb 128 ühikust, mis on täielikult ühendatud sisendkihiga. Iga peidetud kihi üksus arvutab sisendkihi sisendite kaalutud summa ja rakendab väljundi loomiseks aktiveerimisfunktsiooni. Selles näites on peidetud kihis kasutatav aktiveerimisfunktsioon rektifitseeritud lineaarüksuse (ReLU) funktsioon. Funktsioon ReLU on defineeritud kui f(x) = max(0, x), kus x on üksuse sisendite kaalutud summa. Funktsioon ReLU tutvustab võrgule mittelineaarsust, võimaldades tal õppida andmetes keerulisi mustreid ja seoseid.
Väljundkiht koosneb 10 ühikust, millest igaüks esindab ühte klassifikatsiooniprobleemi võimalikest klassidest. Väljundkihi ühikud on samuti täielikult ühendatud peidetud kihi üksustega. Sarnaselt peidetud kihiga arvutab iga väljundkihi üksus peidetud kihi sisendite kaalutud summa ja rakendab aktiveerimisfunktsiooni. Selles näites on väljundkihis kasutatav aktiveerimisfunktsioon softmax funktsioon. Funktsioon softmax teisendab sisendite kaalutud summa klasside tõenäosusjaotuseks, kus tõenäosuste summa võrdub 1-ga. Suurima tõenäosusega ühik tähistab sisendpildi ennustatud klassi.
Kokkuvõtteks võib öelda, et näites kasutatud närvivõrgu arhitektuur koosneb 784 ühikuga sisendkihist, ReLU aktiveerimisfunktsiooni kasutavast 128 ühikust peidetud kihist ja Softmax aktiveerimisfunktsiooni kasutavast 10 ühikuga väljundkihist.
Muud hiljutised küsimused ja vastused selle kohta Närvivõrgu ehitamine klassifitseerimise teostamiseks:
- Kas TensorFlow.js-s töötavate masinõppemudelite jaoks on vaja kasutada asünkroonset õppefunktsiooni?
- Kuidas mudelit TensorFlow.js-s koostatakse ja koolitatakse ning milline on kategoorilise ristentroopia kadumise funktsiooni roll?
- Mis tähtsus on masinõppeprotsessis õppimiskiirusel ja ajastute arvul?
- Kuidas jagatakse treeninguandmed rakenduses TensorFlow.js treening- ja testikomplektideks?
- Mis on TensorFlow.js'i eesmärk klassifitseerimisülesannete jaoks närvivõrgu ehitamisel?