Mis on TensorFlow Keras Tokenizer API maksimaalse sõnade arvu parameeter?
Pühapäev, 14. aprill 2024
by ankarb
TensorFlow Keras Tokenizer API võimaldab tekstiandmete tõhusat märgistamist, mis on loomuliku keele töötlemise (NLP) ülesannete oluline samm. Tokenizeri eksemplari konfigureerimisel TensorFlow Kerases on üheks seadistatavaks parameetriks parameeter "num_words", mis määrab sageduse alusel maksimaalse säilitatavate sõnade arvu.