Näites kasutatud Irise andmestiku leidmiseks pääseb sellele juurde UCI masinõppehoidla kaudu. Irise andmestik on masinõppe valdkonnas klassifitseerimisülesannete jaoks laialt kasutatav andmestik, eriti hariduskontekstis, kuna see on lihtne ja tõhus erinevate masinõppealgoritmide demonstreerimisel.
UCI masinõppehoidla on masinõppekogukonnas laialdaselt kasutatav ressurss, mis majutab erinevaid andmekogumeid uurimis- ja õppeotstarbel. Irise andmestik on üks UCI hoidlas saadaolevatest andmekogumitest ja sellele pääseb hõlpsasti juurde masinõppeprojektides kasutamiseks.
Irise andmestiku hankimiseks UCI masinõppehoidlast saate järgida järgmisi samme.
1. Külastage UCI masinõppehoidla veebisaiti aadressil https://archive.ics.uci.edu/ml/index.php.
2. Liikuge veebisaidil jaotisesse "Andmed".
3. Otsige Irise andmestikku, sirvides saadaolevaid andmekogumiid või kasutades veebisaidi otsingufunktsiooni.
4. Laadige see alla vormingus, mis ühildub kasutatud masinõppekeskkonnaga. Andmekogum on tavaliselt saadaval CSV-vormingus (Comma-Separated Values), mida saab hõlpsasti importida sellistesse tööriistadesse nagu Pythoni pandateek andmete töötlemiseks ja analüüsimiseks.
Teise võimalusena pääseb Irise andmestikule juurde otse populaarsete masinõppeteekide kaudu, näiteks Pythonis scikit-learn. Scikit-learn pakub Irise andmestiku laadimiseks sisseehitatud funktsioone, mis muudab kasutajatele andmestikule juurdepääsu mugavaks ilma seda eraldi alla laadimata.
Allpool on Pythoni koodilõigu näide, mis kasutab Irise andmestiku laadimiseks scikit-learni:
python from sklearn.datasets import load_iris # Load the Iris dataset iris = load_iris() # Access the features and target labels X = iris.data y = iris.target # Print the shape of the dataset print("Shape of the Iris dataset:", X.shape)
Käitades ülaltoodud koodilõigu, saab Irise andmestiku scikit-learni abil otse Pythoni keskkonda laadida ja mõnel masinõppeülesannetel andmestikuga töötada.
Muud hiljutised küsimused ja vastused selle kohta EITC/AI/GCML Google Cloud Machine Learning:
- Mis on tekst kõneks (TTS) ja kuidas see AI-ga töötab?
- Millised on masinõppes suurte andmekogumitega töötamise piirangud?
- Kas masinõpe võib anda dialoogilist abi?
- Mis on TensorFlow mänguväljak?
- Mida suurem andmekogum tegelikult tähendab?
- Millised on mõned näited algoritmi hüperparameetritest?
- Mis on ansambliõpe?
- Mida teha, kui valitud masinõppealgoritm ei sobi ja kuidas valida õige?
- Kas masinõppemudel vajab koolituse ajal järelevalvet?
- Milliseid võtmeparameetreid kasutatakse närvivõrgupõhistes algoritmides?
Vaadake rohkem küsimusi ja vastuseid rakenduses EITC/AI/GCML Google Cloud Machine Learning