Redigerer
K-NN
(avsnitt)
Hopp til navigering
Hopp til søk
Advarsel:
Du er ikke innlogget. IP-adressen din vil bli vist offentlig om du redigerer. Hvis du
logger inn
eller
oppretter en konto
vil redigeringene dine tilskrives brukernavnet ditt, og du vil få flere andre fordeler.
Antispamsjekk.
Ikke
fyll inn dette feltet!
== Algoritme == ''k-''NN blir sett på som en av de simpleste algoritmene for klassifisering som finnes. Algoritmen har bare 2 steg; #Plasser alle objekter i ett plan med dimensjoner som representerer hver attributt. #Finn de ''k-''nærmeste naboene av objektet, ved bruk av en likhets-score. #Gi objektet en klasse fra flertallet av de k-nærmeste naboene. ''k'' er et heltall som må bli bestemt for hver implementasjon. Hvilket tall ''k'' skal være, vil variere basert på for eksempel størrelsen på læresettet. Det er lurt å teste forskjellige verdier for ''k'', for å se hvilken som fungerer best. Man kan sjekke dette ved hjelp av et testsett, altså et sett med objekter som man vet den korrekte klassifiseringen på, men som man ikke gir til algoritmen. Dermed kjører man algoritmen på settet og ser hvor mange den klassifiserer rett. De nærmeste naboene er tatt ut fra et «læresett», som er et sett med objekter som er korrekt klassifisert. Metoden kalles derfor en veiledet algoritme.<ref>Everitt, B. S., Landau, S., Leese, M. and Stahl, D. (2011) Miscellaneous Clustering Methods, in Cluster Analysis, 5th Edition, John Wiley & Sons, Ltd, Chichester, UK.</ref> For å finne ut hvilken av disse som er nærmest dokumentet som klassifiseres, er det vanlig å bruke [[trigonometriske funksjoner]]. Dette er en måte å sammenligne forskjellen mellom to vectorer, i dette tilfellet alle attributtene til dokumentene. Det går også an å bruke evklidsk avstand mellom to dokumenter. Når man har disse rangeringene, kan man også bruke avstandsvekting for å påvirke resultatet.<ref>Eiben, F., Witten H, I., & Hall A, M. (2011). Data Mining: Practical Machine Learning Tools and Techniques (3rd ed.).</ref> En fordel med ''k-''NN er at den bare baserer seg på objektet den skal klassifisere, i stedet for en stor global klassifiseringsmodell. Dette kan gjøre det mer nøyaktig enn for eksempel ved et [[beslutningstre]], da man bare vurderer egenskaper som er relevante for objektet.
Redigeringsforklaring:
Merk at alle bidrag til Wikisida.no anses som frigitt under Creative Commons Navngivelse-DelPåSammeVilkår (se
Wikisida.no:Opphavsrett
for detaljer). Om du ikke vil at ditt materiale skal kunne redigeres og distribueres fritt må du ikke lagre det her.
Du lover oss også at du har skrevet teksten selv, eller kopiert den fra en kilde i offentlig eie eller en annen fri ressurs.
Ikke lagre opphavsrettsbeskyttet materiale uten tillatelse!
Avbryt
Redigeringshjelp
(åpnes i et nytt vindu)
Navigasjonsmeny
Personlige verktøy
Ikke logget inn
Brukerdiskusjon
Bidrag
Opprett konto
Logg inn
Navnerom
Side
Diskusjon
norsk bokmål
Visninger
Les
Rediger
Rediger kilde
Vis historikk
Mer
Navigasjon
Forside
Siste endringer
Tilfeldig side
Hjelp til MediaWiki
Verktøy
Lenker hit
Relaterte endringer
Spesialsider
Sideinformasjon