Redigerer
Invertert indeks
(avsnitt)
Hopp til navigering
Hopp til søk
Advarsel:
Du er ikke innlogget. IP-adressen din vil bli vist offentlig om du redigerer. Hvis du
logger inn
eller
oppretter en konto
vil redigeringene dine tilskrives brukernavnet ditt, og du vil få flere andre fordeler.
Antispamsjekk.
Ikke
fyll inn dette feltet!
== Fullstendig Invertert indeks == Noe den inverterte filindeksen ikke er egnet til er det å svare på spørringer som tar forbehold om setninger eller nærhet. Dersom man for eksempel kjører en spørringer etter «[[New York]]» har ikke den inverterte filindeksen noe informasjon som sier at de to ordene kan høre sammen. Den vil trolig da returnere dokumenter som inneholder de to ordene på ulike steder i dokumentet. Hva jeg vil ha: d<sub>1</sub> = «'''New York''' is the most populous city in the United States...» Hva som kan returneres: d<sub>2</sub> = «I love this '''new''' place in '''York'''» En '''fullstendig invert indeks''' tar i tillegg, til en liste med referanser til dokumenter for hvert ord, også med posisjonen til hvert ord i et dokument. La oss ta et eksempel for å vise hvordan man kan illustrere dette. d<sub>1</sub> = «it is what it is» d<sub>2</sub> = «what is it» d<sub>3</sub> = «it is a banana» {| class="wikitable" |- ! Vokabular !! η<sub>1</sub> !! !! Forekomster med posisjon |- | a || 1 || || [3, 1 [3]] |- | banana || 1 || || [3, 1 [4]] |- | is || 3 || || [1, 2[2, 5]], [2, 1[2]], [3, 1[2]] |- | it || 3|| || [1,2[1,4]], [2,1[3]], [3, 1[1]] |- | what || 2 || || [1,1[3]], [2,1[1]] |} Vi ser i følgende [[matrise]] at ordet «''a''» forekommer i ett dokument. Dette ser vi under tabellen ''η<sub>1</sub>''. Under tabellen #''Forekomster med posisjon''» ser vi at ordet forekommer i dokument nummer 3, og her forekommer ordet kun 1 gang og ordet er på posisjon nummer 3. Tar vi derimot ordet «What» ser vi at den forekommer i to dokumenter. Det første dokumentet dette ordet forekommer i er dokument nummer 1. Her forekommer ordet 1 gang og posisjonen er 3. Neste dokument er dokument 2. Her forekommer ordet en gang på posisjon en. Ved at vi nå har posisjonen til ordene kan vi se om flere ord som «New York» kan ha en sammenheng.<ref name=":0" /><ref name=":1" />
Redigeringsforklaring:
Merk at alle bidrag til Wikisida.no anses som frigitt under Creative Commons Navngivelse-DelPåSammeVilkår (se
Wikisida.no:Opphavsrett
for detaljer). Om du ikke vil at ditt materiale skal kunne redigeres og distribueres fritt må du ikke lagre det her.
Du lover oss også at du har skrevet teksten selv, eller kopiert den fra en kilde i offentlig eie eller en annen fri ressurs.
Ikke lagre opphavsrettsbeskyttet materiale uten tillatelse!
Avbryt
Redigeringshjelp
(åpnes i et nytt vindu)
Navigasjonsmeny
Personlige verktøy
Ikke logget inn
Brukerdiskusjon
Bidrag
Opprett konto
Logg inn
Navnerom
Side
Diskusjon
norsk bokmål
Visninger
Les
Rediger
Rediger kilde
Vis historikk
Mer
Navigasjon
Forside
Siste endringer
Tilfeldig side
Hjelp til MediaWiki
Verktøy
Lenker hit
Relaterte endringer
Spesialsider
Sideinformasjon