Redigerer
Dependensparsing
(avsnitt)
Hopp til navigering
Hopp til søk
Advarsel:
Du er ikke innlogget. IP-adressen din vil bli vist offentlig om du redigerer. Hvis du
logger inn
eller
oppretter en konto
vil redigeringene dine tilskrives brukernavnet ditt, og du vil få flere andre fordeler.
Antispamsjekk.
Ikke
fyll inn dette feltet!
=== Universal Dependencies === Et problem ved utvikling av tverrspråklig språkteknologi er at tilgjengelige ressurser for ulike språk kan ha betydelige forskjeller som gjør det vanskelig å sammenligne modellene. Det er bakgrunnen for prosjektet Universal Dependencies (UD), som koordineres av Joakim Nivre ved [[Uppsala universitet]]. UD lager retningslinjer for syntaktisk annotering slik at trebanker for ulike språk er konsistente og danner bedre sammenligningsgrunnlag mot hverandre.<ref>{{Kilde www|url=https://nlp.stanford.edu/pubs/nivre2016ud.pdf|tittel=Universal Dependencies v1: A Multilingual Treebank Collection|besøksdato=2017-10-27|forfattere=Nivre, Joakim et al.|dato=|forlag=|sitat=}}</ref> Blant annet spesifiserer retningslinjene at et utvalg på 17 ulike [[ordklasse]]r skal brukes for alle språk, samt at hodet i en dependensfrase skal være et innholdsord (verb, substantiv osv.), ikke et funksjonsord (hjelpeverb, bestemmere osv.). UD spesifiserer også et filformat, ''CoNLL-U'', som representerer samlinger med annoterte setninger i et [[Tekstfil|rent tekstformat]]. I tillegg gjør prosjektet et utvalg slike trebanker tilgjengelige på nettsidene sine.<ref>{{Kilde www|url=http://universaldependencies.org/#ud-treebanks|tittel=Universal Dependencies v2: UD Treebanks|besøksdato=2017-10-27|forfattere=Universal Dependencies Contributors|dato=|forlag=|sitat=}}</ref> Det finnes tre norske trebanker i UD-formatet. Bokmål og Nynorsk trebankene er konvertert fra den Norske Dependenstrebanken (NDT), som er to separate trebanker, med tekster på bokmål og nynorsk, annotert [[Morfologisk typologi|morfologisk]] og syntaktisk. Nynorsk LIA trebanken er basert på LIA trebanken som er translitterering fra dialekt til nynorsk.<ref>{{Kilde www|url=http://www.hf.uio.no/iln/english/research/projects/language-infrastructure-made-accessible/|tittel=LIA - Department of Linguistics and Scandinavian Studies|besøksdato=2017-10-27|språk=en|verk=www.hf.uio.no}}</ref> NDT ble utviklet 2011-2014 på Nasjonalbiblioteket i samarbeid med tekstlaboratoriet og informatikkdepartementet ved Universitetet i Oslo. NDT er automatisk konvertert til å følge UD-annotasjon ved Lilja Øvrelid ved Universitetet i Oslo.<ref>{{Kilde www|url=http://universaldependencies.org/no/overview/introduction.html|tittel=Introduction|besøksdato=2017-10-27|språk=en-GB|verk=universaldependencies.org}}</ref>
Redigeringsforklaring:
Merk at alle bidrag til Wikisida.no anses som frigitt under Creative Commons Navngivelse-DelPåSammeVilkår (se
Wikisida.no:Opphavsrett
for detaljer). Om du ikke vil at ditt materiale skal kunne redigeres og distribueres fritt må du ikke lagre det her.
Du lover oss også at du har skrevet teksten selv, eller kopiert den fra en kilde i offentlig eie eller en annen fri ressurs.
Ikke lagre opphavsrettsbeskyttet materiale uten tillatelse!
Avbryt
Redigeringshjelp
(åpnes i et nytt vindu)
Denne siden er medlem av 1 skjult kategori:
Kategori:CS1-vedlikehold: Eksplisitt bruk av m.fl.
Navigasjonsmeny
Personlige verktøy
Ikke logget inn
Brukerdiskusjon
Bidrag
Opprett konto
Logg inn
Navnerom
Side
Diskusjon
norsk bokmål
Visninger
Les
Rediger
Rediger kilde
Vis historikk
Mer
Navigasjon
Forside
Siste endringer
Tilfeldig side
Hjelp til MediaWiki
Verktøy
Lenker hit
Relaterte endringer
Spesialsider
Sideinformasjon