Redigerer
Tegnsett
Hopp til navigering
Hopp til søk
Advarsel:
Du er ikke innlogget. IP-adressen din vil bli vist offentlig om du redigerer. Hvis du
logger inn
eller
oppretter en konto
vil redigeringene dine tilskrives brukernavnet ditt, og du vil få flere andre fordeler.
Antispamsjekk.
Ikke
fyll inn dette feltet!
'''Tegnsett''' eller '''tegnkoding''' er det som i datamaskiner definerer hvilket lesbart symbol som representeres av et gitt [[heltall]]. All tekst i datamaskiner er remser av heltall, i denne sammenhengen kalt ''tegnkoder''. Tegnkodenes digitale representasjon kan være oktetter, elektriske pulser, morsekode eller hva som helst som egner seg for elektronisk databehandling. Det er viktig at tekstdata leses etter samme tegnsett som de ble skrevet med, ellers vil noen tegnkoder bli mistolket. Nordiske tegn og [[diakritiske tegn]] er mest sårbare for denne typen programvarefeil, ettersom de er forskjellig definert eller utelatt i forskjellige tegnsett. Når informasjon om hvilket tegnsett som er brukt ikke lagres sammen med teksten, som tilfellet er med [[tekstfil]]er, er dette et uunngåelig problem. Det moderne [[Unicode]] (som er identisk med [[ISO]]/[[IEC]]-standarden [[ISO/IEC 10646]]) er en omfattende standard som inkluderer all verdens [[bokstaver]], [[tall]] og andre [[symbol]]er, og definerer hvordan hver av dem skal assosieres med en spesifikke tallverdier. Det finnes flere standarder for å oversette disse tallverdiene til oktetter. Noen eksempler er [[UTF-7]], [[UTF-8]], [[UTF-16]], [[UCS-2]] og [[UCS-4]]. I denne sammenhengen omfatter begrepet ''tegnsett'' også kodingen til oktetter. Foruten Unicode finnes de nordiske bokstavene ÄÅÆÖØ og äåæöø (i den rekkefølgen) i følgende tegnsett: [[ISO-8859-1]], ''ISO-8859-4'', ''ISO-8859-9'', ''ISO-8859-10'', ''ISO-8859-14'', ''ISO-8859-15'' og ''ISO-8859-16''. Bare de to siste av denne tegnsettfamilien inneholder eurotegnet €. I [[ASCII]]-baserte tegnsett er det forskjell på tegnene for tallene og tallene selv; tegnene for tallene 0-9 har verdiene 48-57. På systemer der en [[byte]] er 8 bit, lagres også 7 bits ascii som 8 bit. Tegnsettet iso-8859-1 lagrer Å som 197, Æ som 198 og Ø som 216. Små bokstaver er 32 høyere enn de tilsvarende store. Enkle alfabetiseringsalgoritmer vil derfor sortere "ÆæØøÅå" som "ÅÆØåæø". De 256 første tegnene i unicode er de samme som i iso-8859-1, men bare de 128 første tegnene av utf-8 har samme digitale representasjon som i iso-8859-1, ettersom de 128 neste tar 2 oktetter i utf-8. ==Se også== * [[ASCII]] * [[ISO-8859-1]] * [[UTF-8]] * [[UTF-16]] * [[Tegnspråk]] * [[Morsealfabetet]] {{Autoritetsdata}} [[Kategori:Tegnsett]] {{spire}} <!--skanwiki--> <!--interwiki-->
Redigeringsforklaring:
Merk at alle bidrag til Wikisida.no anses som frigitt under Creative Commons Navngivelse-DelPåSammeVilkår (se
Wikisida.no:Opphavsrett
for detaljer). Om du ikke vil at ditt materiale skal kunne redigeres og distribueres fritt må du ikke lagre det her.
Du lover oss også at du har skrevet teksten selv, eller kopiert den fra en kilde i offentlig eie eller en annen fri ressurs.
Ikke lagre opphavsrettsbeskyttet materiale uten tillatelse!
Avbryt
Redigeringshjelp
(åpnes i et nytt vindu)
Maler som brukes på denne siden:
Tegnsett
(
rediger
)
Mal:Autoritetsdata
(
rediger
)
Mal:Spire
(
rediger
)
Mal:Spire/stil.css
(
rediger
)
Modul:Article
(
rediger
)
Modul:External links
(
rediger
)
Modul:External links/conf
(
rediger
)
Modul:External links/conf/Autoritetsdata
(
rediger
)
Modul:Genitiv
(
rediger
)
Denne siden er medlem av 1 skjult kategori:
Kategori:Spirer 2024-04
Navigasjonsmeny
Personlige verktøy
Ikke logget inn
Brukerdiskusjon
Bidrag
Opprett konto
Logg inn
Navnerom
Side
Diskusjon
norsk bokmål
Visninger
Les
Rediger
Rediger kilde
Vis historikk
Mer
Navigasjon
Forside
Siste endringer
Tilfeldig side
Hjelp til MediaWiki
Verktøy
Lenker hit
Relaterte endringer
Spesialsider
Sideinformasjon