Redigerer
Datavarehus
Hopp til navigering
Hopp til søk
Advarsel:
Du er ikke innlogget. IP-adressen din vil bli vist offentlig om du redigerer. Hvis du
logger inn
eller
oppretter en konto
vil redigeringene dine tilskrives brukernavnet ditt, og du vil få flere andre fordeler.
Antispamsjekk.
Ikke
fyll inn dette feltet!
{{kildeløs}} '''Datavarehus''' er en type [[database]]system som søker å organisere data på en tematisk rettet måte, med andre ord å strukturere informasjon og strukturen av disse slik at de egner seg for [[Analyse|analytisk]] behandling. == Opprinnelse og definisjon == [[Bill Inmon]] kom opp med begrepet datavarehus, og regnes som feltets grunnlegger.<ref>Jill Dyché (2000). ''e-Data: turning data into information with data warehousing''. Addison-Wesley. p.323.</ref><ref>Alexander Factor (2001). ''Analyzing Application Service Providers''. Prentice Hall PTR. p.290.</ref> {{Sitat|''A warehouse is a subject-oriented, integrated, time-variant and non-volatile collection of data in support of management's decision making process. ''|Bill Inmon}} På grunn av at såkalte kuber er en meget velegnet måte å støtte effektiv temabasert, analytisk [[uttrekk]] av data, har det dannet seg en feilaktig oppfatning av at kubemodellen er selve definisjonen av datavarehus. Dette er ikke riktig. [[Bill Inmon]], i motsetning til [[Ralph Kimball]], mener at grunndataene for datavarehuset skal lagres på tredje [[Normalisering|normalform]], mens selve rapporteringen skal skje på kuber som henter sine data fra grunnmodellen. == To faglige leirer: Inmon og Kimball == Mens Bill Inmon har fått æren for å oppfinne datavarehuset, har Ralph Kimball hatt mer suksess og innflytelse med sine bøker om datavarehus. Kimball hevder filosofien med at et datavarehus er unionen av en organisasjons samling av [[datatorg]] (engelsk ''data mart''). Inmon derimot, mener at det kun finnes ett sentralt datavarehus som er delt i en [[databasenormalisering|normalisert]] grunnmodell som gir data til mange rapporteringskuber. De to tilnærmingene har ulike fordeler. Mens Kimballs tilnærming muliggjør rask implementasjon av de enkelte [[temavarehus]]ene ([[datatorg]]ene) innen hvert tema, krever Inmons tilnærming mer planlegging, analyse etc.. Noe som fort kan bli kostbart og, ikke minst i stor fallhøyde. Bill Inmons tilnærming er imidlertid mer egnet for store dataintegrasjonsprosjekter, hvor en strukturert tilnærming til datakvalitet og ytelse er viktig. De to tilnærmingene kan henholdsvis kalles sentraliserte og desentraliserte datavarehus. Sistnevnte, som er støttet av Kimballs leir, kan også betegnes som føderert datavarehus (''federated datawarehouse'') eller datatorg-sentrert utvikling (''data mart centric development''). {{Sitat|''DM is the only viable technique for databases that are designed to support end user queries in a data warehouse. ER is very useful for the transaction capture and data administration phases of constructing a warehouse but it should be avoided for the end-user delivery.''|Ralph Kimball}} Denne uttalelsen har skapt mange kontroverser og misforståelser. Den viktigste er at dimensjonsmodellen nærmest er den definerende egenskapen ved et datavarehus eller temavarehus. {{Sitat|The nice thing about relationally designed tables as a basis for a data warehouse is that in a relational format the relational data can be reshaped and reformed into any configuration that is needed. Stated differently, when relational design is done properly and the data exists at a low level of granularity in the data warehouse, any other configuration of data can be supported – multidimensional cubes, star schemas, flat files, etc.|Bill Inmon}} Den største kontroversen mellom de to leirene går på hvor vidt man skal ha en konkret grunnmodell i bunnen av en datavarehussatsing, hvor alle dataene hentes fra, eller om et datavarehus bare skal være en abstrakt union mellom alle temavarehusene. === Hybride metoder === Kimball-metodikken kan beskrives som en [[Design ovenfra og nedenfra|ovenfra]] designmetode, mens Inmon-metodikken kan beskrives som en [[Design ovenfra og nedenfra|nedenfra]] designmetode. Det finnes også flere hybride metoder (også kalt ensemble-metoder) som prøver å eliminere dataredundans, men samtidig legge til rette for enkel dimensjonsmodellering for [[virksomhetsetterretning]]. Den hybride metoden ''fokalmodellering'' ble lansert i 1998 av svenske Patrik Lager og kolleger.<ref>{{Kilde www|url=https://topofminds.se/2016/tom-focal-introduction-to-focal-implementation/|tittel=ToM Focal – Introduction to Focal implementation {{!}} Top of Minds - Specialisterna med fokus på kompetens|besøksdato=2024-04-28|språk=sv-SE}}</ref><ref>{{Kilde www|url=https://topofminds.se/wp/wp-content/uploads/Focal-Introduction-to-Focal-implementation.pdf|tittel=INTRODUCTION TO THE FOCAL FRAMEWORK How to Model, Design and Code in a Focal Data Warehouse}}</ref> [[Datahvelvmodellering]] er en hybrid metode som fokuserer på å kombinere langtids historikk fra ulike kildesystemer med fokus på sporing, revisjonskontroll og motstandsdyktighet mot endringer i kilde-datamodeller. Første versjon ble lansert i 2000 av amerikanske [[Dan Linstedt]], og i 2013 ble datahvelv 2.0 lansert med noen små forbedringer. [[Ankermodellering]] er også en entitetsbasert modelleringsteknikk, og har utvidelser for å arbeide med [[Temporal database|temporale data]]. Den er strengt formalisert, og er godt egnet for informasjon som over tid endrer både struktur og innhold. Rammeverket ble presentert i 2008, og er oppfunnet av svenskene [[Lars Rönnbäck]] og Olle Regardt. == Aktiviteter knyttet til datavarehus == ===Datapopulasjon=== De fleste datavarehus lastes daglig, ukentlig eller månedlig, og i noen tilfeller nær sanntid. For å holde kontroll med kompleksiteten i lastemønsteret brukes vanligvis såkalte [[ETL]] verktøy. ETL prosessen er normalt kjerneaktiviteten i forvaltning av datavarehus løsninger. I de senere år har ETL prosessen gjennomgått en spesialisering til egne aktiviteter for håndtering av [[metadata]], [[datakvalitet]], [[dataprofilering]], [[dataauditing]] og flere andre områder. === Behovsanalyse === Mange datavarehusprosjekter har egne aktiviteter knyttet til behovsanalyse, hvor rapporteringsbehov identifiseres. Denne aktiviteten søker å konsolidere behov i organisasjonen, slik at man kan definere og strukturere [[forretningsbegrep]]er som i sin tur danner grunnlaget for å definere forskjellige [[rapporteringskuber]] eller [[datamart]]s ([[temavarehus]] på norsk). === Dimensjonsmodellering === [[Dimensjonsmodellering]] er å definere og modellere [[OLAP-kube|kuber]], og er en av kjerneaktivitetene i datavarehussammenheng. == Se også == * [[Landingssone]] == Referanser == <references/> <ref>{{Kilde www|url=https://topofminds.se/2016/tom-focal-introduction-to-focal-implementation/|tittel=ToM Focal – Introduction to Focal implementation {{!}} Top of Minds - Specialisterna med fokus på kompetens|besøksdato=2024-04-28|språk=sv-SE}}</ref> {{Data}} {{Databaser}} {{Datavarehus}} {{Autoritetsdata}} [[Kategori:Databaser]] [[Kategori:Virksomhetsetterretning]]
Redigeringsforklaring:
Merk at alle bidrag til Wikisida.no anses som frigitt under Creative Commons Navngivelse-DelPåSammeVilkår (se
Wikisida.no:Opphavsrett
for detaljer). Om du ikke vil at ditt materiale skal kunne redigeres og distribueres fritt må du ikke lagre det her.
Du lover oss også at du har skrevet teksten selv, eller kopiert den fra en kilde i offentlig eie eller en annen fri ressurs.
Ikke lagre opphavsrettsbeskyttet materiale uten tillatelse!
Avbryt
Redigeringshjelp
(åpnes i et nytt vindu)
Maler som brukes på denne siden:
Mal:Amboks
(
rediger
)
Mal:Autoritetsdata
(
rediger
)
Mal:Data
(
rediger
)
Mal:Databaser
(
rediger
)
Mal:Datavarehus
(
rediger
)
Mal:Hlist/styles.css
(
rediger
)
Mal:ISOtilNorskdato
(
rediger
)
Mal:Kilde www
(
rediger
)
Mal:Kildeløs
(
rediger
)
Mal:Kildeløs/Fiks det!.css
(
rediger
)
Mal:Navboks
(
rediger
)
Mal:Navbox
(
rediger
)
Mal:Sitat
(
rediger
)
Mal:Tekstboks
(
rediger
)
Mal:Tekstboks/styles.css
(
rediger
)
Modul:Arguments
(
rediger
)
Modul:Citation/CS1
(
rediger
)
Modul:Citation/CS1/COinS
(
rediger
)
Modul:Citation/CS1/Configuration
(
rediger
)
Modul:Citation/CS1/Date validation
(
rediger
)
Modul:Citation/CS1/Identifiers
(
rediger
)
Modul:Citation/CS1/Utilities
(
rediger
)
Modul:Citation/CS1/Whitelist
(
rediger
)
Modul:External links
(
rediger
)
Modul:External links/conf
(
rediger
)
Modul:External links/conf/Autoritetsdata
(
rediger
)
Modul:Genitiv
(
rediger
)
Modul:ISOtilNorskdato
(
rediger
)
Modul:Kildeløs
(
rediger
)
Modul:Message box
(
rediger
)
Modul:Message box/ambox.css
(
rediger
)
Modul:Message box/configuration
(
rediger
)
Modul:Navbar
(
rediger
)
Modul:Navbar/configuration
(
rediger
)
Modul:Navbar/styles.css
(
rediger
)
Modul:Navboks
(
rediger
)
Modul:Navbox
(
rediger
)
Modul:Navbox/configuration
(
rediger
)
Modul:Navbox/styles.css
(
rediger
)
Modul:TableTools
(
rediger
)
Modul:Yesno
(
rediger
)
Denne siden er medlem av 2 skjulte kategorier:
Kategori:Artikler uten kilder
Kategori:Artikler uten kilder, mangler Wikidata
Navigasjonsmeny
Personlige verktøy
Ikke logget inn
Brukerdiskusjon
Bidrag
Opprett konto
Logg inn
Navnerom
Side
Diskusjon
norsk bokmål
Visninger
Les
Rediger
Rediger kilde
Vis historikk
Mer
Navigasjon
Forside
Siste endringer
Tilfeldig side
Hjelp til MediaWiki
Verktøy
Lenker hit
Relaterte endringer
Spesialsider
Sideinformasjon