Nedanstående är skrivet av Peter Söderström. Han nås på peter.soderstrom@itplan.se eller www.itplan.se .Den som är intresserad av programvaror som använder datalager se www.upphandlabi.se
Vad är datalager
Ett datalager är en logiskt sammanhållen datamängd, som är avsedd för analys och som speglar flera tidsperioder genom att data regelbundet hämtas från andra register.
Data uppdateras således inte direkt i datalagret, utan i andra system från vilka data hämtas.
Datalagret kan fungera som en generell kunskapsbank för en organisation. Vanligare är en mer avgränsad inriktning på ett fåtal verksamhetsområden. Det måste finns en organisation för kvalitetssäkring och samordning av de data som ligger i datalagret. Det är snarare denna gemensamma samordning och kvalitetskontroll som definierar datalagret och inte hur data delas upp fysiskt.
I bilden nedan som beskriver principen för ett datalager, kan man se hur data hämtas från operativa system längst ned och samlas i datalagret varifrån olika kategorier av användare kan hämta dem och använda dem som stöd för sin verksamhet. Verksamheten försäljning lämnar uppgifter till den del av datalagret som används för verksamheten ekonomistyrning. Extern information om marknaden placeras i datalagret och används för verksamheten marknadsanalys. Data om dessa verksamhetsområden behöver inte vara tekniskt sammanlänkade, men de ingår i datalagret vilket innebär att det finns en organisation för kvalitetskontroll och användarstöd och att data har enhetliga definitioner.
Vissa hävdar att data lika gärna kan hämtas direkt i källsystemen. Detta är förvisso tekniskt möjligt, men medför ofta kvalitetsproblem eftersom data i källsystemen sällan byggda för att korrekt kunna jämföras med data i andra system. När man hämtar data direkt i källsystemen uppstår snart ett växande förvaltningsproblem, eftersom analyserna påverkas när källsystemen ändras. Icke desto mindre kan det vara rationellt att hämta data i källsystemen för avgränsade analyser som är begränsade i tiden.
Principerna för ett datalager.
Data som kopieras i ett tredje steg och lagras för användning inom ett verksamhetsområde (t ex marknadsanalys i figuren) sägs ligga i ett lokalt dataskafferi. Den amerikanska termen är "Data Mart".
Ett väl strukturerat och administrerat datalager löser följande problem
2000-talet har medfört en starkt förbättrad teknik för datalagring.
Numera kan de allra flesta organisationer lagra allt de önskar i ett datalager. Tekniken och ekonomin tillåter att man lagrar alla de uppgifter som föds inom en organisation så länge som de har något intresse. Undantag från denna regel är s.k. big data, dvs vanligen data som hämtas från sociala nätverk eller speciella mätdata som meteorologiska data.
Kostnaderna för själva datalagringen är för de flesta organisationer rimlig. För stora organisationer med mycket stora datavolymer kan ett datalager vara kostsamt, men det är inte själva lagringen som kostar utan administrationen.
Exempel på hur datalager kan göra nytta:
En grossist har byggt ett datalager som beskriver lagret över fysiska varor. I datalagret finns data speciellt anpassade till inköpare och säljare liksom till dem som ansvarar för själva lagret. Datalagret laddas varje dag med uppgifter från de operativa systemen. Därvid beräknas för varje slag av artikel uppgifter om kostnad och intäkt för denna artikel. Genom att summera uppgifterna i olika kategorier som produktgrupp, leverantör, kund, tidsperiod, etc kan ansvariga precis se omsättningshastighet, marginaler, bruttointäkt för ett mycket stort antal kombinationer. Härigenom kan beslutsfattare på många nivåer både lokalt och centralt erhålla detaljerad information om verksamheten och var och en kan bidra till att verksamheten bedrivs optimalt utifrån de mål som är uppsatta.
Ett datalager kan stödja verksamhetsstyrningen genom att
Datalager ger organisationen möjlighet att smidigare reagera på sin omgivning och att bättre ta vara på de egna resurserna. I dag är användande av datalager en självklarhet inom den privata industrin. Även inom offentlig verksamhet har de flesta organisationer ett eller flera datalager för att optimera sin verksamhet.
Vad tekniken orkar
2003 hade Wal Mart i USA det största datalagret i världen på över100 terabyte. I dag är detta inga avskräckande volymer. Över huvud taget har tekniken gjort att datavolymen inte är särskilt intressant för de flesta företag.
En flaskhals kan vara hur fort data kan laddas eller "fyllas på" från dag till dag. Wal Marts datalager fylls varje dag på med bl a över 100 miljoner kvittorader från all försäljning i de tusentals varuhusen. Wal Mart lagrar dessa uppgifter i 65 veckor.