Information Lifecycle Management

29
work in progress, Jurgen van de Pol, dec 2013 hoe houden we de kosten in de hand

Transcript of Information Lifecycle Management

work in progress, Jurgen van de Pol, dec 2013

hoe houden we de kosten in de hand

work in progress, Jurgen van de Pol, dec 2013

datagroei

hoe houden we de

kosten in de hand

work in progress, Jurgen van de Pol, dec 2013

Daar zit je dan,

je ziet de data dagelijks groeien, back-up vensters kruipen naar de 24-uur, de enorme

nachtelijke data bewegingen verstoppen het netwerk als aderverkalking in een

kransslagader.

De nieuwe aanvraag voor 5 terrabyte ligt bovenop de aanvraag van 7 terrabyte. Hoe

gaan we aan de business uitleggen dan we weer een storage-uitbreiding nodig hebben

terwijl de vorige uitbreiding van 7,5 ton nog maar 7 maanden geleden was.

Hoe gaan we uitleggen dat we weer tonnen aan storage en toebehoren nodig hebben om

de datagroei binnen het bedrijf op te vangen?

Hoelang kunnen we met deze nieuwe investering eigenlijk de datagroei te lijf? Hoe ziet

de groeiprognose er eigenlijk uit voor de komende twee à drie jaar? Is deze investering

eigenlijk wel nodig, wat als we ongebruikte data verwijderen? Redden we het dan wel?

En waarom back-uppen we nu eigenlijk alles, is dat echt nodig?

work in progress, Jurgen van de Pol, dec 2013

onze groei, 100 Terrabyte in 8 mnd

work in progress, Jurgen van de Pol, dec 2013

Data groeit exponentieel 25% p/jr

"There was 5 exabytes of information created

between the dawn of civilization through 2003,

that much information is now created every 2

days, and the pace is increasing ...

Eric Schmidt CEO Google

work in progress, Jurgen van de Pol, dec 2013

Virtual Servers fueling the wildfire

work in progress, Jurgen van de Pol, dec 2013

wat betekent data voor CZ

CZ is een informatie gedreven organisatie

naast de relatie met de klant en onze kennis

over de processen van zorgverzekeren,

is data onze meest waardevolle asset

work in progress, Jurgen van de Pol, dec 2013

de algemeen heersende opinie

● we hebben teveel data en datagroei

● we spenderen teveel aan storage en backup

● er kan veel data weg omdat het dubbel is,

onnodig is, of oud is.

work in progress, Jurgen van de Pol, dec 2013

waarom is controle zo moeilijk?

● onze data heeft onduidelijke waarde

● omdat we niet precies weten wat de waarde is, weten we niet

hoeveel tijd en geld we moeten investeren in classificatie, opslag,

management en backup.

● de waarde is subjectief

● wie bepaalt wat weg mag, hoe lang het bewaard moet blijven,

hoeveel kopieën ervan moeten zijn.

● het bepalen van de waarde is een moeizaam multidisciplinair

proces, capaciteit uitbreiden is de weg van de minste weerstand

work in progress, Jurgen van de Pol, dec 2013

gedeelde verantwoordelijkheid

twee partijen:

● partij die de data genereert en consumeert

● partij verantwoordelijk voor opslag en

bescherming

werkzaam in compleet gescheiden afdelingen met

verschillende doelen, missie en prioriteiten

work in progress, Jurgen van de Pol, dec 2013

data & informatie

● IB/TAB beheert de data

● de business is eigenaar van & beheert de informatie

Data wordt informatie zodra het door mensen in context

geplaatst en geïnterpreteerd kan worden.

work in progress, Jurgen van de Pol, dec 2013

onbegrip

● laag bewustzijn van kosten die gepaard gaan met het beheer en

management van de data.

● weinig inzicht in deze kosten.

● opties en keuzes zijn onvoldoende transparant en leiden tot

inefficiënt gebruik van resources.

● IT budget en human resources staan onder druk.

● onbeantwoorde vraag : wiens data/informatie is het nu eigenlijk?

● ICT behandelt alle data gelijkwaardig (full backup & gold level)

● data verwijderen is definitief en onomkeerbaar, wie neemt de

beslissing, data kan in een nieuwe context weer nieuwe waarde

krijgen (data analysis)

work in progress, Jurgen van de Pol, dec 2013

de realiteit

● data groeit exponentieel, niet lineair (80% van alle data

is gegenereerd in de laatste 2 jaar)

● opslag wordt goedkoper, nieuwe technieken als

deduplicatie en thin provisioning maken opslag

efficiënter, maar vraag blijft beschikbare capaciteit

overstijgen

● technologie is niet de Haarlemmer olie voor kosten

beheersing

work in progress, Jurgen van de Pol, dec 2013

Data management omvat

● governance, risk & compliance

● architectuur, analyse & design

● database management

● security (access, encryption, vernietiging, diefstal)

● kwaliteit (opschoning, integriteit, verrijking)

● tiering & archivering

● data warehousing & BI (datamarts, mining, golden records)

● ECM content & records management

● metadata

● BCP

work in progress, Jurgen van de Pol, dec 2013

Information Lifecycle Management

“ILM omvat het samenspel van beleid, processen, praktijken en

tooling toegepast om bedrijfswaarde van informatie af te stemmen

op de best passende en meest kosten effectieve IT-infrastructuur,

vanaf het moment dat informatie wordt gevormd

tot en met haar definitieve verwijdering.

De informatie is afgestemd op de business eisen met behulp van

policies en service levels in samenhang met alle toepassingen,

metadata en gegevens.”

work in progress, Jurgen van de Pol, dec 2013

Informatie

● De business is eigenaar van de informatie.

● Informatie is opgeslagen op basis van business eisen.

● De waarde van informatie kan veranderen met de tijd,

waarde wordt regelmatig opnieuw geëvalueerd.

● De eisen tav informatie zijn helder, goed

gecommuniceerd en worden regelmatig geëvalueerd

work in progress, Jurgen van de Pol, dec 2013

Leeftijd en gebruik van data

work in progress, Jurgen van de Pol, dec 2013

work in progress, Jurgen van de Pol, dec 2013

Information Lifecycle Management

storage hardware

storage virtualisatie

SAN Beheer

storage resource beheer

Service Level Monitoring

SLA / OLA beheer

Info

rmatio

n L

ifecycle

Managem

ent

work in progress, Jurgen van de Pol, dec 2013

raadpleeg frequentiebeschikbaarheids

eisen

impact van onbeschikbaarheid

financieel operatiecompliance

data classificatie

primair secundair archief

evaluatie

classificatie

toewijzing

opslag tier

tier 1 tier 2 tier 3

FC/SSD iscsi/sata archief

replicatie / backup / recovery / archivebescherming

work in progress, Jurgen van de Pol, dec 2013

3 onderdelen van een ILM strategie

Een ILM strategie omvat minimaal deze 3 aandachtsgebieden:

● Data lifecycle management infrastructuur

Behandelt de infrastructuur die helpt bij het vaststellen van de juiste opslag categorie,

performance, replicatie, backup levels etc. Deze infrastructuur levert ILM en helpt bij de

vermindering van de totale kosten van data & informatie opslag

● Security

Security is essentieel in het kader van naleving van regel en wetgeving (GRC), beperkte

toegang tot gevoelige informatie beperkt de risico’s. Wie heeft toegang? Hoe wordt je

identiteit gecontroleerd. Hoe is de informatie beschermd?

● Integratie

Beschrijft en realiseert de integratie van applicaties met de fysieke Data Lifecycle

Management infrastructuur. Er bestaat geen complete single vendor oplossing die kan

voldoen aan alle specifieke informatie eisen van CZ, samenwerking tussen verschillende

leverancier tbv een goede integrale oplossing is essentieel.

work in progress, Jurgen van de Pol, dec 2013

work in progress, Jurgen van de Pol, dec 2013

Storage Tiering, wat heb je nodig

● Stakeholders bepalen de behoeften.

● Bepaal hoeveel tiers je echt nodig hebt, hoe minder hoe

beter.

● Bepaal hoe je de tiers technologisch levert.

● Bepaal de behoeften binnen elke tier tav de lifecycle

van de data.

work in progress, Jurgen van de Pol, dec 2013

Classificatie van dataVanuit het datacenter perspectief is de informatie van de CZ business slechts DATA

● IT managed alleen de DATA: files, volumes, bits & bytes

● Informatie is data in context geplaatst : business beslissingen zijn gebaseerd op informatie

● Nauwe samenwerking met de business is nodig om goed te bepalen wat de service behoeften zijn

● Met behulp van de geïnventariseerde behoeften kun je een SLA opstellen

Business Informatie stakeholders:

● Applicatie performance, beschikbaarheid , restore-baarheid

● Response tijden eindgebruiker, waarde bepaling van de data

● Kosten van opslag, kopieën, bescherming, retentie, backup, groei

Organisatie informatie stakeholders:

● Security officer :versleuteling ,vertrouwelijkheid, beschikbaarheid

● Records Manager: bewaar termijnen,...

● Compliance officer: autorisatie,retentie,...

Classificatie proces schept de voorwaarden om onderstaande te realiseren:

● Opstellen van een service catalogus

● Opstellen van data classificatie policies

● Afstemmen van de data op de juiste tier gebaseerd op de overeengekomen requirements

work in progress, Jurgen van de Pol, dec 2013

voorbeeld van een storage catalogus

work in progress, Jurgen van de Pol, dec 2013

ILM maturity

Initial RepeatableDefined &

measured

Quantatitivaly

managedOptimizing

-no storage service

strategy

-no service lifecycle

-no metrics

-no SLA

-introduction of

service design proces

& functions

-event/fault monitoring

-manual configuration

-some reporting

-storage service

catalog

-service level

transition

-capacity

management

-ILM reporting

-all storage classes in

CMDB

-config & asset

mngmt

-tools

-processes

-highly automated

strategy defineddesign of proces &

function

transistion to

serviceservice operation

full service

lifecycle

work in progress, Jurgen van de Pol, dec 2013

work in progress, Jurgen van de Pol, dec 2013

Next Steps

● workshop met IT & business stakeholders

● start met awareness, who’s data is it?

● creëer transparantie in tco/abc en

mogelijkheden

● inventariseer behoeften

work in progress, Jurgen van de Pol, dec 2013

Lifecycle of data