Het organiseren van data en informatie Hoofdstuk 3: Fundamentals of information systems Ralph Stair...
-
Author
wouter-verbeek -
Category
Documents
-
view
215 -
download
0
Embed Size (px)
Transcript of Het organiseren van data en informatie Hoofdstuk 3: Fundamentals of information systems Ralph Stair...

Het organiseren van data en informatie
Hoofdstuk 3:
Fundamentals of information systems
Ralph Stair & George Reynolds
Hoorcollege ICT in Organisatie, Beleid en Management (IOBM)Marco Spruit : http://www.cs.uu.nl/staff/spruit.html

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 2
Principes en Leerdoelen [1/3]Data » Databases » Data mining » Business intelligence
Data management en data modellering zijn centrale aspecten in het organiseren van data en informatie Definieer algemene data management concepten
en termen, en licht de voordelen van de databasebenadering in data management uit
Beschrijf het relationele database model en schets de basiskenmerken hiervan

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 3
Principes en Leerdoelen [2/3] Een goed ontworpen en goed beheerde
database is een extreem waardevol hulpmiddel in het ondersteunen van de besluitvorming Stel de standaard functies vast die door alle
database management systems uitgevoerd worden
Bepaal de populaire database management systems voor eindgebruikers

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 4
Principes en Leerdoelen [3/3] Het aantal en soorten van database
toepassingen zal zich verder blijven ontwikkelen en zal concrete zakelijke voordelen blijven opleveren Benoem en bespreek huidige database
toepassingen

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 5
Waarom leren over Database Systemen? Databasesystemen (Ned: “gegevensbanken”)
verwerken en organiseren (grote) hoeveelheden gegevens
Informatiekunde: waar/hoe is de informatie? Databasegebruik in allerlei functies:
Marketing manager: klantgegevens Bedrijfsjurist: eerdere vonnissen, precedenten …

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 6
Flashback 1/2: Data versus Informatie Data: ruwe feiten
Alfanumeriek, beeld, geluid, video Voorbeeld: “spruit” “1”
Informatie: verzameling van feiten die dusdanig zijn georganiseerd dat er toegevoegde waarde aanwezig is boven de ruwe feiten
Voor mensen begrijpelijk en bruikbaar!

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 7
Flashback 2/2: Informatiesystemen
Componenten van een computer-gebaseerd informatiesysteem Geconfigureerd om data te verzamelen, manipuleren, bewaren, en transformeren
naar informatie

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 8
Introductie Database: een georganiseerde verzameling
gegevens Database management system (DBMS):
een verzameling programma’s om een database mee te beheren Manipuleert de database Verschaft een interface tussen de database en de
gebruiker (zowel database als andere applicaties) Database administrator (DBA): een IT
professional die de databases van een organisatie beheert en onderhoudt

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 9
Data Management Zonder data en de mogelijkheid om ermee te
(ver-)werken, kan een organisatie de meeste bedrijfsactiviteiten niet succesvol uitvoeren Betalen van werknemers Versturen van facturen Bestellen van nieuwe voorraden
Data bestaat uit ruwe feiten Om data te transformeren in betekenisvolle
informatie, moet het eerst worden geordend worden op een betekenisvolle wijze

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 10
De Datahiërarchie [1/3] Bit (een binair getal): een circuit dat óf AAN
óf UIT staat Byte: acht bits
Karakter: basis eenheid van informatie Elke byte representeert een character Kan een hoofdletter, kleine letter, numeriek getal,
speciaal symbool zijn Veld (kolom; rubriek): bijv. een naam,
nummer, of andere combinatie van karakters die een aspect van een zakelijk object of activiteit beschrijven

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 11
Bits-Byte-Karakter: Decimaal versus Binair Wikipedia voorbeeld bij getalsystemen
In 256 128 64 32 16 8 4 2 1 Uit
0011010100 0 1 1 0 1 0 1 0
=106+64 +32 +8 +2
1000100001 0 0 0 1 0 0 0 0
=272+256 +16
57-32 -16 -8 0 0 -1
=1110011 1 1 0 0 1
Bits Byte Karakter
…en vice versa

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 12
De Datahiërarchie [2/3] Record (rij): een verzameling van
gerelateerde velden File (tabel; dossier): een verzameling van
gerelateerde records Database (gegevensbank): een
verzameling van geïntegreerde en gerelateerde files
Datahiërarchie: bits, karakters, velden, records, files, en databases

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 13
De Datahiërarchie [3/3]
Figuur 3.1: De datahiërarchie

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 14
Entiteiten, Attributen, en Sleutels [1/2] Entiteit: een gegeneraliseerde klasse van
mensen, plaatsen, of ‘dingen’ (objecten) waarvoor data wordt verzameld/onderhouden
Attribuut: Een kenmerk van een entiteit Data item: De waarde van een attribuut Sleutel: Een veld of verzameling velden in
een record dat gebruikt wordt om het record te identificeren
Primaire sleutel: Een sleutel waarmee ieder record uniek geïdentificeerd kan worden

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 15
Entiteiten, Attributen, en Sleutels [2/2]
Figuur 3.2: Sleutels en Attributen

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 16
Entiteiten, Attributen, en Terroristen p.112,§1: Van attributen & data naar
terrorismebestrijding…http://news.cnet.com/8301-13578_3-10059987-38.html?part=rss&subj=news&tag=2547-1_3-0-20

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 17
De Databasebenadering [1/4] De traditionele benadering van database
management: voor iedere toepassing worden aparte data bestanden aangemaakt Resulteert in dataredundantie (duplicatie) Dataredundantie conflicteert met data-integriteit
De databasebenadering van database management: ‘een vijver’ van gerelateerde data wordt gedeeld door meerdere toepassingen Significante voordelen t.o.v. de traditionele
benadering

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 18
De Databasebenadering [2/4]
Figure 3.3: De databasebenadering van Data Management

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 19
De Databasebenadering [3/4]
Tabel 3.1: Voordelen van de databasebenadering

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 20
De Databasebenadering [4/4]
Tabel 3.2: Nadelen van de databasebenadering

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 21
Data Modellering [1/2] Data model: een diagram van data entiteiten
en hun onderlinge relaties Entiteit-relatie (ER) diagram: een type data
model dat gebruik maakt van eenvoudige grafische symbolen om de organisatie van —en relaties tussen — de data te tonen

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 22
Data Modellering [2/2]
Figuur 3.4: Entiteit-Relatie (ER) Diagram voor een Klantorder DB
1-1 relatie =>
1-n relatie =>

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 23
Het Relationele Database Model [1/2] Relationele model: alle data elementen
worden geplaatst in tweedimensionale tabellen (relaties), die het logische equivalent zijn van bestanden (files)
In het relationele model geldt: Elke rij in een tabel representeert een data entiteit Kolommen van de tabel representeren attributen Domein: de toegestane waarden voor data
attributen Data dictionary: gedetailleerde beschrijving
van alle data die in de database voorkomt

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 24
Het Relationele Database Model [2/2]
Figuur 3.5: Een Relationeel Database Model

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 25
Datamanipulatie [1/2] Selecteren: het elimineren van rijen volgens
bepaalde criteria Projecteren: het elimineren van kolommen in
een tabel Samenvoegen: het combineren van twee of
meer tabellen Verbinden: het relateren of verbinden van
twee of meer tabellen via gedeelde data attributen

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 26
Datamanipulatie [2/2]
Figuur 3.7: Het verbinden van tabellen om de vraag te kunnen beantwoorden:Wie is de manager van de Sales Manual en sinds wanneer is hij in dienst?

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 27
Overzicht van Database Types Flat file
Simpel databaseprogramma waarin records geen relatie met elkaar hebben
Voorbeeld: Excel Single user
Slechts één persoon kan tegelijkertijd gebruik maken van de database
Voorbeelden: Access, FileMaker Multi-user
Meerdere mensen hebben tegelijkertijd toegang tot hetzelfde database systeem
Voorbeelden: zie volgende slide…

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 28
http://www.dbm.nl/site/jsp/nieuws.jsp?art_iID=10734

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 29
Datamanipulatie en Rapportage [1/2] Structured Query Language (SQL): Dé
standaard vraagtaal voor relationele databases Query-By-Example (QBE): een visuele
benadering om SQL vragen te formuleren Data manipulation language (DML):
Commando’s die de data in een database manipuleren
Database programma’s kunnen rapporten documenten, en allerlei andere vormen van uitvoer produceren

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 30
Manipulatie en Rapportage [2/2]
Table 3.3: Voorbeelden van SQL Commando’s

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 31
Database Beheer Database administrator (DBA): Stuurt aan en
voert uit alle activiteiten binnen de database omgeving Plannen, ontwerpen, aanmaken, opereren,
beveiligen, monitoren en onderhouden van de database systemen (Figuur 3.16!)
Vaststellen en invoeren van beleid en procedures Werknemers trainen

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 32
Selecteren van een Database Systeem Belangrijke database eigenschappen die
overwogen dienen te worden Grootte van de database Kosten van het systeem Aantal gelijktijdige gebruikers Uitvoeringssnelheid (lezen/schrijven) Integratiemogelijkheden met andere systemen Leverancier overwegingen
Open-source?

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 33
Verbinden van Databases met Internet Verbinden van databases met het Internet is
belangrijk voor veel organisaties en mensen Semantische Web
Ontwikkeling van een naadloze integratie van traditionele databases met het Internet
Laat mensen een aantal traditionele databases tegelijkertijd benaderen en manipuleren via het Internet
W3C: “The Semantic Web provides a common framework that allows data to be shared and reused across application, enterprise, and community boundaries”. [http://www.w3.org/2001/sw/SW-FAQ]

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 34
Over Databases, Internet, en De Wet… Wat vindt onze overheid eigenlijk van al die
databases en het internet…?

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 35
Data Warehouses, Marts, Mining [1/3] Data warehouse: verzamelt
bedrijfsinformatie uit meerdere bronnen in de organisatie
Data mart: een deelverzameling van een data warehouse
Data mining: een informatieanalyse gereedschap voor het blootleggen van patronen en relaties in een data warehouse of data mart

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 36
MBI afstudeervoorbeeld: Data mining MBI scriptie van A. Vleugel: Data mining:
finding patterns in historical data to improve the forecasting procedure of employee service providers
.

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 37
Data Warehouses, Marts, Mining [2/3]
Figuur 3.17: Elementen van een Data Warehouse

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 38
Data Warehouses, Marts, Mining [3/3]
Tabel 3.5: Regelmatig voorkomende Data Mining toepassingen

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 39
De Weerbarstige Werkelijkheid…

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 40
Business Intelligence [1/2] Business intelligence (BI): het verzamelen
van de juiste informatie, tijdig, in een bruikbare vorm, en het analyseren van deze informatie om het zaken doen op een positieve manier te beïnvloeden Transformeert data naar bruikbare informatie, die
vervolgens gedistribueerd wordt door de gehele organisatie

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 41
Business Intelligence [2/2] Competitive intelligence: een aspect van
business intelligence dat zich beperkt tot informatie over concurrenten en de manieren waarop deze kennis strategie, tactieken, en de dagelijkse gang van zaken beïnvloedt
Counterintelligence: de stappen die een organisatie neemt om informatie te beschermen die gezocht wordt door “vijandige” intelligence verzamelaars
http://www.fas.org/irp/ops/ci/cistrategy2007.pdf

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 42
Wie zijn de Business Intelligence leveranciers tot 2007?
BI LeverancierBI LeverancierOmzet ($M) Omzet ($M)
20062006Markt aandeel Markt aandeel
20062006Groei Groei
2005-20062005-2006
1 Business Objects 894 14% 7%
2 SAS 679 11% 17%
3 Cognos 622 10% 10%
4 Microsoft 480 8% 28%
5 Hyperion 322 5% 12%
[IDC Research (2006), The BI Tools Market in 2006]

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 43
Wie zijn de Business Intelligence leveranciers in 2008?
BI GrootmachtBI GrootmachtMarktaandeelMarktaandeel
20072007 BI Prooi in 2007BI Prooi in 2007
1 SAP (7) 26,3 % Business Objects (1)
2 IBM (12) 14,7 % Cognos (3)
3 Oracle (8) 10,6 % Hyperion (5)
4 SAS (2)
5 Microsoft (4)

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 44
Gedistribueerde Databases Gedistribueerde database
De data kan verspreid zijn over verschillende kleinere databases die onderling verbonden zijn via telecommunicatie apparaten
Bedrijven krijgen meer flexibiliteit in hoe databases georganiseerd en gebruikt worden
Gerepliceerde database Bevat een identieke verzameling van frequent
gebruikte data

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 45
Online Analytical Processing (OLAP) Software waarmee gebruikers data
kunnen verkennen vanuit verschillende perspectieven
Tabel 3.6: Vergelijking van OLAP en Data Mining

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 46
Objectgeoriënteerde Databases Objectgeoriënteerd database management
systeem (OODBMS) Programma’s die een objectgeoriënteerdee
database manipuleren en een gebruikersinterface en verbindingen naar andere toepassingen verschaffen
Object-relational database management system (ORDBMS) Een DBMS met speciale ondersteuning voor
audio, video, en geografische data

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 47
Samenvatting [1/3] Datahiërarchie: bits, karakters, velden,
records, files, en databases Entiteit: een gegeneraliseerde klasse van
mensen, plaatsen, of ‘dingen’ (objecten) waarvoor data wordt verzameld/onderhouden
Attribuut: Een kenmerk van een entiteit Data model: een diagram van data entiteiten
en hun onderlinge relaties Relationele model: alle data elementen worden
geplaatst in tweedimensionale tabellen (relaties)

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 48
Samenvatting [2/3] Selecteren: het elimineren van rijen volgens
bepaalde criteria Projecteren: het elimineren van kolommen in
een tabel Een database management system (DBMS)
is een groep programma’s die als interface gebruikt worden tussen: Database en toepassingsprogramma’s Database en de gebruiker
Data dictionary: gedetailleerde beschrijving van alle data die in de database voorkomt

dinsdag 16 december 2008
Het organiseren van data en informatie :: Stair & Reynolds :: H3 49
Samenvatting [3/3] Data warehouse: database die
bedrijfsinformatie verzamelt over alle aspecten van bedrijfsprocessen, producten, klanten
Data mining: een informatieanalyse gereedschap voor het blootleggen van patronen en relaties in een data warehouse
Business intelligence (BI): het verzamelen van de juiste informatie, tijdig en bruikbaar, en het analyseren van deze informatie om het zaken doen positief te beïnvloeden