HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden...

46
HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM ...................................... 1 1.1 Wat is SAS ?...................................................................................................................................... 1 Information Delivery System ...................................................................................................................... 1 Toepassingsomgevingen ............................................................................................................................. 1 Multi platform ............................................................................................................................................. 1 Connectiviteit .............................................................................................................................................. 2 SAS modules ............................................................................................................................................... 2 1.2 Uitvoeren van een SAS programma ................................................................................................ 2 Bouwstenen van een SAS programma ........................................................................................................ 2 Verschillende wijzen voor uitvoeren van SAS programma’s ..................................................................... 4 De SAS venster omgeving .......................................................................................................................... 4 Uitvoeren van een SAS programma ............................................................................................................ 6 1.3 Regels voor het schrijven van een SAS programma .................................................................... 12 Syntax regels ............................................................................................................................................. 12 Stapsgewijze uitvoering ............................................................................................................................ 13 1.4 SAS Datasets ................................................................................................................................... 14 Observaties en variabelen ......................................................................................................................... 14 Het beschrijvend gedeelte ......................................................................................................................... 16 Naamconventies voor SAS datasets en variabelen .................................................................................... 17 Opvragen van het data en het beschrijvend gedeelte van een SAS Dataset .............................................. 17 1.5 SAS Data Libraries ........................................................................................................................ 20 Wat is een SAS data library ?.................................................................................................................... 20 De WORK library ..................................................................................................................................... 20 De SASHELP en de SASUSER libraries .................................................................................................. 22 Definiëren van een nieuwe library ............................................................................................................ 24 Werken met libraries ................................................................................................................................. 25 Verwijzen naar SAS datasets : samenvatting ............................................................................................ 27 1.6 Editeren en corrigeren van SAS programma’s ............................................................................ 29 Uitvoeren van een programma met syntax fouten ..................................................................................... 29 Terughalen van een programma in de Editor ............................................................................................ 32 Bewaren van het SAS programma ............................................................................................................ 33 1.7 Gebruik van het Editor venster ..................................................................................................... 35 Functies van de Enhanced Editor en de Program Editor ........................................................................... 35 Extra functionaliteiten van de Enhanced editor (optioneel) ...................................................................... 37 Extra functionaliteiten van de Program Editor (alleen voor niet Windows gebruikers) ............................ 40 1.8 HTML output genereren ............................................................................................................... 41 Listing output ............................................................................................................................................ 41 HTML output ............................................................................................................................................ 41

Transcript of HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden...

Page 1: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM ...................................... 1

1.1 Wat is SAS ? ...................................................................................................................................... 1 Information Delivery System ...................................................................................................................... 1 Toepassingsomgevingen ............................................................................................................................. 1 Multi platform ............................................................................................................................................. 1 Connectiviteit .............................................................................................................................................. 2 SAS modules ............................................................................................................................................... 2

1.2 Uitvoeren van een SAS programma ................................................................................................ 2 Bouwstenen van een SAS programma ........................................................................................................ 2 Verschillende wijzen voor uitvoeren van SAS programma’s ..................................................................... 4 De SAS venster omgeving .......................................................................................................................... 4 Uitvoeren van een SAS programma ............................................................................................................ 6

1.3 Regels voor het schrijven van een SAS programma .................................................................... 12 Syntax regels ............................................................................................................................................. 12 Stapsgewijze uitvoering ............................................................................................................................ 13

1.4 SAS Datasets ................................................................................................................................... 14 Observaties en variabelen ......................................................................................................................... 14 Het beschrijvend gedeelte ......................................................................................................................... 16 Naamconventies voor SAS datasets en variabelen .................................................................................... 17 Opvragen van het data en het beschrijvend gedeelte van een SAS Dataset .............................................. 17

1.5 SAS Data Libraries ........................................................................................................................ 20 Wat is een SAS data library ?.................................................................................................................... 20 De WORK library ..................................................................................................................................... 20 De SASHELP en de SASUSER libraries .................................................................................................. 22 Definiëren van een nieuwe library ............................................................................................................ 24 Werken met libraries ................................................................................................................................. 25 Verwijzen naar SAS datasets : samenvatting ............................................................................................ 27

1.6 Editeren en corrigeren van SAS programma’s ............................................................................ 29 Uitvoeren van een programma met syntax fouten ..................................................................................... 29 Terughalen van een programma in de Editor ............................................................................................ 32 Bewaren van het SAS programma ............................................................................................................ 33

1.7 Gebruik van het Editor venster ..................................................................................................... 35 Functies van de Enhanced Editor en de Program Editor ........................................................................... 35 Extra functionaliteiten van de Enhanced editor (optioneel) ...................................................................... 37 Extra functionaliteiten van de Program Editor (alleen voor niet Windows gebruikers) ............................ 40

1.8 HTML output genereren ............................................................................................................... 41 Listing output ............................................................................................................................................ 41 HTML output ............................................................................................................................................ 41

Page 2: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

INHOUD 2

ICTS FOOCES 2

Page 3: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 1

ICTS FOOCES 1

SAS Institute is een Amerikaanse software onderneming die in de voorbije 30 jaar consequent haar originele opdracht heeft behouden: de ontwikkeling van een omgeving waarin ondernemingen grote hoeveelheden gegevens kunnen verwerken tot bruikbare informatie waardoor zij met kennis van zaken succesvolle beslissingen kunnen nemen. Gedurende een ganse tijd situeerde SAS zich in het marktsegment van software voor statistische analyse. Vandaag is SAS veel meer dan een statistisch pakket en is het uitgegroeid tot een veelzijdig systeem dat in verschillende toepassingsomgevingen oplossingen biedt.

Toegepaste analyse: De diepgaande analyse van gegevens via gesofisticeerde analytische en visualiseringmethodes.

statistische gegevensanalyse kwaliteitsbeheer financiële analyse data mining : het opsporen van verborgen verbanden tussen gegevens

Business Intelligence Een geheel van instrumenten die de managers op een snelle en eenvoudige wijze informatie opleveren :

OLAP: On line analytical processing Query en Reporting DSS: Decision support systems Performance management Dashboards

Data warehousing / Data Integration

Web toepassingen

SAS functioneert op alle hardware platformen en bovendien is 90% van de SAS programmatuur hardware onafhankelijk. Dit betekent dat u SAS programma’s en applicaties eenvoudig en snel kan overdragen naar andere platformen. Platformen binnen K.U. Leuven waarop SAS beschikbaar is: UNIX (HPC), PC(Windows, Linux)

Hoofdstuk 1

Inleiding tot het SAS systeem

1.1 Wat is SAS ?

Information Delivery System

Toepassingsomgevingen

Multi platform

Page 4: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 2

ICTS FOOCES 2

SAS ondersteunt alle Client/Server architecturen. Daarnaast is toegang voorzien naar de meest gangbare databases: DB2, Oracle, … De gegevens kunnen rechtstreeks vanuit de database verwerkt worden en hoeven niet te worden omgezet naar een SAS gegevensbestand.

SAS zoals die in de cursus wordt gebruikt is nu SAS Foundation genaamd. Deze is opgebouwd uit verscheidene modules. Onderstaande modules zijn aanwezig binnen de K.U. Leuven ( niet op alle platformen): SAS/BASE: basis SAS; data manipulatie, beschrijvende statistieken, rapportering SAS/STAT: statistische procedures SAS/QC: kwaliteitscontrole SAS/FSP: full screen data-entry SAS/GRAPH: grafische output SAS/ETS: verwerken van econometrische tijdsreeksen SAS/IML : matrix taal SAS/AF: applicatie – ontwikkeling SAS/EIS: applicatie – ontwikkeling SAS/INSIGHT: interactieve exploratie van statistische gegevens SAS/ACCESS: toegang tot externe databases (PC formaten oa. Excel, Ms Acces, SPSS, MySql, Oracle, SAP R3,….) SAS/CONNECT : connectie tussen verschillende platformen SAS Enterprise Miner: data mining SAS Internet: aanmaak van web-toepassingen SAS AppDev Studio : ontwikkelomgeving voor Java Applets SAS Enterprise Guide : thin client interface voor uitvoeren van analyses op een SAS Server (kan de lokale machine zijn) via point & click.

Een SAS programma bestaat uit 2 componenten: DATA-steps en PROC-steps. Elk SAS programma bevat een opeenvolging van DATA- steps en PROC steps.

Een SAS programma kan bestaan uit een DATA-step of een PROC step

of een willekeurige combinatie van DATA en PROC steps Voorbeeld van een eenvoudig SAS programma:

Connectiviteit

SAS modules

1.2 Uitvoeren van een SAS programma

Bouwstenen van een SAS programma

Page 5: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 3

ICTS FOOCES 3

Onderstaand programma genereert een SAS-dataset met patiëntengegevens. Dit gebeurt in de DATA step. De data worden vervolgens doorgegeven aan een PROC step voor verwerking. Dit programma maakt een listing welke de opnamenummers, het geslacht en de leeftijd bevat en in een tweede PROC step wordt de gemiddelde leeftijd berekend.

data patient ;

infile 'N:\DATA\JOOGHE\SAS\BASIS\LESMATERIAAL\PATIENT.ASC';

input OpnameNummer 1-8 OpnameDatum $ 10-17

OpnameAard 19 OntslagDatum $ 21- 28 Ontslagaard 30

geslacht $ 32 leeftijd 34-36 ;

run;

proc print data = patient ;

var OpnameNummer geslacht leeftijd ;

run;

proc means data = patient;

var leeftijd ;

run;

DATA steps en PROC steps bestaan uit statements (de verschillende lijnen of instructies). Eén DATA of één PROC step kan één, meerdere of heel veel statements bevatten. In de DATA step gebruik je andere statements dan in de PROC step. Een typisch SAS programma begint met een DATA step voor het binnenbrengen van de gegevens in SAS en vervolgt dan met een PROC step die de gegevens analyseert. Dit is niet de enige mogelijkheid om DATA en PROC steps te combineren. Een SAS programma kan bestaan uit om het even welke mix van DATA en PROC steps. Er zijn ook programma’s die zuiver uit DATA steps bestaan of een programma kan ook alleen PROC steps bevatten. Een step eindigt wanneer SAS een nieuwe step tegenkomt of een RUN statement. De belangrijkste verschillen tussen DATA en PROC steps hebben we hieronder weergegeven. Een DATA step

begint steeds met een DATA statement

leest gegevens in en zet ze om in de vorm van een SAS dataset of SAS table.

kan wijzigingen aanbrengen aan bestaande SAS datasets ( nieuwe variabelen berekenen, observaties corrigeren…)

wordt ook gebruikt om nieuwe SAS datasets te creëren door samenvoeging van verscheidene bestaande SAS datasets

Een PROC step

begint steeds met een PROC statement

analyseert en presenteert de gegevens die zijn opgeslagen in een SAS dataset: Bvb. aanmaken van een rapport, berekening van beschrijvende statistieken, frequentietabellen maken, aanmaken van grafieken

produceert resultaten Hou er rekening mee dat in realiteit het verschil tussen DATA en PROC steps vager is dan hier wordt voorgesteld. PROC steps kunnen namelijk data sets aanmaken en het is mogelijk om via DATA steps rapporten te genereren. Maar, bij het leren schrijven van SAS programma’s is het makkelijker om ons te concentreren op de basisfuncties van DATA en PROC steps.

DATA step

PROC steps

Page 6: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 4

ICTS FOOCES 4

Tot hier toe hebben we het kort gehad over de twee bouwstenen van het SAS programma. Een SAS programma doet natuurlijk niets zolang het niet uitgevoerd wordt. Er zijn verschillende manieren om een SAS programma uit te voeren, afhankelijk van het operating systeem waarop je werkt. Werk je met SAS op PC, dan wordt een interactieve SAS sessie opgestart wanneer je vanaf het bureaublad op het pictogram SAS klikt. In deze omgeving ( wat vroeger de display manager werd genoemd) worden verschillende vensters tegelijkertijd geopend. Bij het gebruik van SAS op de HPC cluster van de KU Leuven, kan je een interactieve SAS sessie opstarten. Hiervoor moet er wel een X-Server draaien op je lokale machine. Meer informatie over werken met SAS op de HPC Cluster kan je vinden in de WIKI pagina’s van de cluster : https://vscentrum.be/vsc-help-center/k.u.leuven-vic-vic3-how-tos Er bestaat ook de mogelijkheid om SAS programma’s op niet-interactieve wijze uit te voeren. Deze wijze van werken kan nuttig zijn indien je programma’s onmiddellijk wil uitvoeren maar je geen venster omgeving kan of wil gebruiken. Het programma wordt in een bestand bewaard en uitgevoerd door het commando SAS in te geven gevolgd door de naam van het programma. De resultaten worden eveneens in een bestand bewaard dat je kan consulteren zodra het programma is uitgevoerd. Tenslotte kunnen SAS programma’s in batch mode uitgevoerd worden. Na het doorgeven van het programma voor uitvoering wordt het in een wachtrij geplaatst tussen andere jobs. De jobs worden op de achtergrond uitgevoerd en je kan gewoon verder werken. Batch uitvoering is nuttig voor grote jobs die veel tijd en rekenwerk vergen. Op de HPC cluster van de KU Leuven is batchverwerking de geplogen manier van werken.

Een interactieve SAS sessie ziet er op elk platform nagenoeg hetzelfde uit met de eigen look and feel van het operating systeem. Uiteraard kan je de vensteromgeving van SAS ook aanpassen volgens je eigen noden en behoeften.

Voor een Microsoft Windows SAS sessie: dubbel klik op het SAS pictogram vanaf het bureaublad of in de klassen via Start->programs>scientific->SAS->SAS 9.2

Met het opstarten van SAS worden vijf vensters standaard geopend: : Het Editor venster, het Log venster, het output venster (achter de editor en de log), het Explorer venster en tenslotte het Results venster. Daarnaast bestaan er nog vele andere SAS vensters die je kan gebruiken, bijvoorbeeld voor het raadplegen van de helpfunctie, voor het instellen van systeem opties, voor het aanpassen van de SAS sessie,…. Onderstaande figuur toont de standaard vensters voor een Microsoft Windows SAS sessie ( versie 9.1.3).

Verschillende wijzen voor uitvoeren van SAS

programma’s

De SAS venster omgeving

Page 7: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 5

ICTS FOOCES 5

Het Editor venster is een tekst editor. Het dient voor het intypen, editeren en uitvoeren van programma’s. Ook anderen tekst bestanden kunnen in dit venster geopend en bewerkt worden. Het log venster geeft informatie omtrent het verloop van de uitvoering van het SAS programma met eventueel foutenboodschappen en waarschuwingen. In het output venster verschijnen de resultaten van het programma indien het output genereert. Het Results venster geeft in feite een inhoudstafel weer van de inhoud van het output venster. Vanuit dit venster kunnen de verschillende resultaten van de verschillende PROC steps gemakkellijk beheerd, afgedrukt en bewaard worden. Het Explorer venster tenslotte geeft u gemakkelijk toegang tot SAS bestanden en bibliotheken.

SAS commando’s Voor het uitvoeren van een groot aantal taken zijn er SAS commando’s voorhanden. Sommige taken zijn analoog aan andere pakketten, zoals het openen en bewaren van bestanden, het kopiëren en plakken van tekst of het oproepen van de Helpinformatie. Andere commando’s zijn specifiek voor SAS, zoals het uitvoeren van een SAS programma of het opstarten van een applicatie. Er zijn drie methodes om commando’s uit te voeren binnen de interactieve vensteromgeving van SAS: via menu’s, via de toolbar of via de commandolijn.

Log

Results (achter

Explorer)

Editor

werkbalk

Output (achter Editor en Log)

Explorer

menubalk

Page 8: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 6

ICTS FOOCES 6

Menu’s : Boven aan het scherm ( of bovenaan elk venster) worden pull down menu’s voorzien. Deze wijzigen van inhoud naargelang het venster dat op dat ogenblik actief is. Je kan het pull down menu van een venster ook oproepen door op de rechter muisknop te klikken in het venster. Toolbar : deze geeft u een snelle toegang tot veel gebruikte commando’s die ook via de pull down menu’s kunnen worden opgevraagd. SAS Commandolijn: hierin kunnen SAS commando’s getypt worden. Het merendeel van de commando’s is reeds te bereiken via de pull down menu’s, zodat de commandolijn niet zo vaak gebruikt wordt. Het Windows pull down menu biedt verschillende keuzes aan voor de schikking van de vensters op het scherm. Om één van de vensters te activeren, selecteer je dit vanaf het pull down menu of typ je de naam van het venster in de commandolijn of klik je op het venster.

Werken we in de interactieve vensteromgeving van SAS, dan kunnen we een programma uitvoeren, ook submitten genoemd, vanaf het Editor venster. Hiertoe moeten we eerst het programma binnenhalen in het Editor venster.

Openen van het SAS programma PATIENT.SAS

1. Zorg dat het Editor venster het actieve venster is.

Selecteer File Open Program of klik op de Open-knop van de toolbar om een SAS programma binnen te halen. 2. Ga naar de juiste schijf en de juiste map door op de vervolgkeuzelijst te klikken1. Klik op het bestand PATIENT.SAS en klik op Open.

1 In de PC klassen gaat u naar N:\DATA\JOOGHE\SAS\Basis.

Uitvoeren van een SAS programma

Toolbar

commandolijn

Page 9: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 7

ICTS FOOCES 7

Het programma wordt default geopend in het (Enhanced) Editor venster:

Het (Enhanced) Editor venster dient om

bestaande SAS programma’s te openen ( zoals net gedaan) en om deze te editeren

zelf nieuwe programma’s te schrijven

programma’s uit te voeren

geschreven programma’s te bewaren in een bestand

Bovenstaand SAS programma bestaat uit één DATA step en 2 PROC steps.

Het Enhanced Editor venster is specifiek voor Windows. Bij andere operating systemen (UNIX, mainframe MVS) worden programma’s in het Program Editor venster geopend in plaats van het Enhanced Editor venster.

Page 10: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 8

ICTS FOOCES 8

Onder Windows zijn zowel het Enhanced Editor venster als het Program Editor venster beschikbaar. De Enhanced Editor is default. Er zijn wel enkele verschillen in mogelijkheden tussen beide vensters ( zie paragraaf 1.7 en 1.8).

Uitvoeren van het SAS programma PATIENT.SAS Een programma uitvoeren gebeurt vanaf het (Enhanced) Editor venster. Zorg dat dit het actieve venster is. Er zijn meerdere manieren om de uitvoer van een SAS programma te lanceren;

Klik op de submit-knop in de Toolbar of selecteer Run Submit of typ zelf het woordje SUBMIT in de commandolijn. Nadat het programma werd uitgevoerd, zal je merken dat het output venster op de voorgrond komt en de resultaten toont van het programma.

Bekijken van de resultaten Het Output venster

behoort tot de primaire vensters en is default geopend

wordt het actieve venster ( en komt dus op de voorgrond ) van zodra het uitvoer of output ontvangt van de PROC steps

cumuleert de verschillende outputs van de verschillende PROC steps of procedures in de volgorde waarin deze worden uitgevoerd Via Edit Clear All kan de inhoud van het Output venster volledig geledigd worden

Gebruik de

horizontale scroll bars om horizontaal te scrollen in het Output venster

verticale scroll bars om vertikaal te scrollen

Scroll helemaal tot boven om de output van de PROC PRINT te bekijken of selecteer de PROC PRINT output in het Results venster. In het Results venster wordt de uitvoer van de verschillende procedures of PROC steps onder elkaar geplaatst. Het venster geeft de mogelijkheid individuele output te bekijken, te bewaren en af te drukken.

Page 11: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 9

ICTS FOOCES 9

Per procedure output wordt een folder of map voorzien. Door te klikken op het [+] teken voor de map wordt de map opengevouwen en kan je de individuele componenten van de procedure output aanklikken.

Bijvoorbeeld, bij een dubbelklik op ‘Data Set WORK.PATIENT’ in de ‘Print’-map worden we op de desbetreffende output van de PROC PRINT in het Output venster gebracht. Door te klikken op de [-] tekens wordt de uitvoer terug opgevouwen. Rechts klikken op een map (of een onderdeel ervan) geeft een pop up menu waarmee de uitvoer van die procedure onder andere kan afgedrukt, bewaard of verwijderd worden.

4. Selecteer de Log-knop van de SAS werkbalk onderaan het scherm om het Log venster te openen en de boodschappen te bekijken die SAS heeft gegenereerd.

pop up menu

Page 12: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 10

ICTS FOOCES 10

Het Log venster is

eveneens een primair SAS venster dat default geopend is

het bevat het verloop van de uitvoer van het programma en eventueel boodschappen die SAS genereert tijdens de uitvoer van het programma

De log start met een herhaling van het originele programma voorafgegaan door lijnnummers. De DATA step wordt gevolgd door een NOTE waarin onder meer de naam van de gecreëerde SAS dataset vermeld wordt (WORK.PATIENT) en het aantal observaties (10) en variabelen (7) die deze dataset bevat. Zowel de DATA als de PROC step geven informatie omtrent de gebruikte computer resources. Dit wordt belangrijk bij grote jobs of in systemen waar meerdere gebruikers tegelijk kunnen werken. 5. Klik op Editor in de werkbalk onderaan om terug te keren naar het Editor venster.

Page 13: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 11

ICTS FOOCES 11

Nu kunnen er eventuele wijzigingen aangebracht worden of kan het programma uitgebreid worden met nieuwe instructies om het dan opnieuw uit te voeren.

Page 14: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 12

ICTS FOOCES 12

Zoals eerder aangegeven bestaat elke DATA of PROC step uit statements. Dit zijn de individuele

instructies of lijnen in het programma die tezamen de DATA of PROC step vormen. Een DATA step begint met het keyword DATA. Een PROC step begint met het keyword PROC.

Onderstaand programma bestaat uit een DATA statement, een SET statement, een

RUN statement, een PROC statement en terug een RUN statement.

data patient2;

set patient ;

run;

proc print data = patient2 ;

run;

Elk statement

begint met een keyword

en eindigt met een puntkomma (;) Wat de vorm betreft mogen statements

in hoofdletters of in kleine letters geschreven worden

beginnen en eindigen op gelijk welke kolom

over meer dan één lijn gesplitst worden

met meer dan één statement op één lijn geschreven worden Woorden binnen één statement worden gescheiden door één of meerdere blanco’s. Hoewel onderstaande SAS code correct is, zorgt de onduidelijke layout niet voor een duidelijk leesbaar programma:

data patient ; infile

‘n:\data\jooghe\SAS\basis\lesmateriaal\patient.asc';

input OpnameNummer 1-8 OpnameDatum $ 10-17

OpnameAard 19 OntslagDatum $ 21- 28 Ontslagaard 30

geslacht $ 32 leeftijd 34-36 ; run;

proc print data = patient ; var OpnameNummer geslacht leeftijd ;

proc means data = patient;

var leeftijd ; run;

Volgende tips brengen structuur in uw SAS programmatuur:

begin een DATA, PROC en RUN statement steeds op een nieuwe lijn

begin een DATA, PROC en RUN statement op de eerste kolom

laat statements binnen een DATA of PROC step inspringen

sluit elke DATA of PROC step af met een RUN statement

1.3 Regels voor het schrijven van een SAS programma

Syntax regels

Page 15: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 13

ICTS FOOCES 13

Dezelfde code ziet er zo al heel wat overzichtelijker uit:

data patient ;

infile ‘n:\data\jooghe\SAS\basis\lesmateriaal\patient.asc';

input OpnameNummer 1-8 OpnameDatum $ 10-17

OpnameAard 19 OntslagDatum $ 21- 28

Ontslagaard 30 geslacht $ 32 leeftijd 34-36;

run;

proc print data = patient ;

var OpnameNummer geslacht leeftijd ;

run;

proc means data = patient;

var leeftijd ;

run;

Wanneer een SAS programma wordt uitgevoerd, zal SAS de statements lezen en nakijken op fouten. Zodra hij een DATA, PROC of RUN statement tegenkomt, stopt hij met het lezen van volgende statements en wordt de huidige DATA of PROC step eerst uitgevoerd.

data patient2;

set patient ;

run;

proc print data = patient2 ;

run;

In bovenstaand voorbeeld weet SAS dat de DATA step eindigt van zodra hij het RUN statement tegenkomt. De DATA step wordt dan ook eerst uitgevoerd. Deze creëert een SAS dataset PATIENT2 die een kopie is van de SAS dataset PATIENT. De PROC step eindigt met een RUN statement wat tevens het einde van het programma is. Hetzelfde programma kan ook geschreven worden als:

data patient2;

set patient ;

proc print data = patient2 ;

run;

Van zodra SAS het PROC statement tegenkomt weet hij dat de DATA step beëindigd is en wordt deze eerst uitgevoerd. Een RUN statement na de PROC PRINT step is wel noodzakelijk als dit het einde van het programma is en er met andere woorden geen andere DATA of PROC steps meer volgen.

Stapsgewijze uitvoering

Page 16: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 14

ICTS FOOCES 14

Vooraleer gegevens kunnen worden bewerkt met SAS en analyses kunnen gemaakt worden, moeten we ervoor zorgen dat SAS de gegevens kan lezen. Hiertoe moeten de gegevens in een speciale vorm worden gebracht, namelijk een SAS dataset2. Eens de gegevens in een SAS dataset zijn gebracht kan in de SAS programma’s voor analyse eenvoudig worden verwezen naar de dataset.

De data waarden of gegevens van een SAS dataset zijn ondergebracht in een rechthoekige structuur (tabel) en bestaan uit observaties en variabelen.

In de bovenstaande dataset PATIENT is 319582 een voorbeeld van een data waarde, ook 24/10/90 is een data waarde,… Observaties (rijen) De rijen in de tabel zijn de observaties van de dataset. Een observatie bevat dus alle informatie omtrent één individu of één object of identiteit. De waarden 319582, 11/05/90,2,13/12/90,1,M en 73 vormen één observatie.

Variabelen (kolommen) De kolommen vormen de verschillende variabelen van de dataset. Een variabele is een reeks waarden die een kenmerk van de observaties beschrijft.

2 Het is ook mogelijk om vanuit SAS rechtstreeks andere gegevensbestanden te lezen zonder ze eerst in een SAS dataset te moeten brengen. Dit wordt niet behandeld in deze cursus.

1.4 SAS Datasets

Observaties en variabelen

Page 17: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 15

ICTS FOOCES 15

De waarden M,M,V,V,V,V,V,M,M,M vormen één variabele. Deze variabele geeft het geslacht van de patiënt weer.

Er zijn twee soorten van variabelen : karaktervariabelen en numerieke variabelen. Karaktervariabelen (zoals geslacht) kunnen om het even welke waarden bevatten. Ze hebben een maximale lengte van 32767 karakters. Karaktervariabelen hebben default lengte 8. Indien u een andere lengte wenst, dient u die zelf op te geven in het SAS programma. Numerieke variabelen ( zoals leeftijd) kunnen alleen cijfers bevatten ( 0,1,…9 en wetenschappelijke notatie a.h.v. E ). Alle numerieke variabelen hebben een default lengte van 8 bytes.

Naam van de variabele

Waarden van de variabele karakter- numerieke waarden waarden

Missing values Het kan voorkomen dat de data niet volledig zijn. Het is mogelijk dat de waarde van een variabele ontbreekt voor één of meerdere observaties. Dit zijn ontbrekende waarden of missing values. Bij karaktervariabelen wordt een missing value gepresenteerd door een blanco. Bij numerieke variabelen wordt een missing value gepresenteerd door een punt.

Page 18: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 16

ICTS FOOCES 16

Variabele Kolom

SAS data set SAS Table

Observatie Rij

Afhankelijk van het systeem kan SAS 9.1 412,977,617 variabelen op 32-bit systemen en 2 Gb op 64-bit systemen. Een complete overzicht vind je in Usage Note 8213 bekijken op support.sas.com. Het aantal observaties dat SAS aan kan is afhankelijk van de kracht van de computer waarop u werkt.

In de Windows omgeving wordt in SAS versie 9 volgende terminologie door elkaar gebruikt (naar analogie met de theorie van relationele gegevensbestanden):

Bijkomend aan de eigenlijke data wordt in een SAS dataset ook nog andere informatie bijgehouden. Dit is algemene informatie omtrent de SAS dataset zelf zoals de naam van de SAS dataset, het tijdstip van creatie ervan, het aantal observaties en het aantal variabelen die ze bevat. Ook worden voor elke variabele aanwezig in de dataset de naam van de variabele, het type, de lengte en eventueel het formaat3 , het informaat4 en het label bijgehouden. Al deze extra informatie wordt het beschrijvend gedeelte van de SAS dataset genoemd. Men zegt dat een SAS dataset bestaat uit een data gedeelte en een beschrijvend gedeelte.

3 wordt aangebracht in Hoofdstuk 3, paragraaf 3.6 4 wordt aangebracht in Hoofdstuk 2, pararaaf 2.3

Het beschrijvend gedeelte

missing values

Page 19: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 17

ICTS FOOCES 17

Namen van SAS datasets of variabelen

mogen tot 32 karakters lang zijn

beginnen met een letter (a-z) of een _ volgende karakters: letters, cijfers of _ (dus geen %$!*&#@)

mogen in kleine letters, hoofdletters of een combinatie van beiden gebruikt worden Dit laatste betekent dat het voor SAS niet uitmaakt of u kleine of grote of een mix van kleine en grote letters gebruikt. De variabele GESLACHT is dezelfde als geslacht of als Geslacht. SAS onthoudt wel de eerste schrijfwijze van elke variabele en gebruikt deze verder in elke output waar die variabele in voorkomt.

Het Explorer venster laat toe om SAS datasets te consulteren. Dit is het vijfde venster ( naast het Editor, log, output en Results venster) dat default wordt geopend bij het opstarten van SAS.

Data gedeelte en beschrijvend gedeelte van de PATIENT dataset opvragen 1. Klik op de Explorer tab onderaan om het Explorer venster op de voorgrond te brengen.

U kan het Explorer venster met of zonder boomstructuur-layout gebruiken.

Naamconventies voor SAS datasets en variabelen

Opvragen van het data en het beschrijvend gedeelte van

een SAS Dataset

Page 20: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 18

ICTS FOOCES 18

Kies View Show Tree om de boomstructuur-layout te activeren.

1. Toon de inhoud van de WORK library ( het begrip library komt aan bod in paragraaf 1.5) in het Explorer venster via een dubbel klik op de map WORK onder LIBRARIES.

2. Selecteer de dataset PATIENT. Door rechts te klikken wordt het pop-up menu geopend.

Page 21: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 19

ICTS FOOCES 19

3. Selecteer Open. Het VIEWTABLE venster wordt geopend en toont het data gedeelte van de PATIENT dataset.

Buiten het bekijken van de gegevens uit de dataset PATIENT kan u het VIEWTABLE venster eveneens gebruiken voor het editeren van de gegevens, het sorteren, het toevoegen of verwijderen van observaties en/of variabelen. 4. Sluit het VIEWTABLE venster via de sluitknop rechts boven. 5. Selecteer Properties van het pop-up menu (rechts klikken op de PATIENT datasetnaam) om het beschrijvend gedeelte te zien. De verschillende eigenschappen van de dataset worden onder de vorm van tabbladen gerangschikt. Klik op de Columns tab om de attributen van de variabelen te bekomen.

De data set heeft 4 numerieke variabelen en 3 karaktervariabelen. De variabele geslacht heeft een lengte 1, de overige variabelen hebben een lengte 8.

Page 22: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 20

ICTS FOOCES 20

SAS datasets worden gestockeerd in SAS bibliotheken ook data libraries genoemd. Een SAS data library is een verzameling van SAS bestanden. Deze bestanden worden de leden (members ) van de bibliotheek (library) genoemd. Een SAS dataset is een voorbeeld van een SAS bestand. Er zijn ook nog andere soorten van SAS bestanden ( bijvoorbeeld een SAS cataloog of een SAS view). In het Windows en UNIX operating systeem is een SAS data library een groep van SAS bestanden in dezelfde (sub) directory. Bij het opstarten van SAS wordt automatisch de toegang verschaft tot minstens drie bibliotheken. Een dubbel klik op Libraries in het Explorer venster toont deze bibliotheken.

De WORK library is een werkbibliotheek die door SAS automatisch voorzien wordt. SAS bestanden die hierin staan zijn tijdelijk en verdwijnen bij het afbreken van de SAS sessie.

1. Dubbel klik op de WORK folder van het Explorer venster om de inhoud van de WORK

library te zien. Het SAS programma PATIENT.SAS, hetgeen we reeds hebben uitgevoerd in paragraaf 1.2, creëerde de SAS dataset PATIENT. Deze dataset bevindt zich in de WORK library.

1.5 SAS Data Libraries

Wat is een SAS data library ?

De WORK library

Page 23: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 21

ICTS FOOCES 21

2. Bemerk dat bij het uitvoeren van de programma’s in het log venster een dubbele naam verscheen ( inhoud van het log scherm ; voorbeeld van paragraaf 1.2 )

550 data patient ;

551 infile 'n:\data\jooghe\SAS\basis\lesmateriaal\patient.asc';

552 input OpnameNummer 1-8 OpnameDatum $ 10-17 OpnameAard 19

553 OntslagDatum $ 21- 28 Ontslagaard 30

554 geslacht $ 32 leeftijd 34-36 ;

555 run;

NOTE: The infile 'patient.asc' is:

File Name= n:\data\jooghe\SAS\basis\lesmateriaal\patient.asc,

RECFM=V,LRECL=256

NOTE: 10 records were read from the infile

'n:\data\jooghe\SAS\basis\lesmateriaal\patient.asc'.

The minimum record length was 36.

The maximum record length was 36.

NOTE: The data set WORK.PATIENT has 10 observations and 7 variables.

NOTE: DATA statement used (Total process time):

real time 0.04 seconds

In feite kan elk SAS bestand geschreven worden met een dubbele naam:

LIBREF.NAAMBESTAND

De eerste naam (libref) verwijst naar de library (bibliotheek)

De tweede naam (member-name) verwijst naar de naam van het SAS bestand De benaming WORK.PATIENT verwijst naar een dataset PATIENT in de bibliotheek WORK. Om te refereren naar de dataset PATIENT in de library WORK kan je in plaats van de dubbele naam WORK.PATIENT kortweg PATIENT gebruiken. Als er m.a.w. geen libref voorafgaat aan de bestandsnaam plaatst SAS het bestand zelf in de library WORK. De library WORK is maar een werkbibliotheek die bestaat gedurende de SAS sessie. Bij het verlaten van SAS wordt de library WORK volledig gewist. Vandaar dat SAS datasets in de WORK library dan ook tijdelijke datasets zijn.

Indien View-> Show Tree is aangevinkt

Page 24: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 22

ICTS FOOCES 22

De SASHELP en de SASUSER bibliotheken zijn de 2 andere bibliotheken die bij het opstarten van SAS automatisch toegewezen worden.

Deze bibliotheken zijn niet leeg, maar bevatten een hele reeks SAS bestanden. In tegenstelling tot de WORK bibliotheek zijn deze bibliotheken permanent. Dit betekent dat de bestanden die hierin zitten blijven bestaan als SAS wordt afgesloten.

De bestanden uit de SASHELP en de SASUER library controleren eerder de werking van de SAS software zelf en bevatten een aantal instellingen omtrent de SAS omgeving. Het is niet gebruikelijk dat we als SAS gebruiker in de SASHELP bibliotheek eigen bestanden plaatsen. In de SASUSER bibliotheek kan dit wel.

Om te weten in welke directory de bestanden uit de SASUSER of de SASHELP bibliotheek bewaard worden, dienen we na te gaan naar welke directory’s deze bibliotheken verwijzen. Dit zien we als we vanuit het EXPLORER venster de details opvragen via View Details

Uiteraard hangt dit af van de wijze waarop de SAS software geïnstalleerd werd.

Aanmaak van een SAS dataset AFSTANDEN in de SASUSER bibliotheek. 1. Maak het Editor venster actief en typ volgend programma in het Editor venster. Je kan het Editor venster leeg maken via Edit -> Clear All . data sasuser.afstanden ;

miles = 26 ;

De SASHELP en de SASUSER libraries

Page 25: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 23

ICTS FOOCES 23

kilometers = 1.61*miles ;

run;

proc print data = sasuser.afstanden;

run;

2. Voer het programma uit door bijvoorbeeld op de submit knop te klikken in de toolbar. Indien er foutenboodschappen in het log venster verschijnen ( worden voorafgegaan door het woordje ERROR en verschijnen in het rood), keer dan terug naar het Editor venster. Dit betekent dat je waarschijnlijk één of meerdere syntax fouten (meer hierover in 1.6) hebt gemaakt. Kijk het programma goed na en verbeter indien nodig ; geen puntkomma vergeten bijvoorbeeld, zijn de keywords juist gespeld (data, proc,run…) , gebruik een punt als decimaal scheidingsteken in het getal 1.61, typ een ster (* ) voor de vermenigvuldiging. Submit het programma nogmaals tot je geen foutenboodschappen meer krijgt in het log-venster. 3. In de Log krijgen we volgende informatie :

1 data sasuser.afstanden ;

2 miles = 26 ;

3 kilometers = 1.61*miles ;

4 run;

NOTE: The data set SASUSER.AFSTANDEN has 1 observations and 2 variables.

NOTE: DATA statement used:

real time 0.32 seconds

5 proc print data = sasuser.afstanden;

6 run;

NOTE: There were 1 observations read from the dataset SASUSER.AFSTANDEN.

NOTE: PROCEDURE PRINT used:

real time 1.43 seconds

4. Bij een dubbel klik op de SASUSER map in het Explorer venster verschijnt de SAS dataset AFSTANDEN in de lijst van SAS bestanden in deze bibliotheek.

Zoals eerder gezegd is het niet aan te raden om de SASUSER bibliotheek op te vullen met eigen datasets.

data sasuser.afstanden ;

miles = 26 ;

kilometers = 1.61*miles ;

run;

Page 26: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 24

ICTS FOOCES 24

Het is nuttiger en efficiënter om eigen SAS datasets en/of andere SAS bestanden in een zelf gekozen directory te plaatsen en ze daar permanent te stockeren. Binnen de kursus wordt de directory c:\user gebruikt. In de PC-klassen kan je deze zelf aanmaken. Deze directory wordt wel verwijderd na het herstarten van de PC. Indien je in de PC-klassen aangelogd bent met je eigen m-,s- of u-nummer dan kan je ook een directory aanmaken op uw personlijke ruimte (h:\ drive) bv. h:\SASCursus. In het verdere verloop van de kursus kan dan deze directory gebruikt worden ipv. c:\user. Hiervoor dienen we zelf een referentienaam te definiëren of toe te kennen aan deze directory. Dit kan eveneens via het Explorer venster5.

Toekennen van de referentienaam (libref) MIJNDATA aan de directory c:\user (PC Windows) 1. Klik in het Explorer venster op Libraries met de rechter-muisknop en kies New . Het ‘New Library’ venster verschijnt. 2. Typ in het Name-veld de referentienaam voor de library (ook libref genoemd), bijvoorbeeld MIJNDATA. De referentienaam mag maximaal 8 karakters lang zijn. Laat het engine -veld op default staan. ( Indien je Enable at startup aanklikt zal de libref automatisch worden toegekend telkens SAS wordt opgestart) 3. Klik op Browse en selecteer de directory waar MIJNDATA naar verwijzen moet (c:\user bijvoorbeeld). Klik vervolgens op OK.

4. Klik nogmaals OK om de referentienaam toe te kennen aan de opgegeven directory. 5. MIJNDATA verschijnt nu in de lijst van de Active Libraries in het Explorer venster.

5 Nieuwe bibliotheken kunnen ook worden aangemaakt met een LIBNAME statement. Dit wordt toegelicht in Hoofdstuk 3, paragraaf 3.1.

Definiëren van een nieuwe library

Page 27: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 25

ICTS FOOCES 25

Kopiëren van een SAS dataset Vanuit het Explorer venster kan gemakkelijk een SAS dataset van de ene library naar de andere gekopieerd worden.

Voorbeeld: Kopieer de dataset PATIENT uit de WORK library naar de MIJNDATA library. 1. Zorg ervoor dat de Explorer in boomstructuur-layout staat (View Show Tree) 2. Selecteer in het linkerpaneel de WORK library en scroll in het rechterpaneel tot je het pictogram van de PATIENT dataset tegenkomt.

3. Klik op het PATIENT pictogram en sleep dit van het rechterpaneel naar de MIJNDATA folder in het linkerpaneel. 4. Open de MIJNDATA library (dubbel klik op MIJNDATA folder) en u merkt op dat de data set gekopieerd werd. In het log venster verschijnt een boodschap die zegt dat een

Werken met libraries

Page 28: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 26

ICTS FOOCES 26

nieuwe dataset werd aangemaakt.

5. Via het pop up menu dat verschijnt door rechts te klikken op de naam van de SAS dataset is het mogelijk om een SAS dataset een andere naam te geven (Rename). Een SAS dataset wissen uit een bibliotheek kan via de Delete optie van het pop up menu.

Page 29: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 27

ICTS FOOCES 27

Permanente SAS datasets

WORK.TEST

Tijdelijke SAS datasets

TEST

Tijdelijke SAS datasets

Permanente SAS datasets De dataset MIJNDATA.PATIENT is een permanente dataset omdat de libref MIJNDATA is en niet WORK. Om naar een permanente dataset te verwijzen, dient steeds een dubbele naam te worden gegeven: de referentienaam voor de bibliotheek (libref) gevolgd door een punt en dan de naam van de SAS dataset.

Tijdelijke datasets Tijdelijke datasets hebben steeds WORK als libref. Zo verwijst bijvoorbeeld de dubbele naam WORK.TEST naar de dataset TEST die gestockeerd is in de werkbibliotheek WORK.

Het is eveneens mogelijk om naar tijdelijke datasets te verwijzen met de dataset naam alleen. Dan onderstelt SAS als library de WORK library. Zo verwijst de enkele naam TEST naar dezelfde tijdelijke dataset WORK.TEST.

Verwijzen naar SAS datasets : samenvatting

LIBREF.DATASETNAAM

MIJNDATA.PATIENT

LIBREF.DATASETNAAM

LIBREF.DATASETNAAM

Page 30: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 28

ICTS FOOCES 28

Rechtstreeks verwijzen naar een permanente dataset Vanaf SAS versie 8 kan voor het aanmaken en verwerken van permanente SAS datasets ook met een directe verwijzing naar het bestand gewerkt worden. Geef de naam van de dataset met het volledige pad en plaats dit tussen quotes.

Aanmaken van een dataset TEST in de directory c:\user\old6 dewelke slechts één variabele en één observatie bevat, nl. x = 100.

1. Typ volgende SAS code in het Enhanced Editor venster. Vergeet de quotes niet rond het bestand te plaatsen !!

data 'c:\user\old\test' ;

x = 100 ;

run;

2. voer het programma uit en check de SAS log :

127 data 'c:\user\old\test' ;

128 x = 100 ;

129 run;

NOTE: The data set c:\user\data\test has 1 observations and 1 variables.

NOTE: DATA statement used:

real time 0.04 seconds

4. Ga naar het Explorer venster. Bemerk dat SAS in het Libraries venster automatisch een referentienaam heeft aangemaakt voor de library C:\USER\OLD. Bij een dubbel klik op deze library verschijnt dan ook de dataset TEST.

Samenvattend overzicht verwijzen naar SAS datasets:

Data statement Libref Member Naam Type

data total; WORK total Tijdelijk

data ‘c:\user\total’ automatisch gecreëerd

total Permanent

data mijndata.total Mijndata total Permanent

6 De directory C:\USER kan gebruikt worden in de PC klassen. Indien u werkt op een eigen computer geeft u een bestaande directory op waarin de SAS dataset mag bewaard worden.

Page 31: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 29

ICTS FOOCES 29

Syntax fouten zijn fouten die niet conform zijn aan de regels van de SAS-taal. Meer concreet gaat het om:

verkeerd gespelde keywords

verkeerde of ongeldige interpunctie (bvb. vergeten van ; )

ongebalanceerde quotes

ongeldige opties Syntax fouten worden bij uitvoer van het programma door SAS ontdekt tijdens de compilatiefase. SAS schrijft informatie omtrent de fout weg naar het Log venster. Deze informatie wordt voorafgegaan door het woord ERROR of WARNING. Bij een WARNING wordt de DATA of PROC step nog verder uitgevoerd. Bij een ERROR stopt de verdere uitvoering van de DATA of PROC step. Het programma PATIENT.SAS uit paragraaf 1.2 werd bewust voorzien van een aantal syntax fouten. We zullen ter illustratie dit programma uitvoeren.

1. Ga in het Editor venster staan. Klik op de Open-knop van de toolbar en open het programma PATIENT_ERRORS.SAS

Indien u met het Enhanced Editor venster werkt (alleen voor Windows), geeft SAS de verkeerd gespelde keywords al onmiddellijk aan door ze in het rood te plaatsen. Het keyword DATA is verkeerd gespeld als DAAT. De keywords INFILE en INPUT zijn wel correct, nochtans ook in het rood. Deze statements zijn alleen maar toegelaten binnen een DATA step, maar SAS herkent niet dat het hier om een DATA step gaat. 2. Submit het programma. Het Log venster toont nu meerdere ERROR en WARNING boodschappen:

1.6 Editeren en corrigeren van SAS programma’s

Uitvoeren van een programma met syntax fouten

Page 32: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 30

ICTS FOOCES 30

Het Log venster geeft aan dat het DATA keyword verkeerd gespeld werd maar voert de

DATA step verder uit. Een WARNING, in groene kleur, is niet zo erg in die zin dat de uitvoering van het programma verder gaat. Verkeerd gespelde keywords zal SAS steeds trachten te verbeteren. Het is toch altijd raadzaam om WARNINGs na te kijken. In sommige gevallen kan dit betekenen dat de uitvoering van het SAS programma toch niet helemaal is verlopen zoals we het hadden verwacht.

SAS programma’s worden niet verder uitgevoerd als er ERROR’s in staan. Meestal

gaat het om syntax fouten of verkeerde spelling. SAS onderlijnt het probleem en geeft wat uitleg. Hier wordt het keyword VAR onderlijnt en SAS vertelt dat dit geen geldige optie is bij het PROC PRINT statement. De reden waarom VAR aanzien wordt als optie bij het PROC PRINT statement is dat de puntkomma op het einde van het PROC PRINT statement vergeten werd. De lokatie van de ERROR is dus makkelijk terug te vinden, maar de fout zelf is niet altijd zo makkelijk te vinden. Bovendien, wat onderlijnd wordt is niet altijd fout, de eigenlijke fout kan hogerop in het programma zitten.

De tweede PROC STEP bevat ook een ERROR. SAS herkent het woordje AVERAGE

niet als een geldige optie van het PROC MEANS statement. Dit is inderdaad ook zo. De optie AVERAGE bestaat niet. Er bestaat wel een optie MEAN om gemiddelden te berekenen. De PROC MEANS step wordt niet verder uitgevoerd.

Page 33: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 31

ICTS FOOCES 31

ERROR’s moeten steeds opgelost worden. 3. Om de fouten te corrigeren dienen we het programma aan te passen. Hiervoor keren we terug naar het Enhanced Editor venster door bijvoorbeeld op de knop met de programmanaam onderaan in de werkbalk te klikken. 4. Editeer het programma:

corrigeer het woord DAAT naar DATA

plaats een ; op het einde van het PROC PRINTstatement

wijzig het woord AVERAGE naar het woord MEAN in het PROC MEANS statement

5. Voer het programma terug uit. Het loopt nu zonder fouten en genereert output in het output scherm.

Begin steeds bovenaan in de log van het programma met het opsporen en oplossen van ERROR’s. Een ERROR boodschap in het begin van het programma kan aanleiding geven tot meerdere ERROR boodschappen verderop. Het oplossen van de eerste ERROR kan op deze wijze in één klap meerdere ERROR’s oplossen.

Page 34: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 32

ICTS FOOCES 32

Indien u met de Enhanced Editor werkt (alleen mogelijk in Windows omgeving), blijft het programma in de Enhanced Editor staan wanneer het wordt uitgevoerd. Je kan eventueel correcties en aanpassingen doorvoeren en het programma terug geheel of gedeeltelijk uitvoeren. Indien je vanuit het Program Editor venster programma’s uitvoert (default en enige editor in UNIX of mainframe omgeving, ook mogelijk onder Windows) verdwijnt het programma uit de Program Editor zodra het is uitgevoerd. Het dient dan terug in de Program Editor te worden gebracht via een Recall commando om het vervolgens te kunnen aanpassen. Ook in een Windows omgeving is het Recall commando een nuttig en veel gebruikt commando.

Voorbeeld :

1. Ga terug naar het Enhanced Editor venster. Maak dit venster leeg via Edit Clear All of door rechts te klikken en Clear All te kiezen.

2. Nu wordt het Enhanced Editor venster leeggemaakt. Om nu het programma op te

roepen dat we laatst hebben uitgevoerd kunnen we het Recall commando gebruiken. Kies vanaf de bovenste menubalk Run Recall last submit. Het blok van statements dat we het laatst hebben gesubmit verschijnt nu in het Editor venster. Kies nogmaals Run Recall last submit. Nu zien we dat het programma dat we daarvoor hadden gesubmit ( met de fouten ) wordt toegevoegd aan het Enhanced Editor venster. Zo kunnen we via het Recall commando stap voor stap gesubmitte programma’s terughalen in het Editor venster.

Terughalen van een programma in de Editor

Page 35: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 33

ICTS FOOCES 33

Een SAS programma kan vanuit het Editor venster bewaard worden in een extern bestand.

Indien een bestaand SAS programma voordien geopend werd in de Editor, staat de naam bovenaan in de titelbalk van de Editor. Een asterisk (*) net na de naam van het programma geeft aan dat er wijzigingen werden aangebracht aan het originele programma die nog niet bewaard werden (alleen in de Enhanced Editor).

Via File Save of de knop van de toolbar wordt het aangegeven bestand overschreven met de inhoud van het Editor venster.

Bewaren van het SAS programma

Page 36: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 34

ICTS FOOCES 34

Om de inhoud van het Editor venster naar een ander bestand weg te schrijven dient File Save as te worden geselecteerd. Een dialoog venster verschijnt waarin de naam en de lokatie van het bestand kan worden opgegeven.

Het is gebruikelijk om aan SAS programma’s de extensie sas mee te geven.

Page 37: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 35

ICTS FOOCES 35

SAS programma’s worden in het Editor venster geschreven, bijgewerkt en vanuit dit venster ook uitgevoerd. In een Windows omgeving wordt default het Enhanced Editor venster geopend bij het opstarten van SAS. Dit biedt een aantal extra functionaliteiten vergeleken met het Program Editor venster (wat ook aanwezig is, zie View Program Editor). In niet -Windows operating systemen is alleen de Program Editor beschikbaar en is dit bijgevolg de default editor. In deze paragraaf wordt een overzicht gegeven van de belangrijkste functionaliteiten van beide editor vensters. Verplaatsen van de cursor Onderstaande tabel geeft de toetsencombinaties die kunnen gebruikt worden om de cursor te verplaatsen. De verplaatsingen in het grijs aangeduid zijn mogelijk in beide editors. De overige zijn alleen mogelijk in de Enhanced Editor.

Toetsen (combinatie)

Verplaatsing

één lijn naar boven

één lijn naar onder één karakter naar links één karakter naar rechts

Page Down één pagina naar beneden

Page Up één pagina naar boven

Home naar het begin van de betreffende lijn

Ctrl+ Home naar het begin van het betreffende document

End naar het einde van de betreffende lijn

Ctrl+ End naar het einde van het betreffende document

Ctrl + naar het begin van het volgende woord

Ctrl + naar het begin van het vorige woord

Ctrl + schuif één lijn naar boven en scroll terwijl

Ctrl + schuif één lijn naar onder en scroll terwijl

Ctrl + G ga naar een specifieke lijn (nummer in te geven)

Alt + ga naar de bovenste lijn van alle zichtbare lijnen

Alt + ga naar de onderste lijn van alle zichtbare lijnen

Ctrl+( Ga naar het bijpassende haakje

Alt+( Ga naar de bijpassende do/end

Andere toetsencombinaties zijn te vinden in het menu Tools->Options->Enhanced Editor Keys. Bv. geselecteerde tekst omzetten in hoofdletters (Ctrl+Shft+U). Het is ook mogelijk om een eigen combinatie toe te wijzen aan een bepaalde operatie. Selecties maken en kopiëren en verplaatsen van tekst Net zoals in de meeste teksteditors kunnen selecties gemaakt worden via de muis of via de functietoetsen om één of meerdere karakters of lijnen te selecteren. via de muis:

1. plaats de cursor voor het eerste karakter dat je wenst te selecteren 2. houd de linkermuisknop ingedrukt en sleep de cursor naar het laatste karakter dat je wenst te

selecteren 3. laat de linkermuisknop los

1.7 Gebruik van het Editor venster

Functies van de Enhanced Editor en de Program Editor

Page 38: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 36

ICTS FOOCES 36

via de toetsen:

Wanneer u de Shift toets ingedrukt houdt kan je met de pijltjestoetsen karakters of lijnen selecteren.

In de Enhanced Editor kan je gebruik maken van de marge (grijze rand links in het Enhanced Editor venster) voor het selecteren van één of meerdere lijnen:

1. Klik in de marge ter hoogte van de eerste lijn die je wenst te selecteren 2. Houd de linkermuisknop ingedrukt en sleep binnen de marge de cursor tot de laatste lijn

die je wenst te selecteren 3. Laat de linkermuisknop los

Het kopiëren of verplaatsen van geselecteerde tekst kan in de Editors als volgt:

Kopiëren van een gemaakte selectie kan via Edit Copy of de knop van de toolbar of Ctrl + C

Wissen van een gemaakte selectie kan via Edit Cut of de knop van de toolbar of Ctrl + X

Plakken vanuit het klembord kan via Edit Paste of de knop van de toolbar of Ctrl + V

Verplaatsen van een gemaakte selectie : plaats de cursor in de gemaakte selectie, houd de linkermuisknop ingedrukt en sleep de cursor naar de plaats waar de tekst dient te komen. Laat tenslotte de muisknop los.

TIP : Zowel in de Program Editor als in de Enhanced Editor is het mogelijk om kolommen te selecteren. Houd de Alt toets tesamen met de linkermuisknop ingedrukt om de selectie te maken

Zoeken en vervangen De zoek- en vervangfunctie van de Enhanced Editor heeft een aantal extra opties die niet in de Program Editor aanwezig zijn. Via Edit Find wordt het dialoogvenster om te zoeken geopend.

Page 39: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 37

ICTS FOOCES 37

Find in: alleen zoeken in SAS code, in commentaar of in beiden. Regular Expression Search: geijkte uitdrukkingen gebruiken om te zoeken naar variaties van een tekstblok. De optie Edit Replace laat toe om gezochte tekst ook te vervangen.

SAS code is gekleurd De Enhanced editor maakt het visueel makkelijk om fouten in de code op te sporen tijdens het schrijven van programma’s. Aangezien SAS automatisch verschillende onderdelen van de code in kleur plaatst, worden verkeerd gespelde SAS keywords, syntax fouten of ongebalanceerde quotes (‘) bijvoorbeeld onmiddellijk zichtbaar. Overzicht van de kleuren (standaardinstellingen) voor SAS code in de Enhanced Editor:

Donkerblauw de vaste sleutelwoorden DATA, PROC namen van procedures de macro sleutelwoorden %MACRO en %MEND

Blauw Overige SAS sleutelwoorden (ook macro sleutelwoorden)

Blauwgroen Datum en tijdsconstanten Formaten, informaten Numerieke constanten

Groen Commentaar

Purper Karakterconstanten (strings)

Zwart Alle overige tekst Gegevens uit het cards gedeelte hebben een gele achtergrond

Rood Verkeerd gespelde sleutelwoorden Ongeldige tekst

Voorbeeld In het hiernaast geschreven SAS-programma valt het verkeerd gespelde woord PROK onmiddellijk op doordat het automatisch in het rood werd geplaatst.

Extra functionaliteiten van de Enhanced editor

(optioneel)

Page 40: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 38

ICTS FOOCES 38

Je kan zelf de gebruikte kleurenschema’s voor het inkleuren van SAS code aanpassen via de optie Tools Options Enhanced Editor, selecteer de ‘Appearance’-tab.

SAS code is opgesplitst in secties De SAS code in het Enhanced Editor venster wordt automatisch opgedeeld in secties. Deze secties kan je openvouwen (expand) of terug opvouwen (collapse). Een sectie begint met een sectiewoord, commentaar of blanco’s die een sectiewoord of commentaar voorafgaan. Sectiewoorden zijn oa. de vaste sleutelwoorden DATA, PROC of %MACRO in het data, PROC of %MACRO statement. De secties zijn duidelijk zichtbaar te onderscheiden door de horizontale lijnen die zijn aangebracht in het venster. Op de lijn van het sectiewoord staat in de marge een [-] teken of een [+] teken. Staat er een [-] teken, dan is de sectie opengevouwen. Je kan ze opvouwen (collaps) door op het [-] teken te klikken. De code onder de lijn wordt verborgen en in de marge verschijnt een [+] teken. Om alle code terug te zien kan je de sectie terug openvouwen (expand) door op het [+] teken te klikken.

Indien je editeert in de zichtbare lijn van een opgevouwen sectie, wordt deze automatisch opengevouwen. Globale statements zoals het OPTIONS, TITLE of FOOTNOTE7 statement blijven apart staan tussen de secties.

Kies Tools Options Enhanced Editor en ga naar de ‘General ‘-tab om opties omtrent het werken met secties in te stellen (opties ‘Show section lines in text’ en ‘Show section brackets in margin’) of om het werken met secties volledig uit te zetten (optie ‘Collapsible code sections’).

7 De syntax en functionaliteit van deze statements wordt in Hoofdstuk 3 behandeld.

Page 41: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 39

ICTS FOOCES 39

Meervoudige ‘undo’ Naast een meervoudige ‘Undo’ ( kies Edit Undo) om voorgaande acties ongedaan te maken is in de Enhanced Editor ook een ‘Redo’ voorzien om de actie toch terug door te voeren (kies Edit Redo). Automatisch inspringen Bij het typen van tekst in de Enhanced Editor wordt elke nieuwe regel die je typt automatisch uitgelijnd op de vorige regel. Een bookmark plaatsen bij een lijn Het is mogelijk om een bookmark te plaatsen bij een lijn in uw SAS code. Deze lijn is dan voorzien van een rechthoekje in de marge.

Gemarkeerde lijnen kan men via de functietoets F2 snel opzoeken in het programma.

Ctrl + F2 op niet gemarkeerde lijn markeer de lijn (plaats een bookmark)

Ctrl + F2 op een gemarkeerde lijn verwijder de markering (bookmark)

F2 ga naar de eerstvolgende gemarkeerde lijn

Shift + F2 ga naar de voorgaande gemarkeerde lijn

Page 42: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 40

ICTS FOOCES 40

In bepaalde operating systemen ( mainframe MVS, UNIX) kan het nuttig zijn om over lijnnummers te beschikken in het Program Editor venster bij het typen en editeren van SAS programma’s. Deze lijnnummers kunnen opgeroepen worden via Tools Options Editor , kies Text Editing Options en zet Nums op Yes.

De aanwezigheid van de lijnnummers maakt het mogelijk om lijnbevelen te gebruiken. Deze bevelen worden ingetypt over de lijnnummers heen gevolgd door een enter. Volgende lijnbevelen zijn beschikbaar:

I <A|B> <n> voegt 1 tot n lijnen bij D <n> laat 1 tot n lijnen weg C <n> copieert 1 tot n lijnen M <n> verplaatst 1 tot n lijnen en wordt gecombineerd

met A (after) of B (before) of O (overlay) R <n> herhaalt 1 tot n lijnen DD laat 1 blok lijnen weg en wordt geplaatst op de

eerste en laatste lijn van het blok RR <n> herhaalt een blok lijnen > <n> verplaatst gegevens 1 tot n kolommen naar

rechts < <n> Verplaatst gegevens 1 tot n kolommen

naar links << <n> verplaatst een blok lijnen naar links >> <n> verplaatst een blok lijnen naar rechts

Extra functionaliteiten van de Program Editor (alleen

voor niet Windows gebruikers)

zonder

lijnnummers

met lijnnummers

Page 43: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 41

ICTS FOOCES 41

De output die door SAS standaard gegenereerd wordt en die in het output venster verschijnt bestaat uit gewone ascii-karakters. Men noemt dit listing output. Het Results venster laat toe de verschillende listing output onderdelen te beheren. Het is bijvoorbeeld mogelijk om onderdelen van een output rechtstreeks via Copy en Paste in een tekstverwerker te plakken. Nadeel van de listing output is onder andere dat deze in de tekstverwerker in een monospace font wordt weergegeven en dat tabellen bij het plakken in de tekstverwerker geen ‘echte’ tabel meer zijn.

SAS kan de uitvoer van procedures rechtstreeks in HTML genereren. Hiermee kunnen tabellen, resultaten van analyses en grafieken onmiddellijk beschikbaar gesteld worden via het Internet. Om HTML output te verkrijgen dient de HTML optie éénmalig te worden aangeklikt.

Uitvoeren van het programma PATIENT.SAS waarbij zowel Listing als HTML output worden gevraagd. 1. Kies Tools Options Preferences vanaf de bovenste menubalk en klik op de Results tab. Default is de optie Create listing aangeklikt. 2. Klik nu ook Create HTML aan. 3. Bij View results using, zorg ervoor dat Internal Browser aangeklikt staat (alleen voor Windows). Op deze wijze kan de HTML output binnen SAS bekeken worden in het Results viewer venster.

1.8 HTML output genereren

Listing output

HTML output

listing output

listing output

Page 44: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 42

ICTS FOOCES 42

4. Voer het pogramma PATIENT.SAS (uit paragraaf 1.2) terug uit vanuit de Editor. 5. Ga naar het Results venster.

Per procedure zijn er nu 2 output objecten beschikbaar: een listing output en een HTML output. Bij een dubbel klik op het HTML icoon van de PROC MEANS bijvoorbeeld, verschijnt de HTML output binnen het Results Viewer venster van SAS8.

8 Alleen voor Windows, bij andere operating systemen wordt de web browser geopend.

listing output

HTML output

listing output

HTML output

Page 45: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 43

ICTS FOOCES 43

Merk op dat alle listing output onder elkaar in het output scherm wordt geplaatst. Door te scrollen in het output venster kan de output van de verschillende procedures bekeken worden. HTML output daarentegen wordt telkens in een nieuw HTML bestand bewaard. ( In Hoofdstuk 4, Het ODS systeem, wordt uitgelegd hoe de output van meerdere procedures toch in één HTML bestand kan bewaard worden).

Uiteraard is het ook mogelijk om alleen HTML output te verkrijgen. Zet de optie Create

listing in het Preferences venster af. Het is mogelijk om de stijl van de HTML output aan te passen. Met de stijl wordt de algemene presentatie bedoeld zoals de gebruikte font, de grootte van de font, de kleuren, enz… SAS biedt de keuze tussen een aantal vooraf gedefinieerde stijlen.

(vervolg) 6. Selecteer de stijl STATDOC vanaf de lijst bij Style in het zelfde Preferences venster (weer via Tools Options Preferences):

Page 46: HOOFDSTUK 1 INLEIDING TOT HET SAS SYSTEEM 1 · data mining : het opsporen van verborgen verbanden tussen gegevens ... Inleiding tot het SAS systeem 1.1 Wat is SAS ? Information Delivery

Fout! Gebruik het tabblad Start om Heading 1 toe te passen op de tekst die u hier wilt weergeven. Fout! Gebruik het tabblad Start om Heading 2 toe te passen op de tekst die u hier wilt weergeven. 44

ICTS FOOCES 44

7. Voer hetzelfde programma nogmaals uit. 8. Hieronder de HTML output van de PROC MEANS in de nieuwe stijl.

Het is mogelijk om de door SAS meegeleverde stijlen te wijzigen of zelf eigen stijlen aan te maken. Dit wordt niet behandeld in deze cursus.

Naast listing en HTML output kunnen nog andere formaten worden gegenereerd, zoals rtf, pdf, postscript, xml…. Dit wordt behandeld in Hoofdstuk 4, het ODS systeem.