1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten...

102
1. Opdracht X 1.1. Reeks 1 : aantal inschrijvingen van nieuwe wagens We zullen de verschillende stappen doorlopen met betrekking tot de eerste reeks. Deze reeks weerspiegelt het aantal inschrijvingen van nieuwe wagens (inclusief transit). De geobserveerde periode gaat van januari 1998 tot december 2002. Het gaat hier met andere woorden over maandcijfers, met in totaal 60 metingen. Uit de vorige opdrachten is gebleken dat de reeks getransformeerd moest worden, zodoende stationariteit te bewerkstelligen. Volgende transformaties waren vereist: d : 0 D : 1 λ : 1 In deze tijdreeks konden we slechts één ARIMA-proces destilleren, met name een MA(1)-proces. Uit de backforecasting- procedure is gebleken dat deze parameter significant verschillend is van nul. Verder konden we uit deze procedure geen gebrekkigheden determineren, waardoor een nieuwe schatting niet vereist was. Uit de forecasting-procedure zijn tevens geen gebrekkigheden naar voren gekomen. We kunnen bijgevolg besluiten dat de reeks kan gehanteerd worden om adequate voorspellingen te maken. In deze opdracht zullen we nagaan of de storingstermen van de reeks (na backforecasting) zich op een correcte wijze gedragen. Met andere woorden: de storingstermen moeten ‘white noise’ zijn. 1

Transcript of 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten...

Page 1: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

1. Opdracht X

1.1. Reeks 1 : aantal inschrijvingen van nieuwe wagens

We zullen de verschillende stappen doorlopen met betrekking tot de eerste reeks. Deze reeks weerspiegelt het aantal inschrijvingen van nieuwe wagens (inclusief transit). De geobserveerde periode gaat van januari 1998 tot december 2002. Het gaat hier met andere woorden over maandcijfers, met in totaal 60 metingen.

Uit de vorige opdrachten is gebleken dat de reeks getransformeerd moest worden, zodoende stationariteit te bewerkstelligen. Volgende transformaties waren vereist:

d : 0D : 1λ : 1

In deze tijdreeks konden we slechts één ARIMA-proces destilleren, met name een MA(1)-proces. Uit de backforecasting-procedure is gebleken dat deze parameter significant verschillend is van nul. Verder konden we uit deze procedure geen gebrekkigheden determineren, waardoor een nieuwe schatting niet vereist was. Uit de forecasting-procedure zijn tevens geen gebrekkigheden naar voren gekomen. We kunnen bijgevolg besluiten dat de reeks kan gehanteerd worden om adequate voorspellingen te maken.

In deze opdracht zullen we nagaan of de storingstermen van de reeks (na backforecasting) zich op een correcte wijze gedragen. Met andere woorden: de storingstermen moeten ‘white noise’ zijn.

1

Page 2: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

1.1.1. Task 1

Compute the ACF, PACF, and Spectrum of the estimated residuals. Is there any indication of a 'forgotten' process? Re-identify the ARIMA model (if necessary) and re-estimate the parameters (and forecast). Important: do not apply any new model estimations/forecasts to the residuals (use the original data instead).

ACF EN PACF

ACF PACF

Uit bovenstaande tabel kunnen we besluiten dat de autocorrelatiefunctie en de partiële autocorrelatiefunctie niet op elkaar gelijken. Zou dit eventueel kunnen wijzen op een vergeten proces?

Uit de PACF kunnen we duidelijk een ‘oscillerend-convergerend’ patroon vaststellen. En dit zowel bij de seizoenale als bij de niet-seizoenale partiële autocorrelatiecoëfficiënten. Dit zou eventueel kunnen duiden op een vergeten (S)MA(?) proces. Indien we kijken naar de ACF, zien we duidelijk dat het eerste staafje zich niet buiten het betrouwbaarheidsinterval bevind. Een MA(?) proces is dus uitgesloten. Desalniettemin kunnen we vaststellen dat het eerste niet-seizoenale staafje (lag 12) in de autocorrelatiefunctie zich significant buiten het betrouwbaarheidsinterval bevind. Dit zou kunnen duiden op een SMA(1) proces.

Een (S)AR(?)-proces is uitgesloten, daar noch het eerste niet-seizoenale (lag 1), noch het eerste seizoenale (lag 12) staafje in de partiële autocorrelatiefunctie zich buiten het betrouwbaarheidsinterval bevind.

Na onderzoek van de ACF en de PACF van de residuals komen we tot volgende equatie:

2

Page 3: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Aangezien we een bijkomend proces verwachten, zullen we dit toetsen aan de hand van de (back)forecasting-procedure.

Estimate

d = 0D = 1s = 12lambda = 1

S.E. T-STATMA(1) -0.362 0.1638 -2.2107SMA(1) 0.7627 0.1963 3.8854

TRANSFORMATION

PARAMETER

FINAL PARAMETER ESTIMATES ON CONVERGENCENON-SEASONAL DIFFERENCINGSEASONAL DIFFERENCINGSEASONAL PERIOD

Uit bovenstaande tabel kunnen we besluiten dat beide parameters significant verschillend zijn van nul, daar hun respectievelijke t-statistieken in absolute waarde groter zijn dan twee. Hieruit kunnen we besluiten dat onze ‘visuele vermoedens’ op aanwezigheid van een MA(1) en een SMA(1) proces, statistisch worden gestaafd.

MA(q)B(1) = -2.7621540250856

SMA(Q)B(1) = 1.3111882740355

First roots of ARMA polynomials

Daar de absolute waarde van de ‘First roots of ARMA polynomials’ in absolute waarde groter zijn dan één, kunnen we besluiten dat de differentievergelijking convergeert. Dit wijst op stability en invertibility. Dit is van primordiaal belang om later adequate voorspellingen te maken.

in % MA(1) SMA(1)MA(1) 100 -25SMA(1) -25 100

Correlation matrix

Uit bovenstaande tabel kunnen we besluiten dat de ‘variabelen’ onderling niet sterk zijn gecorreleerd. In het college werd immers vermeld dat we ons

3

Page 4: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

zorgen moesten baren op het moment dat deze correlatiecoëfficiënten groter waren dan 70!

Statistic ValueG = (1 - ? [φ])(1 - ? [Φ]) 1

# e[t] > 0 36# e[t] < 0 59

MAD 92.87351865Mean of e[t] -108.6046328S.E. of e[t] 296.2675148

T-STAT (Mean/S.E.) -0.366576244R-squared Y[t] 0.7976R-squared W[t] 0.2646

Het # e[t] > 0 en het # e[t] < 0 moeten min of meer aan elkaar gelijk zijn. In dit geval klopt dit niet. Toch mogen we besluiten dat het gemiddelde van de residu’s niet significant verschillend is van nul, daar de absolute waarde van de bijhorende t-statistiek kleiner is dan twee. De parameterwaarde van ‘Mean of e[t]’ (hier: -108) maakt in feite niet veel uit, daar deze is uitgedrukt in eenheden, niet in procenten!

De G-statistiek is in dit geval gelijk aan 1, hetgeen wijst op een stabiel model!. Indien de G-statistiek kleiner zou zijn dan nul, zou dit wijzen op een instabiel model!

De determinatiecoëfficiënt [R²] van de stationaire tijdreeks is gelijk aan 0,26. Dit betekent dat 26% van de variantie van de tijdreeks kan verklaard worden, door gebruik te maken van dit wiskundig model! Dit is niet zo goed!

Normalitair zouden de storingstermen zich rondom nul moeten gedragen. Indien de variantie van de storingstermen echter toeneemt bij stijgende ‘fit-waarden’, geeft dit een éérste indicatie op heteroskedasticiteit. Uiteraard is dit een subjectieve benadering. Vandaar dat we onze veronderstellingen moeten staven aan de hand van statistische hulpmiddelen. In de grafiek, die hiernaast wordt vermeld, vrezen

we echter op de aanwezigheid van heteroskedasticiteit. Statistische tests,

4

Page 5: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

waaronder de Park-test, de White-test en de Goldfeld-Quandt test zullen hier uitsluitsel op moeten geven.

Aan de hand van de verschillende onderzochte statistieken, kunnen we besluiten dat deze tijdreeks geen fundamentele gebrekkigheden vertoont (met uitzondering van de eventuele aanwezigheid op heteroskedasticiteit). Bijgevolg kunnen we besluiten, dat we aan de hand van dit geschatte model, adequate prognoses kunnen maken!

Forecast

Forecast Evolutie standaardfouten

Om adequate voorspellingen te kunnen maken, mag de ‘forecast’ niet exploderen. Dit is in hier duidelijk niet het geval. We kunnen dit tevens afleiden uit de parameterwaarden van het MA(1) en het SMA(1)-proces. Beide parameterwaarden liggen immers in het interval [-1 ; 1], hetgeen van primordiaal belang is.

Wat de forecast-procedure betreft, zullen we enkel bovenstaande grafieken meedelen. We zien duidelijk dat de seizoenale trend zich verder zet. Daarenboven merken we enkele patronen (pieken) op, die voorheen niet merkbaar waren! We zien duidelijk dat de standaardfouten toenemen, naarmate we verder in de toekomst voorspellen. Het gros van de standaardfouten is min of meer gelijk aan 0,1. Dit wil zeggen dat de gemiddelde maximale fout die we maken door de voorspelde waarde aan te nemen gelijk is aan 10%!

5

Page 6: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Nu we het model herschat hebben, mits de aanwezigheid van een SMA(1)-proces, zullen we nu teruggaan naar de hoofdopdracht. We zullen thans nagaan of we uit de autocorrelatiefunctie en de partiële autocorrelatiefunctie van de storingstermen nog een patroon kunnen destilleren.

ACF en PACF

ACF PACF

Uit bovenstaande tabel kunnen we besluiten dat de autocorrelatiefunctie en de partiële autocorrelatiefunctie min of meer op elkaar gelijken. Uit de grafieken kunnen we daarenboven geen ARMA-proces meer destilleren, daar noch het eerste niet-seizoenale (lag 1), noch het eerste seizoenale (lag 12) staafje in de autocorrelatiefunctie en de partiële autocorrelatiefunctie zich buiten het betrouwbaarheidsinterval bevind.

6

Page 7: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Spectrum

3

In het ideale geval situeert de witte lijn zich tussen de gele lijnen, ofte binnen de Kolmogorov-Smirnov grenzen! De storingstermen van deze tijdreeks, bevinden zich hoofdzakelijk binnen deze grenzen, mits enkele uitzonderingen. Aan de hand van het spectrum kunnen we noch een beduidende lange termijn-, noch een beduidende korte termijnstrend determineren. Indien dit wel het geval zou zijn, zou de witte lijn zich respectievelijk significant links, of rechts van de Kolmogorov-Smirnov grenzen moeten bevinden.

1.1.2. Task 2

Examine the histogram, rootogram, entropy concentration, and skewness/kurtosis diagnostics of the residuals. Are the residuals normally distributed? What do you think would happen if they are not normally distributed? Does this influence your analysis?

In het ideale geval zijn de storingstermen normaal verdeeld. Is dit niet het geval, dan zijn de schattingsresultaten vertekend, inconsistent en inefficiënt. Dit kan dan uiteraard leiden tot minder adequate prognoses. Indien de storingstermen normaal verdeeld zijn, dan is de kans op ‘kleine’ storingen groter

7

Page 8: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

dan de kans op ‘grote’ storingen. Dit is natuurlijk onze intentie. Hoe kleiner de storingen, hoe dichter de voorspelde waarden immers zullen aanleunen bij de werkelijkheid. Algemeen wordt gesteld dat, indien de storingstermen normaal verdeeld zijn en de steekproef voldoende groot is, we spreken van asymptotisch niet-vertekende, consistente parameters.

Indien zou blijken dat de storingstermen inderdaad niet normaal verdeeld zijn, dan is een mogelijke oplossing het opnemen van meerdere observaties in je steekproef. Algemeen wordt immers het volgende gesteld: hoe groter de steekproef, hoe groter de kans dat de storingstermen normaal verdeel zullen zijn.

Histogram

Bovenstaande grafiek toont het verloop van de storingstermen aan, aan de hand van een histogram. Zoals reeds eerder besproken, moeten de storingstermen normaal verdeeld zijn, zodoende adequate prognoses te kunnen maken. Uit bovenstaande grafiek kunnen we moeilijk een normaalverdeling destilleren. We kunnen echter wel determineren dat de frequentie in het centrum groter is dan aan de staarten! Dit is typisch voor een normaalverdeling. Aangezien we op deze (visuele) wijze moeilijk een uitspraak kunnen doen over de al dan niet aanwezigheid van een normaalverdeling, zullen we ons moeten beroepen op het rootogram. Dit is een statistisch hulpmiddel, dat nagaat of de

8

Page 9: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

storingstermen al dan niet normaal verdeeld zijn. Zij gaat met andere woorden de werkelijke klassenfrequenties van bovenstaand histogram vergelijken met de theoretische klassenfrequenties van een normaalverdeling, en vervolgens een uitspraak maken, op basis van statistische inferenties.

Rootogram

Suspended rootogram of 9910133_ insc.ds.res by bind = 0 D = 0 L = 1Chi-square test at 5%:THIS SERIES IS NORMALLY DISTRIBUTED

Bovenstaande tabel weerspiegelt het rootogram van betreffende tijdreeks. De ondergrens is gelijk aan -2, de bovengrens gelijk aan 2. Dit komt met andere woorden neer op het definitiegebied van de theoretische standaard normaalverdeling [-2, 2] met = 0,05, µ = 0 en = 1. De klassencoëfficiënten mogen zich niet significant buiten dit betrouwbaarheidsinterval begeven, indien we er impliciet van uit gaan dat onze tijdreeks normaal verdeeld is. In bovenstaand voorbeeld, zien we duidelijk dat het betrouwbaarheidsinterval slechts éénmaal significant wordt overschreden, met name bij ‘klasse’ 32. Aan de hand van de grafiek kunnen we bijgevolg besluiten dat de reeks normaal verdeeld is. Dit wordt

9

Page 10: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

tevens statistisch gestaafd aan de hand van de -statistiek. Deze duidt aan, dat er sprake is van een normaalverdeling.

Entropy concentration

Bovenstaande grafiek, is een alternatieve wijze om na te gaan of onze storingstermen al dan niet normaal verdeeld zijn. De witte lijn stelt de entropy voor. We kunnen duidelijk een normaalverdeling destilleren. De software geeft tevens een parameterwaarde weer voor de entropy, maar aangezien het ons niet duidelijk is, hoe deze moet worden geïnterpreteerd, gaan we hier niet dieper op in. We kunnen wel determineren dat deze wijze, voor het bepalen of de storingstermen al dan niet normaal verdeeld is, minder nauwkeurig is dan het rootogram.

Skewness/Kurtosis

De Skewness meet de ‘scheefheidsgraad’ van een verdeling. Een negatieve skewness impliceert een linkscheve verdeling, een positieve skewness impliceert een rechtsscheve verdeling. Indien de skewness gelijk is aan nul, kunnen we spreken van een symmetrische verdeling. Hetgeen uiteraard het geval is bij een normaalverdeling. Vandaar dat we moeten testen of de skewness van de verdeling van onze storingstermen niet significant verschillend is van nul. Is dit niet het geval, dan zijn de storingstermen niet normaal verdeeld!

10

Page 11: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

De Kurtosis is een maatstaf die de dikte van de staarten van de verdeling van de storingstermen in kaart brengt. Een positieve kurtosis wijst op een spitse top, een negatie kurtosis op een vlakke distributie. Bij een normaalverdeling is de kurtosis gelijk aan nul, aangezien we de grootste frequenties in het centrum aantreffen, de kleinste aan de staarten. We zullen bijgevolg moeten testen of de kurtosis van de verdeling van onze storingstermen niet significant verschillend is van nul. Is dit niet het geval, dan zijn de storingstermen immers niet normaal verdeeld!

Skewness Measure Value Kurtosis Measure ValueFISHER Test 1 Probability 0.3788 FISHER Test 2 Probability 0.234

Skewness and Kurtosis - Ungrouped Data

Skewness Kurtosis

De Fisher Test 1 Probability gaat na of de skewness van de verdeling van de storingstermen niet significant verschillend is van nul. Is dit het geval dan zou de P-value groter moeten zijn dan 5% ( -fout = 0,05). De P-value is in huidig voorbeeld gelijk aan 37%. We kunnen bijgevolg stellen dat, wat betreft de scheefheidsgraad, de storingstermen normaal verdeeld zijn! In de skewness-grafiek kunnen we tevens determineren dat de nullijn zich steeds tussen het betrouwbaarheidsinterval bevind. We kunnen tevens determineren dat, indien we enkele extreme waarden zouden elimineren, de skewness nog dichter bij nul zou aanleunen, hetgeen ons model enkel ten goede komt!

De Fisher Test 2 Probability gaat na of de kurtosis van de verdeling van de storingstermen niet significant verschillend is van nul. Is dit het geval dan zou de P-value groter moeten zijn dan 5% ( = 0,05). De P-value is in huidig voorbeeld gelijk aan 23%. We kunnen bijgevolg stellen dat, wat betreft de kurtosis, de storingstermen normaal verdeeld zijn! In de kurtosis-grafiek kunnen we tevens

11

Page 12: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

determineren dat de nullijn zich steeds tussen het betrouwbaarheidsinterval bevind. We kunnen tevens determineren dat, indien we enkele extreme waarden zouden elimineren, de kurtosis nog dichter bij nul zou aanleunen, hetgeen ons model enkel ten goede komt! We moeten echter wel opletten dat we niet te veel waarden zouden elimineren. Dit zou immers leiden tot een vertekend beeld! [De kurtosis blijft ononderbroken dalen, bij eliminatie van (extreme) waarden]

Besluit

Uit de verschillende statistische tests kunnen we besluiten dat de storingstermen normaal verdeeld zijn. Bijgevolg voldoen we aan één van de voorwaarden van ‘white noise’!

1.1.3. Task 3

Compute various measures of central tendency for the residuals. Is the mean significantly different from zero?  How robust is this hypothesis?

Het gemiddelde van de storingstermen mag niet significant verschillend zijn van nul. Is dit echter wel het geval, dat zijn de storingstermen sterk vertekend. Vandaar dat de gemaakte voorspellingen al dan niet met een korreltje zout zullen moeten worden genomen.

Central Tendency - Ungrouped DataMeasure Value S.E. Value/S.E.

Arithmetic Mean 318.4266742 556.0056623 0.572704013Standard Error 3852.120225       Geometric Mean NAN    

Harmonic Mean-

366.3216405    Quadratic Mean 3825.059932    Winzorized Mean (0/48) 318.4266742 556.0056623 0.572704013Winzorized Mean (1/48) 271.4438124 551.8141007 0.4919117Winzorized Mean (2/48) 271.5061544 502.1867799 0.540647754Winzorized Mean (3/48) 326.4977419 467.2717639 0.698732017Winzorized Mean (4/48) 284.7570081 429.0623841 0.66367274Winzorized Mean (5/48) 330.3845737 402.5544823 0.820720147Winzorized Mean (6/48) 424.6959497 371.4934897 1.143212362Winzorized Mean (7/48) 583.1789667 306.3720259 1.903499397Winzorized Mean (8/48) 436.7271611 267.4072544 1.633191149Winzorized Mean (9/48) 484.5246008 228.9817348 2.115996725

12

Page 13: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Winzorized Mean (10/48) 488.782801 224.616781 2.176074284Winzorized Mean (11/48) 483.0344138 220.7974715 2.187680912Winzorized Mean (12/48) 599.5638173 199.5800406 3.004127143Winzorized Mean (13/48) 604.8450654 192.4299091 3.143196754Winzorized Mean (14/48) 636.9352982 186.0393981 3.423658132Winzorized Mean (15/48) 668.4539459 179.2396457 3.729386672Trimmed Mean (0/48) 318.4266742 556.0056623 0.572704013Trimmed Mean (1/48) 311.4009648 492.9361088 0.631726829Trimmed Mean (2/48) 354.9905857 440.6555066 0.805596618Trimmed Mean (3/48) 402.695975 400.3833759 1.005775962Trimmed Mean (4/48) 433.1752682 362.3961844 1.195308579Trimmed Mean (5/48) 480.0441924 331.9897294 1.445960974Trimmed Mean (6/48) 519.9534241 299.2465108 1.737542144Trimmed Mean (7/48) 542.3669474 266.6762065 2.033803294Trimmed Mean (8/48) 533.6215147 248.7447021 2.145257809Trimmed Mean (9/48) 553.0003854 238.6298724 2.317397985Trimmed Mean (10/48) 566.0433921 235.7909351 2.400615578Trimmed Mean (11/48) 580.3068858 231.4822819 2.506917078Trimmed Mean (12/48) 597.9927898 225.0935845 2.656640753Trimmed Mean (13/48) 597.7071484 222.2011475 2.689937271Trimmed Mean (14/48) 596.3893791 218.5835962 2.72842697Trimmed Mean (15/48) 588.666347 212.9058392 2.764914054Median 483.7519943    Midrange 480.017989    Midmean 536.7045952    Observations 48    

Bovenstaande tabel geeft verschillende centrumwaarden (kengetallen van de verdeling) weer! In feite kunnen we het best kijken naar de laatste kolom, aangezien we deze kunnen aanschouwen als een statistiek. De overige kolommen zijn uitgedrukt in eenheden, waardoor we moeilijk een uitspraak kunnen doen of het gemiddelde van de residu’s al dan niet significant verschillend is van nul. Indien we het ‘standaard gemiddelde’ nemen (MEAN), zien we duidelijk dat de absolute waarde van de t-statistiek kleiner is dan twee. We kunnen bijgevolg stellen dat het gemiddelde van de storingstermen niet significant verschillend is van nul. Dit is een goede zaak!

Naast het standaardgemiddelde worden er nog andere gemiddelden berekend, waaronder de ‘trimmed mean’. Deze berekent het gemiddelde van de storingstermen, mits een procentuele eliminatie van extreme waarden. We merken duidelijk op, dat de absolute waarde van de t-statistiek groter wordt, naarmate er meer (extreme) observaties uit de steekproef worden gelicht. Op een bepaald moment wordt de absolute waarde van de t-statistiek zelfs groter dan twee, wat impliceert dat het gemiddelde van de storingstermen significant

13

Page 14: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

verschillend is van nul. Dit is een slechte zaak! Indien we, voor het bekomen van betere schattingsresultaten, enkele extreme waarden wensen te elimineren, moeten we er voor blijven zorgen dat het gemiddelde van de storingstermen niet

significant verschillend wordt van nul (m.a.w. ).

Dezelfde bemerkingen kunnen we maken wat betreft de ‘winzorized mean’. Bij de berekening van dit gemiddelde wordt een percentage van de extreme waarden vervangen door meer normale waarden.

De software geeft bij deze berekeningen tevens twee grafieken, die we hier niet zullen meedelen, aangezien de gemiddelden in de grafieken zijn uitgedrukt in eenheden. We kunnen wel zeggen dat in beide grafieken de ‘gemiddelde-lijn’ zich binnen het betrouwbaarheidsinterval bevind.

1.1.4. Task 4

Compute various measures of variability, quartiles, and percentiles. How could we describe (compute) the 50% confidence interval (of a 1-step-ahead forecast) based on all three computations? What computation would you use to derive the 83% confidence interval?

In wat volgt zullen we enkele spreidingsmaten van de verdeling onderzoeken. Meer bepaald de variantie, de kwartielen en de percentielen.

Variabiliteit

Variability - Ungrouped DataVariability Measure Value

Absolute Range 19717.47912

Relative Range (unbiased) 5.118604293

Relative Range (biased) 5.172770926

Variance (unbiased) 14838830.23

Variance (biased) 14529687.93

Standard Error (unbiased) 3852.120225

Standard Error (biased) 3811.782776

Mean Absolute Deviation from Mean (MAD Mean) 2788.625843

In bovenstaande tabel kunnen we de range aflezen. Deze is hier gelijk aan 19717. De range is niets meer dan het verschil tussen de grootste en de kleinste

14

Page 15: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

meetuitslag, en wordt veelal gebruikt indien het aantal meetuitslagen kleiner is dan 15. We kunnen wel besluiten dat de range vrij groot is.

De variantie (standaarddeviatie²) geeft de relatieve spreiding van de meetuitslagen ten opzichte van het gemiddelde van de residu’s weer (in dit geval gelijk nul).

De standaardfout is de maximale afwijking tussen de voorspelde waarde (1-step-ahead forecast) en de werkelijkheid.

Kwartielen

Quartiles - Ungrouped DataMethod Quartile 1 Quartile 2 Quartile 3

Weighted Average at Xnp -1470.91667 483.6930677 2207.021204Weighted Average at X(n+1)p -1354.375381 483.7519943 2207.05686Empirical Distribution Function -1470.91667 483.6930677 2207.021204Empirical Distribution Function - Averaging -1237.834092 483.7519943 2207.044975Empirical Distribution Function - Interpolation -1121.292804 483.7519943 2207.03309Closest Observation -1470.91667 483.6930677 2207.021204True Basic - Statistics Graphics Toolkit -1121.292804 483.7519943 2207.03309MS Excel (old versions) -1470.91667 483.7519943 2207.068745Observations 48

In bovenstaande grafiek merken we op dat het tweede kwartiel vrij klein is in verhouding tot kwartiel 1 en 3. We kunnen zelfs stellen dat het eerste en het tweede kwartiel in absolute waarde min of meer overeenkomen. Dit is uiteraard niet meer dan normaal, gezien de symmetrie van de verdeling.

Bij het opstellen van een 50% betrouwbaarheidsinterval moeten we bijgevolg als ondergrens het 2ste kwartiel nemen, en als bovengrens het 3de

kwartiel!

Percentielen

Percentiles - Ungrouped Data

% Weighted Average at Xnp Weighted Average at X(n+1)p0.01 -4501.7864 -4595.5736

15

Page 16: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

0.02 -9003.5727 -9191.14710.03 -9134.1972 -9117.5250.04 -8867.4433 -8845.21380.05 -8224.3305 -8149.49880.06 -7505.946 -7416.1480.07 -6899.0834 -6816.00380.08 -6329.3948 -6234.44670.09 -5892.8183 -5823.4394

0.1 -5522.7978 -5445.71020.11 -5200.5854 -5134.57080.12 -4912.5216 -4840.50570.13 -4561.6174 -4449.56150.14 -4147.8727 -4027.19720.15 -3594.9241 -3361.2260.16 -2847.09 -2597.81190.17 -2320.1783 -2290.05060.18 -2235.1117 -2203.21170.19 -2097.7294 -1981.2241

0.2 -1803.4001 -1680.76290.21 -1554.0539 -1543.36530.22 -1529.6228 -1518.42530.23 -1505.7753 -1497.42370.24 -1488.346 -1479.63130.25 -1470.9167 -1354.37540.26 -1247.1574 -1125.95450.27 -1023.3981 -984.01510.28 -965.0818 -939.83750.29 -921.8058 -889.6985

0.3 -867.1749 -831.61120.31 -810.2729 -773.73590.32 -753.7729 -716.19540.33 -697.4067 -649.92750.34 -624.6123 -567.23120.35 -543.6037 -501.61040.36 -494.4693 -474.6940.37 -468.1022 -420.00140.38 -390.456 -288.39010.39 -261.5306 -182.7616

0.4 -179.8468 -166.89210.41 -164.3012 -147.78930.42 -143.0075 -114.31650.43 -110.2178 -82.3850.44 -80.0703 -59.70130.45 -57.8496 -37.9610.46 -37.1381 -24.52130.47 -23.9727 2.9635

16

Page 17: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

0.48 7.9195 245.80630.49 245.8063 483.6942

0.5 483.6931 483.7520.51 483.7496 483.80970.52 483.8062 537.71330.53 533.2215 592.73870.54 587.1239 919.82720.55 877.6029 1264.65890.56 1215.3972 1320.26440.57 1316.552 1343.00330.58 1338.8268 1369.11130.59 1363.6686 1395.7809

0.6 1389.7938 1439.52470.61 1427.8711 1487.11020.62 1474.4855 1565.55820.63 1540.592 1652.94020.64 1626.1906 1728.25340.65 1705.0844 1799.20850.66 1774.5915 1919.64560.67 1867.3841 2061.9130.68 2006.7481 2116.57340.69 2113.2594 2124.6925

0.7 2121.2129 2130.39740.71 2128.5226 2134.57320.72 2132.6131 2156.14720.73 2139.1891 2190.76980.74 2173.1052 2207.03360.75 2207.0212 2207.05690.76 2207.044 2221.80350.77 2207.0668 2251.8870.78 2234.0825 2275.16460.79 2263.5521 2290.0893

0.8 2280.6471 2370.57560.81 2295.2672 2546.12610.82 2427.8982 2847.25660.83 2599.866 3364.66370.84 2995.0872 3788.52110.85 3501.935 4019.43220.86 3845.0708 4199.41550.87 4071.2694 4252.07930.88 4210.1632 4311.29880.89 4261.7522 4390.7318

0.9 4324.2674 4581.13050.91 4402.0794 5204.29520.92 4657.4364 5750.27760.93 5267.8835 5900.7008

17

Page 18: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

0.94 5762.5571 6122.4130.95 5909.9103 6855.03070.96 6152.3158 7640.27950.97 6869.9821 9017.62770.98 7640.2795 10131.98240.99 8989.5185 5065.9912

Gezien de normaalverdeling van de residu’s zouden het eerste en het negenennegentigste percentiel, het tweede en het achtennegentigste percentiel,… in absolute waarde sterk moeten overeenkomen.

Het middelste percentiel (dus het vijftigste) zou min of meer gelijk moeten zijn aan nul!

Bij het opstellen van een 83% betrouwbaarheidsinterval moeten we gebruik maken van de percentielen. Aangezien we slechts 83% nodig hebben en geen 100%, moeten we 8,5% ((100%-83%)/2) van iedere staart halen. Bijgevolg zal het betrouwbaarheidsgeval liggen tussen het 9 de en het 91ste percentiel of tussen het 10de en het 92ste percentiel.

18

Page 19: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Scatterplot R2 = 0.0001

-15000

-10000

-5000

0

5000

10000

15000

-1.5 -1 -0.5 0 0.5

reeks 2

reek

s 1

Scatterplot reeks 1 vs reeks 2

y = -609.38x + 104724R2 = 0.0265

0

10,000

20,000

30,000

40,000

50,000

60,000

70,000

98 100 102 104 106 108 110

reeks 2

reek

s 1

1.1.5. Task 5

Are the residuals of the time series white noise?

We hebben gezien dat de storingstermen normaal verdeeld zijn, er geen sprake meer is van autocorrelatie (ACF) en het gemiddelde van de residu’s niet significant verschillend is van nul. We kunnen bijgevolg besluiten dat de storingstermen ‘white noise’ zijn. Herschatting is bijgevolg niet meer nodig.

1.1.6. Task 6

Create scatterplots between the (white noise) residuals of your selected time series (with various timelags). Is there ANY relationship between the series? Do your findings correspond to your initial hypotheses? Did you now solve the spurious (nonsense) correlation problem?*

Reeks 1 refereert naar de inschrijving van nieuwe wagens; Reeks 2 refereert naar de prijsevolutie van nieuwe- en tweedehandswagens

(1996 = 100); Reeks 3 refereert naar de prijsevolutie van autoverzekeringen B.A.+; Reeks 4 refereert naar de rente-evolutie van langlopende kredieten

Voor transformatie,… Na transformatie,…

19

Page 20: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

ScatterplotR2 = 0.0057

-15000

-10000

-5000

0

5000

10000

15000

-1.5 -1 -0.5 0 0.5 1 1.5 2

reeks 3

reek

s 1

Scatterplot R2 = 8E-05

-15000

-10000

-5000

0

5000

10000

15000

-0.6 -0.4 -0.2 0 0.2 0.4 0.6

reeks 2

reek

s 1

Scatterplot reeks 1 vs reeks 3

y = -2876.7x + 323471R2 = 0.1288

0

10,000

20,000

30,000

40,000

50,000

60,000

70,000

96 97 98 99 100 101 102

reeks 3

reek

s 1

Voor transformatie,… Na transformatie,…

Voor transformatie,… Na transformatie,…

Scatterplot reeks 1 vs reeks 4y = -2984.5x + 62573

R2 = 0.0144

0

10,000

20,000

30,000

40,000

50,000

60,000

70,000

6 6.5 7 7.5 8 8.5

reeks 4

reek

s 1

Uit alle scatterplots kunnen we determineren dat door transformatie, onderzoek van de ARIMA-processen en dergelijke, de aanvankelijke (moeilijk zichtbare) lineaire trend volledig verloren is. Dit is een duidelijk voorbeeld van ‘spurious regressen’, ofte nepregressie. Het is wel opmerkelijk dat er geen verband bestaat tussen beide variabelen, terwijl we dat intuïtief wel vermoeden. We gaan er toch allemaal van uit dat de verkoop van wagens zal reduceren bij prijsstijgingen. Dit komt hier nu niet meer tot uiting.

20

Page 21: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

1.2. Reeks 2 : prijsevolutie wagens

We zullen de verschillende stappen doorlopen met betrekking tot de tweede reeks. Deze reeks weerspiegelt de prijsevolutie van zowel nieuwe- als tweedehandswagens doorheen de geobserveerde periode (1996 = 100). De geobserveerde periode gaat van januari 1998 tot december 2002. Het gaat hier met andere woorden over maandcijfers, met in totaal 60 metingen.

Uit de vorige opdrachten is gebleken dat de reeks getransformeerd moest worden, zodoende stationariteit te bewerkstelligen. Volgende transformaties waren vereist:

d : 1D : 0λ : 1

In deze tijdreeks konden we geen ARIMA-proces destilleren. Uit de backforecasting-procedure konden we geen gebrekkigheden determineren, waardoor een nieuwe schatting niet vereist was. Aangezien er geen ARMA-proces aanwezig was, diende er voor deze tijdreeks geen forecasting te gebeuren.

In deze opdracht zullen we nagaan of de storingstermen van de reeks (na backforecasting) zich op een correcte wijze gedragen. Met andere woorden: de storingstermen moeten ‘white noise’ zijn.

21

Page 22: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

1.2.1. Task 1

Compute the ACF, PACF, and Spectrum of the estimated residuals. Is there any indication of a 'forgotten' process? Re-identify the ARIMA model (if necessary) and re-estimate the parameters (and forecast). Important: do not apply any new model estimations/forecasts to the residuals (use the original data instead).

ACF en PACF

ACF PACF

Uit bovenstaande tabel kunnen we besluiten dat de autocorrelatiefunctie en de partiële autocorrelatiefunctie min of meer op elkaar gelijken. Uit de grafieken kunnen we daarenboven geen ARMA-proces meer destilleren, daar noch het eerste niet-seizoenale (lag 1), noch het eerste seizoenale (lag 12) staafje in de autocorrelatiefunctie en de partiële autocorrelatiefunctie zich buiten het betrouwbaarheidsinterval bevind. Geen enkel staafje bevind zich overigens buiten het betrouwbaarheidsinterval.

22

Page 23: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Spectrum

3

In het ideale geval situeert de witte lijn zich tussen de gele lijnen, ofte binnen de Kolmogorov-Smirnov grenzen! De storingstermen van deze tijdreeks voldoen aan deze voorwaarde. Aan de hand van het spectrum kunnen we noch een beduidende lange termijn-, noch een beduidende korte termijnstrend determineren. Indien dit wel het geval zou zijn, zou de witte lijn zich respectievelijk significant links, of rechts van de Kolmogorov-Smirnov grenzen moeten bevinden.

1.2.2. Task 2

Examine the histogram, rootogram, entropy concentration, and skewness/kurtosis diagnostics of the residuals. Are the residuals normally distributed? What do you think would happen if they are not normally distributed? Does this influence your analysis?

In het ideale geval zijn de storingstermen normaal verdeeld. Is dit niet het geval, dan zijn de schattingsresultaten vertekend, inconsistent en inefficiënt. Dit kan dan uiteraard leiden tot minder adequate prognoses. Indien de storingstermen normaal verdeeld zijn, dan is de kans op ‘kleine’ storingen groter

23

Page 24: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

dan de kans op ‘grote’ storingen. Dit is natuurlijk onze intentie. Hoe kleiner de storingen, hoe dichter de voorspelde waarden immers zullen aanleunen bij de werkelijkheid. Algemeen wordt gesteld dat, indien de storingstermen normaal verdeeld zijn en de steekproef voldoende groot is, we spreken van asymptotisch niet-vertekende, consistente parameters.

Indien zou blijken dat de storingstermen inderdaad niet normaal verdeeld zijn, dan is een mogelijke oplossing het opnemen van meerdere observaties in je steekproef. Algemeen wordt immers het volgende gesteld: hoe groter de steekproef, hoe groter de kans dat de storingstermen normaal verdeel zullen zijn.

Histogram

Bovenstaande grafiek toont het verloop van de storingstermen aan, aan de hand van een histogram. Zoals reeds eerder besproken, moeten de storingstermen normaal verdeeld zijn, zodoende adequate prognoses te kunnen maken. Uit bovenstaande grafiek kunnen we moeilijk een normaalverdeling destilleren. We kunnen echter wel determineren dat de frequentie in het centrum groter is dan aan de staarten! Dit is typisch voor een normaalverdeling. Aangezien we op deze (visuele) wijze moeilijk een uitspraak kunnen doen omtrent de al dan niet aanwezigheid van een normaalverdeling, zullen we ons moeten beroepen op het rootogram. Dit is een statistisch hulpmiddel, dat nagaat of de

24

Page 25: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

storingstermen al dan niet normaal verdeeld zijn. Zij gaat met andere woorden de werkelijke klassenfrequenties van bovenstaand histogram vergelijken met de theoretische klassenfrequenties van een normaalverdeling, en vervolgens een uitspraak maken, op basis van statistische inferenties.

Rootogram

Suspended rootogram of 9910133_CPIW.ds.res by bind = 0 D = 0 L = 1Chi-square test at 5%:THIS SERIES IS NORMALLY DISTRIBUTED

Bovenstaande tabel weerspiegelt het rootogram van betreffende tijdreeks. De ondergrens is gelijk aan -2, de bovengrens gelijk aan 2. Dit komt met andere woorden neer op het definitiegebied van de theoretische standaard normaalverdeling [-2, 2] met = 0,05, µ = 0 en = 1. De klassencoëfficiënten mogen zich niet significant buiten dit betrouwbaarheidsinterval begeven, indien we er impliciet van uit gaan dat onze tijdreeks normaal verdeeld is. In bovenstaand voorbeeld, zien we duidelijk dat het betrouwbaarheidsinterval nooit overschreden wordt. Aan de hand van de grafiek kunnen we bijgevolg besluiten dat de reeks

25

Page 26: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

normaal verdeeld is. Dit wordt tevens statistisch gestaafd aan de hand van de -statistiek. Deze duidt aan, dat er sprake is van een normaalverdeling.

Entropy concentration

Bovenstaande grafiek, is een alternatieve wijze om na te gaan of onze storingstermen al dan niet normaal verdeeld zijn. De witte lijn stelt de entropy voor. We kunnen duidelijk een normaalverdeling destilleren (zie de klokvorm). De software geeft tevens een parameterwaarde weer voor de entropy, maar aangezien het ons niet duidelijk is, hoe deze moet worden geïnterpreteerd, gaan we hier niet dieper op in. We kunnen wel determineren dat deze wijze, voor het bepalen of de storingstermen al dan niet normaal verdeeld is, minder nauwkeurig is dan het rootogram.

Skewness/Kurtosis

De Skewness meet de ‘scheefheidsgraad’ van een verdeling. Een negatieve skewness impliceert een linkscheve verdeling, een positieve skewness impliceert een rechtsscheve verdeling. Indien de skewness gelijk is aan nul, kunnen we spreken van een symmetrische verdeling. Hetgeen uiteraard het geval is bij een normaalverdeling. Vandaar dat we moeten testen of de skewness van de verdeling van onze storingstermen niet significant verschillend is van nul. Is dit niet het geval, dan zijn de storingstermen niet normaal verdeeld!

26

Page 27: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

De Kurtosis is een maatstaf die de dikte van de staarten van de verdeling van de storingstermen in kaart brengt. Een positieve kurtosis wijst op een spitse top, een negatie kurtosis op een vlakke distributie. Bij een normaalverdeling is de kurtosis gelijk aan nul, aangezien we de grootste frequenties in het centrum aantreffen, de kleinste aan de staarten. We zullen bijgevolg moeten testen of de kurtosis van de verdeling van onze storingstermen niet significant verschillend is van nul. Is dit niet het geval, dan zijn de storingstermen immers niet normaal verdeeld!

Skewness Measure Value Kurtosis Measure ValueFISHER Test 1 Probability 0 FISHER Test 2 Probability 0

Skewness and Kurtosis - Ungrouped Data

Skewness Measure (small sample) ValueProbabilit

yKurtosis Measure (small

sample) ValueProbabilit

yTrimmed Skewness (0/59) -2.1656 0 Trimmed Kurtosis (0/59) 11.353 0Trimmed Skewness (1/59) -0.2476 0.4296 Trimmed Kurtosis (1/59) -0.177 0.7718Trimmed Skewness (2/59) -0.2384 0.4532 Trimmed Kurtosis (2/59) -0.189 0.7642

Trimmed Skewness and Kurtosis (2) - Ungrouped Data

Skewness Kurtosis

De Fisher Test 1 Probability gaat na of de skewness van de verdeling van de storingstermen niet significant verschillend is van nul. Is dit het geval dan zou de P-value groter moeten zijn dan 5% ( -fout = 0,05). De P-value is in huidig voorbeeld gelijk aan 0%. We kunnen bijgevolg stellen dat, wat betreft de scheefheidsgraad, de storingstermen niet normaal verdeeld zijn!

De oorzaak hiervan is te wijten aan outliers. Op de Skewness-grafiek, alsook op de Skewness en Kurtosis tabel (2) kunnen we immers vaststellen dat door eliminatie van één extreme waarde de nullijn zich rond nul gedraagt. De respectievelijke P-value is dan gelijk aan 42% en de storingstermen zijn derhalve,

27

Page 28: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

wat betreft de scheefheidsgraad, normaal verdeeld. In de skewness-grafiek kunnen we tevens determineren dat de nullijn zich steeds tussen het betrouwbaarheidsinterval bevind.

De Fisher Test 2 Probability gaat na of de kurtosis van de verdeling van de storingstermen niet significant verschillend is van nul. Is dit het geval dan zou de P-value groter moeten zijn dan 5% ( = 0,05). De P-value is in huidig voorbeeld gelijk aan 0%. We kunnen bijgevolg stellen dat, wat betreft de kurtosis, de storingstermen niet normaal verdeeld zijn!

De oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2) kunnen we immers vaststellen dat door eliminatie van één extreme waarde de nullijn zich rond nul gedraagt. De respectievelijke P-value is dan gelijk aan 77% en de storingstermen zijn derhalve, wat betreft de kurtosis, normaal verdeeld. In de kurtosis-grafiek kunnen we tevens determineren dat de nullijn zich steeds tussen het betrouwbaarheidsinterval bevind.

Besluit

Uit de verschillende statistische tests kunnen we besluiten dat de storingstermen normaal verdeeld zijn, mits eliminatie van één extreme waarde. Bijgevolg voldoen we aan één van de voorwaarden van ‘white noise’!

1.2.3. Task 3

Compute various measures of central tendency for the residuals. Is the mean significantly different from zero?  How robust is this hypothesis?

Het gemiddelde van de storingstermen mag niet significant verschillend zijn van nul. Is dit echter wel het geval, dat zijn de storingstermen sterk vertekend. Vandaar dat de gemaakte voorspellingen al dan niet met een korreltje zout zullen moeten worden genomen.

Central Tendency - Ungrouped DataMeasure Value S.E. Value/S.E.

Arithmetic Mean -5.57E-17 0.033597128 -1.66E-15Standard Error 0.258064436       Geometric Mean NAN    

28

Page 29: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Harmonic Mean 0.327831739    Quadratic Mean 0.255868103    Winzorized Mean (0/59) -9.79E-17 0.033597128 -2.91E-15Winzorized Mean (1/59) 0.011355932 0.025594614 0.443684454Winzorized Mean (2/59) 0.011694915 0.023849343 0.490366345Winzorized Mean (3/59) 0.013220339 0.023404797 0.564855955Winzorized Mean (4/59) 0.013898305 0.022652578 0.61354186Winzorized Mean (5/59) 0.011355932 0.019754233 0.574860701Winzorized Mean (6/59) 0.009322034 0.018317933 0.508902069Winzorized Mean (7/59) 0.009322034 0.017776616 0.524398671Winzorized Mean (8/59) 0.012033898 0.016745356 0.718640948Winzorized Mean (9/59) 0.013559322 0.016428774 0.825339875Winzorized Mean (10/59) 0.011864407 0.016190166 0.732815646Winzorized Mean (11/59) 0.013728814 0.015817449 0.867953732Winzorized Mean (12/59) 0.013728814 0.015817449 0.867953732Winzorized Mean (13/59) 0.013728814 0.015106237 0.908817565Winzorized Mean (14/59) 0.016101695 0.014655535 1.098676739Winzorized Mean (15/59) 0.016101695 0.013850719 1.162516904Winzorized Mean (16/59) 0.021525424 0.01289304 1.669538311Winzorized Mean (17/59) 0.018644068 0.011602819 1.606856753Winzorized Mean (18/59) 0.02779661 0.00914545 3.039392145Winzorized Mean (19/59) 0.02779661 0.008180702 3.397826825Trimmed Mean (0/59) -9.79E-17 0.033597128 -2.91E-15Trimmed Mean (1/59) 0.01225394 0.023138045 0.529601354Trimmed Mean (2/59) 0.013217257 0.021970623 0.601587722Trimmed Mean (3/59) 0.014064599 0.020696746 0.679556042Trimmed Mean (4/59) 0.014390163 0.01929344 0.745857802Trimmed Mean (5/59) 0.014538222 0.01786579 0.81374639Trimmed Mean (6/59) 0.01533718 0.017261544 0.888517256Trimmed Mean (7/59) 0.016651601 0.016852966 0.988051672Trimmed Mean (8/59) 0.018088293 0.016440898 1.100201057Trimmed Mean (9/59) 0.019177346 0.016179669 1.185274336Trimmed Mean (10/59) 0.020121686 0.015889271 1.266369351Trimmed Mean (11/59) 0.021438388 0.015540998 1.379473069Trimmed Mean (12/59) 0.022619855 0.015139527 1.49409255Trimmed Mean (13/59) 0.02394453 0.01455433 1.645182607Trimmed Mean (14/59) 0.025440131 0.013931351 1.826106486Trimmed Mean (15/59) 0.026797195 0.013152617 2.037403993Trimmed Mean (16/59) 0.028355304 0.012271764 2.31061366Trimmed Mean (17/59) 0.029362712 0.011297197 2.599114728Trimmed Mean (18/59) 0.030980103 0.010308858 3.005192511Trimmed Mean (19/59) 0.031476998 0.009869902 3.18919048Median 0.025762712    

29

Page 30: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Midrange-

0.349237288    Midmean 0.021792588    Observations 59    

Bovenstaande tabel geeft verschillende centrumwaarden (kengetallen van de verdeling) weer! In feite kunnen we het best kijken naar de laatste kolom, aangezien we deze kunnen aanschouwen als een statistiek. De overige kolommen zijn uitgedrukt in eenheden, waardoor we moeilijk een uitspraak kunnen doen of het gemiddelde van de residu’s al dan niet significant verschillend is van nul. Indien we het ‘standaard gemiddelde’ nemen (MEAN), zien we duidelijk dat de absolute waarde van de t-statistiek kleiner is dan twee. We kunnen bijgevolg stellen dat het gemiddelde van de storingstermen niet significant verschillend is van nul. Dit is een goede zaak!

Naast het standaardgemiddelde worden er nog andere gemiddelden berekend, waaronder de ‘trimmed mean’. Deze berekent het gemiddelde van de storingstermen, mits een procentuele eliminatie van extreme waarden. We merken duidelijk op, dat de absolute waarde van de t-statistiek groter wordt, naarmate er meer (extreme) observaties uit de steekproef worden gelicht. Op een bepaald moment wordt de absolute waarde van de t-statistiek zelfs groter dan twee, wat impliceert dat het gemiddelde van de storingstermen significant verschillend is van nul. Dit is een slechte zaak! Indien we, voor het bekomen van betere schattingsresultaten, enkele extreme waarden wensen te elimineren, moeten we er voor blijven zorgen dat het gemiddelde van de storingstermen niet

significant verschillend wordt van nul (m.a.w. ). Bij deze tijdreeks

vormt dit geen probleem, aangezien we slechts één extreme waarden moeten elimineren. De absolute waarde van de t-statistiek blijft in dit geval beduidend kleiner dan 2.

Dezelfde bemerkingen kunnen we maken wat betreft de ‘winzorized mean’. Bij de berekening van dit gemiddelde wordt een percentage van de extreme waarden vervangen door meer normale waarden.

De software geeft bij deze berekeningen tevens twee grafieken, die we hier niet zullen meedelen, aangezien de gemiddelden in de grafieken zijn uitgedrukt in eenheden. We kunnen wel zeggen dat in beide grafieken de ‘gemiddelde-lijn’ zich binnen het betrouwbaarheidsinterval bevind.

1.2.4. Task 4

30

Page 31: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Compute various measures of variability, quartiles, and percentiles. How could we describe (compute) the 50% confidence interval (of a 1-step-ahead forecast) based on all three computations? What computation would you use to derive the 83% confidence interval?

In wat volgt zullen we enkele spreidingsmaten van de verdeling onderzoeken. Meer bepaald de variantie, de kwartielen en de percentielen.

Variabiliteit

Variability - Ungrouped DataVariability Measure Value

Absolute Range 1.95Relative Range (unbiased) 7.55625235Relative Range (biased) 7.621114074Variance (unbiased) 0.066597253Variance (biased) 0.065468486Standard Error (unbiased) 0.258064436Standard Error (biased) 0.255868103

Mean Absolute Deviation from Mean (MAD Mean) 0.168675668

In bovenstaande tabel kunnen we de range aflezen. Deze is hier gelijk aan 1.95. De range is niets meer dan het verschil tussen de grootste en de kleinste meetuitslag, en wordt veelal gebruikt indien het aantal meetuitslagen kleiner is dan 15. We kunnen wel besluiten dat de range zeer klein, hetgeen zeer goed is.

De variantie (standaarddeviatie²) geeft de relatieve spreiding van de meetuitslagen ten opzichte van het gemiddelde van de residu’s weer (in dit geval gelijk nul).

De standaardfout is de maximale afwijking tussen de voorspelde waarde (1-step-ahead forecast) en de werkelijkheid. In dit voorbeeld gelijk aan 25%, hetgeen vrij hoog is.

Kwartielen

Quartiles - Ungrouped DataMethod Quartile 1 Quartile 2 Quartile 3

Weighted Average at Xnp -0.136737288 0.025762712 0.138262712Weighted Average at X(n+1)p -0.134237288 0.025762712 0.145762712Empirical Distribution Function -0.134237288 0.025762712 0.145762712

31

Page 32: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Empirical Distribution Function - Averaging -0.134237288 0.025762712 0.145762712

Empirical Distribution Function - Interpolation -0.129237288 0.025762712 0.140762712Closest Observation -0.134237288 0.025762712 0.135762712True Basic - Statistics Graphics Toolkit -0.134237288 0.025762712 0.145762712MS Excel (old versions) -0.134237288 0.025762712 0.145762712

Observations 59

In bovenstaande grafiek merken we op dat het tweede kwartiel vrij klein is in verhouding tot kwartiel 1 en 3. We kunnen zelfs stellen dat het eerste en het tweede kwartiel in absolute waarde min of meer overeenkomen. Dit is uiteraard niet meer dan normaal, gezien de symmetrie van de verdeling.

Bij het opstellen van een 50% betrouwbaarheidsinterval moeten we bijgevolg als ondergrens het 2ste kwartiel nemen, en als bovengrens het 3de

kwartiel!

Percentielen

Percentiles - Ungrouped Data

% Weighted Average at Xnp Weighted Average at X(n+1)p0.01 -0.7813 -0.79450.02 -1.155 -1.13620.03 -0.6004 -0.57220.04 -0.377 -0.37620.05 -0.3652 -0.36420.06 -0.348 -0.34620.07 -0.3303 -0.32820.08 -0.3126 -0.31020.09 -0.2825 -0.2762

0.1 -0.2412 -0.23420.11 -0.2244 -0.22220.12 -0.2134 -0.21220.13 -0.2075 -0.20620.14 -0.1964 -0.19220.15 -0.1787 -0.17420.16 -0.1698 -0.16820.17 -0.1642 -0.16420.18 -0.1642 -0.16420.19 -0.1621 -0.1602

0.2 -0.1562 -0.15420.21 -0.1542 -0.15420.22 -0.1542 -0.1522

32

Page 33: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

0.23 -0.1485 -0.14620.24 -0.1426 -0.14020.25 -0.1367 -0.13420.26 -0.1308 -0.12820.27 -0.1249 -0.12020.28 -0.1138 -0.10820.29 -0.1031 -0.1002

0.3 -0.0972 -0.09420.31 -0.0826 -0.07020.32 -0.059 -0.05220.33 -0.0495 -0.04620.34 -0.0436 -0.04020.35 -0.0377 -0.03420.36 -0.0318 -0.02820.37 -0.0259 -0.02420.38 -0.0242 -0.02420.39 -0.0241 -0.0202

0.4 -0.0182 -0.01420.41 -0.0123 -0.00820.42 -0.0064 -0.00220.43 -0.0005 0.00380.44 0.0054 0.00580.45 0.0058 0.00580.46 0.0072 0.01180.47 0.0131 0.01780.48 0.019 0.02380.49 0.0249 0.0258

0.5 0.0258 0.02580.51 0.0285 0.04380.52 0.0462 0.05580.53 0.0558 0.05580.54 0.0558 0.05580.55 0.0558 0.05580.56 0.0562 0.06180.57 0.0621 0.06580.58 0.0658 0.06580.59 0.0658 0.0658

0.6 0.0658 0.06580.61 0.0658 0.07180.62 0.0716 0.07980.63 0.0792 0.09180.64 0.091 0.09580.65 0.0958 0.09580.66 0.0958 0.09580.67 0.0958 0.09780.68 0.097 0.1038

33

Page 34: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

0.69 0.1029 0.10980.7 0.1088 0.1158

0.71 0.1147 0.12780.72 0.1254 0.13580.73 0.1358 0.13580.74 0.1358 0.13980.75 0.1383 0.14580.76 0.1442 0.14580.77 0.1458 0.14780.78 0.146 0.15380.79 0.1519 0.1558

0.8 0.1558 0.15580.81 0.1558 0.15580.82 0.1558 0.15780.83 0.1558 0.16380.84 0.1614 0.16580.85 0.1658 0.16580.86 0.1658 0.17180.87 0.1691 0.17780.88 0.175 0.18380.89 0.1809 0.2018

0.9 0.1898 0.22580.91 0.2134 0.28580.92 0.2538 0.32980.93 0.3128 0.34180.94 0.335 0.34580.95 0.3458 0.34580.96 0.3458 0.35180.97 0.3481 0.40980.98 0.354 0.57180.99 0.4665 0.3755

Gezien de normaalverdeling van de residu’s zouden het eerste en het negenennegentigste percentiel, het tweede en het achtennegentigste percentiel,… in absolute waarde sterk moeten overeenkomen.

Het middelste percentiel (dus het vijftigste) zou min of meer gelijk moeten zijn aan nul! Dit blijkt te kloppen.

Bij het opstellen van een 83% betrouwbaarheidsinterval moeten we gebruik maken van de percentielen. Aangezien we slechts 83% nodig hebben en geen 100%, moeten we 17% (100%-83%) van iedere staart halen. Bijgevolg zal het betrouwbaarheidsgeval liggen tussen het 9de en het 91ste percentiel of tussen het 10de en het 92ste percentiel.

34

Page 35: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

1.2.5. Task 5

Are the residuals of the time series white noise?

We hebben gezien dat de storingstermen normaal verdeeld zijn, er geen sprake meer is van autocorrelatie (ACF) en het gemiddelde van de residu’s niet significant verschillend is van nul (mits eliminatie van één extreme waarde). We kunnen bijgevolg besluiten dat de storingstermen ‘white noise’ zijn. Herschatting is bijgevolg niet meer nodig.

1.2.6. Task 6

Create scatterplots between the (white noise) residuals of your selected time series (with various timelags). Is there ANY relationship between the series? Do your findings correspond to your initial hypotheses? Did you now solve the spurious (nonsense) correlation problem?*

Hiervoor verwijs ik naar 1.1.6. Onze hypotheses gingen steeds uit van reeks 1 als afhankelijke variabele. We verwachten bijvoorbeeld geen verband tussen de rente-evolutie op langlopende kredieten en de prijsevolutie van nieuwe-wagens,…

35

Page 36: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

1.3. Reeks 3 : prijsevolutie vervoersverzekeringen

We zullen de verschillende stappen doorlopen met betrekking tot de derde reeks. Deze reeks weerspiegelt de prijsevolutie van de vervoersverzekeringen doorheen de geobserveerde periode (1996 = 100). Met vervoersverzekeringen veronderstellen wij een autoverzekering B.A. +. De geobserveerde periode gaat van januari 1998 tot december 2002. Het gaat hier met andere woorden over maandcijfers, met in totaal 60 metingen.

Uit de vorige opdrachten is gebleken dat de reeks getransformeerd moest worden, zodoende stationariteit te bewerkstelligen. Volgende transformaties waren vereist:

d : 1D : 0λ : 1

We moeten wel vermelden, dat er een relatie bestond tussen de standaarddeviatie en het gemiddelde van de tijdreeks. De voorgestelde lambdawaarde was gelijk aan -49. Daar de voorgestelde lambdawaarde zich buiten het interval [-2, +2] bevind, mogen we met een aan zekerheid grenzende waarschijnlijkheid aannemen dat lambda niet verschillend is van 1. Vandaar dat we, in wat volgt zullen verdergaan met lambda gelijk aan 1.

In deze tijdreeks konden we geen ARIMA-proces destilleren. Uit de backforecasting-procedure konden we geen gebrekkigheden determineren, waardoor een nieuwe schatting niet vereist was. Aangezien er geen ARMA-proces aanwezig was, diende er voor deze tijdreeks geen forecasting te gebeuren.

In deze opdracht zullen we nagaan of de storingstermen van de reeks (na backforecasting) zich op een correcte wijze gedragen. Met andere woorden: de storingstermen moeten ‘white noise’ zijn.

36

Page 37: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

1.3.1. Task 1

Compute the ACF, PACF, and Spectrum of the estimated residuals. Is there any indication of a 'forgotten' process? Re-identify the ARIMA model (if necessary) and re-estimate the parameters (and forecast). Important: do not apply any new model estimations/forecasts to the residuals (use the original data instead).

ACF en PACF

ACF PACF

Uit bovenstaande tabel kunnen we besluiten dat de autocorrelatiefunctie en de partiële autocorrelatiefunctie min of meer op elkaar gelijken. Uit de grafieken kunnen we daarenboven geen ARMA-proces meer destilleren, daar noch het eerste niet-seizoenale (lag 1), noch het eerste seizoenale (lag 12) staafje in de autocorrelatiefunctie en de partiële autocorrelatiefunctie zich buiten het betrouwbaarheidsinterval bevind.

37

Page 38: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Spectrum

3

In het ideale geval situeert de witte lijn zich tussen de gele lijnen, ofte binnen de Kolmogorov-Smirnov grenzen! De storingstermen van deze tijdreeks voldoen aan deze voorwaarde. Aan de hand van het spectrum kunnen we noch een beduidende lange termijn-, noch een beduidende korte termijnstrend determineren. Indien dit wel het geval zou zijn, zou de witte lijn zich respectievelijk significant links, of rechts van de Kolmogorov-Smirnov grenzen moeten bevinden.

1.3.2. Task 2

Examine the histogram, rootogram, entropy concentration, and skewness/kurtosis diagnostics of the residuals. Are the residuals normally distributed? What do you think would happen if they are not normally distributed? Does this influence your analysis?

In het ideale geval zijn de storingstermen normaal verdeeld. Is dit niet het geval, dan zijn de schattingsresultaten vertekend, inconsistent en inefficiënt. Dit kan dan uiteraard leiden tot minder adequate prognoses. Indien de storingstermen normaal verdeeld zijn, dan is de kans op ‘kleine’ storingen groter

38

Page 39: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

dan de kans op ‘grote’ storingen. Dit is natuurlijk onze intentie. Hoe kleiner de storingen, hoe dichter de voorspelde waarden immers zullen aanleunen bij de werkelijkheid. Algemeen wordt gesteld dat, indien de storingstermen normaal verdeeld zijn en de steekproef voldoende groot is, we spreken van asymptotisch niet-vertekende, consistente parameters.

Indien zou blijken dat de storingstermen inderdaad niet normaal verdeeld zijn, dan is een mogelijke oplossing het opnemen van meerdere observaties in je steekproef. Algemeen wordt immers het volgende gesteld: hoe groter de steekproef, hoe groter de kans dat de storingstermen normaal verdeel zullen zijn.

Histogram

Bovenstaande grafiek toont het verloop van de storingstermen aan, aan de hand van een histogram. Zoals reeds eerder besproken, moeten de storingstermen normaal verdeeld zijn, zodoende adequate prognoses te kunnen maken. Uit bovenstaande grafiek kunnen we zeker geen normaalverdeling destilleren. Aangezien we op deze (visuele) wijze moeilijk een uitspraak kunnen doen omtrent de al dan niet aanwezigheid van een normaalverdeling, zullen we ons moeten beroepen op het rootogram. Dit is een statistisch hulpmiddel, dat nagaat of de storingstermen al dan niet normaal verdeeld zijn. Zij gaat met andere woorden de werkelijke klassenfrequenties van bovenstaand histogram

39

Page 40: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

vergelijken met de theoretische klassenfrequenties van een normaalverdeling, en vervolgens een uitspraak maken, op basis van statistische inferenties.

Rootogram

Suspended rootogram of 9910133_CPIV.ds.res by bind = 0 D = 0 L = 1Chi-square test at 5%:THIS SERIES IS NORMALLY DISTRIBUTED

Bovenstaande tabel weerspiegelt het rootogram van betreffende tijdreeks. De ondergrens is gelijk aan -2, de bovengrens gelijk aan 2. Dit komt met andere woorden neer op het definitiegebied van de theoretische standaard normaalverdeling [-2, 2] met = 0,05, µ = 0 en = 1. De klassencoëfficiënten mogen zich niet significant buiten dit betrouwbaarheidsinterval begeven, indien we er impliciet van uit gaan dat onze tijdreeks normaal verdeeld is. In bovenstaand voorbeeld, zien we duidelijk dat het betrouwbaarheidsinterval nooit overschreden wordt. Aan de hand van de grafiek kunnen we bijgevolg besluiten dat de reeks normaal verdeeld is. Dit wordt tevens statistisch gestaafd aan de hand van de -statistiek. Deze duidt aan, dat er sprake is van een normaalverdeling.

40

Page 41: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Entropy concentration

Bovenstaande grafiek, is een alternatieve wijze om na te gaan of onze storingstermen al dan niet normaal verdeeld zijn. De witte lijn stelt de entropy voor. We kunnen een normaalverdeling destilleren, indien we zeer goed kijken. De software geeft tevens een parameterwaarde weer voor de entropy, maar aangezien het ons niet duidelijk is, hoe deze moet worden geïnterpreteerd, gaan we hier niet dieper op in. We kunnen wel determineren dat deze wijze, voor het bepalen of de storingstermen al dan niet normaal verdeeld is, minder nauwkeurig is dan het rootogram.

Skewness/Kurtosis

De Skewness meet de ‘scheefheidsgraad’ van een verdeling. Een negatieve skewness impliceert een linkscheve verdeling, een positieve skewness impliceert een rechtsscheve verdeling. Indien de skewness gelijk is aan nul, kunnen we spreken van een symmetrische verdeling. Hetgeen uiteraard het geval is bij een normaalverdeling. Vandaar dat we moeten testen of de skewness van de verdeling van onze storingstermen niet significant verschillend is van nul. Is dit niet het geval, dan zijn de storingstermen niet normaal verdeeld!

De Kurtosis is een maatstaf die de dikte van de staarten van de verdeling van de storingstermen in kaart brengt. Een positieve kurtosis wijst op een spitse

41

Page 42: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

top, een negatie kurtosis op een vlakke distributie. Bij een normaalverdeling is de kurtosis gelijk aan nul, aangezien we de grootste frequenties in het centrum aantreffen, de kleinste aan de staarten. We zullen bijgevolg moeten testen of de kurtosis van de verdeling van onze storingstermen niet significant verschillend is van nul. Is dit niet het geval, dan zijn de storingstermen immers niet normaal verdeeld!

Skewness Measure Value Kurtosis Measure ValueFISHER Test 1 Probability 0 FISHER Test 2 Probability 0

Skewness and Kurtosis - Ungrouped Data

Skewness Measure (small sample) Value ProbabilityKurtosis Measure (small

sample) ValueProbabilit

yTrimmed Skewness (0/59) -5.0208 0 Trimmed Kurtosis (0/59) 35.848 0

Trimmed Skewness (13/59) 0 0.992 Trimmed Kurtosis (13/59) -3.303 0Trimmed Skewness (14/59) 1.0516 0.012 Trimmed Kurtosis (14/59) -2.143 0.0088

Trimmed Skewness (15/59) 0 0.992 Trimmed Kurtosis (15/59) -3.35 0Trimmed Skewness (16/59) 0 0.992 Trimmed Kurtosis (16/59) -3.38 0.0002

Trimmed Skewness (17/59) 0 0.992 Trimmed Kurtosis (17/59) -3.415 0.0002Trimmed Skewness (18/59) 0 0.992 Trimmed Kurtosis (18/59) -3.457 0.0002

Trimmed Skewness (19/59) 0 0.992 Trimmed Kurtosis (19/59) -3.509 0.0002

Trimmed Skewness and Kurtosis (small sample) - Ungrouped Data

Skewness Kurtosis

De Fisher Test 1 Probability gaat na of de skewness van de verdeling van de storingstermen niet significant verschillend is van nul. Is dit het geval dan zou de P-value groter moeten zijn dan 5% ( -fout = 0,05). De P-value is in huidig voorbeeld gelijk aan 0%. We kunnen bijgevolg stellen dat, wat betreft de scheefheidsgraad, de storingstermen niet normaal verdeeld zijn!

De oorzaak hiervan is te wijten aan outliers. Op de Skewness-grafiek, alsook op de Skewness en Kurtosis tabel (2) kunnen we immers vaststellen dat door eliminatie van dertien extreme waarde de nullijn zich rond nul gedraagt. De

42

Page 43: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

respectievelijke P-value is dan gelijk aan 99% en de storingstermen zijn derhalve, wat betreft de scheefheidsgraad, normaal verdeeld. In de skewness-grafiek kunnen we tevens determineren dat de nullijn zich steeds tussen het betrouwbaarheidsinterval bevind.

De Fisher Test 2 Probability gaat na of de kurtosis van de verdeling van de storingstermen niet significant verschillend is van nul. Is dit het geval dan zou de P-value groter moeten zijn dan 5% ( = 0,05). De P-value is in huidig voorbeeld gelijk aan 0%. We kunnen bijgevolg stellen dat, wat betreft de kurtosis, de storingstermen niet normaal verdeeld zijn!

We kunnen tevens determineren, dat zelfs ondanks eliminatie van extreme waarden, de kurtosis steeds significant verschillend zal zijn van nul. Hetgeen impliceert dat wat betreft de kurtosis de storingstermen niet normaal verdeeld zijn.

Besluit

Uit het rootogram is gebleken dat de storingstermen normaal verdeeld zijn. Zelfs wat de skewness betreft, zijn de storingstermen normaal verdeeld (mits eliminatie van extreme waarden). De kurtosis is steeds verschillend van nul, en derhalve zijn de storingstermen op dit vlak niet normaal verdeeld. Toch kunnen we besluiten dat de storingstermen normaal verdeeld zijn, ons baserend op het rootogram en de skewness.

43

Page 44: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

1.3.3. Task 3

Compute various measures of central tendency for the residuals. Is the mean significantly different from zero?  How robust is this hypothesis?

Het gemiddelde van de storingstermen mag niet significant verschillend zijn van nul. Is dit echter wel het geval, dat zijn de storingstermen sterk vertekend. Vandaar dat de gemaakte voorspellingen al dan niet met een korreltje zout zullen moeten worden genomen.

Central Tendency - Ungrouped DataMeasure Value S.E. Value/S.E.

Arithmetic Mean -7.72E-16 0.075779949 -1.02E-14Standard Error 0.582076836       Geometric Mean NAN    Harmonic Mean 0.042153528    Quadratic Mean 0.5771229    Winzorized Mean (0/59) -7.56E-16 0.075779949 -9.98E-15Winzorized Mean (1/59) 0.03559322 0.038910537 0.91474504Winzorized Mean (2/59) 0.049491525 0.024483875 2.021392688Winzorized Mean (3/59) 0.053050847 0.02031703 2.611151722Winzorized Mean (4/59) 0.063220339 0.014891558 4.245380991Winzorized Mean (5/59) 0.068305085 0.0135606 5.037025087Winzorized Mean (6/59) 0.033728814 0.005762712 5.852941176Winzorized Mean (7/59) 0.033728814 6.38E-18 5.29E+15Winzorized Mean (8/59) 0.033728814 6.38E-18 5.29E+15Winzorized Mean (9/59) 0.033728814 6.38E-18 5.29E+15Winzorized Mean (10/59) 0.033728814 6.38E-18 5.29E+15Winzorized Mean (11/59) 0.033728814 6.38E-18 5.29E+15Winzorized Mean (12/59) 0.033728814 6.38E-18 5.29E+15Winzorized Mean (13/59) 0.033728814 6.38E-18 5.29E+15Winzorized Mean (14/59) 0.033728814 6.38E-18 5.29E+15Winzorized Mean (15/59) 0.033728814 6.38E-18 5.29E+15Winzorized Mean (16/59) 0.033728814 6.38E-18 5.29E+15Winzorized Mean (17/59) 0.033728814 6.38E-18 5.29E+15Winzorized Mean (18/59) 0.033728814 6.38E-18 5.29E+15Winzorized Mean (19/59) 0.033728814 6.38E-18 5.29E+15Trimmed Mean (0/59) -7.56E-16 0.075779949 -9.98E-15Trimmed Mean (1/59) 0.041798989 0.026177099 1.596776975Trimmed Mean (2/59) 0.048456086 0.018420554 2.630544481Trimmed Mean (3/59) 0.047879757 0.013567105 3.529106513

44

Page 45: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Trimmed Mean (4/59) 0.045885676 0.009609284 4.775140186Trimmed Mean (5/59) 0.040667589 0.006938776 5.860917248Trimmed Mean (6/59) 0.033728814 5.12E-18 6.59E+15Trimmed Mean (7/59) 0.033728814 5.23E-18 6.45E+15Trimmed Mean (8/59) 0.033728814 4.28E-18 7.88E+15Trimmed Mean (9/59) 0.033728814 4.39E-18 7.69E+15Trimmed Mean (10/59) 0.033728814 3.38E-18 9.99E+15Trimmed Mean (11/59) 0.033728814 2.31E-18 1.46E+16Trimmed Mean (12/59) 0.033728814 1.19E-18 2.83E+16Trimmed Mean (13/59) 0.033728814 0  Trimmed Mean (14/59) 0.033728814 1.27E-18 2.66E+16Trimmed Mean (15/59) 0.033728814 0  Trimmed Mean (16/59) 0.033728814 0  Trimmed Mean (17/59) 0.033728814 0  Trimmed Mean (18/59) 0.033728814 0  Trimmed Mean (19/59) 0.033728814 0  Median 0.033728814    

Midrange-

1.191271186    Midmean 0.034300488    Observations 59    

Bovenstaande tabel geeft verschillende centrumwaarden (kengetallen van de verdeling) weer! In feite kunnen we het best kijken naar de laatste kolom, aangezien we deze kunnen aanschouwen als een statistiek. De overige kolommen zijn uitgedrukt in eenheden, waardoor we moeilijk een uitspraak kunnen doen of het gemiddelde van de residu’s al dan niet significant verschillend is van nul. Indien we het ‘standaard gemiddelde’ nemen (MEAN), zien we duidelijk dat de absolute waarde van de t-statistiek kleiner is dan twee. We kunnen bijgevolg stellen dat het gemiddelde van de storingstermen niet significant verschillend is van nul. Dit is een goede zaak!

Naast het standaardgemiddelde worden er nog andere gemiddelden berekend, waaronder de ‘trimmed mean’. Deze berekent het gemiddelde van de storingstermen, mits een procentuele eliminatie van extreme waarden. We merken duidelijk op, dat de absolute waarde van de t-statistiek groter wordt, naarmate er meer (extreme) observaties uit de steekproef worden gelicht. Op een bepaald moment wordt de absolute waarde van de t-statistiek zelfs groter dan twee, wat impliceert dat het gemiddelde van de storingstermen significant verschillend is van nul. Dit is een slechte zaak! Indien we, voor het bekomen van betere schattingsresultaten, enkele extreme waarden wensen te elimineren, moeten we er voor blijven zorgen dat het gemiddelde van de storingstermen niet

significant verschillend wordt van nul (m.a.w. ). Nu zullen we een

45

Page 46: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

keuze moeten maken: of we elimineren 13 extreme waarden, waardoor de skewness niet significant verschillend wordt van nul, of we opteren ervoor dat het gemiddelde van de storingstermen niet significant verschillend is van nul! We zullen opteren voor het laatste, aangezien deze voorwaarde immers belangrijker is dan de eerste. Het is echter niet omdat de skewness niet significant verschillend is van nul, de storingstermen niet normaal verdeeld kunnen zijn!

Dezelfde bemerkingen kunnen we maken wat betreft de ‘winzorized mean’. Bij de berekening van dit gemiddelde wordt een percentage van de extreme waarden vervangen door meer normale waarden.

De software geeft bij deze berekeningen tevens twee grafieken, die we hier niet zullen meedelen, aangezien de gemiddelden in de grafieken zijn uitgedrukt in eenheden. We kunnen wel zeggen dat in beide grafieken de ‘gemiddelde-lijn’ zich binnen het betrouwbaarheidsinterval bevind.

1.3.4. Task 4

Compute various measures of variability, quartiles, and percentiles. How could we describe (compute) the 50% confidence interval (of a 1-step-ahead forecast) based on all three computations? What computation would you use to derive the 83% confidence interval?

In wat volgt zullen we enkele spreidingsmaten van de verdeling onderzoeken. Meer bepaald de variantie, de kwartielen en de percentielen.

Variabiliteit

Variability - Ungrouped DataVariability Measure ValueAbsolute Range 5.39Relative Range (unbiased) 9.259945889Relative Range (biased) 9.339431861Variance (unbiased) 0.338813442Variance (biased) 0.333070842Standard Error (unbiased) 0.582076836Standard Error (biased) 0.5771229

Mean Absolute Deviation from Mean (MAD Mean) 0.186825625

46

Page 47: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

In bovenstaande tabel kunnen we de range aflezen. Deze is hier gelijk aan 5,39. De range is niets meer dan het verschil tussen de grootste en de kleinste meetuitslag, en wordt veelal gebruikt indien het aantal meetuitslagen kleiner is dan 15. We kunnen wel besluiten dat de range zeer klein, hetgeen zeer goed is.

De variantie (standaarddeviatie²) geeft de relatieve spreiding van de meetuitslagen ten opzichte van het gemiddelde van de residu’s weer (in dit geval gelijk nul).

De standaardfout is de maximale afwijking tussen de voorspelde waarde (1-step-ahead forecast) en de werkelijkheid. In dit voorbeeld gelijk aan 57%, hetgeen vrij hoog is.

Kwartielen

Quartiles - Ungrouped DataMethod Quartile 1 Quartile 2 Quartile 3Weighted Average at Xnp 0.033728814 0.033728814 0.033728814Weighted Average at X(n+1)p 0.033728814 0.033728814 0.033728814Empirical Distribution Function 0.033728814 0.033728814 0.033728814

Empirical Distribution Function - Averaging 0.033728814 0.033728814 0.033728814

Empirical Distribution Function - Interpolation 0.033728814 0.033728814 0.033728814Closest Observation 0.033728814 0.033728814 0.033728814True Basic - Statistics Graphics Toolkit 0.033728814 0.033728814 0.033728814MS Excel (old versions) 0.033728814 0.033728814 0.033728814

Observations 59

In bovenstaande grafiek merken we op dat de drie kwartielen vrij klein zijn, en zich situeren rond nul. We kunnen zelfs stellen dat het eerste en het tweede kwartiel in absolute waarde identiek hetzelfde zijn. Dit is uiteraard niet meer dan normaal, gezien de symmetrie van de verdeling. Zelfs kwartiel 2 is identiek aan kwartiel 1 en 3. Dit is het gevolg van de kleine variantie.

Bij het opstellen van een 50% betrouwbaarheidsinterval moeten we bijgevolg als ondergrens het 2ste kwartiel nemen, en als bovengrens het 3de

kwartiel!

Percentielen

Percentiles - Ungrouped Data

47

Page 48: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

% Weighted Average at Xnp Weighted Average at X(n+1)p0.01 -2.2929 -2.33180.02 -3.3463 -3.28630.03 -1.5763 -1.48630.04 -0.7243 -0.70630.05 -0.4588 -0.43630.06 -0.3445 -0.33430.07 -0.2364 -0.22030.08 -0.1007 -0.08230.09 -0.0146 -0.0083

0.1 0.0267 0.03370.11 0.0337 0.03370.12 0.0337 0.03370.13 0.0337 0.03370.14 0.0337 0.03370.15 0.0337 0.03370.16 0.0337 0.03370.17 0.0337 0.03370.18 0.0337 0.03370.19 0.0337 0.0337

0.2 0.0337 0.03370.21 0.0337 0.03370.22 0.0337 0.03370.23 0.0337 0.03370.24 0.0337 0.03370.25 0.0337 0.03370.26 0.0337 0.03370.27 0.0337 0.03370.28 0.0337 0.03370.29 0.0337 0.0337

0.3 0.0337 0.03370.31 0.0337 0.03370.32 0.0337 0.03370.33 0.0337 0.03370.34 0.0337 0.03370.35 0.0337 0.03370.36 0.0337 0.03370.37 0.0337 0.03370.38 0.0337 0.03370.39 0.0337 0.0337

0.4 0.0337 0.03370.41 0.0337 0.03370.42 0.0337 0.03370.43 0.0337 0.03370.44 0.0337 0.0337

48

Page 49: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

0.45 0.0337 0.03370.46 0.0337 0.03370.47 0.0337 0.03370.48 0.0337 0.03370.49 0.0337 0.0337

0.5 0.0337 0.03370.51 0.0337 0.03370.52 0.0337 0.03370.53 0.0337 0.03370.54 0.0337 0.03370.55 0.0337 0.03370.56 0.0337 0.03370.57 0.0337 0.03370.58 0.0337 0.03370.59 0.0337 0.0337

0.6 0.0337 0.03370.61 0.0337 0.03370.62 0.0337 0.03370.63 0.0337 0.03370.64 0.0337 0.03370.65 0.0337 0.03370.66 0.0337 0.03370.67 0.0337 0.03370.68 0.0337 0.03370.69 0.0337 0.0337

0.7 0.0337 0.03370.71 0.0337 0.03370.72 0.0337 0.03370.73 0.0337 0.03370.74 0.0337 0.03370.75 0.0337 0.03370.76 0.0337 0.03370.77 0.0337 0.03370.78 0.0337 0.03370.79 0.0337 0.0337

0.8 0.0337 0.03370.81 0.0337 0.03370.82 0.0337 0.03370.83 0.0337 0.03370.84 0.0337 0.03370.85 0.0337 0.03370.86 0.0337 0.03370.87 0.0337 0.03370.88 0.0337 0.03370.89 0.0337 0.1697

0.9 0.0677 0.3737

49

Page 50: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

0.91 0.2683 0.37970.92 0.3765 0.39970.93 0.3824 0.44770.94 0.4205 0.50370.95 0.4687 0.56370.96 0.5277 0.58770.97 0.5729 0.78370.98 0.5965 1.32370.99 0.9727 0.9022

Gezien de normaalverdeling van de residu’s zouden het eerste en het negenennegentigste percentiel, het tweede en het achtennegentigste percentiel,… in absolute waarde sterk moeten overeenkomen.

Het middelste percentiel (dus het vijftigste) zou min of meer gelijk moeten zijn aan nul! Dit blijkt te kloppen. Het is zelfs zo dat meer dan 80% van de percentielen gelijk zijn aan 0,0337. Dit is het gevolg van de kleine variantie. Dit wil ook zeggen dat meer dan 80% van de meetuitslagen zich in het centrum bevinden. Dit konden we ook determineren uit het histogram. Daar zagen we hoofdzakelijk één hoge frequentie, en enkele zeer kleine.

Bij het opstellen van een 83% betrouwbaarheidsinterval moeten we gebruik maken van de percentielen. Aangezien we slechts 83% nodig hebben en geen 100%, moeten we 17% (100%-83%) van iedere staart halen. Bijgevolg zal het betrouwbaarheidsgeval liggen tussen het 9de en het 91ste percentiel of tussen het 10de en het 92ste percentiel.

50

Page 51: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

1.3.5. Task 5

Are the residuals of the time series white noise?

We hebben gezien dat de storingstermen normaal verdeeld zijn (ons baserend op het rootogram, en zonder eliminatie van extreme waarden), er geen sprake meer is van autocorrelatie (ACF) en het gemiddelde van de residu’s niet significant verschillend is van nul (mits eliminatie van één extreme waarde). We kunnen bijgevolg besluiten dat de storingstermen ‘white noise’ zijn. Herschatting is bijgevolg niet meer nodig.

1.3.6. Task 6

Create scatterplots between the (white noise) residuals of your selected time series (with various timelags). Is there ANY relationship between the series? Do your findings correspond to your initial hypotheses? Did you now solve the spurious (nonsense) correlation problem?*

Hiervoor verwijs ik naar 1.1.6. Onze hypotheses gingen steeds uit van reeks 1 als afhankelijke variabele. We verwachten bijvoorbeeld geen verband tussen de rente-evolutie op langlopende kredieten en de prijsevolutie van nieuwe-wagens,…

51

Page 52: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

1.4. Reeks 4 : rente-evolutie langlopend krediet

We zullen de verschillende stappen doorlopen met betrekking tot de vierde reeks. Deze reeks weerspiegelt de rentevoet, waartegen men belast zou worden, indien men in de betrokken maand een lening zou afsluiten. De geobserveerde periode gaat van januari 1998 tot december 2002. Het gaat hier met andere woorden over maandcijfers, met in totaal 60 metingen.

Uit de vorige opdrachten is gebleken dat de reeks getransformeerd moest worden, zodoende stationariteit te bewerkstelligen. Volgende transformaties waren vereist:

d : 1D : 0λ : 1

In deze tijdreeks konden we geen ARIMA-proces destilleren. Uit de backforecasting-procedure konden we geen gebrekkigheden determineren, waardoor een nieuwe schatting niet vereist was. Aangezien er geen ARMA-proces aanwezig was, diende er voor deze tijdreeks geen forecasting te gebeuren.

In deze opdracht zullen we nagaan of de storingstermen van de reeks (na backforecasting) zich op een correcte wijze gedragen. Met andere woorden: de storingstermen moeten ‘white noise’ zijn.

52

Page 53: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

1.4.1. Task 1

Compute the ACF, PACF, and Spectrum of the estimated residuals. Is there any indication of a 'forgotten' process? Re-identify the ARIMA model (if necessary) and re-estimate the parameters (and forecast). Important: do not apply any new model estimations/forecasts to the residuals (use the original data instead).

ACF en PACF

ACF PACF

Uit bovenstaande tabel kunnen we besluiten dat de autocorrelatiefunctie en de partiële autocorrelatiefunctie min of meer op elkaar gelijken. Uit de grafieken kunnen we daarenboven geen ARMA-proces meer destilleren, daar noch het eerste niet-seizoenale (lag 1), noch het eerste seizoenale (lag 12) staafje in de autocorrelatiefunctie en de partiële autocorrelatiefunctie zich buiten het betrouwbaarheidsinterval bevind. Geen enkel staafje bevind zich overigens buiten het betrouwbaarheidsinterval.

53

Page 54: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Spectrum

3

In het ideale geval situeert de witte lijn zich tussen de gele lijnen, ofte binnen de Kolmogorov-Smirnov grenzen! De storingstermen van deze tijdreeks voldoen aan deze voorwaarde. Aan de hand van het spectrum kunnen we noch een beduidende lange termijn-, noch een beduidende korte termijnstrend determineren. Indien dit wel het geval zou zijn, zou de witte lijn zich respectievelijk significant links, of rechts van de Kolmogorov-Smirnov grenzen moeten bevinden.

1.4.2. Task 2

Examine the histogram, rootogram, entropy concentration, and skewness/kurtosis diagnostics of the residuals. Are the residuals normally distributed? What do you think would happen if they are not normally distributed? Does this influence your analysis?

In het ideale geval zijn de storingstermen normaal verdeeld. Is dit niet het geval, dan zijn de schattingsresultaten vertekend, inconsistent en inefficiënt. Dit kan dan uiteraard leiden tot minder adequate prognoses. Indien de storingstermen normaal verdeeld zijn, dan is de kans op ‘kleine’ storingen groter

54

Page 55: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

dan de kans op ‘grote’ storingen. Dit is natuurlijk onze intentie. Hoe kleiner de storingen, hoe dichter de voorspelde waarden immers zullen aanleunen bij de werkelijkheid. Algemeen wordt gesteld dat, indien de storingstermen normaal verdeeld zijn en de steekproef voldoende groot is, we spreken van asymptotisch niet-vertekende, consistente parameters.

Indien zou blijken dat de storingstermen inderdaad niet normaal verdeeld zijn, dan is een mogelijke oplossing het opnemen van meerdere observaties in je steekproef. Algemeen wordt immers het volgende gesteld: hoe groter de steekproef, hoe groter de kans dat de storingstermen normaal verdeel zullen zijn.

Histogram

Bovenstaande grafiek toont het verloop van de storingstermen aan, aan de hand van een histogram. Zoals reeds eerder besproken, moeten de storingstermen normaal verdeeld zijn, zodoende adequate prognoses te kunnen maken. Uit bovenstaande grafiek kunnen we moeilijk een normaalverdeling destilleren. We kunnen echter wel determineren dat de frequentie in het centrum groter is dan aan de staarten! Dit is typisch voor een normaalverdeling. Aangezien we op deze (visuele) wijze moeilijk een uitspraak kunnen doen omtrent de al dan niet aanwezigheid van een normaalverdeling, zullen we ons moeten beroepen op het rootogram. Dit is een statistisch hulpmiddel, dat nagaat of de

55

Page 56: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

storingstermen al dan niet normaal verdeeld zijn. Zij gaat met andere woorden de werkelijke klassenfrequenties van bovenstaand histogram vergelijken met de theoretische klassenfrequenties van een normaalverdeling, en vervolgens een uitspraak maken, op basis van statistische inferenties.

Rootogram

Suspended rootogram of 9910133_RENT.ds.res by bind = 0 D = 0 L = 1Chi-square test at 5%:THIS SERIES IS NORMALLY DISTRIBUTED

Bovenstaande tabel weerspiegelt het rootogram van betreffende tijdreeks. De ondergrens is gelijk aan -2, de bovengrens gelijk aan 2. Dit komt met andere woorden neer op het definitiegebied van de theoretische standaard normaalverdeling [-2, 2] met = 0,05, µ = 0 en = 1. De klassencoëfficiënten mogen zich niet significant buiten dit betrouwbaarheidsinterval begeven, indien we er impliciet van uit gaan dat onze tijdreeks normaal verdeeld is. In bovenstaand voorbeeld, zien we duidelijk dat het betrouwbaarheidsinterval nooit overschreden wordt. Aan de hand van de grafiek kunnen we bijgevolg besluiten dat de reeks

56

Page 57: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

normaal verdeeld is. Dit wordt tevens statistisch gestaafd aan de hand van de -statistiek. Deze duidt aan, dat er sprake is van een normaalverdeling.

Entropy concentration

Bovenstaande grafiek, is een alternatieve wijze om na te gaan of onze storingstermen al dan niet normaal verdeeld zijn. De witte lijn stelt de entropy voor. We kunnen duidelijk een normaalverdeling destilleren (zie de klokvorm). De software geeft tevens een parameterwaarde weer voor de entropy, maar aangezien het ons niet duidelijk is, hoe deze moet worden geïnterpreteerd, gaan we hier niet dieper op in. We kunnen wel determineren dat deze wijze, voor het bepalen of de storingstermen al dan niet normaal verdeeld is, minder nauwkeurig is dan het rootogram.

Skewness/Kurtosis

De Skewness meet de ‘scheefheidsgraad’ van een verdeling. Een negatieve skewness impliceert een linkscheve verdeling, een positieve skewness impliceert een rechtsscheve verdeling. Indien de skewness gelijk is aan nul, kunnen we spreken van een symmetrische verdeling. Hetgeen uiteraard het geval is bij een normaalverdeling. Vandaar dat we moeten testen of de skewness van de

57

Page 58: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

verdeling van onze storingstermen niet significant verschillend is van nul. Is dit niet het geval, dan zijn de storingstermen niet normaal verdeeld!

De Kurtosis is een maatstaf die de dikte van de staarten van de verdeling van de storingstermen in kaart brengt. Een positieve kurtosis wijst op een spitse top, een negatie kurtosis op een vlakke distributie. Bij een normaalverdeling is de kurtosis gelijk aan nul, aangezien we de grootste frequenties in het centrum aantreffen, de kleinste aan de staarten. We zullen bijgevolg moeten testen of de kurtosis van de verdeling van onze storingstermen niet significant verschillend is van nul. Is dit niet het geval, dan zijn de storingstermen immers niet normaal verdeeld!

Skewness Measure Value Kurtosis Measure ValueFISHER Test 1 Probability 0.976 FISHER Test 2 Probability 0.246

Skewness and Kurtosis - Ungrouped Data

Skewness Kurtosis

De Fisher Test 1 Probability gaat na of de skewness van de verdeling van de storingstermen niet significant verschillend is van nul. Is dit het geval dan zou de P-value groter moeten zijn dan 5% ( -fout = 0,05). De P-value is in huidig voorbeeld gelijk aan 97%. We kunnen bijgevolg stellen dat, wat betreft de scheefheidsgraad, de storingstermen normaal verdeeld zijn! In de skewness-grafiek kunnen we tevens determineren dat de nullijn zich steeds tussen het betrouwbaarheidsinterval bevind. We kunnen tevens determineren dat, indien we enkele extreme waarden zouden elimineren, de skewness nog dichter bij nul zou aanleunen, hetgeen ons model enkel ten goede komt!

De Fisher Test 2 Probability gaat na of de kurtosis van de verdeling van de storingstermen niet significant verschillend is van nul. Is dit het geval dan zou de P-value groter moeten zijn dan 5% ( = 0,05). De P-value is in huidig voorbeeld

58

Page 59: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

gelijk aan 24%. We kunnen bijgevolg stellen dat, wat betreft de kurtosis, de storingstermen normaal verdeeld zijn! In de kurtosis-grafiek kunnen we tevens determineren dat de nullijn zich steeds tussen het betrouwbaarheidsinterval bevind. We kunnen tevens determineren dat, indien we enkele extreme waarden zouden elimineren, de kurtosis nog dichter bij nul zou aanleunen, hetgeen ons model enkel ten goede komt!

Besluit

Uit de verschillende statistische tests kunnen we besluiten dat de storingstermen normaal verdeeld zijn, mits eliminatie van één extreme waarde. Bijgevolg voldoen we aan één van de voorwaarden van ‘white noise’!

1.4.3. Task 3

Compute various measures of central tendency for the residuals. Is the mean significantly different from zero?  How robust is this hypothesis?

Het gemiddelde van de storingstermen mag niet significant verschillend zijn van nul. Is dit echter wel het geval, dat zijn de storingstermen sterk vertekend. Vandaar dat de gemaakte voorspellingen al dan niet met een korreltje zout zullen moeten worden genomen.

Central Tendency - Ungrouped DataMeasure Value S.E. Value/S.E.

Arithmetic Mean 2.73E-16 0.021248466 1.28E-14Standard Error 0.163212561       Geometric Mean NAN    Harmonic Mean 0.04400487    Quadratic Mean 0.161823493    Winzorized Mean (0/59) 2.88E-16 0.021248466 1.35E-14Winzorized Mean (1/59) -0.001355932 0.020818762 -0.065130301Winzorized Mean (2/59) 0.000338983 0.019303723 0.017560502Winzorized Mean (3/59) -0.002711864 0.018342036 -0.147849696Winzorized Mean (4/59) -0.002033898 0.017556985 -0.115845533Winzorized Mean (5/59) -0.001186441 0.016980363 -0.069871338Winzorized Mean (6/59) -0.001186441 0.016539228 -0.071734951Winzorized Mean (7/59) -0.002372881 0.015836351 -0.149837636Winzorized Mean (8/59) 0.003050847 0.014117914 0.216097609Winzorized Mean (9/59) -0.001525424 0.013325869 -0.114470866Winzorized Mean (10/59) 0.000169492 0.01289035 0.013148714

59

Page 60: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Winzorized Mean (11/59) 0.000169492 0.012229297 0.013859465Winzorized Mean (12/59) -0.001864407 0.011878509 -0.156956299Winzorized Mean (13/59) 0.011355932 0.009483538 1.197436251Winzorized Mean (14/59) 0.011355932 0.009483538 1.197436251Winzorized Mean (15/59) 0.006271186 0.006998584 0.896065037Winzorized Mean (16/59) 0.008983051 0.006438909 1.395120023Winzorized Mean (17/59) 0.008983051 0.006438909 1.395120023Winzorized Mean (18/59) 0.002881356 0.005471824 0.526580492Winzorized Mean (19/59) -0.003559322 0.003512114 -1.013441624Trimmed Mean (0/59) 2.88E-16 0.021248466 1.35E-14Trimmed Mean (1/59) -0.000844484 0.018888478 -0.044708953Trimmed Mean (2/59) -0.00029584 0.017605409 -0.016803913Trimmed Mean (3/59) -0.000649185 0.016455957 -0.039449818Trimmed Mean (4/59) 0.000146228 0.015660813 0.00933719Trimmed Mean (5/59) 0.00080249 0.014855849 0.054018489Trimmed Mean (6/59) 0.001301839 0.014042693 0.092705803Trimmed Mean (7/59) 0.001845574 0.013142148 0.140431717Trimmed Mean (8/59) 0.002672448 0.012207061 0.21892639Trimmed Mean (9/59) 0.002604382 0.011527068 0.225936209Trimmed Mean (10/59) 0.003298566 0.010881428 0.303137213Trimmed Mean (11/59) 0.003797526 0.010108172 0.375688721Trimmed Mean (12/59) 0.004353511 0.009262609 0.47000916Trimmed Mean (13/59) 0.005279918 0.008162154 0.64687802Trimmed Mean (14/59) 0.004390377 0.007470139 0.587723603Trimmed Mean (15/59) 0.003378141 0.006412177 0.52683219Trimmed Mean (16/59) 0.002956685 0.005951689 0.496780913Trimmed Mean (17/59) 0.002067797 0.005385165 0.383980191Trimmed Mean (18/59) 0.001024318 0.004420344 0.231728206Trimmed Mean (19/59) 0.000734463 0.003404013 0.215763973Median 0.004067797    Midrange 0.024067797    Midmean 0.000746912    Observations 59    

Bovenstaande tabel geeft verschillende centrumwaarden (kengetallen van de verdeling) weer! In feite kunnen we het best kijken naar de laatste kolom, aangezien we deze kunnen aanschouwen als een statistiek. De overige kolommen zijn uitgedrukt in eenheden, waardoor we moeilijk een uitspraak kunnen doen of het gemiddelde van de residu’s al dan niet significant verschillend is van nul. Indien we het ‘standaard gemiddelde’ nemen (MEAN), zien we duidelijk dat de absolute waarde van de t-statistiek kleiner is dan twee. We kunnen bijgevolg stellen dat het gemiddelde van de storingstermen niet significant verschillend is van nul. Dit is een goede zaak!

60

Page 61: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Naast het standaardgemiddelde worden er nog andere gemiddelden berekend, waaronder de ‘trimmed mean’. Deze berekent het gemiddelde van de storingstermen, mits een procentuele eliminatie van extreme waarden.

Een ander gemiddelde is de ‘winzorized mean’. Bij de berekening van dit gemiddelde wordt een percentage van de extreme waarden vervangen door meer normale waarden.

De software geeft bij deze berekeningen tevens twee grafieken, die we hier niet zullen meedelen, aangezien de gemiddelden in de grafieken zijn uitgedrukt in eenheden. We kunnen wel zeggen dat in beide grafieken de ‘gemiddelde-lijn’ zich binnen het betrouwbaarheidsinterval bevind.

1.4.4. Task 4

Compute various measures of variability, quartiles, and percentiles. How could we describe (compute) the 50% confidence interval (of a 1-step-ahead forecast) based on all three computations? What computation would you use to derive the 83% confidence interval?

In wat volgt zullen we enkele spreidingsmaten van de verdeling onderzoeken. Meer bepaald de variantie, de kwartielen en de percentielen.

Variabiliteit

Variability - Ungrouped DataVariability Measure ValueAbsolute Range 0.9Relative Range (unbiased) 5.514281456Relative Range (biased) 5.561615213Variance (unbiased) 0.02663834Variance (biased) 0.026186843Standard Error (unbiased) 0.163212561Standard Error (biased) 0.161823493Mean Absolute Deviation from Mean (MAD Mean) 0.115598966

In bovenstaande tabel kunnen we de range aflezen. Deze is hier gelijk aan 10,9. De range is niets meer dan het verschil tussen de grootste en de kleinste meetuitslag, en wordt veelal gebruikt indien het aantal meetuitslagen kleiner is dan 15. We kunnen wel besluiten dat de range zeer klein, hetgeen zeer goed is.

61

Page 62: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

De variantie (standaarddeviatie²) geeft de relatieve spreiding van de meetuitslagen ten opzichte van het gemiddelde van de residu’s weer (in dit geval gelijk nul).

De standaardfout is de maximale afwijking tussen de voorspelde waarde (1-step-ahead forecast) en de werkelijkheid. In dit voorbeeld gelijk aan 16%, hetgeen vrij goed is.

Kwartielen

Quartiles - Ungrouped DataMethod Quartile 1 Quartile 2 Quartile 3Weighted Average at Xnp -0.075932203 0.004067797 0.084067797Weighted Average at X(n+1)p -0.075932203 0.004067797 0.114067797Empirical Distribution Function -0.075932203 0.004067797 0.114067797

Empirical Distribution Function - Averaging -0.075932203 0.004067797 0.114067797

Empirical Distribution Function - Interpolation -0.065932203 0.004067797 0.094067797Closest Observation -0.075932203 0.004067797 0.074067797True Basic - Statistics Graphics Toolkit -0.075932203 0.004067797 0.114067797MS Excel (old versions) -0.075932203 0.004067797 0.114067797Observations 59

In bovenstaande grafiek merken we op dat het tweede kwartiel vrij klein is in verhouding tot kwartiel 1 en 3. We kunnen zelfs stellen dat het eerste en het tweede kwartiel in absolute waarde min of meer overeenkomen. Dit is uiteraard niet meer dan normaal, gezien de symmetrie van de verdeling. Het tweede kwartiel is gelijk aan nul, hetgeen typisch is voor een normaalverdeling.

Bij het opstellen van een 50% betrouwbaarheidsinterval moeten we bijgevolg als ondergrens het 2ste kwartiel nemen, en als bovengrens het 3de

kwartiel!

Percentielen

Percentiles - Ungrouped Data

% Weighted Average at Xnp Weighted Average at X(n+1)p0.01 -0.2513 -0.25560.02 -0.4115 -0.40990.03 -0.3643 -0.3619

62

Page 63: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

0.04 -0.3243 -0.32190.05 -0.2889 -0.28590.06 -0.2751 -0.27390.07 -0.2633 -0.26190.08 -0.2515 -0.24990.09 -0.2397 -0.2379

0.1 -0.2279 -0.22590.11 -0.221 -0.21990.12 -0.2151 -0.21390.13 -0.2092 -0.20790.14 -0.1929 -0.18590.15 -0.1634 -0.15590.16 -0.1559 -0.15590.17 -0.1556 -0.15390.18 -0.1497 -0.14790.19 -0.1438 -0.1419

0.2 -0.1379 -0.13590.21 -0.1359 -0.13590.22 -0.1359 -0.12390.23 -0.1017 -0.08790.24 -0.0759 -0.07590.25 -0.0759 -0.07590.26 -0.0691 -0.06390.27 -0.0573 -0.05390.28 -0.0507 -0.04790.29 -0.0459 -0.0459

0.3 -0.0459 -0.04590.31 -0.0459 -0.04590.32 -0.0459 -0.04390.33 -0.0412 -0.03790.34 -0.0353 -0.03190.35 -0.0294 -0.02590.36 -0.0235 -0.01990.37 -0.0176 -0.01590.38 -0.0159 -0.01590.39 -0.0158 -0.0119

0.4 -0.0099 -0.00590.41 -0.0059 -0.00590.42 -0.0059 -0.00590.43 -0.0059 -0.00590.44 -0.0059 -0.00590.45 -0.0059 -0.00590.46 -0.0045 0.00010.47 0.0014 0.00410.48 0.0041 0.00410.49 0.0041 0.0041

63

Page 64: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

0.5 0.0041 0.00410.51 0.0041 0.00410.52 0.0041 0.00410.53 0.0041 0.00410.54 0.0041 0.00410.55 0.0041 0.00410.56 0.0041 0.00410.57 0.0041 0.00410.58 0.0041 0.00410.59 0.0041 0.0081

0.6 0.0081 0.01410.61 0.014 0.01410.62 0.0141 0.01610.63 0.0158 0.02210.64 0.0217 0.02410.65 0.0241 0.02410.66 0.0241 0.02410.67 0.0241 0.03010.68 0.0277 0.04810.69 0.0454 0.0621

0.7 0.0601 0.07410.71 0.0719 0.07410.72 0.0741 0.07410.73 0.0741 0.07410.74 0.0741 0.09010.75 0.0841 0.11410.76 0.1077 0.11410.77 0.1141 0.11410.78 0.1141 0.11410.79 0.1141 0.1181

0.8 0.1161 0.12410.81 0.122 0.13010.82 0.1279 0.13410.83 0.1338 0.13410.84 0.1341 0.14610.85 0.1386 0.16410.86 0.1563 0.17010.87 0.1674 0.17810.88 0.1733 0.19010.89 0.1843 0.1981

0.9 0.1951 0.20410.91 0.201 0.21010.92 0.2069 0.21610.93 0.2128 0.22210.94 0.2187 0.25610.95 0.2281 0.3041

64

Page 65: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

0.96 0.2753 0.31010.97 0.3064 0.34610.98 0.3123 0.44210.99 0.3797 0.2844

Gezien de normaalverdeling van de residu’s zouden het eerste en het negenennegentigste percentiel, het tweede en het achtennegentigste percentiel,… in absolute waarde sterk moeten overeenkomen.

Het middelste percentiel (dus het vijftigste) zou min of meer gelijk moeten zijn aan nul! Dit blijkt te kloppen.

Bij het opstellen van een 83% betrouwbaarheidsinterval moeten we gebruik maken van de percentielen. Aangezien we slechts 83% nodig hebben en geen 100%, moeten we 17% (100%-83%) van iedere staart halen. Bijgevolg zal het betrouwbaarheidsgeval liggen tussen het 9de en het 91ste percentiel of tussen het 10de en het 92ste percentiel.

1.4.5. Task 5

Are the residuals of the time series white noise?

We hebben gezien dat de storingstermen normaal verdeeld zijn, er geen sprake meer is van autocorrelatie (ACF) en het gemiddelde van de residu’s niet significant verschillend is van nul (mits eliminatie van één extreme waarde). We kunnen bijgevolg besluiten dat de storingstermen ‘white noise’ zijn. Herschatting is bijgevolg niet meer nodig.

1.4.6. Task 6

Create scatterplots between the (white noise) residuals of your selected time series (with various timelags). Is there ANY relationship between the series? Do your findings correspond to your initial hypotheses? Did you now solve the spurious (nonsense) correlation problem?*

Hiervoor verwijs ik naar 1.1.6. Onze hypotheses gingen steeds uit van reeks 1 als afhankelijke variabele. We verwachten bijvoorbeeld geen verband tussen de rente-evolutie op langlopende kredieten en de prijsevolutie van nieuwe-wagens,…

65

Page 66: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

66

Page 67: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

1.5. Reeks Unemployment

We zullen de verschillende stappen doorlopen met betrekking tot de reeks van de unemployment-data.

Uit de vorige opdrachten is gebleken dat de reeks getransformeerd moest worden, zodoende stationariteit te bewerkstelligen. Volgende transformaties waren vereist:

d : 1D : 1λ : 0.5

In deze tijdreeks konden we een AR(2) en een SMA(1) proces destilleren. Uit de backforecasting-procedure was gebleken dat deze parameters significant verschillend waren van nul. Verder konden we uit deze procedure geen gebrekkigheden determineren, waardoor een nieuwe schatting niet vereist was. Uit de forecasting-procedure zijn tevens geen gebrekkigheden naar voren gekomen. We kunnen bijgevolg besluiten dat de reeks kan gehanteerd worden om adequate voorspellingen te maken.

In deze opdracht zullen we nagaan of de storingstermen van de reeks (na backforecasting) zich op een correcte wijze gedragen. Met andere woorden: de storingstermen moeten ‘white noise’ zijn.

67

Page 68: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

1.5.1. Task 1

Compute the ACF, PACF, and Spectrum of the estimated residuals. Is there any indication of a 'forgotten' process? Re-identify the ARIMA model (if necessary) and re-estimate the parameters (and forecast). Important: do not apply any new model estimations/forecasts to the residuals (use the original data instead).

ACF en PACF

ACF PACF

Uit bovenstaande tabel kunnen we besluiten dat de autocorrelatiefunctie en de partiële autocorrelatiefunctie min of meer op elkaar gelijken. Uit de grafieken kunnen we daarenboven geen ARMA-proces meer destilleren, daar noch het eerste niet-seizoenale (lag 1), noch het eerste seizoenale (lag 12) staafje in de autocorrelatiefunctie en de partiële autocorrelatiefunctie zich buiten het betrouwbaarheidsinterval bevind. Geen enkel staafje bevind zich overigens buiten het betrouwbaarheidsinterval. Geen enkele coëfficiënt bevind zich overigens buiten het betrouwbaarheidsinterval.

68

Page 69: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Spectrum

3 In het ideale geval situeert de witte lijn zich tussen de gele lijnen, ofte

binnen de Kolmogorov-Smirnov grenzen! De storingstermen van deze tijdreeks voldoen aan deze voorwaarde. Aan de hand van het spectrum kunnen we noch een beduidende lange termijn-, noch een beduidende korte termijnstrend determineren. Indien dit wel het geval zou zijn, zou de witte lijn zich respectievelijk significant links, of rechts van de Kolmogorov-Smirnov grenzen moeten bevinden.

1.5.2. Task 2

Examine the histogram, rootogram, entropy concentration, and skewness/kurtosis diagnostics of the residuals. Are the residuals normally distributed? What do you think would happen if they are not normally distributed? Does this influence your analysis?

In het ideale geval zijn de storingstermen normaal verdeeld. Is dit niet het geval, dan zijn de schattingsresultaten vertekend, inconsistent en inefficiënt. Dit kan dan uiteraard leiden tot minder adequate prognoses. Indien de storingstermen normaal verdeeld zijn, dan is de kans op ‘kleine’ storingen groter

69

Page 70: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

dan de kans op ‘grote’ storingen. Dit is natuurlijk onze intentie. Hoe kleiner de storingen, hoe dichter de voorspelde waarden immers zullen aanleunen bij de werkelijkheid. Algemeen wordt gesteld dat, indien de storingstermen normaal verdeeld zijn en de steekproef voldoende groot is, we spreken van asymptotisch niet-vertekende, consistente parameters.

Indien zou blijken dat de storingstermen inderdaad niet normaal verdeeld zijn, dan is een mogelijke oplossing het opnemen van meerdere observaties in je steekproef. Algemeen wordt immers het volgende gesteld: hoe groter de steekproef, hoe groter de kans dat de storingstermen normaal verdeel zullen zijn.

Histogram

Bovenstaande grafiek toont het verloop van de storingstermen aan, aan de hand van een histogram. Zoals reeds eerder besproken, moeten de storingstermen normaal verdeeld zijn, zodoende adequate prognoses te kunnen maken. Uit bovenstaande grafiek kunnen we een normaalverdeling destilleren. We zien duidelijk dat de frequentie in het centrum groter is dan aan de staarten! Dit is typisch voor een normaalverdeling. Aangezien we op deze (visuele) wijze moeilijk een uitspraak kunnen doen omtrent de al dan niet aanwezigheid van een normaalverdeling, zullen we ons moeten beroepen op het rootogram. Dit is een statistisch hulpmiddel, dat nagaat of de storingstermen al dan niet normaal

70

Page 71: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

verdeeld zijn. Zij gaat met andere woorden de werkelijke klassenfrequenties van bovenstaand histogram vergelijken met de theoretische klassenfrequenties van een normaalverdeling, en vervolgens een uitspraak maken, op basis van statistische inferenties.

Rootogram

Suspended rootogram of 9910133_UNEM.ds.res by bind = 0 D = 0 L = 1Chi-square test at 5%:THIS SERIES IS NORMALLY DISTRIBUTED

Bovenstaande tabel weerspiegelt het rootogram van betreffende tijdreeks. De ondergrens is gelijk aan -2, de bovengrens gelijk aan 2. Dit komt met andere woorden neer op het definitiegebied van de theoretische standaard normaalverdeling [-2, 2] met = 0,05, µ = 0 en = 1. De klassencoëfficiënten mogen zich niet significant buiten dit betrouwbaarheidsinterval begeven, indien we er impliciet van uit gaan dat onze tijdreeks normaal verdeeld is. In bovenstaand voorbeeld, zien we duidelijk dat slechts twee coëfficiënten het betrouwbaarheidsinterval overschrijden. Aan de hand van de grafiek kunnen we bijgevolg besluiten dat de reeks normaal verdeeld is. Dit wordt tevens statistisch

71

Page 72: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

gestaafd aan de hand van de -statistiek. Deze duidt aan, dat er sprake is van een normaalverdeling.

Entropy concentration

Bovenstaande grafiek, is een alternatieve wijze om na te gaan of onze storingstermen al dan niet normaal verdeeld zijn. De witte lijn stelt de entropy voor. We kunnen duidelijk een normaalverdeling destilleren (zie de klokvorm). De software geeft tevens een parameterwaarde weer voor de entropy, maar aangezien het ons niet duidelijk is, hoe deze moet worden geïnterpreteerd, gaan we hier niet dieper op in. We kunnen wel determineren dat deze wijze, voor het bepalen of de storingstermen al dan niet normaal verdeeld is, minder nauwkeurig is dan het rootogram.

Skewness/Kurtosis

De Skewness meet de ‘scheefheidsgraad’ van een verdeling. Een negatieve skewness impliceert een linksscheve verdeling, een positieve skewness impliceert een rechtsscheve verdeling. Indien de skewness gelijk is aan nul, kunnen we spreken van een symmetrische verdeling. Hetgeen uiteraard het geval is bij een normaalverdeling. Vandaar dat we moeten testen of de skewness van de

72

Page 73: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

verdeling van onze storingstermen niet significant verschillend is van nul. Is dit niet het geval, dan zijn de storingstermen niet normaal verdeeld!

De Kurtosis is een maatstaf die de dikte van de staarten van de verdeling van de storingstermen in kaart brengt. Een positieve kurtosis wijst op een spitse top, een negatie kurtosis op een vlakke distributie. Bij een normaalverdeling is de kurtosis gelijk aan nul, aangezien we de grootste frequenties in het centrum aantreffen, de kleinste aan de staarten. We zullen bijgevolg moeten testen of de kurtosis van de verdeling van onze storingstermen niet significant verschillend is van nul. Is dit niet het geval, dan zijn de storingstermen immers niet normaal verdeeld!

Skewness Measure Value Kurtosis Measure ValueFISHER Test 1 Probability 0.0278 FISHER Test 2 Probability 0.0602

Skewness and Kurtosis - Ungrouped Data

Skewness Measure (small sample) Value Probability Kurtosis Measure (small sample) ValueProbabilit

yTrimmed Skewness (0/359) 0.2847 0.0264 Trimmed Kurtosis (0/359) 0.5078 0.0478Trimmed Skewness (1/359) 0.2744 0.0332 Trimmed Kurtosis (1/359) 0.2562 0.3174Trimmed Skewness (2/359) 0.2391 0.0644 Trimmed Kurtosis (2/359) 0.0154 0.9522Trimmed Skewness (3/359) 0.2046 0.1142 Trimmed Kurtosis (3/359) -0.122 0.6312Trimmed Skewness (4/359) 0.1876 0.147 Trimmed Kurtosis (4/359) -0.196 0.4472Trimmed Skewness (5/359) 0.1768 0.1738 Trimmed Kurtosis (5/359) -0.242 0.3524

Trimmed Skewness and Kurtosis (small sample) - Ungrouped Data

Skewness Kurtosis

De Fisher Test 1 Probability gaat na of de skewness van de verdeling van de storingstermen niet significant verschillend is van nul. Is dit het geval dan zou de P-value groter moeten zijn dan 5% ( -fout = 0,05). De P-value is in huidig voorbeeld gelijk aan 2%. We kunnen bijgevolg stellen dat, wat betreft de scheefheidsgraad, de storingstermen niet normaal verdeeld zijn!

73

Page 74: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

De oorzaak hiervan is te wijten aan outliers. Op de Skewness-grafiek, alsook op de Skewness en Kurtosis tabel (2) kunnen we immers vaststellen dat door eliminatie van twee extreme waarde de nullijn zich rond nul gedraagt. De respectievelijke P-value is dan gelijk aan 6% en de storingstermen zijn derhalve, wat betreft de scheefheidsgraad, normaal verdeeld. In de skewness-grafiek kunnen we tevens determineren dat de nullijn zich steeds tussen het betrouwbaarheidsinterval bevind.

De Fisher Test 2 Probability gaat na of de kurtosis van de verdeling van de storingstermen niet significant verschillend is van nul. Is dit het geval dan zou de P-value groter moeten zijn dan 5% ( = 0,05). De P-value is in huidig voorbeeld gelijk aan 6%. We kunnen bijgevolg stellen dat, wat betreft de kurtosis, de storingstermen normaal verdeeld zijn!

Besluit

Uit de verschillende statistische tests kunnen we besluiten dat de storingstermen normaal verdeeld zijn, mits eliminatie van twee extreme waarden. Bijgevolg voldoen we aan één van de voorwaarden van ‘white noise’!

1.5.3. Task 3

Compute various measures of central tendency for the residuals. Is the mean significantly different from zero?  How robust is this hypothesis?

Het gemiddelde van de storingstermen mag niet significant verschillend zijn van nul. Is dit echter wel het geval, dat zijn de storingstermen sterk vertekend. Vandaar dat de gemaakte voorspellingen al dan niet met een korreltje zout zullen moeten worden genomen.

Central Tendency - Ungrouped DataMeasure Value S.E. Value/S.E.

Arithmetic Mean 0.006731366 0.027909544 0.241185103Standard Error 0.528810378       Geometric Mean NAN    Harmonic Mean -0.559484143    Quadratic Mean 0.528116261    Winzorized Mean (0/359) 0.006731366 0.027909544 0.241185103

74

Page 75: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Winzorized Mean (1/359) 0.007184259 0.02783032 0.258145027Winzorized Mean (2/359) 0.007357821 0.027582341 0.266758377Winzorized Mean (3/359) 0.006129114 0.027303634 0.224479795Winzorized Mean (4/359) 0.005450329 0.027040289 0.201563288Winzorized Mean (5/359) 0.005361352 0.026893626 0.199354006Winzorized Mean (6/359) 0.005205169 0.026826419 0.194031463Winzorized Mean (7/359) 0.005349937 0.026738972 0.200080146Winzorized Mean (8/359) 0.004477235 0.026595315 0.168346754Winzorized Mean (9/359) 0.00399538 0.026449741 0.151055537Winzorized Mean (10/359) 0.003754285 0.026400612 0.142204457Winzorized Mean (11/359) 0.001130339 0.025974322 0.043517541Winzorized Mean (12/359) -0.00027463 0.02571802 -0.010678523Winzorized Mean (13/359) -5.44E-05 0.02563644 -0.002120906Winzorized Mean (14/359) 0.000690708 0.025505902 0.02708034Winzorized Mean (15/359) 0.00113748 0.025391055 0.044798459Winzorized Mean (16/359) 0.000832042 0.025144764 0.03309008Winzorized Mean (17/359) 8.65E-06 0.025027113 0.000345537Winzorized Mean (18/359) -0.000455923 0.02496366 -0.018263488Winzorized Mean (19/359) 4.71E-05 0.024706108 0.001905421Winzorized Mean (20/359) 6.75E-05 0.024640364 0.002738929Winzorized Mean (21/359) 0.001370781 0.024488991 0.055975379Winzorized Mean (22/359) 0.002105114 0.024271724 0.086731139Winzorized Mean (23/359) 0.001008933 0.024053831 0.041944804Winzorized Mean (24/359) 0.0022101 0.023851486 0.092660889Winzorized Mean (25/359) 0.001524795 0.023530168 0.064801686Winzorized Mean (26/359) 0.001611638 0.023501187 0.068576869Winzorized Mean (27/359) 0.003349684 0.023335236 0.143546165Winzorized Mean (28/359) 0.002718104 0.023272766 0.116793319Winzorized Mean (29/359) 0.002729579 0.023254763 0.117377181Winzorized Mean (30/359) 0.001362549 0.023046508 0.059121724Winzorized Mean (31/359) 0.000473128 0.022919683 0.020642866Winzorized Mean (32/359) -0.000848655 0.022583942 -0.037577799Winzorized Mean (33/359) -0.005701583 0.022139597 -0.257528741Winzorized Mean (34/359) -0.005942992 0.022039169 -0.269655888Winzorized Mean (35/359) -0.005029657 0.021955007 -0.229089297Winzorized Mean (36/359) -0.001331427 0.021596718 -0.061649503Winzorized Mean (37/359) -0.002565322 0.02145671 -0.119558016Winzorized Mean (38/359) -0.002498045 0.02139939 -0.116734393Winzorized Mean (39/359) -0.001401476 0.021305394 -0.065780345Trimmed Mean (0/359) 0.006731366 0.027909544 0.241185103Trimmed Mean (1/359) 0.006109183 0.027256072 0.224140244Trimmed Mean (2/359) 0.005021993 0.026670679 0.188296409Trimmed Mean (3/359) 0.003834228 0.026230882 0.146172288Trimmed Mean (4/359) 0.003051831 0.025873511 0.117951944Trimmed Mean (5/359) 0.002435025 0.025565362 0.095247038Trimmed Mean (6/359) 0.00182952 0.02527241 0.072391985

75

Page 76: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Trimmed Mean (7/359) 0.001244081 0.024979839 0.04980341Trimmed Mean (8/359) 0.000630169 0.024690476 0.02552277Trimmed Mean (9/359) 0.000123902 0.024413341 0.005075186Trimmed Mean (10/359) -0.00033164 0.024144644 -0.013735566Trimmed Mean (11/359) -0.000766907 0.023870697 -0.03212753Trimmed Mean (12/359) -0.00095174 0.023639085 -0.040261284Trimmed Mean (13/359) -0.001012571 0.023424017 -0.043227911Trimmed Mean (14/359) -0.001092514 0.023207475 -0.047075953Trimmed Mean (15/359) -0.001231502 0.022995009 -0.053555168Trimmed Mean (16/359) -0.001404889 0.022784715 -0.061659268Trimmed Mean (17/359) -0.001559323 0.022587895 -0.069033575Trimmed Mean (18/359) -0.001661837 0.022392816 -0.074212937Trimmed Mean (19/359) -0.001736763 0.022194923 -0.078250447Trimmed Mean (20/359) -0.001842421 0.022008877 -0.083712652Trimmed Mean (21/359) -0.001950569 0.021820029 -0.089393527Trimmed Mean (22/359) -0.002130821 0.021634291 -0.098492757Trimmed Mean (23/359) -0.00235166 0.021456145 -0.109603125Trimmed Mean (24/359) -0.002520324 0.021285533 -0.118405511Trimmed Mean (25/359) -0.002749319 0.021120666 -0.130171974Trimmed Mean (26/359) -0.002949241 0.020969479 -0.14064448Trimmed Mean (27/359) -0.003155718 0.020813505 -0.151618747Trimmed Mean (28/359) -0.003441189 0.020660949 -0.16655521Trimmed Mean (29/359) -0.003703551 0.020505934 -0.180608728Trimmed Mean (30/359) -0.003969897 0.020345481 -0.195124289Trimmed Mean (31/359) -0.004184751 0.020190397 -0.20726444Trimmed Mean (32/359) -0.004367603 0.020035729 -0.217990724Trimmed Mean (33/359) -0.004502341 0.019892878 -0.226329289Trimmed Mean (34/359) -0.004457508 0.01976759 -0.225495791Trimmed Mean (35/359) -0.004403235 0.019641543 -0.224179696Trimmed Mean (36/359) -0.004380847 0.019514313 -0.224494051Trimmed Mean (37/359) -0.004487547 0.019399392 -0.231324116Trimmed Mean (38/359) -0.004553451 0.019286444 -0.236095936Trimmed Mean (39/359) -0.004622555 0.019171195 -0.241119814Median -0.026227717    Midrange 0.117791164    Midmean -0.017268056    Observations 359    

Bovenstaande tabel geeft verschillende centrumwaarden (kengetallen van de verdeling) weer! In feite kunnen we het best kijken naar de laatste kolom, aangezien we deze kunnen aanschouwen als een statistiek. De overige kolommen zijn uitgedrukt in eenheden, waardoor we moeilijk een uitspraak kunnen doen of het gemiddelde van de residu’s al dan niet significant verschillend is van nul. Indien we het ‘standaard gemiddelde’ nemen (MEAN), zien we duidelijk dat de absolute waarde van de t-statistiek kleiner is dan twee. We kunnen bijgevolg

76

Page 77: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

stellen dat het gemiddelde van de storingstermen niet significant verschillend is van nul. Dit is een goede zaak!

Naast het standaardgemiddelde worden er nog andere gemiddelden berekend, waaronder de ‘trimmed mean’. Deze berekent het gemiddelde van de storingstermen, mits een procentuele eliminatie van extreme waarden.

Een ander gemiddelde is de ‘winzorized mean’. Bij de berekening van dit gemiddelde wordt een percentage van de extreme waarden vervangen door meer normale waarden.

De software geeft bij deze berekeningen tevens twee grafieken, die we hier niet zullen meedelen, aangezien de gemiddelden in de grafieken zijn uitgedrukt in eenheden. We kunnen wel zeggen dat in beide grafieken de ‘gemiddelde-lijn’ zich binnen het betrouwbaarheidsinterval bevind.

1.5.4. Task 4

Compute various measures of variability, quartiles, and percentiles. How could we describe (compute) the 50% confidence interval (of a 1-step-ahead forecast) based on all three computations? What computation would you use to derive the 83% confidence interval?

In wat volgt zullen we enkele spreidingsmaten van de verdeling onderzoeken. Meer bepaald de variantie, de kwartielen en de percentielen.

77

Page 78: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

Variability Measure ValueAbsolute Range 3.36768414Relative Range (unbiased) 6.36841537Relative Range (biased) 6.3773036Variance (unbiased) 0.27964042Variance (biased) 0.27886147Standard Error (unbiased) 0.52881038Standard Error (biased) 0.52807336Mean Squared Error (MSE versus 0) 0.27890678Mean Squared Error (MSE versus Mean) 0.27886147

Mean Absolute Deviation from Mean (MAD Mean) 0.41121468

Variability - Ungrouped Data

Method Quartile 1 Quartile 2 Quartile 3Weighted Average at Xnp -0.3385268 -0.0267672 0.3143424Weighted Average at X(n+1)p -0.3370942 -0.0262277 0.3158538Empirical Distribution Function -0.3370942 -0.0262277 0.3158538

Empirical Distribution Function - Averaging -0.3370942 -0.0262277 0.3158538

Empirical Distribution Function - Interpolation -0.3353702 -0.0262277 0.3148462Closest Observation -0.3370942 -0.0262277 0.3138386True Basic - Statistics Graphics Toolkit -0.3370942 -0.0262277 0.3158538MS Excel (old versions) -0.3370942 -0.0262277 0.3158538Observations

Quartiles - Ungrouped Data

359

Variabiliteit

In bovenstaande tabel kunnen we de range aflezen. Deze is hier gelijk aan 3,36. De range is niets meer dan het verschil tussen de grootste en de kleinste meetuitslag, en wordt veelal gebruikt indien het aantal meetuitslagen kleiner is dan 15. We kunnen wel besluiten dat de range zeer klein, hetgeen zeer goed is.

De variantie (standaarddeviatie²) geeft de relatieve spreiding van de meetuitslagen ten opzichte van het gemiddelde van de residu’s weer (in dit geval gelijk nul).

De standaardfout is de maximale afwijking tussen de voorspelde waarde (1-step-ahead forecast) en de werkelijkheid. In dit voorbeeld gelijk aan 16%, hetgeen vrij goed is.

Kwartielen

In bovenstaande grafiek merken we op dat het tweede kwartiel vrij klein is in verhouding tot kwartiel 1 en 3. We kunnen zelfs stellen dat het eerste en het tweede kwartiel in absolute waarde min of meer overeenkomen. Dit is uiteraard

78

Page 79: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

niet meer dan normaal, gezien de symmetrie van de verdeling. Het tweede kwartiel is gelijk aan nul, hetgeen typisch is voor een normaalverdeling.

Bij het opstellen van een 50% betrouwbaarheidsinterval moeten we bijgevolg als ondergrens het 2ste kwartiel nemen, en als bovengrens het 3de

kwartiel!

Percentielen

Percentiles - Ungrouped Data

% Weighted Average at XnpWeighted Average at

X(n+1)p0.01 -1.1428 -1.14240.02 -1.0348 -1.03440.03 -0.9918 -0.99170.04 -0.9351 -0.9340.05 -0.8718 -0.87170.06 -0.8209 -0.81940.07 -0.7467 -0.74520.08 -0.7016 -0.70160.09 -0.6869 -0.6856

0.1 -0.6615 -0.66050.11 -0.6091 -0.6080.12 -0.5667 -0.56570.13 -0.5439 -0.54320.14 -0.5158 -0.51470.15 -0.5072 -0.50710.16 -0.4911 -0.4910.17 -0.4581 -0.45620.18 -0.4348 -0.43420.19 -0.4192 -0.4167

0.2 -0.4041 -0.40390.21 -0.3957 -0.39530.22 -0.3912 -0.38930.23 -0.3731 -0.37280.24 -0.3567 -0.35660.25 -0.3385 -0.33710.26 -0.3234 -0.32270.27 -0.3108 -0.30970.28 -0.2996 -0.29690.29 -0.2763 -0.2758

0.3 -0.2657 -0.26530.31 -0.2578 -0.25730.32 -0.2516 -0.25110.33 -0.2472 -0.2462

79

Page 80: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

0.34 -0.2336 -0.23260.35 -0.2114 -0.21130.36 -0.1966 -0.19460.37 -0.1813 -0.17990.38 -0.1679 -0.16590.39 -0.1414 -0.141

0.4 -0.1353 -0.13420.41 -0.1224 -0.12220.42 -0.1059 -0.10570.43 -0.0929 -0.09230.44 -0.0778 -0.07740.45 -0.0717 -0.07090.46 -0.0637 -0.06170.47 -0.0547 -0.05270.48 -0.0498 -0.04950.49 -0.042 -0.0409

0.5 -0.0268 -0.02620.51 -0.0162 -0.01550.52 -0.0089 -0.00880.53 -0.004 0.00290.54 0.0174 0.01810.55 0.0288 0.02970.56 0.0442 0.04920.57 0.066 0.07010.58 0.0813 0.08250.59 0.088 0.0892

0.6 0.0961 0.10260.61 0.1089 0.11010.62 0.1313 0.13420.63 0.1443 0.15110.64 0.1672 0.16970.65 0.1857 0.18610.66 0.1968 0.19720.67 0.2078 0.21140.68 0.217 0.21790.69 0.2357 0.2402

0.7 0.2555 0.26040.71 0.2661 0.26690.72 0.2762 0.27790.73 0.2919 0.29270.74 0.2958 0.29670.75 0.3143 0.31590.76 0.3322 0.33690.77 0.3465 0.350.78 0.3797 0.38810.79 0.4181 0.4239

80

Page 81: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

0.8 0.4317 0.43280.81 0.4607 0.46310.82 0.4817 0.48840.83 0.5026 0.50710.84 0.5125 0.51430.85 0.5357 0.53820.86 0.5824 0.58380.87 0.5932 0.59690.88 0.6006 0.60780.89 0.6225 0.6244

0.9 0.6422 0.64530.91 0.6906 0.72520.92 0.7728 0.77530.93 0.7843 0.8090.94 0.8552 0.86340.95 0.8915 0.90160.96 0.959 0.96610.97 1.0537 1.13950.98 1.2206 1.24150.99 1.3459 1.4835

Gezien de normaalverdeling van de residu’s zouden het eerste en het negenennegentigste percentiel, het tweede en het achtennegentigste percentiel,… in absolute waarde sterk moeten overeenkomen.

Het middelste percentiel (dus het vijftigste) zou min of meer gelijk moeten zijn aan nul! Dit blijkt te kloppen.

Bij het opstellen van een 83% betrouwbaarheidsinterval moeten we gebruik maken van de percentielen. Aangezien we slechts 83% nodig hebben en geen 100%, moeten we 17% (100%-83%) van iedere staart halen. Bijgevolg zal het betrouwbaarheidsgeval liggen tussen het 9de en het 91ste percentiel of tussen het 10de en het 92ste percentiel.

81

Page 82: 1users.telenet.be/audreygoeman/2eLic/Statistiek/CD... · Web viewDe oorzaak hiervan is te wijten aan outliers. Op de Kurtosis-grafiek, alsook op de Skewness en Kurtosis tabel (2)

1.5.5. Task 5

Are the residuals of the time series white noise?

We hebben gezien dat de storingstermen normaal verdeeld zijn, er geen sprake meer is van autocorrelatie (ACF) en het gemiddelde van de residu’s niet significant verschillend is van nul (mits eliminatie van één extreme waarde). We kunnen bijgevolg besluiten dat de storingstermen ‘white noise’ zijn. Herschatting is bijgevolg niet meer nodig.

1.5.6. Task 6

Create scatterplots between the (white noise) residuals of your selected time series (with various timelags). Is there ANY relationship between the series? Do your findings correspond to your initial hypotheses? Did you now solve the spurious (nonsense) correlation problem?*

Met betrekking tot deze tijdreeks kan deze opdracht niet gemaakt worden.

82