Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

81
Faculteit Wetenschappen Vakgroep Fysica en Sterrenkunde Voorzitter: Prof. Dr. Dirk Ryckbosch Simulatie van informatie-entropie in financi¨ ele markten op basis van moleculaire dynamica door Pieter Van Nuffel Promotor: Prof. Dr. Jan Ryckebusch Masterproef ingediend tot het behalen van de academische graad van Master in de Fysica en Sterrenkunde Academiejaar 2010–2011

description

masterthesis

Transcript of Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Page 1: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Faculteit Wetenschappen

Vakgroep Fysica en Sterrenkunde

Voorzitter: Prof. Dr. Dirk Ryckbosch

Simulatie van informatie-entropie

in financiele markten

op basis van moleculaire dynamica

door

Pieter Van Nuffel

Promotor: Prof. Dr. Jan Ryckebusch

Masterproef ingediend tot het behalen van de academische graad van

Master in de Fysica en Sterrenkunde

Academiejaar 2010–2011

Page 2: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica
Page 3: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Faculteit Wetenschappen

Vakgroep Fysica en Sterrenkunde

Voorzitter: Prof. Dr. Dirk Ryckbosch

Simulatie van informatie-entropie

in financiele markten

op basis van moleculaire dynamica

door

Pieter Van Nuffel

Promotor: Prof. Dr. Jan Ryckebusch

Masterproef ingediend tot het behalen van de academische graad van

Master in de Fysica en Sterrenkunde

Academiejaar 2010–2011

Page 4: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Dankwoord

Wanneer je gefascineerd raakt door interessante theorieen, dan worden die je doorgaans

aangereikt door interessante mensen. Het was een regenachtige zaterdag in 2005 toen ik

voor het eerst met het concept ‘econofysica’ in aanraking kwam, tijdens een lezing van

prof. dr. Jan Ryckebusch. Die paste in een gevarieerde lezingenreeks georganiseerd aan

de UGent ter ere van het wonderjaar waarin ene Albert Einstein honderd jaar eerder

een ware revolutie had ontketend in de natuurkunde. En het moet gezegd, die lezingen

maakten stuk voor stuk een meeslepende indruk op mij. Na de presentatie over de

fysica van financiele markten, stond mijn besluit vast: ik zou natuurkunde studeren.

Vooralsnog de beste beslissing van mijn leven. Daarom wil ik Jan Ryckebusch driemaal

bedanken. Ten eerste: voor die lezing. Ten tweede: als lesgever, om me anders te leren

denken over concepten als temperatuur, fasetransities en kritisch gedrag. Ten derde: als

promotor, voor de positieve raad en de aangename samenwerking. Dankuwel Jan.

Simon Standaert verdient hier tevens een vermelding, want in de prille beginfase van

mijn onderzoek werd ik door hem op weg geholpen doorheen de computercode. Ook

ben ik dankbaar voor de computationele hulp die me werd aangeboden door de immer

behulpzame Maarten Van Halst en Lesley De Cruz. Verder ben ik evenzeer de makers

van de vrije software waarop ik beroep heb gedaan, bijzonder erkentelijk.

i

Page 5: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Uiteraard mag ik mijn persoonlijke entourage niet vergeten, want ook zij hebben -op een

of andere manier- geholpen vorm te geven aan mijn denken. Bedankt zus, voor de hulp

en de vele discussies. Mijn vrienden, mijn medestudenten en de redactie van Schamperdank ik voor de bemoedigende woorden. En voor de moeite om alles na te lezen, heeft

Michael Houbraken nog een fles wijn van me te goed.

Ik zie deze masterproef niet als het eindpunt van mijn wetenschappelijke ontplooiing,

want na het indienen ervan zal mijn nieuwsgierigheid naar hoe de natuur in elkaar zit,

niet verdwenen zijn. Toch kan je een thesis in zekere zin beschouwen als het sluitstuk

van een eerste fase in een mensenleven. Dan komt plots het besef dat het mijn ouders

waren, die er als mecenassen voor gezorgd hebben dat ik me al die tijd zorgeloos op het

studeren kon focussen. En toegegeven, dan komt daarenboven het besef dat zij al die

tijd nog eens mijn asociaal gedrag moesten gedogen. Aan hen ben ik bijgevolg meer

dank verschuldigd dan aan wie ook op deze planeet.

Pieter Van Nuffel, juli 2011

ii

Page 6: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Samenvatting

In mijn masterproef onderzoek ik de entropie-evolutie van een systeem dat zich nietin evenwicht bevindt. Dat gebeurt aan de hand van simulaties van een vloeistof metbehulp van moleculaire dynamica. Deze modelleringstechniek heeft het voordeel dat deevolutie van het systeem in functie van de tijd kan gevolgd worden en dat deze tijdensde simulatie uit haar evenwichtstoestand kan gebracht worden. De onderliggende be-doeling is om het robuust gedrag van financiele markten te modelleren, met een focusop causale mechanismen en statistische wetten. Empirisch blijken de distributies vanaandelenprijzen namelijk niet gaussisch verdeeld te zijn (in tegenstelling tot wat doorklassieke economische modellen en het centraal-limiet-theorema wordt voorspeld), maarleptokurtosisch. Met de vorm van dergelijke distributie is een lagere informatie-entropiegeassocieerd dan met een gaussiche distributie. Deze leptokurtosische distributies wor-den tevens teruggevonden in de niet-evenwichtssimulatie.

Door beroep te doen op het shannoniaans concept van informatie-entropie, kan verderde theoretische uitdrukking voor de entropie van een ideaal gas herafgeleid worden.Deze entropie, die enkel temperatuursafhankelijk is, wordt met grote nauwkeurigheidteruggevonden uit de snelheidsdistributies van de deeltjes in de simulatie. Deze ideaalgas-entropie kan gebruikt worden als basis voor een methode om de entropie van eenvloeistof te berekenen, waarin de aanwezige correlaties voor een entropieverlaging zullenzorgen.

iii

Page 7: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Inhoudsopgave

Dankwoord i

Samenvatting iii

Inhoudsopgave v

Lijst van afkortingen en symbolen vi

1 Econofysica 11.1 De efficiente markt-hypothese . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Return . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.3 Geometrische brownse beweging . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.4 Empirische data: S&P 500-index . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.5 Waarschijnlijkheidsdistributie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.6 Machtswetten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.7 De tekortkomingen van de EMH . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.8 Naar een vloeistofmodel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 Moleculaire dynamica 122.1 Benaderingen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.2 Integratie-algoritme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.3 Systeemeenheden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.4 Lennard-Jones-potentiaal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.5 Het canonisch ensemble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.6 Programma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.6.1 Initialisatie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.6.2 Evolutie naar evenwicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.6.3 Productiefase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.7 Correlatiefuncties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.7.1 Radiale distributiefunctie . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.7.2 Snelheidsautocorrelatiefunctie . . . . . . . . . . . . . . . . . . . . . . . . . 212.7.3 Besluit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

iv

Page 8: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

3 Niet-evenwichts moleculaire dynamica 233.1 Zelfgeorganiseerde kritikaliteit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233.2 Softcore potentiaal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.3 Invloed van λ op de temperatuursevolutie . . . . . . . . . . . . . . . . . . . . . . 253.4 Vette staarten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273.5 Kurtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4 Entropie en informatie 314.1 Boltzmanndistributie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324.2 Entropie van een ideaal gas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324.3 Informatie-entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

4.3.1 Entropie a la Shannon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344.3.2 Entropie van de Maxwell-snelheidsdistributie . . . . . . . . . . . . . . . . 354.3.3 Configurationele entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.4 Entropie in de simulatie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394.5 Interactie-entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424.6 Entropie in NEMD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.6.1 Lokale entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464.6.2 Tijdsevolutie van de entropie . . . . . . . . . . . . . . . . . . . . . . . . . 48

5 Informatie-entropie in financiele markten: discussie 505.1 Informatie-entropie uit returns . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

5.1.1 Entropie en leptokurtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . 525.1.2 Entropiefluctuaties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

5.2 Dissipatie van informatie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 545.2.1 Bullwhip effect . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

5.3 Beperkingen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 565.3.1 Mapping van stapgroottes op returns . . . . . . . . . . . . . . . . . . . . . 565.3.2 Negatieve entropie-probleem . . . . . . . . . . . . . . . . . . . . . . . . . 57

6 Conclusies 596.1 Informatie-entropie van leptokurtosische distributies . . . . . . . . . . . . . . . . 596.2 Informatie-entropie van een ideaal gas . . . . . . . . . . . . . . . . . . . . . . . . 60

A Bepaling van de machtswetexponent 61

B Structuur van de broncode 63B.1 Subroutine voor berekening translationele entropie Str . . . . . . . . . . . . . . . 63B.2 Subroutine voor berekening lokale entropie . . . . . . . . . . . . . . . . . . . . . . 64

Lijst van referenties 67

Lijst van figuren 70

Lijst van tabellen 71

v

Page 9: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Gebruikte afkortingen en symbolen

CLT Centraal-limiet-theoremaEMH Efficiente markt-hypotheseGBB Geometrische brownse bewegingh Constante van Planck (≈ 6.626 · 10−34J · s)H HamiltoniaanH Informatie-entropieI Zelfinformatiek Constante van Boltzmann ( ≈ 1.38 · 10−23J/K)LJ Lennard-Jones (potentiaal)MD Moleculaire dynamicaMLE Maximum likelihood estimationN Aantal deeltjes in de simulatieNEMD Niet-evenwichts moleculaire dynamicapj Probabiliteit dat systeem zich in toestand j bevindtPDF ProbabiliteitsdistributiefunctieP (∆x) Distributie van de verplaatsingen op een tijdstapRDF Radiale distributiefunctieR(t) Return van een aandeel of een indexSDV Stochastische differentiaalvergelijkingS(t) (Een niet nader bepaalde) stochastische variabeleS Gereduceerde entropie per deeltje S

Nk

Str Entropie geassocieerd met de translationele vrijheidsgradenSpos(U = 0) Entropie geassocieerd met de positionele vrijheidsgraden in afwezigheid van interactiesSint(U) Entropie geassocieerd met de positionele vrijheidsgraden in aanwezigheid van interactiesT ∗ Temperatuur (in gereduceerde eenheden)U InteractiepotentiaalY (t) Waarde van een aandeel of een indexβ (kT )−1

γ2 Kurtosisζ Normeringsfactorλ Herschalingsfactor in het niet-evenwichtsprotocolλdB De Broglie-golflengte ( h√

3mkT, voor een deeltje in een ideaal gas)

λth Thermische golflengte ( h√2πmkT

, voor een deeltje in een ideaal gas)

µn ne moment van een distributieσ Standaardafwijkingτ Gereduceerd tijdsinterval tussen twee herschalingen in het niet-evenwichtsprotocolΩ Aantal mogelijke microtoestanden

vi

Page 10: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

vii

Page 11: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Hoofdstuk 1

Econofysica

De term ‘econofysica’, bedacht door E. Stanley in 1995, omschrijft het multidisciplinaironderzoeksveld dat gebruik maakt van methoden uit de statistische fysica in het do-mein van de economie. Statistische fysica probeert het gedrag van complexe systemenbestaande uit veel interagerende deeltjes te voorspellen. Financiele markten kunnen inzekere zin ook beschouwd worden als complexe systemen waarin vele spelers met elkaarin interactie treden. Die interacties kunnen in beide systemen een collectief emergentgedrag tot gevolg hebben: fasetransities of crashes. Bovendien is een financiele markteen complex adaptief systeem dat zich voortdurend aanpast aan de nieuwe informatie diede markt binnenkomt. Het is dus een open systeem dat zich nooit in evenwicht bevindt.

Deze ‘niet-evenwichts-kijk’ op markten staat in schril contrast met heel wat traditionelemodellen die ontwikkeld zijn in de context van de zogenaamde efficiente markt-hypothese(sectie 1.1). Opvallend is dat die economische modellen gebaseerd zijn op de dynamicavan een ander fysisch fenomeen: de brownse beweging. Dit geeft aanleiding tot gaussischedistributies (sectie 1.3).

Eerder dan van modellen, hebben natuurkundigen de gewoonte om te vertrekken van em-pirische gegevens. Daarom wordt de voorspelling dat de distributie van prijsveranderingengaussisch zal zijn, getoetst aan de ‘empirische’ distributies van reele financiele data (sec-tie 1.5). Centraal in de distributie vindt men dan weliswaar dat gaussisch gedrag terug,maar in de staarten observeert men een machtswet (sectie 1.6,[Man63]). In klassieke eco-nomische modellen wordt dat niet-gaussisch gedrag in de staarten doorgaans genegeerd,terwijl het net die machtswet is die fysici zo intrigeert.

Machtswetten zijn immers alomtegenwoordig in de natuur en worden in diverse systemenwaargenomen. Denk aan de machtswet van Gutenberg-Richter die de distributie van de

1

Page 12: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 1. ECONOFYSICA 2

intensiteit van aardbevingen beschrijft, of aan de Pareto-verdeling die de verdeling vanrijkdom of de frequentie van woorden in een tekst typeert [New05]. Ook fasetransi-ties worden gekarakteriseerd door het divergeren van een correlatielengte volgens eenmachtswet. De machtsfunctie komt tevoorschijn tijdens het kritisch moment waarop decomponenten van het systeem zich op een coherente manier gaan gedragen. Opvallendis dat de kritische exponent van die machtswet een universele constante is, die enkelafhangt van de dimensie van het syteem en van de aard van de interactie tussen decomponenten, maar verder onafhankelijk is van het soort systeem dat bestudeerd wordt[MC05]. Om die redenen wordt verwacht dat het machtsverband een emergent gevolg isvan de onderliggende dynamische structuur van het systeem [Bou00]. De ‘vette staar-ten’ accentueren de niet-lineaire mechanismen die gegenereerd worden door de sterkeonderlinge afhankelijkheid van de interagerende entiteiten. Daarom dringt een bottomup-benadering van complexe systemen –hier in het bijzonder van economische systemen–zich op.

1.1 De efficiente markt-hypothese

Volgens de efficient market hypothesis (EMH) is een markt efficient als alle beschikbareinformatie instantaan verwerkt wordt en alle prijzen zich ogenblikkelijk aan de nieuweinformatie aanpassen. De marktprijs op een gegeven moment reflecteert dus de verwach-tingen van alle rationele spelers, gebaseerd op alle beschikbare informatie in de markt[Fam70]. Daaruit volgt dat de nieuwe prijs enkel nog afhankelijk zal zijn van de nieuweinformatie die de markt binnenkomt. Aangezien die nieuwe informatie als een toevals-variabele wordt gezien (nieuws is per definitie onvoorspelbaar), zal ook de nieuwe prijsdie zich instelt nadat alle investeerders hun verwachtingen hebben berekend, willekeurigzijn [Bei07].

Dit paradigma werd geformuleerd in de jaren 60, maar heeft eigenlijk al haar wortels inhet werk van Louis Bachelier in 1900. Bachelier stelde in zijn Theorie de la speculation[Bac00] dat prijsfluctuaties kunnen beschreven worden door een stochastisch proces,meerbepaald door een ongecorreleerde random walk. Random walks hebben de Markov-eigenschap, wat inhoudt dat het verleden irrelevant is om de toekomst te voorspellenwanneer men het heden kent. De verwachtingswaarde E van de prijs Yt+1 op tijdstipt+ 1 zal dus gerelateerd zijn aan de gekende prijzen uit het verleden door de relatie

EYt+1|Y0, Y1, ..., Yt = Yt. (1.1)

Page 13: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 1. ECONOFYSICA 3

Dit impliceert dat het onmogelijk is om toekomstige prijsveranderingen te voorspellendoor het analyseren van tijdreeksen van prijsveranderingen. Prijsveranderingen wor-den bepaald door de willekeur van ‘goed’ of ‘slecht’ nieuws dat de markt binnenkomt.Omdat een economie in een geındustrialiseerde wereld eerder de tendens heeft om tegroeien, moet er echter een lichte bias naar ‘goed nieuws’ bestaan. Daarom kan aanhet basismodel van de random walk een driftterm toegevoegd worden die de gemiddeldetendens in rekening brengt. Dit wordt beschreven in sectie 1.3. Op dit model is de met-een-Nobelprijs-onderscheiden Black-Scholes-theorie voor het berekenen van optieprijzengebaseerd [BS73].

1.2 Return

We stellen ons eerst de vraag wat de meest geschikte variabele is om de tijdsevolutievan een indexprijs Y (t) te onderzoeken. Een logische definitie voor de return van eeninvestering zou er een zijn die het het percentage opbrengst binnen een periode ∆tweergeeft,

Rp(t) =Y (t+ ∆t)− Y (t)

Y (t). (1.2)

Een andere definitie van de return R(t) bestaat erin het verschil te nemen tussen denatuurlijke logaritmen van de opeenvolgende prijzen,

Rln(t) = lnY (t+ ∆t)Y (t)

. (1.3)

Voor hoogfrequente data, met kleine ∆t, herleidt deze definitie zich tot de vorige,

Rln(t) = ln(

1 +Y (t+ ∆t)− Y (t)

Y (t)

)≈ Y (t+ ∆t)− Y (t)

Y (t)= Rp(t). (1.4)

Het voordeel van de procentuele definitie van de return Rp is dat deze verdwijnt als deprijs tijdens de eerste tijdstap p procent stijgt en tijdens de volgende tijdstap p procentdaalt (Rp = 0, terwijl Rln = ln(1 + p) + ln(1 − p) 6= 0 als p 6= 0). Het voordeel vande logaritmische definitie van de return Rln is dat deze verdwijnt als de prijs eerst eenfactor f groter wordt en daarna f keer verkleint (Rln = 0, terwijl Rp = f + 1

f − 2 6= 0als f 6= 1).

1.3 Geometrische brownse beweging

De beweging van stuifmeelkorrels in een vloeistof volgt een grillig en willekeurig patroon,zag de botanicus Robert Brown in zijn microscoop. In 1905 veronderstelde Einstein

Page 14: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 1. ECONOFYSICA 4

een random walk-model met stappen van dezelfde grootte, waartussen geen correlatiesbestaan, om deze brownse beweging te verklaren als een stochastisch proces. Op dezelfdemanier kan ook de schijnbaar willekeurige schommeling van indexprijzen onderhevig zijnaan een stochastisch proces. Algemeen wordt de tijdsevolutie van een stochastischevariabele S(t) beschreven door een stochastische differentiaalvergelijking (SDV), waarineen van de termen dat stochastisch proces voorstelt. Deze SDV kan bijvoorbeeld dekarakteristieke vorm

dS(t) = µS(t)dt+ σS(t)dz(t). (1.5)

aannemen. In dat geval spreekt men van een geometrische brownse beweging (GBB).In het standaardmodel voor aandelenprijzen is de variabele S(t) dan de indexprijs1

die elke infinitesimale tijdstap dt bepaald wordt door vergelijking (1.5). De tweede termis de diffusieterm waarin dz(t) het stochastisch proces voorstelt. In het GBB-model is ditdus het Wiener-proces dz = ε

√dt, waarbij ε getrokken wordt uit een normale verdeling,

met gemiddelde 0 en standaardafwijking 1. De constante µ wordt de driftcoefficientgenoemd en stelt in het financieel GBB-model de verwachte return (1.2) per tijdseenheidvoor. De grootte van de fluctuaties daarop wordt bepaald door de standaardafwijking σ,ook de volatiliteit genoemd. Belangrijk is dat het GBB-model de veronderstelling2maaktdat deze σ onafhankelijk zal zijn van de tijd t en van de prijs S(t).

Ten gevolge van de stochastische term kunnen we niet zomaar dSS = d lnS stellen [Voi05].

Het lemma van Ito laat evenwel toe om de differentiaal van een functie f(S(t), t) teberekenen wanneer de SDV van S(t) gekend is,

df(S(t), t) = (∂f

∂t+ µS

∂f

∂S+

12

(σS)2 ∂2f

∂S2 )dt+ σS∂f

∂Sdz. (1.6)

Dit volgt uit een Taylorexpansie van df(S(t), t) en substitutie van (1.5). Wanneer wedaarin f(S(t), t) = f(S(t)) = lnS(t) stellen, dan vinden we de elegante vergelijking

d lnS(t) = (µ− σ2

2)dt+ σdz(t), (1.7)

met als oplossing

S(t) = exp(

(µ− σ2

2)t+ σz(t)

)S(t = 0). (1.8)

1In het oorspronkelijke random walk -model van Bachelier werd de nieuwe prijs berekend door een

additieve ruisterm op te tellen bij de vorige prijs, waardoor prijzen in principe negatief konden wor-

den. GBB daarentegen, een multiplicatief random walk -model, bevat een multiplicatieve ruis S(t)dz(t).

Daardoor zullen nu de logaritmen van de prijs (dus de returns) aan een additieve ruis onderworpen zijn

(vergelijking 1.7) en wordt het negatieve prijzen-probleem uit Bacheliers model vermeden.2Al kan dit standaard-GBB-model uitgebreid worden met een σ(t, S(t)) of met een stochastische

volatiliteit die bepaald wordt door een ander GBB-proces (zoals GARCH-modellen, [MS99]).

Page 15: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 1. ECONOFYSICA 5

We zien dat de indexprijzen een log-normaal proces volgen. Hun logaritme, lnS(t) volgtdus een gaussische verdeling met verwachtingswaarde lnS0 + (µ− σ2

2 )t.

0 2000 4000 6000 8000 10000 12000 14000 16000Tijd t

10-6

10-3

100

103

106

109

1012

1015

1018

1021

1024

1027

1030

1033

1036

S(t)

µ=0.0045, σ=0.07

µ=0.0045, σ=0.07

µ=0.0055, σ=0.07

µ=0.0045, σ=0.09

Figuur 1.1: De tijdsevolutie van de stochastische variabele S(t) voor verschillende waarden van µ en

σ. De gele lijn volgt een SDV met een grotere driftterm µ en bijgevolg een sterker stijgende

trend. De groene lijn volgt een SDV met een hogere diffusieterm σ en vertoont bijgevolg

sterkere fluctuaties en een minder sterk stijgende trend.

Voorbeelden van enkele GBB-processen zijn te zien in figuur 1.1. De tijdsevolutie vanS(t) vertoont fluctuaties van de orde σ, maar volgt gemiddeld een trend die afhangt vanµ− σ2

2 .Ook de waarde van de return zal een gemiddelde trend volgen. Hierbij wordt het

belangrijk om een onderscheid te maken tussen beide definities. We vinden namelijk alsverwachtingswaarde voor Rln(t) = d lnS(t) een trend (µ− σ2

2 ) en voor Rp(t) = dS(t)S(t) een

trend µ.

1.4 Empirische data: S&P 500-index

De S&P 500-index is een beursindex van de Verenigde Staten die een betrouwbaar beeldgeeft van de ontwikkelingen op de aandelenmarkt. De 500 grootste Amerikaanse bedrij-

Page 16: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 1. ECONOFYSICA 6

1950 1960 1970 1980 1990 2000 2010Tijd t

0.00

0.05

0.10

0.15

0.20

0.25Re

turn

s |R

(t)|

Figuur 1.2: De absolute waarde van de returns van de S&P 500-index van 3 januari 1950 tot 8 april

2011. De piek in 1987 is de handtekening van de beurscrash op Black Monday.

ven zijn erin opgenomen met een gewicht dat afhankelijk is van hun marktkapitalisatie.De index wordt samengesteld door de kredietbeoordelaar Standard & Poor’s. Op basisvan de intraday gegevens van de S&P 500, die vrij beschikbaar zijn op [yah], worden deindexprijzen Y (t) per dag geanalyseerd. De gegevens lopen over een periode van 3 janu-ari 1950 tot en met 8 april 2011. Deze grote hoeveelheid data maakt de S&P 500-indexgeschikt om te onderzoeken of het GBB-model in overeenstemming is met de empirischeobservaties.

Om de tijdsevolutie van een indexprijs Y (t) te karakteriseren, werd in sectie 1.2 dereturn R(t,∆t) = ln Y (t+∆t)

Y (t) ≈ Y (t+∆t)−Y (t)Y (t) gedefinieerd. Het tijdsvenster ∆t is in dit

geval een beursdag. In figuur 1.2 is het tijdsverloop van de absolute waarde van de S&P500-returns te zien. Die zijn meestal klein (van de orde 1 procent), al worden er ook eenaantal returns geobserveerd die uitzonderlijk hoog zijn (tot 22.6 procent). Zo is er opmaandag 19 oktober 1987 een duidelijke piek te zien. Die dag, ‘Black Monday’, crashtende beurzen wereldwijd. Het af en toe opduiken van dergelijke extreem hoge returns ende grote variantie in de returns is typerend voor een onderliggend niet-gaussisch proces.

Laten we deze returns daarom eens vergelijken met de returns uit het model van geo-metrisch brownse beweging (wel een gaussisch proces). Als we de standaardafwijkingvan de fluctuaties in de returns berekenen, dan kunnen we een waarde voor de drift µen de diffusie σ bepalen. Dit resulteert in µ = 0.000378 en σ = 0.00967. Hiermee kan

Page 17: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 1. ECONOFYSICA 7

een GBB-simulatie uitgevoerd worden die geassocieerd is met de robuuste gegevens vande S&P 500-index. Uit figuur 1.3 wordt duidelijk dat de GBB-returns steeds kleinerblijven dan 0.05, terwijl die van de reele data af en toe veel extremere waarden kunnenaannemen.

Figuur 1.3: De S&P 500 absolute returns (boven) vergeleken met de absolute returns van het GBB-

model (onder) waarin µ = 0.003778 en σ = 0.00967 voor 15416 simulatiestappen.

1.5 Waarschijnlijkheidsdistributie

De efficiente markt-hypothese impliceert dat de distributies van prijsveranderingen gaus-sisch moeten zijn. Het centraal-limiet-theorema (CLT) stelt immers dat de distributieP (xn) van de som van n onderling onafhankelijke en gelijk verdeelde stochastische vari-abelen xi met eindige variantie, een normaalverdeling zal volgen in de limiet n→∞.

We kunnen dat nagaan dat door de returns die bekomen worden uit een GBB-simulatie3 te normaliseren met hun standaardafwijking en ze te rangschikken in een PDF.Deze PDF is geplot in figuur 1.4 voor een GBB-proces met µ = 0.003778 en σ = 0.00967.

3De term dz(t) in formule 1.5 van het GBB-model vereist gaussisch verdeelde pseudo-randomgetallen.

Voor figuur 1.3 werden deze gegenereerd met de Box-Muller-methode. Deze methode schiet echter tekort

om de normaaldistributie ook in de buurt van R ≈ 0 te genereren. Daarom werd hier gebruik gemaakt

van de gaussische data uit de maxwelldistributies die in de MD-simulatie gegenereerd werden (fig. 4.2).

Page 18: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 1. ECONOFYSICA 8

Ter vergelijking toont de figuur tevens de distributie P (Rσ ) van de S&P 500-returns,genormaliseerd met hun standaardafwijking σ. We zien dat zeer kleine fluctuaties fre-quenter voorkomen dan voorspeld door de gaussische GBB-distributies, terwijl gemid-delde fluctuaties minder frequent voorkomen. Extreem hoge returns lijken dan weer veelfrequenter voor te komen. Black monday blijkt zelfs een 21σ-event te zijn. De kansdat zo’n gebeurtenis zich ooit voordoet onder de assumpties van de EMH is verwaar-loosbaar klein. Het verbaast dan ook niet dat na de beurscrash van 1987 de efficientemarkt-hypothese in vraag gesteld werd.

20 15 10 5 0 5 10 15Return R/σ

10-3

10-2

10-1

100

P(R/σ

)

GBB-modelS&P500

Figuur 1.4: De probabiliteitsdistributie van de genormaliseerde returns van de S&P 500-index wordt

vergeleken met die van het GBB-model op log-lineaire schaal. Het geısoleerde event bij

−21.2σ is de return op Black Monday.

1.6 Machtswetten

We onderzoeken nu de waarschijnlijkheid dat de PDF van de returns p(R′) een waardeaanneemt die groter dan of gelijk is aan R,

Pc(R) =∫ ∞R

p(R′)dR′. (1.9)

Page 19: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 1. ECONOFYSICA 9

Deze cumulatieve distributiefunctie (CDF) Pc(R) bezit meer gegevens in haar staartenen zal minder afhankelijk zijn van de gekozen bin-groottes. Daarom is ze beter geschiktom een machtswet te observeren [New05]. Laten we eens veronderstellen dat de CDFvan de S&P 500-returns aan een machtswet

Pc(R > Rmin) = C ·R−α (1.10)

gehoorzaamt, vanaf Rmin = 0.015. Met behulp van een maximum likelihood methode(beschreven in appendix A) kunnen we de exponent α bepalen. Op basis van een fit aannp = 2585 punten in de staart van de CDF, vinden we de waarde α = 3.315± 0.046. Ditis in overeenstemming met de resultaten van [GPA+99] waarin α bepaald werd volgenseen andere methode (beschreven in [Hil75]): voor CDF’s van returns met tijdsvensters∆t < 4 dagen wordt telkens een exponent α ≈ 3 teruggevonden.

10-3 10-2 10-1

Returns R

10-4

10-3

10-2

10-1

100

101

CDF Pc(R

)

Figuur 1.5: Aan de cumulatieve distributiefunctie van de positieve returns wordt een machtswetstaart

gefit met α = 3.3146 en C = 1.235 · 10−7 (op log-log-schaal).

Als de CDF asymptotisch een machtswet volgt, zal ook de PDF asymptotisch eenmachtswet volgen. Integratie van een machtswet p(R′) = C ′ ·R′−β levert immers een

Page 20: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 1. ECONOFYSICA 10

nieuwe machtswet:

Pc(R) = C ′∫ ∞R

R′−βdR′ =C ′

β − 1R−(β−1). (1.11)

De machtswet-exponent β in de staart van de PDF van de returns is dus gerelateerd aandie van de CDF door β = α+ 1 ≈ 4.3.

Machtswetten hebben de schaalinvariante eigenschap P (cR) ∼ P (R). In tegenstel-ling tot normaalverdelingen, bezitten ze geen karakteristieke schaal: het is bijvoorbeeldniet mogelijk om een maximale grootte voor een return te definieren. Daarom kunnenmachtswetten contra-intuıtief zijn. Wanneer men fenomenen waarvan de distributie eenmachtswet volgt, probeert te modelleren met gaussische distributies kan dit bijgevolgleiden tot een verkeerde inschatting van de realiteit [Tal08].

1.7 De tekortkomingen van de EMH

Hoewel het GBB-model een eerste benadering levert om het robuust gedrag van de datavan financiele markten te modelleren, vertoont het enkele tekortkomingen. De hypothesedat markten efficient zijn en dat alle informatie ogenblikkelijk in de prijs verwerkt zit,is van toepassing op een geıdealiseerd systeem. Reele markten zijn slechts benaderendefficient. Met het voorgaande in gedachten, bakenen we aan de hand van de empirischedata de limieten van de EMH af.

Enerzijds blijkt bij het testen van de efficient market hypothesis dat tijdscorrela-ties tussen prijsveranderingen inderdaad verwaarloosbaar zijn. In [LGC+99] wordt bij-voorbeeld aangetoond dat de autocorrelatiefunctie van de returns exponentieel naar nulvervalt binnen korte tijd (∼ exp(− t

τ ) met τ ≈ 4 minuten). Dit is in overeenstemmingmet de idee dat in een efficiente markt de mogelijkheid van arbitrage dergelijke corre-laties snel wegfiltert en dat toekomstige aandelenprijzen niet voorspeld kunnen wordenop basis van hun verleden.

Anderzijds wijzen empirische observaties er echter ook op dat het mogelijk is omop grotere tijdschaal hogere orde-correlaties terug te vinden [MS99]. Zonder dergelijke‘lange dracht’-correlaties zouden de extreme fluctuaties moeilijk te verklaren zijn. Beurs-crashes zouden dan enkel kunnen optreden ten gevolge van gebeurtenissen van buitenaf(rampen), niet door de dynamica van het systeem zelf. Verder blijkt de volatiliteit inreele data tijdsafhankelijk te zijn –in tegenstelling tot de veronderstellingen die gemaaktwerden in sectie 1.3– en treden er fenomenen als volatiliteitsclustering op [MS99].

De empirische return-distributies van de S&P 500 komen niet volledig overeen methet veralgemeend GBB-model. De zeldzame ‘uitschieters’ die zich in de staarten van de

Page 21: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 1. ECONOFYSICA 11

distributie bevinden, worden niet gereproduceerd, terwijl het net deze zeldzame gebeur-tenissen zijn die een grote impact kunnen hebben. Dit wijst erop dat het gebruik vandit GBB-model kan leiden tot het onderschatten van risico’s.

1.8 Naar een vloeistofmodel

De 61-jarige tijdreeks van de dagelijkse S&P 500-indexprijzen (alsook andere indexprij-zen [GPA+99]) toont dat extreme prijsvariaties veel frequenter blijken voor te komendan verwacht vanuit het GBB-paradigma. Vanuit de geometrisch brownse beweging zijnde ‘vette staarten’ die we in de return-distributies hebben waargenomen immers moeilijkte begrijpen.

De bedoeling is om een simulatiemodel te vinden dat dergelijke fenomenen vanuithun onderliggende ‘universele’ dynamica tracht te verklaren. Daarvoor wordt een vloei-stofmodel vooropgesteld. In een vloeistof bewegen de deeltjes niet onafhankelijk vanelkaar (in tegenstelling tot een ideaal gas). Er bestaat geen lange dracht-orde (in te-genstelling tot een vaste stof), maar er zijn wel sterke korte dracht-correlaties aanwezig[Ryc10]. We insinueren dat economische modellen die gebaseerd zijn op de dynamicavan de brownse beweging en waarin prijsveranderingen gezien worden als onafhankelijkerandom-variabelen, kunnen verbeterd worden door ze te baseren op een systeem waarinopeenvolgende toestanden niet langer ongecorreleerd zijn.

Zulk vloeistofmodel wordt gesimuleerd met de techniek van moleculaire dynamica(MD), die in hoofdstuk 2 uiteengezet wordt. Hoewel de opeenvolgende stappen in dieevenwichts-MD-simulatie gecorreleerd zijn, zal de distributie van de stapgroottes van dedeeltjes nog steeds een gaussische vorm hebben. We werken immers nog altijd in hetevenwichtsformalisme, terwijl we geponeerd hebbend dat markten zich niet in evenwichtbevinden. Daarom zullen we in hoofdstuk 3 een methode introduceren om de simulatieuit evenwicht te drijven, met de bedoeling om ook die andere robuuste eigenschap vanmarkten – ‘vette staarten’ in de distributie van prijsveranderingen– te genereren. Eenvloeistofmodel waarin dergelijke niet-gaussische distributies opduiken, zou een meer ac-curate beschrijving kunnen geven van de geobserveerde dynamische eigenschappen vanfinanciele markten.

Page 22: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Hoofdstuk 2

Moleculaire dynamica

Thermodynamische grootheden kunnen voorspeld worden door uit te middelen over allemogelijke microtoestanden waarin een veeldeeltjessysteem zich kan bevinden. Zoiets voorreele systemen op een computer simuleren is echter onbegonnen werk. Gelukkig kunnenwe die uitmiddeling over de mogelijke microtoestanden relateren aan een uitmiddelingover tijd, in de veronderstelling dat elke microtoestand even waarschijnlijk wordt alshet systeem maar lang genoeg gevolgd wordt. Dit ergodisch principe rechtvaardigt debenadering om uit te middelen over een beperkte set configuraties. De methode van mo-leculaire dynamica laat ons toe om die configuraties een voor een uit elkaar te genererendoor numeriek alle bewegingsvergelijkingen te integreren. Het N -deeltjessysteem volgtdan een pad in de faseruimte waarvan de positionele coordinaten ~ri bepaald worden doorde oplossing van deze bewegingsvergelijkingen:

d2~ridt2

=~Fimi

∀i = 1, ..., N. (2.1)

Hierin is mi de massa van deeltje i. De kracht ~Fi die op elk deeltje inwerkt, wordtteruggevonden als de som van de interacties met alle andere deeltjes in het systeem:

~Fi =N∑

j=1,j 6=iF (|~ri − ~rj |)~eij , (2.2)

met ~eij de eenheidsvector die gericht is volgens ~rj − ~ri.

2.1 Benaderingen

Moleculaire dynamica is dus de simulatietechniek waarin de tijdsevolutie van een grootaantal deeltjes bepaald wordt door na elke stap de differentiaalvergelijkingen (2.1) nu-

12

Page 23: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 2. MOLECULAIRE DYNAMICA 13

meriek op te lossen. Deze oplossingen zullen benaderend zijn, omwille van de volgenderedenen [Thi99]:

• We beperken ons tot een klassieke beschrijving: kwantumeffecten worden gene-geerd. Het verwaarlozen van interferentie-effecten tussen de de Broglie-golven vande deeltjes is pas gerechtvaardigd als

λdB l, (2.3)

waarin l = ( VN )13 de gemiddelde separatie tussen de deeltjes voorstelt en λdB = h√

3mkT

hun de Broglie-golflengte is [Ryc10]. In het geval van Argon-atomen bij kamertem-peratuur (≈ 2.7 · 1020 atomen per cm3) vinden we bijvoorbeeld dat

l ≈ 1.55 · 10−9m, λdB ≈ 2.35 · 10−11m. (2.4)

Onder zulke normale omstandigheden (geen te hoge dichtheid, geen te lage tempe-ratuur) bevinden we ons dus in het klassiek regime en kunnen we het golfkaraktervan de deeltjes gerust buiten beschouwing laten.

• De interactiepotentiaal is niet exact gekend, enkel in geparametriseerde vorm. Deinteractie tussen twee deeltjes in een ideale vloeistof kan bijvoorbeeld benaderdworden door de fenomenologische Lennard-Jones-potentiaal (2.10).

• We doen beroep op de veronderstelling dat alle mogelijke toestanden even waar-schijnlijk zullen zijn (het ergodisch principe). Een uitmiddeling van een fysischegrootheid O over alle mogelijke configuraties 〈O〉 zal bijgevolg equivalent zijn aaneen uitmiddeling O over de tijd,

〈O〉 = O = limT →∞

1T

∫ T0Odt. (2.5)

• De computationele kost is N2-afhankelijk. Typische simulaties draaien daaromslechts met N ∼ 103 deeltjes. Er kan dus enkel een zeer klein deel van een reeelsysteem (met N ∼ 1023) gesimuleerd worden. Dit laat zich voelen in de verhoogdeoppervlakte-bulkverhouding. Beschouwen we bijvoorbeeld een 10x10x10-volume,dan zitten er van de 1000 deeltjes 488 op het oppervlak, een verhouding die veel tehoog is in vergelijking met de werkelijkheid. Om dit probleem te omzeilen kunnenwe ons simulatiesysteem omringen met oneindig veel equivalente replica’s ervan.We passen periodieke randvoorwaarden toe zodat deeltjes die aan het oppervlakverdwijnen, langs de andere zijde van het simulatievolume opnieuw verschijnen.

Page 24: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 2. MOLECULAIRE DYNAMICA 14

De kracht ~Fij die op deeltje i inwerkt ten gevolge van deeltje j, is dan de somvan de krachten tussen deeltje i en alle kopieen van deeltje j. Omdat de krachtendoorgaans een eindige dracht hebben, kunnen we de berekeningen echter vereen-voudigen met behulp van de minimum image convention: de interactie tussen tweedeeltjes wordt bepaald door het eerste deeltje en door de meest nabije kopie vanhet tweede deeltje.

• In een simulatie zijn ruimte en tijd niet continu aangezien de bewegingsverge-lijkingen enkel kunnen opgelost worden voor een eindige tijdstap ∆t. Er zullendus steeds afwijkingen van de orde (∆t)n optreden (met n = 2 voor het hieron-der beschreven snelheids-Verlet-algoritme). In een typische simulatie is ∆t van degrootteorde 0.001 in systeemeenheden. Zoals wordt uitgelegd wordt in sectie 2.3,komt dat voor een vloeistof in de realiteit overeenkomt met 10−17 seconden.

2.2 Integratie-algoritme

Om de differentiaalvergelijkingen (2.1) op te lossen wordt beroep gedaan op het snelheids-Verlet-algoritme. Met behulp van de Taylor-ontwikkeling vinden we benaderend telkensde nieuwe positie ~ri, snelheid ~vi en versnelling ~ai van deeltje i :

~ri(t+ ∆t) = ~ri(t) + ~vi(t)∆t+12~ai(t)∆t2 (2.6)

~vi(t+ ∆t) = ~vi(t) + ~ai(t)∆t+12~bi(t)∆t2 (2.7)

~ai(t+ ∆t) = ~ai(t) + ~bi(t)∆t, (2.8)

met ~bi = d~aidt de jerk van deeltje i.

Bij het snelheids-Verlet-algoritme wordt de snelheid berekend uit:

~vi(t+ ∆t) = ~vi(t) +~ai(t) + ~ai(t+ ∆t)

2∆t, (2.9)

wat als voordeel heeft dat snelheden en posities op dezelfde ogenblikken kunnen bepaaldworden. De positie wordt bij elke simulatiestap berekend uit formule (2.7). De ver-snelling ~ai = ~Fi

miwordt daarin telkens bepaald aan de hand van vergelijking (2.2). Op

welbepaalde tijdstappen wordt ~ri(t+ ∆t)− ~ri(t) bijgehouden om er later de distributievan de stapgroottes uit te kunnen bepalen (sectie 3.4). De cumulatieve fout van hetsnelheids-Verlet-algoritme schaalt volgens (∆t)2. Zoals blijkt uit figuur 2.2 belet ditsymplectisch integratieschema het optreden van een energiedrift [Thi99].

Page 25: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 2. MOLECULAIRE DYNAMICA 15

2.3 Systeemeenheden

Om de computationele berekeningen te vereenvoudigen, wordt er gewerkt met gere-duceerde eenheden, waarbij telkens gedeeld wordt door de karakteristieke schaal. Deinteractiepotentiaal wordt vaak gemodelleerd door een Lennard-Jones-potentiaal:

ULJ(r) = 4ε[(σ

r)12 − (

σ

r)6]. (2.10)

De grootheden ε en σ bepalen dan respectievelijk de energie- en de lengteschaal vande interactie. Omdat in het geval van Argon-atomen de LJ-potentiaal de empirischverkregen potentiaal uitermate goed benadert (fig. 2.1), kiezen we de parameters voorArgon als systeemeenheden:

εArkB

= 119.8K (2.11)

σAr = 3.405 · 10−10m (2.12)

mAr = 6.633517 · 10−26kg (2.13)

De energie wordt dan gemeten in functie van εAr (E∗ = EεAr

), lengtes in functie van σAr

( r∗ = rσAr

) en bijgevolg tijd in functie van√

mArσ2Ar

εAr(t∗ = t

√εAr

mArσ2Ar

) en temperatuur in

functie van eenheden 119.8K (T ∗ = kBεAr

T ). In hoofdstuk 4 zal de entropie S doorgaansuitgedrukt worden als de dimensieloze gereduceerde entropie per deeltje, S = S

Nk .

2.4 Lennard-Jones-potentiaal

Wanneer we de LJ-potentiaal (2.10) bekijken, dan vinden we volgende eigenschappen:

• een korte dracht: zoals te zien in figuur 2.1 verdwijnt de potentiaal nagenoeg voorr > 3, zodat enkel interacties in rekening gebracht moeten worden voor deeltjesdie zich dicht bij elkaar bevinden. In de simulatie is het daarom computationeelvoordelig om een lijst bij te houden van deeltjes die zich binnen een bepaalderadius van elkaar bevinden en die lijst slechts om een bepaald aantal tijdstappente actualiseren.

• attractief voor r > 1, door de vanderwaals-interacties.

• harde kern waarin een sterk repulsieve kracht heerst, te wijten aan het eindigvolume dat elk atoom inneemt. De potentiaal divergeert voor r → 0, zodat op het

Page 26: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 2. MOLECULAIRE DYNAMICA 16

Figuur 2.1: De fenemenologische LJ-potentiaal komt overeen met de empirische potentiaalcurve voor

twee Argon-atomen in functie van hun interatomaire afstand R = r · 3.405A. [wik]

moment dat de elektronenwolken van twee atomen atomen beginnen te overlappen,er een oneindig hoge kinetische energie nodig zou zijn om die potentiaalbarriere teoverwinnen.

2.5 Het canonisch ensemble

Er wordt gewerkt in het canonisch (T, V,N)-ensemble waarin temperatuur T , aantaldeeltjes N en volume V van het systeem initieel worden ingegeven en constant wor-den gehouden doorheen de tijd. Een ensemble is de verzameling van alle mogelijkemicrotoestanden x1, ..., pN die aanleiding geven tot eenzelfde macrotoestand. Dezemacrotoestand wordt enkel bepaald door externe parameters die vast gehouden worden.De microtoestanden worden vertegenwoordigd door punten in een 6N -dimensionale fa-seruimte. Als de deeltjes geen interne vrijheidsgraden bezitten, wordt de microtoestandimmers enkel bepaald door de ruimtelijke posities ~xj en door de coordinaten in de mo-mentumruimte ~pj (j = 1, ..., N).

Om de gemiddelde waarde van een bepaalde observabele O te bepalen, moeten wedeze uitmiddelen over het deel van de faseruimte dat door het ensemble wordt beschreven.

Page 27: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 2. MOLECULAIRE DYNAMICA 17

Dit ensemblegemiddelde wordt dus gedefinieerd door:

〈O〉 =1Z

∫O(~xi, ~pi)ψ(~xi, ~pi)d3~x1...d

3~xNd3~p1...d

3~pN , (2.14)

met normering

Z =∫ψ(~xi, ~pi)d3~x1...d

3~xNd3~p1...d

3~pN . (2.15)

De distributie ψ(~xi, ~pi) bepaalt het gewicht dat aan elk punt in de faseruimte wordtgegeven. De vorm ervan is afhankelijk van het ensemble.

Voor het microcanonisch (E, V,N)-ensemble is dit bijvoorbeeld gewoon de delta-functie ψENV (~xi, ~pi) = δ(H(~xi, ~pi)− E) die behoud van energie verzekert. In het cano-nisch ensemble is deze gelijk aan de boltzmannfactor ψTNV (~xi, ~pi) = exp(−βH(~xi, ~pi)),zoals wordt aangetoond in sectie 4.1.

2.6 Programma

2.6.1 Initialisatie

Het aantal deeltjes N , de dichtheid ρ, de gewenste temperatuur T en het aantal tijd-stappen worden als parameters ingegeven. Initieel worden de deeltjes op een roostergezet. In het geval van Argon-atomen is een FCC-rooster namelijk de meest stabieleconfiguratie. Omdat elke eenheidscel dan vier atomen bevat, wordt het deeltjesaantaldoorgaans N = 4M3 = 256, 500, 864, ... gekozen. De initiele snelheden worden verdeeldvolgens een Maxwell-Boltzmann-distributie. Dit gebeurt door elke snelheidscomponentuit een Gaussische distributie met gemiddelde 0 en standaardafwijking 1 te trekken endaarna deze dimensieloze getallen te schalen met een standaardafwijking

√kTm . Aan-

gezien snelheid uitgedrukt wordt in functie van√

εArmAr

wordt dit in systeemeenheden

v∗j = v0j

√T ∗

m∗ . Daarna wordt de totale impuls ~ptot berekend en wordt ~ptotNmi

van de initielesnelheidsvector van elk deeltje afgetrokken, zodat de totale impuls van het systeem terugnul wordt.

2.6.2 Evolutie naar evenwicht

We laten het systeem thermaliseren. De bewegingsvergelijkingen worden geıntegreerdmet behulp van het snelheids-Verlet-algoritme. De tijd die het systeem nodig heeft omevenwicht te bereiken is afhankelijk van de initiele condities. Deze relaxatietijd zal groterzijn dan de tijdscorrelaties in het systeem. Wanneer het systeem in evenwicht is, zal detemperatuur fluctueren rond een evenwichtswaarde die in het algemeen zal afwijken van

Page 28: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 2. MOLECULAIRE DYNAMICA 18

de initieel gewenste temperatuur TD. Daarom wordt de snelheid tijdens deze fase nawelbepaalde tijdsintervallen (bijvoorbeeld twintig simulatiestappen) herschaald met eenfactor

λ =

√(N − 1)3kBTD∑N

i=1miv2i

. (2.16)

Hierin is∑N

i=1miv2i de totale kinetische energie van N deeltjes, uitgemiddeld over die

twintig tijdstappen. Wanneer λ naar 1 convergeert (of T naar TD, volgens het equipar-titietheorema) en wanneer de fluctuaties tussen de opeenvolgende λ‘s verwaarloosbaarworden (dan is T ongeveer constant) wordt evenwicht verondersteld en kan de produc-tiefase van start gaan.

2.6.3 Productiefase

Eens evenwicht bereikt is, wordt de tijd terug op nul gezet en worden de thermody-namische grootheden en correlatiefuncties berekend. Als het systeem n0 thermalisatie-stappen nodig heeft om tot evenwicht te komen, wordt het ensemblegemiddelde van eenstatische fysische grootheid O bepaald uit n integratiestappen, volgens

O =1

n− n0

n∑ν>n0

Oν . (2.17)

Kinetische energie

De kinetische energie Ek van het systeem wordt op elke tijdstap bepaald uit:

Ek(t) =12

N∑i=1

miv2i (t). (2.18)

Temperatuur

Met behulp van het equipartitietheorema, vindt men dan de temperatuur T :

T (t) =∑N

i=1miv2i (t)

3k(N − 1). (2.19)

Potentiele energie

De potentiele energie Ep van het systeem wordt bepaald door de interactiepotentiaal Utussen alle deeltjesparen op te tellen.

Ep(t) =N∑

i<j=1

U(|~ri − ~rj |). (2.20)

Page 29: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 2. MOLECULAIRE DYNAMICA 19

Figuur 2.2: De tijdsevolutie van de potentiele energie Epot, kinetische energie Ekin en hun som Etot,

voor een simulatie met 256 deeltjes bij ρ∗ = 0.5 en T ∗ = 0.7.

Hierin is |~ri − ~rj | de afstand tussen beide deeltjes (volgens de minimale beeldconventie,zoals uitgelegd in sectie 2.1)

Het Verlet-algoritme heeft de eigenschap dat het de totale energie constant houdt,daarom zal Ep(t) +Ek(t) opgeslagen worden ter controle. Het behoud van energie en detemperatuurfluctuaties zijn voor een typische simulatie te zien in figuur 2.2.

2.7 Correlatiefuncties

Het random walk -model negeert het effect van de interacties tussen de deeltjes, waardooropeenvolgende stappen ongecorreleerd zijn. Het schiet dus tekort om de sterke correlatiesten gevolge van de korte dracht-interacties in een vloeistof te verklaren. Om inzichtin dergelijke correlaties te krijgen, kunnen we correlatiefuncties introduceren. Daarmeekunnen we bovendien nagaan of het systeem zich in een vaste, gasvormige of vloeistoffasebevindt.

Page 30: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 2. MOLECULAIRE DYNAMICA 20

2.7.1 Radiale distributiefunctie

De radiale distributiefunctie (RDF) geeft een beeld van de ruimtelijke correlaties in hetsysteem. Deze wordt gedefinieerd als [Ryc10]:

g(2)(r) =(V

N

)2

N(N − 1)

∫d~r3

∫d~r4...

∫d ~rN exp(−β

∑i<j U(|~ri − ~rj |)∫

d~r1

∫d~r2

∫d~r3...

∫d ~rN exp(−β

∑i<j U(|~ri − ~rj |)

. (2.21)

en geeft de kans om op een afstand r van een referentiedeeltje een ander deeltje te vinden.Het aantal moleculen in een bolschil tussen r en r + ∆r wordt dan gegeven door:

N

Vg(2)(r)4πr2∆r. (2.22)

Als we dit integreren over het volledige simulatievolume, vinden we uiteraard

N

V

∫g(2)(r)4πr2∆r = N − 1. (2.23)

In de praktijk zal een histogram voor elk interval [r, r+ ∆r] het aantal deeltjesparenn(r) bijhouden die zich op een afstand ∆r van elkaar bevinden. De maximale afstandtussen twee deeltjes is de helft van de lengte van het simulatievolume, zodat voor eenhistogram dat I dergelijke intervallen bevat, de grootte van elk interval gegeven wordtdoor: ∆r = boxsize

2I . Wanneer alles in het histogram opgeteld wordt, dan vinden we

boxsize/2∑r

n(r) =N(N − 1)

2. (2.24)

Dit is het equivalent van (2.23). We kunnen de radiale distributiefunctie dus uit hethistogram berekenen volgens:

g(2)(r) =2VN2

n(r)4πr2∆r

. (2.25)

Dit is geıllustreerd in fig. 2.3. In de vaste fase zijn de ruimtelijke correlaties duidelijkhet grootst: de RDF vertoont duidelijke pieken die een indicatie zijn voor het verwachteaantal deeltjes op afstand r van het referentiedeeltje. In de gasfase daarentegen ver-dwijnen de ruimtelijke correlaties al voor r > 2.5. Ten gevolge van de harde pit van deLJ-potentiaal is de waarschijnlijkheid dat een deeltje zich bevindt op een afstand r < 1nul. In fig. 2.3 is te zien dat g(2)(r) inderdaad verdwijnt voor r < 1. Op grote afstanddooft de oscillerende radiale afhankelijkheid van g(2)(r) uit en nadert deze naar 1.

Page 31: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 2. MOLECULAIRE DYNAMICA 21

Figuur 2.3: De radiale distributiefunctie voor Ar bij T ∗ = 0.7, ρ∗ = 0.5 (gasvormig), bij T ∗ = 0.4,

ρ∗ = 0.5 (vloeibaar) en T ∗ = 0.7, ρ∗ = 1 (vast). De intermoleculaire afstand r is uitgedrukt

in functie van σAr.

2.7.2 Snelheidsautocorrelatiefunctie

De autocorrelatiefunctie geeft een beeld van de tijdscorrelaties in het systeem. Een velo-city autocorrelation function (VAF) wordt algemeen berekend uit het scalair product vande snelheidsvector op een bepaalde tijdstap met de snelheidsvector op een vorige tijd-stap. Voor een systeem in evenwicht kunnen we veronderstellen dat deze VAF invariantis onder tijdstranslaties en zich herleidt tot:

V (t) =1

Nv20

N∑i

~vi(τ) ·~vi(τ + t) ∀τ ∈ R, (2.26)

waarin de normeringsfactor v20 gedefinieerd is als

v20 =

1N

N∑i

~vi(0) ·~vi(0). (2.27)

Zoals te zien in fig. 2.4 nadert de VAF gestaag naar nul bij lage dichtheid. In datgeval zijn er weinig botsingen en ‘vergeet’ het deeltje niet snel zijn initiele beweging. Voorgrote dichtheid en hoge temperatuur zal de frequentie van botsingen met andere deeltjesvergroten. Door die botsingen wordt de richting van de snelheidsvector sneller verstoord,zodat de VAF veel sneller naar nul zal naderen. Hoe hoger de dichtheid, hoe frequenter debotsingen en hoe moeilijker de richting en grootte van de snelheidsvector behouden blijft.

Page 32: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 2. MOLECULAIRE DYNAMICA 22

Bij zeer hoge dichtheid is te zien dat de VAF zelfs negatief kan worden: de snelhedenworden negatief gecorreleerd doordat het deeltje verplicht is om in tegenovergestelderichting te bewegen op het moment dat het botst met zijn dichtste naburen.

Figuur 2.4: De snelheidsautocorrelatiefunctie voor τ = 0 (zonder convolutie) uit een simulatie met 846

deeltjes bij T ∗ = 0.7 en verschillende dichtheden.

2.7.3 Besluit

In hoofdstuk 1 werd opgemerkt dat de returns in het GBB-model ongecorreleerd zijn,terwijl financiele tijdreeksen wel een korte correlatietijd kennen [LGC+99]. In boven-staande evenwichts-MD-simulatie werden ook korte tijdscorrelaties teruggevonden in desnelheidsautocorrelatiefunctie van een vloeistof (figuur 2.4). Wat de tijdscorrelaties be-treft, weerspiegelt dit model van een vloeistof dus beter de realiteit dan het GBB-model.

Verder bleek echter dat de return-distributies van financiele tijdreeksen niet-gaussischzijn. In de context van evenwichts-moleculaire dynamica is het onmogelijk om deze niet-gaussische distributies te genereren. Daarom zullen we in het volgende hoofdstuk eenaanvaardbare methode voorstellen om het systeem uit evenwicht te dwingen.

Page 33: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Hoofdstuk 3

Niet-evenwichts moleculaire

dynamica

Tot zover zijn we erin geslaagd om een systeem te simuleren dat dezelfde eigenschappenvertoont als die van een vloeistof. In zulk systeem dat zich in evenwicht bevindt en waarinnormale diffusie geldt, zorgt het CLT ervoor dat de distributie van de stapgroottes eennormaalverdeling zal volgen. Om de vette staarten in de probabiliteitsdistributies vande returns uit hoofdstuk 1 te genereren en een link te kunnen leggen1met financielemarkten, zullen we dus niet-evenwichtsomstandigheden moeten introduceren. We zullendaarvoor beroep doen op niet-evenwichts moleculaire dynamica (NEMD).

3.1 Zelfgeorganiseerde kritikaliteit

Een complex systeem wordt gekenmerkt door een grote mate van onderlinge afhankelijk-heid tussen de entiteiten waaruit het is opgebouwd. Daardoor is de dynamica ervanonderworpen aan positieve, versterkende feedbacklussen die er voor zorgen dat de voor-waarden voor het CLT niet langer geldig zijn. Deze correlaties in het systeem verhinderendus de convergentie naar een normaalverdeling en kunnen tot gevolg hebben dat er vettestaarten worden gegenereerd.

Om de gedachte te vestigen, grijpen we eerst terug naar het befaamde sandpile-model van Per Bak, C. Tang en K. Wiesenfeld waarin een zandberg gemodelleerd wordtals een cellulaire automaat [MC05]. Elke extra zandkorrel die op de zandberg terechtkomt, speelt de rol van een externe schok. Afhankelijk van de hellingsgraad kan erhelemaal niets gebeuren of kan deze externe verstoring juist aanleiding geven tot lawines

1Dit impliceert dus een mapping van de stapgroottes ∆x(t) op de returns R(t), zie sectie 5.3.1.

23

Page 34: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 3. NIET-EVENWICHTS MOLECULAIRE DYNAMICA 24

die zich doorheen het ganse systeem voortzetten. De grootte van die lawines blijktniet gaussisch verdeeld te zijn, maar een distributie te vertonen die in haar staarteneen machtswet volgt. De respons van het systeem op de initiele perturbatie is dusonafhankelijk van de details ervan. De belangrijkste voorwaarde is het herhaaldelijktoebrengen van een exogene schok op welbepaalde tijdstappen, waartussen het systeemtijd heeft om te relaxeren volgens haar interne dynamica. Tijdens die relaxatiefase is hetsysteem in een zelfgeorganiseerde kritische toestand. Kritisch, omdat de correlatielengtedivergeert en er een machtswet wordt waargenomen. Zelfgeorganiseerd, omdat daarvoorgeen finetuning van de relevante parameters vereist is (het kritisch punt is een attractor).Dit fenomeen van zelfgeorganiseerde kritikaliteit lijkt een vrij universeel concept te zijnwaarmee het robuust gedrag van heel wat niet-evenwichtssystemen met een groot aantalvrijheidsgraden kan begrepen worden. Meer en meer worden ook financiele marktenbestudeerd als complexe systemen die zich in een zelfgeorganiseerde kritische toestandbevinden [BM11].

Op een gelijkaardige manier zullen we daarom externe schokken aanbrengen in deMD-simulatie. In [SRC10] wordt een methode voorgesteld waarin het systeem uit even-wicht gedreven wordt door op welbepaalde periodieke tijdstappen de radiale afstand inde potentiaal te veranderen. Dit komt in feite neer op het herschalen van de groottevan de deeltjes met een factor λ. De facto wordt in de potentiaal r → λr gezet, naelk tijdsinterval τ . De parameters λ en τ worden ingegeven tijdens de start van desimulatie en blijven constant. Deze voorwaarden van een constante discontinue inputtonen inderdaad sterke gelijkenissen met de voorwaarden om een systeem in een zelfge-organiseerde kritische toestand te brengen. Doordat het systeem ‘traag gedreven’ wordt–de injectering van potentiele energie gebeurt slechts op welbepaalde tijdstappen– heefthet immers de tijd om te relaxeren. Tijdens die niet-evenwichtsfase verwachten we danook schaalinvariant gedrag. Als de distributie van de stapgroottes P (∆x) daadwerkelijkzal voldoen aan een machtswet in zijn staarten, dan verwachten we dat ook zeer grotestapgroottes ∆x kunnen opduiken.

3.2 Softcore potentiaal

Wanneer een deeltje evenwel een zeer grote afstand ∆x kan afleggen in een tijdstap, kanhet –tengevolge van de eindige tijdsresolutie die inherent is aan een simulatie– mogelijkbinnendringen in de harde kern van de LJ-potentiaal van andere deeltjes. Daardoorverkrijgt het een onfysische hoeveelheid potentiele energie en bijgevolg een nog hogeresnelheid. Dat kan op zijn beurt aanleiding geven tot een kettingreactie waardoor de

Page 35: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 3. NIET-EVENWICHTS MOLECULAIRE DYNAMICA 25

simulatie onstabiel en oncontroleerbaar wordt [SRC10]. Het probleem zit in het kortedracht-stuk van de LJ-potentiaal, zodat we deze harde kern-potentiaal moeten aanpas-sen. Een goed alternatief is volgende softcore (SC) potentiaal [Fra07]

USC(r) =H

1 + exp ∆(r −Rr)− UA exp

(−(r −RA)2

2δ2A

). (3.1)

De parameters RA, Rr, ∆ en δA werden zo gekozen opdat het lange dracht-stuk zouovereenkomen met dat van de LJ-potentiaal (tabel 3.1). De SC-potentiaal bezit dan ookongeveer dezelfde eigenschappen als de LJ-potentiaal, op de divergentie voor r → 0 na.Verder vertonen de VAF en de RDF van een SC-potentiaal kwalitatief hetzelfde gedragals de VAF en de RDF voor een LJ-potentiaal. De hardheidsparameter H bepaalt dehoogte van potentiaalbarriere en dus de ‘hardheid’ van de potentiaal, hoe moeilijk hetis om binnen te dringen. In figuur 3.1 is een SC-potentiaal gefit met H = 20. Daaruitblijkt dat we het effect van de herschaling (voor λ < 1) kunnen interpreteren als eeneffectieve vergroting van het ruimtelijk volume dat een deeltje inneemt.

H RA UA RR ∆ 2δ2A

20 1 1 0.79 39.4 0.062

Tabel 3.1: Gefitte parameters van de SC-potentiaal in systeemeenheden[Sta10]

3.3 Invloed van λ op de temperatuursevolutie

Wanneer we de radiale afstand telkens veranderen volgens een multiplicatief proces(r → λr), dan wordt de effectieve schalingsfactor na M herschalingen

λ(t = Mτ) = [λ(t = 0)]M . (3.2)

De extra potentiele energie die door de schaalvergroting in het systeem wordt binnen-gebracht, wordt in de relaxatiefase gedissipeerd in kinetische energie. Dit heeft telkenseen temperatuurstijging tot gevolg. Het viriaaltheorema leert immers dat

32NkT = −1

2

N∑i=1

~ri · ~Fi. (3.3)

Omdat ~Fij = −~Fji, valt de viriaalterm in het rechterlid met behulp van formule (2.2) teherschrijven als

− 12

N∑i,j=1

~ri · ~Fij = −14

N∑i,j=1

~rij · ~Fij = −12

N∑i<j

~rij · ~Fij = −12

N∑i<j

rijFij . (3.4)

Page 36: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 3. NIET-EVENWICHTS MOLECULAIRE DYNAMICA 26

Figuur 3.1: Het effect van de herschaling op een softcore potentiaal met H = 20, in gereduceerde

simulatie-eenheden: hoe kleiner de factor λ waarmee de lengteschaal vermenigvuldigd

wordt, hoe groter het effectieve volume van elk deeltje

Hierin is rij = |~ri − ~rj | en

Fij = −dU(rij)drij

. (3.5)

Na de herschaling U(rij) → U(λrij), zal Fij → F ′ij . Bijgevolg verandert de viriaal enbereikt het systeem een nieuwe temperatuur

32NkT ′ = −1

2

N∑i=1

~ri · ~F ′i (λ). (3.6)

Wanneer we daarin dULJ (r)dr of dUSC(r)

dr invullen, dan blijkt T ′(λ)T (λ=1) steeds een dalende

functie van λ te zijn. Daaruit begrijpen we dat een effectieve schaalvergroting van dedeeltjes (λ < 1) inderdaad een temperatuurstijging tot gevolg heeft.

Zoals blijkt uit figuur 3.2 (in het rood) zal de temperatuur na enkele herschalingenal snel stijgen naar zeer grote waarden. Een mogelijke oplossing voor dit probleembestaat erin om de temperatuur terug naar haar beginwaarde te brengen, telkens ze eenbepaalde maximumwaarde overschrijdt. Dit gebeurt door de snelheden te herschalenvolgens dezelfde procedure als in vergelijking (2.16).

Page 37: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 3. NIET-EVENWICHTS MOLECULAIRE DYNAMICA 27

Figuur 3.2: Het effect van het niet-evenwichts-protocol op de gereduceerde temperatuur T ∗ van tien

opeenvolgende herschalingen met 1λ(t=0)

= 1.15, elke τ = 1000 stappen, bij ρ∗ = 0.1. Met

een steeds kleiner wordende herschaling 1λ→ 1

λ+ ( 1−λ

λ) neemt de temperatuur minder

snel toe (in het blauw) dan met herschalingen waarin λ constant blijft (in het rood).

Een andere oplossing bestaat erin om de lengteschaal van de potentiaal op eenmeer gestage manier te laten veranderen. In plaats van een constante schaalfactorλ(t) = λ(t = 0), kunnen we deze bijvoorbeeld na elke stap verkleinen volgens 1

λ →1λ + (1−λ

λ ).Daardoor verandert de lengteschaal nu op een additieve manier r → r + ∆r met∆r ≈ 1 − λ. Zoals blijkt uit figuur 3.2 (in het blauw) zal de temperatuur daardoorelke tijdstap gelijkmatig stijgen. Deze methode heeft dus als voordeel dat de tempe-ratuur in de simulatie beter onder controle blijft. In wat volgt zullen we daarom dezemanier van herschaling gebruiken in plaats van de herschaling r → λr die in [SRC10]vooropgesteld werd.

3.4 Vette staarten

In [SRC10] wordt aangetoond dat herschalingen met constante λ niet-gaussische ver-plaatsingsdistributies kunnen genereren. Hier wordt onderzocht of de nieuwe methode

Page 38: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 3. NIET-EVENWICHTS MOLECULAIRE DYNAMICA 28

6 4 2 0 2 4 6 ∆x/σ

10-3

10-2

10-1

100

P(∆x/σ

)Equilibrium-MDNEMDGaussian

Figuur 3.3: In een simulatie die elke τ = 1000 stappen uit evenwicht gebracht wordt met N = 4000

en initieel 1λ(t=0)

= 1.15, verschijnen vette staarten in de distributie van de stapgroottes

P ( ∆xσ

).

waarbij de herschaling additief gebeurt, eveneens aanleiding geeft tot dergelijke vet-te staarten in de distributies van de stapgroottes. De netto verplaatsingen ∆x(t) =x(t+ ∆t)− x(t)zijn niet enkel afhankelijk van de niet-evenwichtsomstandigheden, maarook van de dichtheid en de temperatuur in het systeem. Om verschillende distributiesP (∆x) te kunnen vergelijken met elkaar en met een normaalverdeling zullen we de stap-groottes delen door de standaardafwijking σ van de distributie. Omdat we een driedimen-sionaal systeem simuleren, worden ook P (∆y) en P (∆z) berekend. Uitgemiddeld over al-le ensembles zorgt de symmetrie van het probleem ervoor dat P (∆x

σ ) = P (∆yσ ) = P (∆z

σ ).Om de hoeveelheid statistiek te verhogen worden de distributies uit de drie richtingendan ook opgeteld, maar voor de eenvoud nog steeds P (∆x

σ ) genoemd. De standaard-afwijking wordt daarin evenwel berekend uit

σ =

√√√√ 13N

N∑i=1

(∆xi −∆x)2 + (∆yi −∆x)2 + (∆yi −∆x)2, (3.7)

met ∆x = 13N

∑Ni=1(∆xi+ ∆yi+ ∆zi). In figuur 3.3 is dan te zien dat de stapdistributie

P (∆xσ ) breder uitgesmeerd wordt in haar staarten en scherper gepiekt wordt wanneer

Page 39: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 3. NIET-EVENWICHTS MOLECULAIRE DYNAMICA 29

het systeem uit evenwicht gebracht wordt. Hierin herkennen we de niet-gaussische dis-tributies van de returns uit financiele tijdsreeksen (figuur 1.4). De leptokurtosischecurve in figuur 3.3 werd gesimuleerd in NEMD met een specifieke herschalingsparameterλ((t = 0)) = 1/1.15. Dit is echter geen toevalstreffer: ook voor andere waarden van λ (enτ) werden dergelijke vette staarten teruggevonden. Ze zijn dus een robuuste eigenschapin NEMD en er komt geen finetuning aan te pas.

3.5 Kurtosis

Begrippen als ‘gepiektheid, ‘vette staarten’ of ‘het optreden van extreme waarden’ zijnnogal kwalitatieve omschrijvingen. Daarom gaan we op zoek naar een geschikte grootheidom dergelijke niet-gaussische eigenschappen van een probabiliteitsdistributie op een meerkwantitatieve manier te karakteriseren. Die vinden we bijvoorbeeld in de kurtosis.

Figuur 3.4: Voor leptokurtosische distributies daalt de kans op extreme evenementen zeer traag

Beschouw de PDF P (x) van een random-variabele x. Zoals de standaardafwijkingσ en de scheefheid gebaseerd zijn op de verwachtingswaarde van de tweede en de derdemacht van (x − x), zo wordt de kurtosis berekend uit de verwachtingswaarde van devierde macht daarvan:

γ2 =〈(x− x)4〉

σ4− 3. (3.8)

Hierin is x = µ1 het gemiddelde van de distributie. Analoog kunnen we het ne momentvoorstellen door µn =

∫xnP (x)dx. Na uitwerking vinden we

γ2 =µ4 − 4µ1µ3 + 6µ2µ

21 − 3µ4

1

σ4− 3. (3.9)

Page 40: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 3. NIET-EVENWICHTS MOLECULAIRE DYNAMICA 30

De normering met de vierde macht van σ maakt de kurtosis dimensieloos. De term −3werd ingevoerd omdat voor een gaussische distributie gecentreerd rond nul (µ1 = 0) geldtdat µ4

σ4 = 3, zodat de kurtosis van een gaussische distributie verdwijnt. Algemeen wordenzulke distributies met kurtosis gelijk aan nul, mesokurtosisch genoemd. Distributies meteen positieve kurtosis daarentegen zijn scherper gepiekt rond het gemiddelde en hebbenvettere staarten (zie fig. 3.4). Daardoor vergroot de kans op evenementen die ofweldicht bij het gemiddelde liggen ofwel zeer extreme waarden hebben. Zulke distributiesdragen de naam leptokurtosisch. In figuur 3.5 is te zien dat voor de distributie van deverplaatsingen op een tijdstap de kurtosis op bepaalde tijdstappen de hoogte inschiet. Opdat moment is het systeem ver uit evenwicht en worden de staarten van de distributiesbreder. Dit wijkt af van het gaussisch gedrag γ2 ≈ 0 dat teruggevonden wordt inevenwichtssimulaties.

0 2000 4000 6000 8000 10000 12000steps

1

0

1

2

3

4

5

kurt

osi

s

mul SCadd SCequilibrium LJ

Figuur 3.5: De tijdsevolutie van de kurtosis voor een systeem in evenwicht (groen) verschilt met die

voor een systeem dat uit evenwicht gebracht werd door een multiplicatieve herschaling

(blauw) en een additieve herschaling (rood) met 1λ(t=0)

= 1.15, τ = 500. De pieken met

γ2 > 3 verschijnen pas nadat de temperatuur terug op haar beginwaarde gezet werd, iets

wat langer duurt voor de additieve herschaling omdat de temperatuur volgens die methode

minder snel divergeert.

We kunnen de kurtosis dus gebruiken als een maat die aangeeft in hoeverre zeldzamegebeurtenissen een rol spelen. In de volgende hoofdstukken zullen we argumenteren dat,behalve cumulanten als σ of γ2, ook de informatie-entropie H kan gebruikt worden omeen PDF op een kwantitatieve manier te karakteriseren.

Page 41: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Hoofdstuk 4

Entropie en informatie

Op de grafzerk van Ludwig Boltzmann (1844-1906) staat een formule gegraveerd die hetaantal mogelijke microtoestanden Ω waarin een systeem zich kan bevinden, koppelt aaneen welbepaalde macroscopische grootheid, genaamd entropie (S),

S = k ln Ω, (4.1)

waarin de boltzmannconstante k ≈ 1.38 · 10−23J/K.De grootheid S was al eerder gekend uit de tweede hoofdwet van de thermodynamica

die stelt dat de entropie van een geısoleerd systeem nooit zal dalen, wat wil zeggen dathet aantal microtoestanden horende bij een welbepaalde macrotoestand gemaximaliseerdwordt. Hierdoor worden twee intuıtieve interpretaties van entropie met elkaar gekoppeld:een maat voor wanorde en een maat voor onzekerheid. Of nog: de interpretatie vanentropie als beschrijving van irreversibiliteit en haar probabilistische interpretatie.

Bovenstaande formule is enkel geldig in evenwichtsomstandigheden. De probabilistischeinterpretatie van entropie komt nog beter tot uiting in haar meer algemene vorm, deGibbs-entropie:

S = −k∑j

pj ln(pj), (4.2)

waarin gesommeerd wordt over alle mogelijke microtoestanden en pj de probabiliteit isdat het systeem zich in toestand j bevindt. Wanneer elke toestand even waarschijnlijkwordt (pj = 1

Ω) herleidt deze zich tot formule (4.1). Om de entropie te kunnen berekenenvan een systeem waarin die evenwichtstoestand op bepaalde tijdstappen verstoord wordt,zullen we in dit proefschrift vertrekken van de uitdrukking (4.2). De Gibbs-entropieS wordt bepaald door pj , dus gaan we eerst op zoek naar de de distributie die deprobabiliteit bepaalt dat het systeem zich in een toestand j bevindt.

31

Page 42: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 32

4.1 Boltzmanndistributie

Beschouw daartoe een systeem bestaande uit een subsysteem en een reservoir [MC05].Beiden kunnen energie met elkaar uitwisselen, maar de totale energie blijft constant. Inevenwicht hebben het subsysteem en het reservoir een gemeenschappelijke temperatuurT . We gaan nu op zoek naar de probabiliteit pj dat het subsysteem een energie Ej heeft.

Als het subsysteem zich in een toestand zou bevinden met een energie Ej , dan kanhet reservoir zich in elke microtoestand bevinden die overeenkomt met een constanteenergie ER = Etot − Ej . Volgens het ergodisch principe zijn deze microtoestanden alleneven waarschijnlijk. Bijgevolg is de probabiliteit dat het subsysteem een energie Ej heeftevenredig met het aantal microtoestanden ΩR(Etot−Ej) die het reservoir kan aannemen,consistent met die energie:

pj ∝ ΩR(Etot − Ej). (4.3)

Omdat het reservoir veel groter is dan het subsysteem, zal Etot >> Ej , en kunnen wehet aantal toegelaten microtoestanden expanderen in machten van Ej . Omdat deze eenexponentiele functie is van de energie en bijgevolg veel te snel varieert, zullen we ln(pj)ontwikkelen in plaats van pj .

ln[ΩR(Etot − Ej)] = ln[ΩR(Etot)]− Ej∂ ln(ΩR)∂Er

+ ... (4.4)

De energie van het ganse systeem ligt vast, zodat de eerste term een constante zalzijn. De partieel afgeleide in de tweede term is niets anders dan de definitie van deinverse temperatuur βR. Het subsysteem en het reservoir zijn op dezelfde temperatuurzodat β = βR. De gezochte probabiliteit dat het subsysteem een energie Ej heeft, wordtdus – na normalisatie– gegeven door 1

pj =exp(−βEj)∑j exp(−βEj)

. (4.5)

4.2 Entropie van een ideaal gas

We kunnen de entropie van een reeel gas opsplitsen in een ideaal gas-bijdrage Str dieenkel te wijten is aan de translationele vrijheidsgraden in het systeem en in een bijdrageafkomstig van de interactie tussen de deeltjes Sint.

S = Str(~p1, ~p2, ...~pN ) + Sint(~r1, ~r2, ...~rN ) (4.6)1De boltzmannfactor kan ook eenvoudig afgeleid worden met behulp van Lagrange-multiplicatoren

door de entropie te maximaliseren onder de voorwaardenPi pi = 1 en

Pi piEi = cte.

Page 43: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 33

Om te beginnen, negeren we interacties en focussen we ons op de contributie Str dieenkel geassocieerd is met de kinetische energie van het systeem.

We vertrekken opnieuw van de Gibbs-entropie, waarin de waarschijnlijkheid pj dathet systeem een energie Ej heeft, gegeven wordt door (4.5). In het geval van een klassiekideaal gas, wordt dit

Str = −k∑j

pj ln(pj), (4.7)

met

pj = ptrj =exp(−β

∑Ni

p2i

2m)Z

. (4.8)

Aangezien de gasdeeltjes niet onderscheidbaar zijn, wordt de N -deeltjes-partitiefunctiebij benadering

Z(T, V,N) ≈ 1N !

[Z1(T, V )]N , (4.9)

waarin de een-deeltjes-partitiefunctie van de translationele vrijheidsgraden, gelijk is aan:

Ztr1 (T, V ) =∫ ∞

0

4πp2dp

h3exp(−βp

2

2m) =

V

λ3, (4.10)

met de thermische golflengte gedefinieerd als

λ =h√

2πmkT(4.11)

zodat

ptrj =N !λ3N

V Nexp(−β

N∑i

p2i

2m). (4.12)

We bedenken dat als we de impuls van deeltje 1 en deeltje 2 verwisselen, dit aanleidinggeeft tot dezelfde pj . We kunnen de sommatie over alle microtoestanden dus vervangendoor een integratie over alle vrijheidsgraden op voorwaarde dat we delen door N ! alscorrectie voor het feit dat de deeltjes niet onderscheidbaar zijn. Aangezien enkel deimpulsvrijheidsgraden een rol spelen in pj , wordt de entropie dan:

Sideaal = −k V N

h3NN !

∫d3~p1d

3~p2...d3~pN

N !λ3N

V Nexp(−β

N∑i

p2i

2m) ln

[N !λ3N

V Nexp(−β

N∑i

p2i

2m)

],

Sideaal = −k(λ

h)3N ∫

d3~p1d3~p2...d

3~pN exp(−βN∑i

p2i

2m)

[ln(

N !λ3N

V N)− β

N∑i

p2i

2m)

],

of na N integraties:

Sideaal = k(λ

h)3N

(2πmkT )3N2 [− ln(

N !λ3N

V N) +

3N2

]. (4.13)

Page 44: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 34

Met behulp van Stirlings formule en formule (4.11) wordt dit:

Sideaal =SideaalNk

= ln(V

Nλ3) +

52. (4.14)

Dit levert dezelfde formule als welke Otto Sackur (en onafhankelijk van hem de 17-jarige Hugo Tetrode) bekwam op basis van thermodynamische beschouwingen [Sac13].Uitgaande van Gibbs’ probabilistische definitie van entropie– die algemeen geldig is, ookvoor een systeem uit evenwicht– wordt dus de correcte uitdrukking voor de entropie vaneen ideaal mono-atomisch gas bekomen. We willen nagaan of deze wetmatigheid ookteruggevonden wordt via de MD-simulatie. We ontbreken echter nog het inzicht hoe deonderliggende distributies aanleiding geven tot deze entropie. Daarvoor zullen we eerstteruggrijpen naar de betekenis van entropie in de context van informatietheorie.

4.3 Informatie-entropie

4.3.1 Entropie a la Shannon

Gibbs’ definitie van de entropie (4.2) is gebaseerd op de probabiliteit dat het systeemzich in een bepaalde microtoestand bevindt, dus op onze kennis (of onwetendheid) overdie microtoestand. In die zin is entropie eerder een beschrijving van de informatie diewe hebben over het thermodynamisch systeem dan een eigenschap van het systeem zelf.In de context van informatietheorie ontstaat informatie als een gebeurtenis plaatsvindtwaarvan vooraf onzeker was of deze daadwerkelijk zou gebeuren. De ‘zelfinformatie’ I isdan de hoeveelheid informatie die kennis over de uitkomst van een gebeurtenis toevoegtaan onze totale kennis. De functionele vorm hiervan kan afgeleid worden uit de axioma’svan de informatietheorie en blijkt logaritmisch afhankelijk van de probabiliteit p [Sha48].Veronderstellen we immers:

• informatie is een niet-negatieve grootheid , I(p) ≥ 0,

• een gebeurtenis die zich voordoet met probabiliteit p = 1 zal geen informatieopleveren, I(1) = 0,

• als twee ongecorreleerde gebeurtenissen zich voordoen (zodat hun gezamenlijkeprobabiliteit het product is van hun individuele probabiliteiten) zal de informatiebekomen door ze beide te observeren de som zijn van de informatie geassocieerdmet de afzonderlijke gebeurtenissen, I(p1 ∗ p2) = I(p1) + I(p2),

• de maat voor informatie is een continue en monotone functie van de probabiliteitervan,

Page 45: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 35

dan volgt daaruit dat I(pa) = aI(p) voor elke reele a en zien we in dat I(p) inderdaadeen logaritmische functie moet zijn. Bovendien zal de informatie van een geobserveer-de gebeurtenis groter worden wanneer de waarschijnlijkheid p waarmee die gebeurteniszich voordoet kleiner wordt. Bij een uitkomst j met probabiliteit pj hoort dus een zelf-informatie −log2(pj). Wanneer deze zelfinformatie uitgemiddeld wordt door ze te wegenmet de waarschijnlijkheid pj dat de uitkomst j zich ook effectief voordoet, bekomen wede verwachtingswaarde van de zelfinformatie:

H = −∑j

pj log2(pj). (4.15)

Deze grootheid is maximaal (H = log2n) als alle n toestanden even waarschijnlijk zijn enminimaal (H = 0) als we a priori weten in welke toestand het systeem zich bevindt. Wezouden H dus kunnen interpreteren als ‘onzekerheid’. Naar analogie met de statistischemechanica verkoos Claude Shannon echter de naam ‘entropie’. H wordt doorgaans uit-gedrukt in bits, waarbij iedere bit het aantal mogelijke toestanden verdubbelt. Daarommaakt de definitie gebruik van de binaire logaritme, met grondtal 2. Shannons definitievan entropie kan echter evengoed geschreven worden in natuurlijke logaritmen door overte gaan van binaire eenheden naar logaritmische eenheden (1 nat = 1

ln2 bit).De aanwezigheid van de boltzmannconstante k is dan nog het enige verschil tussen

de definities (4.2) en (4.15). Deze staat er echter omwille van historische redenen (omervoor te zorgen dat de statistische definitie van entropie dimensioneel overeenstemt metde thermodynamische definitie van Clausius S = Q/T ) en kan dus evengoed opgeslorptworden in een gereduceerde entropie2 S∗ = S/k. Op basis van deze equivalentie zullenwe H en S voortaan beide bestempelen als de ‘informatie-entropie’ van het systeem.We interpreteren deze als een maat voor onze onwetendheid over het systeem, of andersgezegd, als de vrijheid die het systeem heeft om zich een toestand te ‘kiezen’, gegevende informatie die we over het systeem hebben.

4.3.2 Entropie van de Maxwell-snelheidsdistributie

Uit het voorgaande volgt dat we de informatie-entropie kunnen zien als een statistischeeigenschap van een discrete waarschijnlijkheidsdistributie. We kunnen dit veralgemenenvoor een continue waarschijnlijkheidsdistributie door de sommatie in de Shannon-entropie(4.15) te vervangen door een integraal.3 Om de gedachte te vestigen, berekenen we eerst

2[BN08] houdt een pleidooi om de term entropie te vervangen door ‘ontbrekende informatie’ en herfor-

muleert de statistische mechanica door temperatuur en energie in dezelfde eenheden kT uit te drukken.3Bemerk evenwel de discussie in sectie 5.3.2 die met deze overgang gepaard gaat.

Page 46: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 36

de informatie-entropie geassocieerd met een gaussische distributie, p(x) = 1√2πσ2

exp(− x2

2σ2 ).4

H = −∫p(x) ln p(x)dx (4.16)

=∫p(x) ln

√2πσ2dx+

∫p(x)

x2

2σ2dx

= ln√

2πσ2 +12

= ln(√

2πeσ).

We kunnen deze redenering uitbreiden naar een n-dimensionale randomvector xi metdistributie

p(x1, ...xn) =1√

(2π)n|cij |exp(−1

2

∑aijxixj),

waarin aij de inverse van de covariantiematrix cij is en |cij | de determinant ervan. Deinformatie-entropie van deze n-dimensionale gaussische distributie wordt dan:

H = ln(

(2πe)n/2|cij |1/2). (4.17)

In de afwezigheid van correlaties tussen de verschillende componenten, zal cij = δijσ2

en wordt dit:H =

n

2ln(2πe) + n lnσ. (4.18)

Een deeltje in een warmtebad

De impulsvector van een deeltje dat in contact staat met een warmtebad volgt eenwaarschijnlijkheidsdistributie die evenredig is met de boltzmannfactor (4.5). Voor eenniet-interagerend deeltje met enkel kinetische energie E = p2

2m , wordt dit

P [1](~p) =1

(2πmkT )3/2exp(−

p2x + p2

y + p2z

2mkT). (4.19)

De normeringsconstante werd daarin bepaald uit∫P [1](~p)d~p = 1.

De impulsvector van een deeltje dat beweegt in drie dimensies en in contact staatmet een warmtebad, volgt dus een driedimensionale gaussische distributie met standaard-afwijking σ =

√mkT . Volgens (4.18) is de hiermee geassocieerde informatie-entropie:

H =S

k=

32

ln 2πe+ 3 ln√mkT . (4.20)

4Zoals aangetoond door [Sha48] is dit de distributie die de Shannon-entropie maximaliseert bij de

randvoorwaardenRp(x)dx = 1 en

Rp(x)x2dx = σ2.

Page 47: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 37

N deeltjes

Beschouw nu N niet-interagerende deeltjes in een volume V . We brengen wederom en-kel de impulsvrijheidsgraden in rekening zodat E =

∑Ni=1

p2i

2m . De faseruimte komt nuovereen met een 3N -dimensionale vector ~pi. De hiermee geassocieerde probabiliteits-distributie P (~pi) wordt

P [N ](~p1, ...~pN ) = P [1](~p1)P [1](~p2)...P [1](~pN ). (4.21)

waarin P [1](~pi) telkens de driedimensionale gaussische distributie (4.19) is. Met behulpvan vergelijking (4.18), vinden we dan de informatie-entropie voor een systeem van N

deeltjes die vrij bewegen in een driedimensionale ruimte.

Strk

= −∫P [N ](~p1, ...~pN ) ln[P [N ](~p1, ...~pN )]d~p1...d~pN (4.22)

=3N2

ln 2πe+3N2

lnmkT . (4.23)

Of, met behulp van formule (4.11):

Str =StrNk

=32

+ lnh3

λ3. (4.24)

Dit is de informatie-entropie die enkel te wijten is aan de impulsvrijheidsgraden. Insectie 4.14 werd de veronderstelling gemaakt dat de entropie van een ideaal gas enkelhaar oorsprong vindt in de translationele vrijheidsgraden, geassocieerd met de kinetischeenergie van het systeem. Vergelijking met (4.14) toont dat die redenering niet volledigwas. De entropie van een ideaal gas bevat namelijk nog een extra term ln eV

h3N. We

zullen nu aantonen dat deze term gerelateerd is aan de positionele vrijheidsgraden in hetsysteem en overeenkomt met de informatie-entropie van een uniforme distributie.

4.3.3 Configurationele entropie

Een deeltje

Om de microtoestand volledig te karakteriseren kunnen we de faseruimte opdelen inzesdimensionale cellen. Het lijkt er dan op dat als we de cellen maar klein genoeg kiezen,een eindig volume aanleiding zal geven tot een oneindig aantal mogelijke toestanden.Volgens het onzekerheidsprincipe van Heisenberg5 is zulke continue beschrijving van

5Merk op dat we hier gebruik maken van de oorspronkelijke formulering uit Heisenbergs artikel

[Hei27] en dat deze een factor 16π3 verschilt van σxσyσzσpxσpyσpz ≥ ~3

8, die bekomen wordt uit de

Robertson–Schrodinger-relatie en de kwantummechanische commutatieregels.

Page 48: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 38

de faseruimte echter onmogelijk. Ze legt immers een fundamentele limiet op aan hetminimaal volume van elke cel,

∆x∆y∆z∆px∆py∆pz ∼= h3. (4.25)

Omdat de natuur kwantummechanisch is en de faseruimte bijgevolg granulair, heeft eendeeltje dus ‘slechts’ de keuze tussen V

h3 mogelijke microtoestanden. Er bestaat bovendiengeen enkele reden waarom een bepaalde ingenomen positie waarschijnlijker zou zijn daneen andere, zodat pi = h3

V uniform verdeeld is. De informatie-entropie geassocieerd metde positie van een deeltje is dan volgens (4.15) S1(~r)

k = ln Vh3 .

N deeltjes

In afwezigheid van interacties factoriseert de probabiliteitsdistributie van N deeltjesopnieuw in de afzonderlijke distributies van elk deeltje. Voorgaande redenering, hedentoegepast op een deeltje dat beweegt in een 6N-dimensionale faseruimte, leert:

P (~r1, ..., ~rN ) = P (~r1)...P (~rN ) =h3N

V N. (4.26)

Er treedt echter nog een complicatie op waarmee we rekening moeten houden: de deeltjesin de simulatie zijn niet onderscheidbaar. Daarom zal het verwisselen van de faseruimte-coordinaten van twee deeltjes aanleiding zal geven tot dezelfde toestand. Omdat hetaantal toestanden die N niet onderscheidbare deeltjes kunnen bezetten N ! keer kleineris dan het aantal toestanden die N onderscheidbare deeltjes kunnen innemen, vinden wevoor de uniforme distributie van de positionele vrijheidsgraden:

P (~r1, ..., ~rN ) =h3NN !V N

. (4.27)

De bijdrage van de positionele vrijheidsgraden aan de entropie, wordt dan:

Spos(U = 0) =S(~r1, ..., ~rN )

Nk=

1N

lnV

h3N != ln

eV

h3N. (4.28)

Deze is enkel geldig in afwezigheid van interacties (U = 0). Optellen van (4.24) en (4.28)levert dan de correcte uitdrukking voor de entropie van een ideaal gas (4.14),

Sideaal = Str + Spos(U = 0) = ln(V

Nλ3) +

52. (4.29)

Page 49: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 39

4.4 Entropie in de simulatie

We ontwikkelen een methode om de translationele bijdrage aan de entropie Str te bepalenin de simulatie. Naar analogie met vergelijking (4.22) kunnen we Str trachten te bereke-nen door te sommeren over alle impulswaarden die de deeltjes in het simulatiesysteemkunnen aannemen. Aangezien we m∗i = 1, ∀i = 1...N gekozen hebben in de simula-tie, kunnen we de probabiliteit pj associeren met de snelheidsverdeling P (vx,y,z) van dedeeltjes. Omdat we voor het translationeel gedeelte, de interacties tussen deeltjes buitenbeschouwing laten, bewegen ze onafhankelijk van elkaar. De probabiliteitsdistributiefactoriseert dan in het product van N identieke termen:

Strk

= −∑j

pj ln(pj) = −N(∑vx

P (vx) ln[P (vx)]+∑vy

P (vy) ln[P (vy)]+∑vz

P (vz) ln[P (vz)]).

(4.30)In de simulatie worden tijdens elke tijdstap de snelheidscomponenten van de deeltjes ineen histogram gerangschikt. Om alles op een te normeren, wordt er achteraf gedeelddoor het aantal deeltjes N . Elke bin b bevat dan de probabiliteit Pb = Nb

N dat de snel-heidscomponent zich in het bijhorende snelheidsinterval bevindt. Om over te gaan vaneen histogram naar een kansdistributie met oppervlakte een, wordt die waarde gedeelddoor de breedte van de bins ∆ = ∆v∗x,y,z. Daarna wordt Pb

∆ ln Pb∆ elke tijdstap over alle

bins opgeteld en vermenigvuldigd met ∆.6

In figuur 4.1 worden de kansdistributies op drie verschillende tijdstappen vergelekenmet de gaussische maxwelldistributie bij T ∗ = 0.7. In figuur 4.2 is de hieruit berekendewaarde Str(t) op elke tijdstap gevisualiseerd. Het is duidelijk dat de entropie in de simu-latie fluctueert rond een gemiddelde waarde. Wanneer we Str(t) uitmiddelen over alletijdstappen dan bekomen we de gemiddelde entropie, gerelateerd aan de translationelevrijheidsgraden. Als we uit tien simulaties telkens deze entropie bepalen, dan vindenwe Str = 3.7344± 0.0167, een significante overeenkomst met de theoretische waarde uitvergelijking (4.23), Str = 3.7218. Bovenstaande analyse ondersteunt dus dat men metgrote nauwkeurigheid de entropie kan bepalen uit een probabiliteitsdistributie.

De verdeling van een snelheidscomponent j = x, y, z convergeert naar een gaussischedistributie die de vorm

p(vj) =

√1

2πT ∗exp(−

v∗2j2T ∗

) (4.31)

krijgt wanneer haar parameters uitgedrukt worden in systeemeenheden, met m∗ = 1. Devariantie daarvan wordt dus volledig bepaald door de gereduceerde temperatuur T ∗ inhet systeem (figuur 4.3). Bijgevolg zal de entropie van de translationele vrijheidsgraden

6De structuur van de relevante broncode is toegevoegd in bijlage B.1.

Page 50: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 40

Figuur 4.1: De gereduceerde snelheidscomponent v∗x van 4000 deeltjes werd gerangschikt in 50 bins.

P (vx) geeft de waarschijnlijkheid dat een deeltje een snelheidscomponent heeft in het inter-

val [v∗x, v∗x+ ∆v∗x]. Drie verschillende gesimuleerde histogrammen P (vx) zijn te zien tijdens

drie verschillende tijdstappen en deze volgen de maxwelldistributie (in het zwart).

Figuur 4.2: De tijdsevolutie van Str in een simulatie met 4000 deeltjes bij ρ∗ = 0.5 en T ∗ = 0.7.

Str = S[P [N ](px)] + S[P [N ](py)] + S[P [N ](pz)] wordt elke tijdstap berekend uit histogram-

men zoals in fig. 4.1 en fluctueert rond de theoretische waarde Str = 3.722.

Page 51: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 41

4 3 2 1 0 1 2 3 4v ∗x

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

P(vx)

T ∗ =0.5

T ∗ =0.7

T ∗ =0.9

Figuur 4.3: De gereduceerde snelheidshistogrammen (waarvan er enkele zijn geplot op verschillende

tijdstappen in de simulatie) convergeren naar een maxwelldistributie waarvan de variantie

stijgt met de temperatuur T ∗.

enkel temperatuursafhankelijk zijn en dus niet afhangen van de dichtheid of van depotentiele energie in het systeem. Tabel 4.1 bevestigt dat deze voorspelde waarde telkenskan gereproduceerd worden voor verschillende waarden van de temperatuur.

T ∗ 0.5 0.7 0.9 1.1

Str -uit vergelijking (4.24) 3.217 3.722 4.099 4.400Str -uit de simulatie 3.233 3.734 4.094 4.400

Tabel 4.1: De temperatuursafhankelijkheid van Str voor een simulatie met 4000 deeltjes en ρ∗ = 0.5.

Str volgt de theoretische afhankelijkheid uit onze redenering in sectie 4.3.2.

Page 52: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 42

4.5 Interactie-entropie

Tot nog toe hebben we steeds een hamiltoniaan beschouwd voor N niet-interagerendedeeltjes die vrij bewegen in een volume V . We gaan nu op zoek naar de bijdrage tot deentropie die te wijten is aan de interacties en we vertrekken van de hamiltoniaan

H =N∑i

pi2

2m+∑i<j

U(i, j). (4.32)

De potentiele energie inwerkend op een deeltje is afhankelijk van de positiecoordinatenvan alle andere deeltjes. Daarom kunnen we de probabiliteitsdistributie niet langerfactoriseren in de distributies horende bij een deeltje. Volgens vergelijking (4.5) wordtde configurationele probabiliteitsdistributie nu:

P (~r1, ..., ~rN ) =h3NN !V N

exp−β∑

i<j U(i, j)ζ

. (4.33)

De redenering uit sectie 4.3.3 vereist namelijk dat de factor h3NN !V N

expliciet voorop wordtgeplaatst. De normeringsfactor ζ werd hierin gedefinieerd als

ζ =1V N

∫d~r1...d~rN exp−β

∑i<j

U(i, j), (4.34)

zodat deze convergeert naar een in de afwezigheid van interacties U = 0 en de uniformedistributie van de positionele vrijheidsgraden (4.27) inderdaad teruggevonden wordt.

De configurationele distributie gehoorzaamt dus aan volgende normalisatieconditie:∫d~r1...d~rN

1h3NN !

P (~r1, ..., ~rN ) = 1 (4.35)

en de daaraan gerelateerde entropie wordt:

S(~r1, ..., ~rN ) = −k∫d~r1...d~rN

1h3NN !

h3NN !V N

exp−β∑

i<j U(i, j)ζ

ln[h3NN !V N

exp−β∑

i<j U(i, j)ζ

],

S(~r1, ..., ~rN )k

= lnV Nζ

h3NN !−∫d~r1...d~rN

1V N

exp−β∑

i<j U(i, j)ζ

[−β∑i<j

U(i, j)].

In de tweede term herkennen we het ensemblegemiddelde (2.14) van de potentiele energieU = 〈Ep(t)〉,

S(~r1, ..., ~rN )k

= lnV Nζ

h3NN !+ βU. (4.36)

Page 53: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 43

We vinden dus de interactie-entropie door bij de entropie geassocieerd met de positionelevrijheidsgraden in afwezigheid van interacties, een correctieterm op te tellen.

Spos(U) = Spos(U = 0) +1N

(ln(ζ) + βU). (4.37)

De grootheid U kan berekend worden via een MD-gemiddelde. Voor de factor ζ hebbenwe een benadering nodig.

Laten we ζ daarom berekenen met behulp van een perturbatie-expansie. Daavoorgaan we over op de hulpfunctie van Mayer [GT07]: λ(i, j) = exp(−βU(i, j))− 1.

We passen daarop volgende reeksontwikkeling toe:∏i<j

(1 + λ(i, j)) = 1 +∑k<l

λ(k, l) +∑

k<l,n<m

λ(k, l)λ(n,m) + ... (4.38)

De eerste term daarin is de ideaal gas-bijdrage, terwijl de tweede de interactie tussen tweenabije deeltjes voorstelt. De derde term wordt maar relevant wanneer drie deeltjes zich inelkaars nabijheid bevinden. Voor een hogere dichtheid en sterke interacties moeten steedsmeer hogere orde-termen in rekening gebracht worden. Voor lage dichtheid convergeertdeze expansie snel genoeg, zodat we ze kunnen afbreken na de tweede term:

ζ =1V N

∫d~r1..., d~rN

∏i<j

exp−βU(i, j) (4.39)

≈ 1 +1V N

∫d~r1...d~rN

∑k<l

λ(k, l). (4.40)

De som in bovenstaande vergelijking telt N(N−1)2 termen, zijnde het aantal manieren

waarop twee deeltjes aan elkaar gelinkt kunnen worden. Deze termen zijn allen gelijkwant ze verschillen enkel maar in de manier waarop hun integratievariabelen gelabeldzijn. We vinden dus:

ζ = 1 +V N−2

V N

N(N − 1)2

∫d~r1d~r2λ(1, 2) (4.41)

= 1 +N(N − 1)

2V 2

∫d~r1d~r2(−1 + exp−βU(~r1, ~r2)) (4.42)

= 1 +N(N − 1)

2V

∫d~r12(−1 + exp−βU(~r12)), (4.43)

waarbij in de laatste stap werd overgegaan op relatieve coordinaten door een van beidedeeltjes als oorsprong te kiezen. De eerste term in de integraal zorgt ervoor dat deintegraal convergeert. Wanneer de interacties verwaarloosbaar worden, nadert ζ naar 1.

Page 54: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 44

Figuur 4.4: De dichtheidsafhankelijkheid van de gereduceerde entropie S(ρ∗) bij T ∗ = 0.7 in een

simulatie met 4000 deeltjes waarvan de interactie gemodelleerd werd met een LJ-potentiaal.

Het ideaal gas-deel Sideaal ervan wordt tevens vergeleken met de theoretische waarde van

Sackur en Tetrode Sth (daarin zijn de foutenvlaggen onzichtbaar klein) .

Interactie-entropie in de MD-simulatie

De totale gereduceerde entropie van het syteem wordt, na het in rekening brengen vaninteracties

S =S

Nk= Spos(U) + Str (4.44)

= ln(V

Nλ3) +

52

+1N

(ln ζ + βU) = Sideaal +1N

(ln ζ + βU). (4.45)

Deze gemiddelde entropie wordt nu berekend in de MD-simulatie uit enerzijds het tijds-gemiddelde van de potentiele energie en uit anderzijds de snelheidsdistributies van dedeeltjes (zoals in sectie 4.4). Door telkens een nieuwe simulatie uit te voeren bij een ande-

Page 55: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 45

0.0 0.2 0.4 0.6 0.8 1.0f

2

3

4

5

6

7

8

9

10

11

S

Sideaal

S

Figuur 4.5: Het effect van de interactie op de gereduceerde entropie S: in een simulatie met N = 2048

deeltjes (T ∗ = 0.7, ρ∗ = 0.5) waarvan de interactie gemodelleerd werd met een gereduceerde

LJ-potentiaal, neemt S toe als die interacties zwakker gemaakt worden met een factor f .

re dichtheid ρ∗, kan de dichtheidsafhankelijkheid van de entropie gecontroleerd worden(figuur 4.4). We zien dat bij hogere dichtheid de toenemende interacties in het sys-teem ervoor zorgen dat de totale entropie van het systeem verlaagt. Dit blijkt ook uitvergelijking (4.45), waarin de laatste term negatief is. Het verwaarlozen van correlatiesin het systeem had dus een overschatting van de entropie tot gevolg. Voor zeer lagedichtheid verdwijnt de interactie-entropie en convergeert de totale entropie van het sys-teem naar de entropie van een ideaal gas. In het vaste stof-regime ( ρ∗ & 0.8) zal dedichtheidsexpansie niet meer convergeren en gaat de benadering in vergelijking (4.40)niet meer op. De figuur toont dus enkel een goede schatting van de entropie bij nietal te hoge dichtheden. Verder dient bemerkt te worden dat de correctieterm ln ζ/Neen contributie geeft die ervoor zorgt dat S niet langer een intensieve grootheid is, wateen tekortkoming is van de hier vooropgestelde methode om interacties in rekening tebrengen.

Wanneer de interacties zwakker gemaakt worden door de interactiesterkte te her-schalen met een factor f ∈ [0, 1]:

ULJ(r) = f · 4ε[(σr

)12 − (σ

r)6],

dan zal de entropie tevens convergeren naar haar waarde voor een ideaal gas (fig. 4.5).

Page 56: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 46

0 5 10 15 20x ∗

0

5

10

15

20

y∗

Energy fluctuations

0.5

0.4

0.3

0.2

0.1

0.0

0.1

0.2

0.3

0.4

0.5

∆Ep

0 5 10 15 20x ∗

0

5

10

15

20

y∗

Energy fluctuations

0.5

0.4

0.3

0.2

0.1

0.0

0.1

0.2

0.3

0.4

0.5

∆Ep

Figuur 4.6: De ruimtelijke distributie van de veranderingen in potentiele energie voor een LJ-potentiaal

in evenwichtsomstandigheden (links) en voor een SC-potentiaal op het moment dat het

systeem uit evenwicht gebracht wordt (rechts). Een typische projectie op het xy-vlak

waarin |zi| < 0.5 ∀i, wordt getoond voor een simulatie met ρ∗ = 0.5, T ∗ = 0.7 enN = 4000.

4.6 Entropie in NEMD

Wanneer het systeem een exogene schok ondervindt door het herschalen van de lengte-schaal in de interactiepotentiaal, zal dat zijn invloed hebben op de interacties tussen dedeeltjes. Het effect op de potentiele energie wordt geıllustreerd in figuur 4.6. Daarin iseen dwarsdoornede te zien van de simulatiebox waarin voor ieder deeltje de veranderingvan de potentiele energie in vergelijking met de vorige tijdstap gevisualiseerd is,

∆Ep(~ri) =∑j 6=i

U(~rij(t+ ∆t))− U(~rij(t)). (4.46)

De potentiele energiefluctuaties worden duidelijk veel groter op het moment dat hetsysteem uit evenwicht gebracht wordt.

4.6.1 Lokale entropie

De herschaling introduceerde in bepaalde gebieden van het simulatiesysteem dus eenpotentiele energiestijging die veel groter is dan haar gemiddelde waarde. We gaan nu nawat het effect daarvan is op de entropie. In tegenstelling tot potentiele energie is entropieeen eigenschap die niet kan worden toegeschreven aan een deeltje, maar enkel aan een

Page 57: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 47

0 5 10 15 20 25x ∗

0

5

10

15

20

25

y∗

Equilibirum Entropy Str

0

1

2

3

4

5

6

7

8

9

10

Str

Figuur 4.7: De ruimtelijke verdeling van de entropie verbonden met de translationele vrijheidsgraden

Str voor een systeem in evenwicht (links) en voor een systeem dat uit evenwicht gebracht

werd volgens ( 1λ(t=0)

= 1.15, τ = 500 ) (rechts). Deze wordt getoond als een projectie op

het xy-vlak tijdens een typische tijdstap in een simulatie met 8788 deeltjes bij ρ∗ = 0.5 en

T ∗ = 0.7.

distributie of een systeem van deeltjes. Om de ruimtelijke entropiefluctuaties te kunnenberekenen, zal dus een manier van coarse-graining vereist zijn. Daarom wordt ons simu-latiesysteem opgedeeld in n×n subsystemen van hetzelfde volume. Om genoeg data overte houden en om die subsystemen eenvoudig te kunnen visualiseren wordt de z-dimensieonveranderd gelaten. Uit de snelheden van alle deeltjes die in een bepaald subsysteembewegen, wordt dan een Maxwell-Boltzmann-distributie gegenereerd7. Daaruit wordttelkens de entropie Str bepaald die correspondeert met de snelheidsverdeling van dedeeltjes in het subvolume. Ter verduidelijking zijn de groottes van die entropiewaardenafgebeeld in figuur 4.7 voor een typische dwarsdoorsnede. In de evenwichtssimulatiezien we dat de entropie overal in de buurt ligt van de gemiddelde waarde Str ≈ 3.7. Ophet moment dat het systeem uit evenwicht gebracht is, merken we op dat de verschillentussen de lokale entropiewaarden sterk toenemen Dit is een gevolg van het feit dat detemperatuur T ∗ niet langer als een globale eigenschap van het systeem kan beschouwdwordt, maar zich ten gevolge van de herschaling als een lokale variabele gedraagt. Defluctuaties in de temperatuur bepalen de fluctuaties op de variantie van de snelheidsver-delingen en bijgevolg ook de fluctuaties in Str.

7De relevante pseudocode is terug te vinden in bijlage B.2.

Page 58: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 48

0 5 10 15 20 25x ∗

0

5

10

15

20

25

y∗

Equilibirum Entropy Spos

0

1

2

3

4

5

6

7

8

9

10

Spos

Figuur 4.8: De ruimtelijke verdeling van de entropie verbonden met de positionele vrijheidsgraden

Spos voor een systeem in evenwicht (links) en voor een systeem dat uit evenwicht gebracht

werd volgens ( 1λ(t=0)

= 1.15, τ = 500 )(rechts). Deze wordt getoond als een projectie op

het xy-vlak tijdens een typische tijdstap in een simulatie met 8788 deeltjes bij ρ∗ = 0.5 en

T ∗ = 0.7.

Verder wordt in elk subvolume tevens de gemiddelde potentiele energie berekend. Daar-uit wordt de entropie die gerelateerd is aan de positionele vrijheidsgraden Spos in elksubsysteem teruggevonden. Dit wordt gevisualiseerd in figuur 4.8.

Uit beide figuren 4.7 en 4.8 kunnen we besluiten dat de ruimtelijke fluctuatiesin de totale entropie sterk toenemen op het moment dat het systeem in een niet-evenwichtstoestand wordt gebracht. De herschaling had immers het injecteren van po-tentiele energie op verschillende plaatsen tot gevolg, die tijdens de relaxatiefase wordtomgezet in kinetische energie.

4.6.2 Tijdsevolutie van de entropie

Laten we daarom de tijdsevolutie van de entropiebijdragen Spos en Str in het volle-dige systeem onderzoeken. Uit de tweede term van vergelijking (4.45) blijkt dat detotale entropie in het systeem afhankelijk is van de potentiele energie U in het sys-teem. Na de herschaling is deze term niet langer negatief. De injectie van potentieleenergie zal er dus voor zorgen dat de totale entropie S sterk zal toenemen in niet-evenwichtsomstandigheden. Zoals te zien is in figuur 4.9 is dat het gevolg van de in-teracties in het systeem, want de entropie van een ideaal gas varieert veel minder. Ter

Page 59: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 4. ENTROPIE EN INFORMATIE 49

0 1000 2000 3000 4000 5000steps t ∗

0

10

20

30

40

50

60

entr

opy

Str

Spos

Sideaal

S

Figuur 4.9: De evolutie van de entropie S = Spos+Str voor een systeem dat herhaaldelijk uit evenwicht

gebracht wordt ( 1λ

= 1.15, τ = 500 ) in een simulatie met 8788 deeltjes bij ρ∗ = 0.5 en

T ∗ = 0.7.

verduidelijking wordt het relatief belang van de positionele Spos en de translationele Strvrijheidsgraden in de totale entropie S in het niet-evenwichtssysteem getoond.

Page 60: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Hoofdstuk 5

Informatie-entropie in financiele

markten: discussie

Eerst wordt de informatie-entropie die geassocieerd is met de PDF van de prijsfluctuatiesin economische data onderzocht. Vervolgens wordt ingegaan op de aard van informatie-stromen in niet-evenwichtsomstandigheden. Daarna worden eventuele beperkingen vanhet hier ontwikkeld informatie-entropie-paradigma bediscussieerd.

5.1 Informatie-entropie uit returns

In sectie 1.4 hebben we de standaardafwijking van de returns van de S&P 500-indexberekend: σ = 0.00967. We delen de waarde van de returns nu door deze σ en geven degenormaliseerde returns weer in de probabiliteitsdistributie 5.1. Daaruit kunnen we nuook de informatie-entropie van de distributie berekenen. We vinden SS&P500 = 1.276 Wevinden dus een beduidend lagere waarde in vergelijking met de informatie-entropie vaneen gaussiaan met standaardafwijking 1, ln(

√2πe) = 1.419. Dit is geen toevallige waarde

die inherent is aan de S&P 500-index, maar een robuuste eigenschap die een gevolg is vanhet feit dat markten niet-evenwichtssystemen zijn. Ook de informatie-entropieen van deJapanse beursindex Nikkei 225: SNIK = 1.305 en van de Duitse DAX SDAX = 1.311bevinden zich immers lager dan de gaussiaanse informatie-entropie1. Dat wil zeggendat hun onzekerheid lager is, m.a.w dat de fluctuaties in indexprijzen minder aan hetrandom walk -model voldoen dan de EMH ons laat geloven. Ter vergelijking wordt ookde informatie-entropie van de leptokurtosische distributie P (∆x

σ ) die gegenereerd werdin de NEMD-simulatie (figuur 3.3), berekend. We vinden SNEMD = 1.297 < 1.419.

1Hiervoor werd tevens gebruik gemaakt van de intraday gegevens die beschikbaar zijn op [yah].

50

Page 61: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE MARKTEN: DISCUSSIE 51

20 15 10 5 0 5 10 15Returns R(t)/σ

10-3

10-2

10-1

100Pr

obab

ilite

it P(R/σ

)

DAXNikkei 225S&P 500

Figuur 5.1: De probabiliteitsdistributies van de genormaliseerde returns van de S&P 500-index, de

Nikkei225-index en de DAX-index, vergeleken met een gaussische distributie op log-lineaire

schaal.

4 2 0 2 4Return R/σ

10-3

10-2

10-1

100

P(R/σ

)

S&P500DAXNikkei 255Gaussian

Figuur 5.2: Het centraal stuk van bovenstaande PDF (enkel voor |R| < 5 en met bredere bins) toont

duidelijker dat de empirische return-distributies afwijken van een mesokurtosische distri-

butie.

Page 62: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE MARKTEN: DISCUSSIE 52

5.1.1 Entropie en leptokurtosis

0.0 0.2 0.4 0.6 0.8 1.0p

0.00

0.05

0.10

0.15

0.20

0.25

0.30

0.35

0.40

−plnp

Figuur 5.3: De contributie van een term in de som die de entropie bepaalt, wordt gevisualiseerd als

functie van de probabiliteit p

De functie −p ln p levert kleine waarden voor zeer kleine en voor zeer grote probabi-liteiten p. Daartussen vertoont ze een maximum. Voor leptokurtosische distributies zijndie tussenliggende waarden minder frequent, waardoor ze minder entropie bijdragen invergelijking met een mesokurtosische distributie. De entropiebijdrage van de extreme(lage p) en gemiddelde waarden (hoge p) is sowieso klein. Daaruit wordt duidelijk datvoor de informatie-entropie H van leptokurtosische distributies steeds zal gelden datH < 1.419. Dit is in overeenstemming met de teruggevonden empirische waarden.

5.1.2 Entropiefluctuaties

Nu we de grootte van de empirische informatie-entropie berekend hebben, onderzoekenwe ook de fluctuaties daarop. Daartoe werd de S&P 500-data opgedeeld in J subin-tervallen van telkens evenveel beursdagen. Van elk subinterval werd herhaaldelijk deinformatie-entropie van de distributie Pj(Rσ ) berekend. Hierin is R de waarde van eenreturn in het je tijdsinterval, met j = 1, ..., J .

Ter vergelijking werden MD-simulaties (in evenwicht) uitgevoerd waarbij op bepaal-de tijdstappen j de verplaatsingsdistributies Pj(∆x

σ ) werden bijgehouden. Daaruit werdeveneens de informatie-entropie berekend. Er werd voor gezorgd dat het aantal data-punten in Pj(∆x

σ ) telkens overeenkomt met het aantal datapunten in Pj(Rσ ) zodat eenzinvolle vergelijking mogelijk is.

Page 63: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE MARKTEN: DISCUSSIE 53

Figuur 5.4: De tijdsevolutie van de informatie-entropie van de S&P 500-returns vergeleken met de

tijdsevolutie van de informatie-entropie van de verplaatsingen in een MD-stap, met tijds-

vensters ∆t = 3082 (links) en ∆t = 3082 (rechts).

Figuur 5.5: De tijdsevolutie van de informatie-entropie van de S&P 500-returns vergeleken met de

tijdsevolutie van de informatie-entropie van de verplaatsingen in een MD-stap, met tijds-

venster ∆t = 670.

In figuren 5.4, 5.5 en 5.6 is telkens de tijdsevolutie van de informatie-entropie SS&P500

en SMD van beide distributies afgebeeld, voor J = 5, 10, 23, 46 en 67. Hieruit valt opte merken dat de entropie van de returns veel meer fluctueert dan de entropie van de

Page 64: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE MARKTEN: DISCUSSIE 54

Figuur 5.6: De tijdsevolutie van de informatie-entropie van de S&P 500-returns vergeleken met de

tijdsevolutie van de informatie-entropie van de verplaatsingen in een MD-stap, met tijds-

vensters ∆t = 335 (links) en ∆t = 230 (rechts).

verplaatsingen in een MD-simulatie in evenwichtsomstandigheden. Deze wilde fluctuatieszijn niet in overeenstemming met het beeld van een markt die in evenwicht is (zie sectie5.2.1). In figuur 5.4 (met J = 46 en J = 67) zijn de entropiefluctuaties duidelijker waarte nemen dan in de figuur 5.6 (met J = 5 en J = 10). Merk evenwel op dat het aantaldatapunten waaruit S berekend werd, zijnde 15410

J , navenant daalt (en daarmee ook denauwkeurigheid op S).

5.2 Dissipatie van informatie

Om te onderzoeken hoe informatie zich verspreidt in financiele markten ten gevolge vannieuws dat binnenkomt, stellen we ons de meer algemene vraag hoe na een exogeneshock informatie in een systeem wordt gedissipeerd. Wanneer we roeren in een emmerwater, wordt energie aan het systeem toegevoegd op grote schaal, die later gedissipeerdwordt op steeds kleinere schalen. Dit is vooralsnog een onopgelost fysisch probleem.Op dezelfde manier kan informatie toegevoegd worden aan een economisch systeem diedaarna gedissipeerd wordt op steeds kleinere schalen. De gelijkenissen in de fluctuatiesbij dit fenomeen en bij dat van turbulentie worden onderzocht in [MS97].

Een karakteristiek kenmerk van een niet-evenwichtssysteem is de manier waarop hetenergie (of informatie) absorbeert wanneer het gevoed wordt door een externe kracht(of door ‘nieuws’). De factor die er in de MD-simulatie voor zorgde dat het systeem uitevenwicht gebracht werd, is de exogene shock die gepaard ging met de herschaling vande lengteschaal in de potentiele energie. De verhoogde potentiele energie gaf aanleiding

Page 65: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE MARKTEN: DISCUSSIE 55

tot meer interacties en werd geleidelijk omgezet in een verhoogde kinetische energie.De verhoogde entropie die hiermee gepaard gaat kan geınterpreteerd worden als eeninformatiestroom in het systeem. Op die manier kunnen we de exogene shock in de MD-simulatie associeren met het beschikbaar worden van nieuwe informatie in een financielemarkt.

We kunnen nu ook de verschillende bijdragen van de entropie in de MD-simulatieproberen te mappen naar een economisch model voor een markt. In haar meest eenvou-dige vorm kunnen we een markt zien als een systeem waarin informatie zich verspreidten uitgewisseld wordt. Die informatie is daarin een algemene benaming voor producten,diensten, opties etc. Essentieel zijn er twee contributies: de beweging van informatieen de uitwisseling van informatie. De informatie-entropie die geassocieerd is met detranslationele vrijheidsgraden in het systeem, Str, zouden we dan kunnen interpreterenals de verplaatsing van informatie door de agent in het systeem. De informatie-entropiedie geassocieerd is met de positionele vrijheidsgraden, Sint, kunnen we dan zien als deuitwisseling van informatie tussen verschillende die agents.2

5.2.1 Bullwhip effect

Ook in eenvoudige economische modellen kan de interactie van enerzijds een welbepaaldedynamische structuur en anderzijds menselijk gedrag, aanleiding geven tot grote fluctu-aties.

Veronderstel bijvoorbeeld een productieketen, waarin verschillende spelers een be-paald product aan elkaar leveren. Wanneer er plots een een exogene shock ontstaat inde vraag aan het einde van de productieketen, wordt de voorspelling van het aantalte leveren producten elke stap in de keten iets bemoeilijkt. Dit effect zet zich ‘als eenzweepbeweging’ door naar het begin van de productieketen (het ‘bullwhip-effect’ [HL04]).Dit kan ertoe leiden dan een voorraadtekort snel verschuift naar een voorraadoverschot.De informatie wordt immers steeds te laat ontvangen om zo’n overschot of tekort teverwerken. De ultieme oorzaak van deze wilde oscillaties is niet de exogene shock, maarwel de feedback-structuur van het systeem en de neiging van de spelers om te overrea-geren op nieuwe informatie (gekend als Anchoring and adjustment in de psychologischeliteratuur). De dynamica wordt dus op een endogene manier gecreeerd en het grilligindividueel gedrag op microniveau heeft emergente consequenties: de wilde fluctuatiesop macroniveau.

2De agents hoeven daarbij geen fysieke personen te zijn, ze kunnen ook organisaties representeren

(bijvoorbeeld een groep personen die een pensioenfonds beheert).

Page 66: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE MARKTEN: DISCUSSIE 56

Volgens de traditionele economische theorie zouden dergelijke fluctuaties niet voorko-men. Elke speler heeft immers op elk moment de nodige informatie om de meest rationelebeslissing te nemen, tijdsvertragingen in acht genomen. Het systeem zou ogenblikkelijkvan de ene evenwichtstoestand naar de andere overgaan [Bei07].

5.3 Beperkingen

5.3.1 Mapping van stapgroottes op returns

In een financiele tijdreeks fluctueert de prijsvariabele als functie van de tijd. In de MD-simulatie fluctueert de plaats van een deeltje als functie van de tijd. Het zijn telkens degrootheden die de netto verandering van de prijs en de plaats beschrijven, namelijk dereturn R(t) en de verplaatsing ∆x, die we met elkaar vergeleken hebben. Het gebruikvan die relatieve grootheden is de meest natuurlijke keuze. Ze voldoen bijvoorbeeld aande additieregel:

∆xi(t,∆t) + ∆xi(t+ ∆t,∆t) = ∆xi(t, 2∆t), (5.1)

met ∆xi(t, 2∆t) ≡ xi(t + 2∆t) − xi(t) de netto verplaatsing van deeltje i over tweetijdstappen.

Dezelfde eigenschap is van toepassing op de returns Rln van een indexprijs Y (t)(waarbij we gebruik maken van de logaritmische definitie 1.3),

R(t+ ∆t,∆t) +R(t,∆t) = lnY (t+ 2∆t)− lnY (t) = R(t, 2∆t). (5.2)

Om beide relatieve grootheden op een zinvolle manier met elkaar te relateren, werdenze gedeeld door hun standaardafwijking,

∆xi(t,∆t)σ(t,∆t)

↔ R(t+ ∆t,∆t)σR(∆t)

. (5.3)

waarin de standaardafwijking σ(t,∆t) berekend wordt uit de stapgroottes van alle deel-tjes tijdens [t, t+ ∆], terwijl σR(∆t) de standaardafwijking is van alle returns met tijds-venster ∆t over het volledige tijdsinterval. Deze normering heeft echter tot gevolg datvoorgaande additieregel niet langer opgaat voor elke tijdschaal (zoals in [Sta10] expli-ciet wordt aangetoond) en dat we geen rechtstreekse mapping kunnen maken tussende waarde van de returns en de lengte-eenheden in de MD-simulatie. In [Sta10] wordtevenwel geargumenteerd dat de absolute variabelen (de waarde van de indexprijs Y (t)en de positie xi(t)) toch met elkaar gelinkt kunnen worden door het uitvoeren van eenlokale coordinatentransformatie.

Page 67: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE MARKTEN: DISCUSSIE 57

5.3.2 Negatieve entropie-probleem

In dit proefschrift werd de informatie-entropie steeds berekend uit het histogram van eenrandomvariabele. Dat gebeurde door de distributie op te delen in n bins met breedte ∆en de waarschijnlijkheid pb te berekenen dat de variabele zich in de be bin bevindt. Alswe uit deze discrete distributie de informatie-entropie zouden berekenen door −pb ln pb tesommeren over alle bins, dan zou deze afhankelijk worden van de gekozen bin-grootte ∆.

Om de bekomen waarde van de informatie-entropie onafhankelijk te maken van ∆,werd overgegaan op een kansdistributie f(xb) die in de be bin de waarde f(xb) = pb

aanneemt. Daarvoor moeten we echter een prijs betalen:

• Deze fb is nu niet langer beperkt tot het probabiliteitsinterval [0, 1]. Dit heeft totgevolg dat de informatie-entropie bekomen uit −f(xb) ln f(xb) negatief kan worden.Dat is een ongewenste eigenschap als we onze probabilistische interpretatie vaninformatie-entropie willen behouden.

• Waar oorspronkelijk een waarschijnlijkheid pb geassocieerd was met de oppervlaktevan een bin, is f(xb) nu enkel geassocieerd met de functiewaarde van een bin. Wan-neer we de informatie-entropie S van de volledige distributie optellen, moeten wede entropiewaarde van elke functiewaarde dus vermenigvuldigen met de volledigebreedte ∆ van de bin: S =

∑b ∆f(xb) ln f(xb). Met andere woorden: we bereke-

nen S uit ons histogram alsof dat histogram een continue kansdistributie f(x) zouzijn, met oppervlakte

∫f(x)dx = 1 en informatie-entropie H =

∫f(x) ln f(x)dx.

De entropie werd dus berekend naar analogie met formule 4.17 voor een continuerandomvariabele. Hierin duikt het probleem van de negatieve informatie-entropieop.

Shannon breidde in [Sha48] zijn definitie van entropie namelijk stilzwijgend uit naardifferentiele entropie door simpelweg de sommatie in de discrete entropie te vervan-gen door een integraal. En deze veralgemening is niet zomaar geldig. De differentieleinformatie-entropie H van een continue probabiliteitsdistributie f(x) kunnen we immersherschrijven als

H = −∫f(x) ln f(x)dx. = −

n∑b=1

∫ fb

ib

f(x) ln f(x)dx. (5.4)

Hierin is fb − ib = ∆ de breedte van de bins.De gebinde probabiliteiten zijn echter te schrijven als

pb =∫ fb

ib

f(x)dx ≈ f(xb)∆. (5.5)

Page 68: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 5. INFORMATIE-ENTROPIE IN FINANCIELE MARKTEN: DISCUSSIE 58

Op dezelfde manier kunnen we de b-de term in de sommatie van 5.4 benaderen doorf(xb)∆ ln f(xb). We vinden dan dat de continue informatie-entropie in termen van pb

gelijk is aan

H ≈ −n∑b=1

∆f(xb) ln f(xb) (5.6)

= −n∑b=1

pb lnpb∆

(5.7)

= −n∑b=1

pb ln pb + ln ∆. (5.8)

Als de breedte van de bins infinitesimaal klein wordt, ∆→ 0, vinden we de gelijkheid

H = −n∑b=1

pb ln pb + ln ∆ = S (5.9)

De tweede term divergeert dan, ln ∆ → −∞, zodat de differentiele entropie H negatiefkan worden. Ze kan dus geen geldige veralgemening zijn van de discrete informatie-entropie (de eerste term in het rechterlid). In dit proefschrift vormt dit echter geenprobleem, om twee redenen:

• Er werd telkens gebruik gemaakt van de continue definitie (5.4) zodat de vergelijkingtussen de theoretische H en de gesimuleerde informatie-entropie S consistent is(beiden komen overeen in de limiet ∆→ 0).

• De entropie van een gaussiche distributie wordt enkel negatief voor

σ <1√2πe≈ 0.24. (5.10)

Omdat de distributies in dit proefschrift telkens genormaliseerd werden3 met hunstandaardafwijking, zal σ = 1. Voor een normaalverdeling levert dat een positievecontinue informatie-entropie (H ≈ 1.4). Ook voor de leptokurtosische distributiesbleef H > 0.

3In sectie 4.4 gebeurde deze normalisatie impliciet doordat de snelheidsvariabele in dimensieloze

eenheden werd uitgedrukt en T ∗ -die de rol van σ speelt- voor een vloeistof nooit kleiner dan 0.24

gekozen werd.

Page 69: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Hoofdstuk 6

Conclusies

In het standaard GBB-model wordt de evolutie van beursdata op mathematische wijzebeschreven vanuit de veronderstelling dat de returns van prijsveranderingen een brownsebeweging volgen. De probleemstelling in dit proefschrift vertrok van de observatie datde hieruit gesimuleerde return-distributie niet goed overeenstemt met de distributie vanreele returns. Op basis van de S&P 500-index werd bijvoorbeeld aangetoond dat de kansop zeer grote returns niet snel verdwijnt: in plaats van op gaussische manier naar nulte convergeren, gehoorzaamt de empirische distributie aan een machtswet met exponentα ≈ 4.3 voor R > 0.015.

De aanwezigheid van deze ‘vette staarten’ is een universeel terugkomende observatie.Om dit emergent fenomeen beter te begrijpen, werd het formalisme van een vloeistof-model in een MD-simulatie vooropgesteld. Het systeem werd uit evenwicht gedwongendoor op bepaalde simulatiestappen de dichtheid te herschalen. Ondanks de extra poten-tiele energie die daardoor het systeem werd binnengebracht, bleef de temperatuurstijgingonder controle. Na meerdere herschalingen werd opgemerkt dat de distributie van destapgroottes eveneens vette staarten ging vertonen. Door de mapping van relatieve ver-plaatsingen in een anomaal vloeistofmodel op de relatieve prijsveranderingen in beurs-data, werden dergelijke ‘leptokurtosische’ distributies dus kwalitatief gereproduceerd.

6.1 Informatie-entropie van leptokurtosische distributies

Informatie-entropie bleek verder een geschikte grootheid te zijn om die leptokurtosi-sche distributies te onderzoeken. Zo werd een beduidend lagere informatie-entropieteruggevonden dan de informatie-entropie die door Shannon werd toegeschreven aaneen normaalverdeling en die dus geassocieerd is met de distributies in het GBB-model:

59

Page 70: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK 6. CONCLUSIES 60

6 4 2 0 2 4 6 ∆x/σ

10-3

10-2

10-1

100

P(∆x/σ

)

Equilibrium-MDNEMDGaussian

Figuur 6.1: De distributies van de returns van indexprijzen (links) en de distributie van de verplaat-

singen van de deeltjes die in een MD-simulatie uit evenwicht gedreven werden (rechts).

H < 1.419. In de simulatie werd tijdens de niet-evenwichtsperioden eveneens een lagereinformatie-entropie teruggevonden. Dat is weliswaar nog geen voldoende voorwaardeom NEMD als een geldig model te zien voor de onderliggende dynamica van financieletijdreeksen, het is toch een indicatie dat financiele markten zich niet in een evenwichts-toestand bevinden.

6.2 Informatie-entropie van een ideaal gas

Daarnaast werd ook gepoogd om een marktmodel te associeren met de entropie in deMD-simulatie. Zo kan de entropie Str die gekoppeld is aan de beweging van de deeltjes,geınterpreteerd worden als ‘de beweging van informatie’, terwijl de entropie Spos die eengevolg is van de interacties tussen de deeltjes kan beschouwd worden als ‘de uitwisselingvan informatie’.

De entropie van een ideaal gas, die gekend is uit de formule van Sackur en Tetrode,werd daarbij gebruikt als aanknopingspunt. Deze ideaal gas-entropie werd teruggevon-den met behulp van concepten uit de informatietheorie. Daarbij werd ondervonden datSideaal niet enkel een gevolg is van de translationele vrijheidsgraden, maar dat er ookrekening dient gehouden te worden met een configurationele contributie die geassocieerdis met de ononderscheidbaarheid van de deeltjes en met Heisenbergs onzekerheidsbe-ginsel. Verder werd een methode voorgesteld om interacties in rekening te brengen.Deze methode had de wenselijke eigenschap dat de interactie-entropie convergeerde naarde configurationele contributie van een ideaal gas wanneer de interacties op nul gezetwerden of wanneer de simulaties bij zeer lage dichtheid uitgevoerd werden.

Page 71: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Bijlage A

Bepaling van de

machtswetexponent

De maximum-likelihood estimation (MLE) is een betrouwbare methode om de parame-ters van een statisch model aan een empirische dataset te fitten. Hier wordt beroepgedaan op deze methode om de exponent van aan machtswet terug te vinden [New05].Beschouw daartoe de machtswetdistributie

p(x) = CR−α = npα− 1xmin

(x

xmin

)−α(A.1)

waarbij de constante C berekend werd uit de normalisatievoorwaarde

np =∫ ∞xmin

x−αdx, (A.2)

met np het aantal datapunten waaraan de machtswet gefit wordt. We hebben dus eenset van np waarden xi. De probabiliteit dat deze onafhankelijke en identiek verdeelderandom-variabelen gegenereerd werden uit de machtswetdistributie p(x) is:

P (x|α) =np∏i=1

p(xi) =np∏i=1

npα− 1xmin

(xixmin

)−α(A.3)

Om nu de waarde van α te vinden die het best overeenkomt met de gegevens, moetenwe op zoek gaan naar de probabiliteit P (α|x) voor een welbepaalde α, gegeven onzegeobserveerde waarden xi. Deze is gerelateerd aan P (x|α) door het theorema van Bayes,

P (α|x) = P (x|α)P (α)P (x)

(A.4)

P (x) wordt bepaald door de set gegevens waarvan we vertrekken en deze liggen vast.Verder wordt P (α) verondersteld een uniforme distributie te zijn, dus een constante

61

Page 72: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK A. BEPALING VAN DE MACHTSWETEXPONENT 62

onafhankelijk van α. A priori (zonder de set geobserveerde waarden xi in beschouwingte nemen) is elke waarde van α immers even waarschijnlijk. We vinden dus

P (α|x) ∼ P (x|α) (A.5)

De a posteriori waarschijnlijkheid P (α|x) wordt de likelihood genoemd. De MLE-methode bestaat erin om deze te maximaliseren. Equivalent daarmee is maximalisatievan de logaritme (een monotone stijgende functie) ervan. Met behulp van de evenredig-heidsrelatie A.5, vinden we voor de log likelihood L1:

L = P (x|α) =np∑i=1

[ln(α− 1) + lnnp − lnxmin − α lnx

xmin]. (A.6)

Door ∂L∂α = 0 te stellen

npα− 1

−np∑i=1

lnx

xmin= 0, (A.7)

vinden we de meest waarschijnlijke waarde voor de machtswetexponent

α = 1 + np

[ np∑i=1

lnx

xmin

]−1

. (A.8)

In [New05] wordt aangetoond dat de standaardfout op deze verwachte α gegeven wordtdoor

σ =√np

[ np∑i=1

lnx

xmin

]−1

=α− 1√np

. (A.9)

1De evenredigheidsconstante in A.5 laten we buiten beschouwing omdat die in de logaritme verschijnt

als een additieve constante die sowieso zal wegvallen in de maximalisatie.

Page 73: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Bijlage B

Structuur van de broncode

In dit proefschrift werd de informatie-entropie van een continue randomvariabele meer-maals berekend. Daarom wordt de structuur van het algoritme in de MD-simulatiehieronder geschetst in pseudocode. Voor de bepaling van de informatie-entropie diegeassocieerd is met de distributies van prijsindexen, werd een analoge methode gebruikt.

B.1 Subroutine voor berekening translationele entropie Str

for alle tijdstappen t in de simulatie do

for alle deeltjes i ≤ N in het systeem do

for alle bins b in het snelheidshistogram do

if snelheidscomponent vx van deeltje i correspondeert met b∆vx then

pb ← pb + 1 tel event opend if

idem voor andere snelheidscomponenten vy en vz end for

end for

for alle bins b in het snelheidshistogram do

pb ← pb/N normaliseer aantal events pb binnen b∆vx met aantal deeltjes Npb ← pb/∆vx normaliseer aantal events pb met breedte van de bin ∆vxtel entropiebijdrage −∆vxpb ln pb opidem voor histogrammen van vy en vz

end for

bereken Str(t) = som van entropie uit de drie snelheidshistogrammenend for

63

Page 74: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

HOOFDSTUK B. STRUCTUUR VAN DE BRONCODE 64

B.2 Subroutine voor berekening lokale entropie

for alle deeltjes i ≤ N in het systeem do

for alle subvolumes in de x-richting do

if x-coordinaat positie deeltje i correspondeert met x-coordinaat subvolume then

for alle subvolumes in de y-richting do

if y-coordinaat positie deeltje i correspondeert met y-coordinaat subvolumethen

tel potentiele energie U(x, y) van deeltje i op in subvolume (x,y)tel deeltje i op bij aantal deeltjes Ns in subvolume (x,y)sla de drie snelheidscomponenten van deeltje i op in subvolume (x,y)

end if

end for

end if

end for

end for

for alle subvolumes in de x-richting do

for alle subvolumes in de y-richting do

for alle deeltjes in subvolume (x,y) do

for alle bins b in het snelheidshistogram do

if snelheidscomponent vx van deeltje correspondeert met b∆vx then

pb ← pb + 1 tel event opend if

idem voor andere snelheidscomponenten vy en vz end for

end for

for alle bins b het snelheidshistogram do

pb ← pb/Ns normaliseer aantal events pb binnen b∆vx met aantal deeltjes Nspb ← pb/∆vx normaliseer aantal events pb met breedte van de bin ∆vxtel entropiebijdrage −∆vxpb ln pb opidem voor histogrammen van vy en vz

end for

bereken Str = som van entropie uit de drie snelheidshistogrammenbereken Spos = ln eV

h3N + interactie-entropie uit U(x, y) in subvolumeend for

end for

Page 75: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Bibliografie

[Bac00] L. Bachelier. Theorie de la speculation. Annales scientifiques de l’Ecole Normale

Superieure, 3(17):21–86, 1900.

[Bei07] E. D. Beinhocker. The origin of wealth. Random House Business Books, 2007.

[BM11] H.R. Fiebig B. Dupoyet and D.P. Musgrove. Replicating financial market dy-namics with a simple self-organized critical lattice model. Physica A: Statistical

Mechanics and its Applications, 390(18–19):3120–3135, 2011.

[BN08] A. Ben-Naim. A Farewell to Entropy: Statistical Thermodynamics Based on Infor-

mation. World Scientific Pub Co Inc, 2008.

[Bou00] J-P. Bouchaud. Power-laws in economics and finance: some ideas from phy-sics. Science & Finance (CFM) working paper archive 500023, Science &Finance, Capital Fund Management, 2000.

[BS73] F. Black and M. Scholes. The pricing of options and corporate liabilities.Journal of Political Economy, 81(3):pp. 637–654, 1973.

[Fam70] E. F. Fama. Efficient capital markets: a review of theory and empirical work.Journal of Finance, 25:383–417, 1970.

[Fra07] G. Franzese. Differences between discontinuous and continuous soft-core at-tractive potentials: the appearance of density anomaly. Journal of Molecular

Liquids, (136):267–273, 2007.

[GPA+99] P. Gopikrishnan, V. Plerou, L.A. Nunes Amaral, M. Meyer, and E. H. Stanley.Scaling of the distribution of fluctuations of financial market indices. Phys.

Rev. E, 60(5):5305–5316, Nov 1999.

65

Page 76: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

BIBLIOGRAFIE 66

[GT07] H. Gould and J. Tobochnik. Statistical and Thermal Physics: With Computer

Applications, chapter 8: Classical Gases and Liquids. Princeton UniversityPress, 2007.

[Hei27] W. Heisenberg. Uber den anschauclichen inhalt der quantentheo-retischen kinematik und mechanik http://osulibrary.oregonstate.edu/

specialcollections/coll/pauling/bond/papers/corr155.1-04.html. Zeits-

chrift fur Physik, 43:172–198, 1927.

[Hil75] B. M. Hill. A simple general approach to inference about the tail of a distri-bution. Annals of Statistics, 3:1163–1174, 1975.

[HL04] D. Helbing and S. Lammer. Supply and production networks: From thebullwhip effect to business cycles. Technical Report cond-mat/0411486, Nov2004.

[Jay57] E. T. Jaynes. Information theory and statistical mechanics. Phys. Rev.,106(4):620–630, May 1957.

[LGC+99] Y. Liu, P. Gopikrishnan, P. Cizeau, M. Meyer, C-K. Peng, and H. E. Stanley.Statistical properties of the volatility of price fluctuations. Physical review E,60(2), 1999.

[Man63] B.B. Mandelbrot. The variation of certain speculative prices. Journal of

Business, 36, 1963.

[MC05] N.R. Moloney and K. Christensen. Complexity And Criticality. Imperial CollegeLondon, 2005.

[ML02] A. C. Mackinlay and A. W. Lo. A Non-Random Walk Down Wall Street. Prin-ceton University Press, http://press.princeton.edu/books/lo/, 2002.

[MS97] R.N. Mantegna and H.E. Stanley. Stock market dynamics and turbulence:parallel analysis of fluctuation phenomena. Physica A, 239, 1997.

[MS99] R.N. Mantegna and H.E. Stanley. An introduction to Econophysics: correlations

and complexity in finance. Cambridge University Press, 1999.

[New05] M.E.J. Newman. Power laws, pareto distributions and zipf’s law. Contempo-

rary Physics, (46):323–351, 2005.

[Ryc10] J. Ryckebusch. Statistische fysica. cursus, 2010.

Page 77: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

BIBLIOGRAFIE 67

[Sac13] O. Sackur. Die universelle bedeutung des sog. elementaren wirkungsquan-tums. Annalen der Physik, (345):78, 1913.

[Set09] J.P. Sethna. Entropy, Order Parameters, and Complexity. Cla-rendon Press Oxford, http://www.physics.cornell.edu/sethna/StatMech/

EntropyOrderParametersComplexity.pdf, 2009.

[Sha48] C. E. Shannon. A mathematical theory of communication. The Bell System

Technical Journal, 27, 1948.

[Skl] Sklogwiki. http://www.sklogwiki.org/SklogWiki/index.php/Main_Page.

[SRC10] S. Standaert, J. Ryckebusch, and L. De Cruz. Creating the conditions of ano-malous self-diffusion in a liquid with molecular dynamics. Journal of Statistical

Mechanics- Theory and experiment, page P04004, 2010.

[Sta10] S. Standaert. Connecting the dynamics of financial markets to the dynamics of

non-equilibrium fluids. PhD thesis, UGent, http://inwpent5.ugent.be/papers/phdsimon.pdf, 2010.

[Tal08] N. N. Taleb. The Black Swan. The Impact of the Highly Improbable. RandomHouse Inc., 2008.

[Thi99] J.M. Thijsen. Computational Physics. Cambridge University Press, 1999.

[Voi05] J. Voit. The Statistical Mechanics of Financial Markets. Springer, 2005.

[wik] Wikipedia, the free encyclopedia. http://en.wikipedia.org/.

[WM04] R. P. White and H. Meirovitch. A simulation method for calculating theabsolute entropy and free energy of fluids: Application to liquid argon andwater. Proc. Natl. Acad. Sci. USA, pages 9235–9240, 2004.

[yah] Yahoo. http://finance.yahoo.com.

Page 78: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Lijst van figuren

1.1 De tijdsevolutie van de stochastische variabele S(t) voor verschillende waarden vanµ en σ. De gele lijn volgt een SDV met een grotere driftterm µ en bijgevolg eensterker stijgende trend. De groene lijn volgt een SDV met een hogere diffusietermσ en vertoont bijgevolg sterkere fluctuaties en een minder sterk stijgende trend. 5

1.2 De absolute waarde van de returns van de S&P 500-index van 3 januari 1950 tot 8april 2011. De piek in 1987 is de handtekening van de beurscrash op Black Monday. 6

1.3 De S&P 500 absolute returns (boven) vergeleken met de absolute returns van hetGBB-model (onder) waarin µ = 0.003778 en σ = 0.00967 voor 15416 simulatie-stappen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4 De probabiliteitsdistributie van de genormaliseerde returns van de S&P 500-indexwordt vergeleken met die van het GBB-model op log-lineaire schaal. Het geısoleerdeevent bij −21.2σ is de return op Black Monday. . . . . . . . . . . . . . . . . . . 8

1.5 Aan de cumulatieve distributiefunctie van de positieve returns wordt een machts-wetstaart gefit met α = 3.3146 en C = 1.235 · 10−7 (op log-log-schaal). . . . . . . 9

2.1 De fenemenologische LJ-potentiaal komt overeen met de empirische potentiaal-curve voor twee Argon-atomen in functie van hun interatomaire afstand R =r · 3.405A. [wik] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.2 De tijdsevolutie van de potentiele energie Epot, kinetische energie Ekin en hun somEtot, voor een simulatie met 256 deeltjes bij ρ∗ = 0.5 en T ∗ = 0.7. . . . . . . . . 19

2.3 De radiale distributiefunctie voor Ar bij T ∗ = 0.7, ρ∗ = 0.5 (gasvormig), bij T ∗ =0.4, ρ∗ = 0.5 (vloeibaar) en T ∗ = 0.7, ρ∗ = 1 (vast). De intermoleculaire afstandr is uitgedrukt in functie van σAr. . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.4 De snelheidsautocorrelatiefunctie voor τ = 0 (zonder convolutie) uit een simulatiemet 846 deeltjes bij T ∗ = 0.7 en verschillende dichtheden. . . . . . . . . . . . . . 22

3.1 Het effect van de herschaling op een softcore potentiaal met H = 20, in gere-duceerde simulatie-eenheden: hoe kleiner de factor λ waarmee de lengteschaalvermenigvuldigd wordt, hoe groter het effectieve volume van elk deeltje . . . . . 26

68

Page 79: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

LIJST VAN FIGUREN 69

3.2 Het effect van het niet-evenwichts-protocol op de gereduceerde temperatuur T ∗

van tien opeenvolgende herschalingen met 1λ(t=0) = 1.15, elke τ = 1000 stappen,

bij ρ∗ = 0.1. Met een steeds kleiner wordende herschaling 1λ →

1λ + ( 1−λ

λ ) neemtde temperatuur minder snel toe (in het blauw) dan met herschalingen waarin λ

constant blijft (in het rood). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273.3 In een simulatie die elke τ = 1000 stappen uit evenwicht gebracht wordt met

N = 4000 en initieel 1λ(t=0) = 1.15, verschijnen vette staarten in de distributie van

de stapgroottes P (∆xσ ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.4 Voor leptokurtosische distributies daalt de kans op extreme evenementen zeertraag . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.5 De tijdsevolutie van de kurtosis voor een systeem in evenwicht (groen) verschiltmet die voor een systeem dat uit evenwicht gebracht werd door een multiplicatieveherschaling (blauw) en een additieve herschaling (rood) met 1

λ(t=0) = 1.15, τ = 500.De pieken met γ2 > 3 verschijnen pas nadat de temperatuur terug op haar begin-waarde gezet werd, iets wat langer duurt voor de additieve herschaling omdat detemperatuur volgens die methode minder snel divergeert. . . . . . . . . . . . . . 30

4.1 De gereduceerde snelheidscomponent v∗x van 4000 deeltjes werd gerangschikt in50 bins. P (vx) geeft de waarschijnlijkheid dat een deeltje een snelheidscomponentheeft in het interval [v∗x, v

∗x + ∆v∗x]. Drie verschillende gesimuleerde histogram-

men P (vx) zijn te zien tijdens drie verschillende tijdstappen en deze volgen demaxwelldistributie (in het zwart). . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.2 De tijdsevolutie van Str in een simulatie met 4000 deeltjes bij ρ∗ = 0.5 en T ∗ =0.7. Str = S[P [N ](px)] + S[P [N ](py)] + S[P [N ](pz)] wordt elke tijdstap berekenduit histogrammen zoals in fig. 4.1 en fluctueert rond de theoretische waarde Str =3.722. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.3 De gereduceerde snelheidshistogrammen (waarvan er enkele zijn geplot op ver-schillende tijdstappen in de simulatie) convergeren naar een maxwelldistributiewaarvan de variantie stijgt met de temperatuur T ∗. . . . . . . . . . . . . . . . . 41

4.4 De dichtheidsafhankelijkheid van de gereduceerde entropie S(ρ∗) bij T ∗ = 0.7in een simulatie met 4000 deeltjes waarvan de interactie gemodelleerd werd meteen LJ-potentiaal. Het ideaal gas-deel Sideaal ervan wordt tevens vergeleken metde theoretische waarde van Sackur en Tetrode Sth (daarin zijn de foutenvlaggenonzichtbaar klein) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.5 Het effect van de interactie op de gereduceerde entropie S: in een simulatie metN = 2048 deeltjes (T ∗ = 0.7, ρ∗ = 0.5) waarvan de interactie gemodelleerd werdmet een gereduceerde LJ-potentiaal, neemt S toe als die interacties zwakker ge-maakt worden met een factor f . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

Page 80: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

LIJST VAN FIGUREN 70

4.6 De ruimtelijke distributie van de veranderingen in potentiele energie voor een LJ-potentiaal in evenwichtsomstandigheden (links) en voor een SC-potentiaal op hetmoment dat het systeem uit evenwicht gebracht wordt (rechts). Een typischeprojectie op het xy-vlak waarin |zi| < 0.5 ∀i, wordt getoond voor een simulatiemet ρ∗ = 0.5, T ∗ = 0.7 en N = 4000. . . . . . . . . . . . . . . . . . . . . . . . . 46

4.7 De ruimtelijke verdeling van de entropie verbonden met de translationele vrijheids-graden Str voor een systeem in evenwicht (links) en voor een systeem dat uitevenwicht gebracht werd volgens ( 1

λ(t=0) = 1.15, τ = 500 ) (rechts). Deze wordtgetoond als een projectie op het xy-vlak tijdens een typische tijdstap in een simu-latie met 8788 deeltjes bij ρ∗ = 0.5 en T ∗ = 0.7. . . . . . . . . . . . . . . . . . . 47

4.8 De ruimtelijke verdeling van de entropie verbonden met de positionele vrijheids-graden Spos voor een systeem in evenwicht (links) en voor een systeem dat uitevenwicht gebracht werd volgens ( 1

λ(t=0) = 1.15, τ = 500 )(rechts). Deze wordtgetoond als een projectie op het xy-vlak tijdens een typische tijdstap in een simu-latie met 8788 deeltjes bij ρ∗ = 0.5 en T ∗ = 0.7. . . . . . . . . . . . . . . . . . . 48

4.9 De evolutie van de entropie S = Spos + Str voor een systeem dat herhaaldelijk uitevenwicht gebracht wordt ( 1

λ = 1.15, τ = 500 ) in een simulatie met 8788 deeltjesbij ρ∗ = 0.5 en T ∗ = 0.7. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

5.1 De probabiliteitsdistributies van de genormaliseerde returns van de S&P 500-index, de Nikkei225-index en de DAX-index, vergeleken met een gaussische distri-butie op log-lineaire schaal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.2 Het centraal stuk van bovenstaande PDF (enkel voor |R| < 5 en met bredere bins)toont duidelijker dat de empirische return-distributies afwijken van een mesokur-tosische distributie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.3 De contributie van een term in de som die de entropie bepaalt, wordt gevisualiseerdals functie van de probabiliteit p . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

5.4 De tijdsevolutie van de informatie-entropie van de S&P 500-returns vergeleken metde tijdsevolutie van de informatie-entropie van de verplaatsingen in een MD-stap,met tijdsvensters ∆t = 3082 (links) en ∆t = 3082 (rechts). . . . . . . . . . . . . . 53

5.5 De tijdsevolutie van de informatie-entropie van de S&P 500-returns vergeleken metde tijdsevolutie van de informatie-entropie van de verplaatsingen in een MD-stap,met tijdsvenster ∆t = 670. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5.6 De tijdsevolutie van de informatie-entropie van de S&P 500-returns vergeleken metde tijdsevolutie van de informatie-entropie van de verplaatsingen in een MD-stap,met tijdsvensters ∆t = 335 (links) en ∆t = 230 (rechts). . . . . . . . . . . . . . . 54

6.1 De distributies van de returns van indexprijzen (links) en de distributie van deverplaatsingen van de deeltjes die in een MD-simulatie uit evenwicht gedrevenwerden (rechts). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

Page 81: Simulatie van informatie-entropie in financiële markten op basis van moleculaire dynamica

Lijst van tabellen

3.1 Gefitte parameters van de SC-potentiaal in systeemeenheden[Sta10] . . . . . . . 25

4.1 De temperatuursafhankelijkheid van Str voor een simulatie met 4000 deeltjes enρ∗ = 0.5. Str volgt de theoretische afhankelijkheid uit onze redenering in sectie4.3.2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

71