De detectie van mono- en bi-allelische DNA-methylatie op basis … · 2012. 12. 5. ·...

138
Faculteit Bio-ingenieurswetenschappen Academiejaar 2011-2012 De detectie van mono- en bi-allelische DNA-methylatie op basis van single nucleotide polymorfismen Sandra Steyaert Promotor: Prof. Dr. ir. Tim De Meyer Copromotor: Prof. Dr. ir. Wim Van Criekinge Masterproef voorgedragen tot het behalen van de graad van Master in de bio-ingenieurswetenschappen: cel- en genbiotechnologie

Transcript of De detectie van mono- en bi-allelische DNA-methylatie op basis … · 2012. 12. 5. ·...

  • Faculteit Bio-ingenieurswetenschappen

    Academiejaar 2011-2012

    De detectie van mono- en bi-allelischeDNA-methylatie op basis van single

    nucleotide polymorfismen

    Sandra SteyaertPromotor: Prof. Dr. ir. Tim De MeyerCopromotor: Prof. Dr. ir. Wim Van Criekinge

    Masterproef voorgedragen tot het behalen van de graad vanMaster in de bio-ingenieurswetenschappen: cel- en genbiotechnologie

  • “De auteur en de promotor geven de toelating deze scriptie voor consultatie beschikbaar te stellenen delen ervan te kopiëren voor persoonlijk gebruik. Elk ander gebruik valt onder de beperkingenvan het auteursrecht, in het bijzonder met betrekking tot de verplichting uitdrukkelijk de bron tevermelden bij het aanhalen van resultaten uit deze scriptie”

    Datum

    (handtekening student) (handtekening promotor)

    (Naam student) (Naam promotor)

  • ii

    VOORWOORD

    Reeds voor en vooral sinds aanvang van mijn studies bio-ingenieur ging mijn interesse uit naarwiskunde en wetenschap. Na het volgen van de cursus ‘Biochemie en moleculaire biologie’ in 2debachelor werd deze interesse aangerijkt met de wereld van genetica en gentechnologie die meer enmeer een passie werd. Het was voor mij snel duidelijk dat ik hierin wou verdergaan en de keuzevoor de optie cel- en gentechnologie in 3de bachelor was dan ook een zeer logische stap. Eenkeuze die ik mij nooit beklaagd heb, want keer op keer stond ik versteld van hoe complex maartoch ook fantastisch geregeld het netwerk van moleculaire biologie en (epi)genetica in elkaar zit.

    Hoewel ik nooit tegenopzag tegen het labowerk dat onoverkomelijk verweven is in deze tak vande wetenschap, was ik toch steeds sterk geboeid door statistiek, programmeren en de mix van dezetwee, namelijk bio-informatica. Het uitdenken en schrijven van programma’s nodig om data teanalyseren vind ik zeer uitdagend en het gevoel dat je uiteindelijke script doet wat het moest doen(of dat je dat toch tenminste denkt) was en blijft keer op keer fantastisch. Als je dan achteraf ooknog eens mooie conclusies kan trekken uit wat je eigenlijk geanalyseerd hebt, dan maakt het datgevoel extra af.

    Vandaar dat ik dan ook graag mijn promotor Dr. ir. Tim De Meyer wil bedanken voor de kansdie ik kreeg om via mijn masterproef te mogen proeven van hoe dit (bio-informatica) werk zichin de ‘echte’ praktijk voordoet. Maar ik wil hem voornamelijk bedanken voor de begeleiding ditjaar. Tim, bedankt voor het vertrouwen dat je in me had waardoor je me toeliet om zelfstandig tezoeken en werken, maar je toch steeds beschikbaar was als ik (weer) eens vastzat. Bedankt datik je steeds mocht bestoken met vragen en problemen (met soms bijhorende frustraties) en dat jetelkens bereid was om bijkomende tips en uitleg te geven bij de statistische methodes alsook voorhet nodige geduld hierbij. Ik vond het een enorme verrijking in mijn manier van denken. Verderwil ik je ook bedanken voor de tijd en energie die je gestoken hebt in het lezen en verbeteren vandeze masterproef.

    Een welgemeende dankuwel aan de BioBiX-groep dat ik ook bij jullie steeds terecht kon voorhulp. Geert, Joachim, Alexander, Jeroen, Klaas, Simon, Gerben, Daisy en Wim, bedankt voor devele tips en het delen van ervaringen die mij verder op weg hebben geholpen alsook mijn kennisin het veld hebben verruimd. Bedankt voor de kansen die ik heb gekregen, zoals onder anderemijn aanwezigheid tijdens de Benelux Bioinformatics Conference in Luxemburg met de volledigegroep. Ik wil jullie in het bijzonder ook bedanken voor de gezellige en leuke werksfeer. Het wastelkens een plezier om bij jullie te komen werken!

    Ook mijn vrienden mogen hier zeker niet ontbreken. Bedankt om mijn studietijd de afgelopen jarenzo aangenaam te maken! Zowel binnen als buiten de lesuren waren er onvergetelijke momentendie vastgepind blijven in mijn geheugen. En ook dit jaar waren jullie weer volledig van de partij.Bedankt voor de gezellige middagpauze’s, etentjes ‘s avonds en cafébezoeken om stoom af teblazen en te delen in elkaars (thesis)miserie. Jullie hebben het woord ‘comfort food’ een geheel

  • iii

    andere dimensie gegeven! In het bijzonder ook nog een extra danku aan Danielle en Joost voor hetnalezen van bepaalde stukken van deze masterproef met bijhorend advies.

    Via deze weg zou ik ook graag mijn ouders bedanken voor de vele kansen die ze mij hebben gege-ven, zowel op studievlak als daarbuiten. Bedankt om mij telkens aan te moedigen en te motiveren.Ze zeggen wel dat je je leven zelf bepaald, maar zonder jullie onvoorwaardelijke steun, en dan be-doel ik niet enkel financieel maar ook emotioneel, zou ik nu niet staan waar ik nu sta. Integendeel.Mama en Papa, een super dankuwel om mij vroeger en nu te blijven stimuleren op studievlak enmij op weg te helpen naar wat ik eigenlijk echt wil.

    Adriaan, ook jij verdient een speciale vermelding in mijn dankwoord. Bedankt dat je er steedsvoor mij was en mij gesteund hebt. Ook op minder aangename momenten. Want als ik vastzit metiets, dan kan ik dat moeilijk loslaten tot ik een oplossing gevonden heb. Op werkvlak is dit waar-schijnlijk een voordelige eigenschap, maar voor jou zal dat soms net iets minder gezellig geweestzijn. Maar ook op die momenten wou je steeds naar mij luisteren en mij helpen en zo kon ik bij joutelkens tot rust komen. Bedankt voor de vele leuke momenten alsook de vele schrijfuren die we ditjaar samen hadden en waarin we elkaar konden vooruithelpen als één van ons twee een probleemof ‘writers block’ had. Bedankt dat ik altijd bij jou terecht kon!

    Sandra SteyaertGent, juni 2012

  • Inhoudsopgave

    Woord vooraf ii

    1 Lijst van afkortingen 1

    2 Samenvatting 4

    3 Inleiding 6

    4 Mono-allelische expressie 7

    4.1 Epigenetica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

    4.1.1 Epigenetische mechanismen . . . . . . . . . . . . . . . . . . . . . . . . . 9

    4.1.1.1 Histonmodificaties . . . . . . . . . . . . . . . . . . . . . . . . . 9

    4.1.1.2 DNA-methylatie . . . . . . . . . . . . . . . . . . . . . . . . . 11

    4.1.1.3 Niet-coderend RNA . . . . . . . . . . . . . . . . . . . . . . . . 14

    4.1.2 Regulatie van genexpressie door DNA-methylatie . . . . . . . . . . . . . 15

    4.1.3 Interactie tussen histonmodificaties, DNA-methylatie en niet-coderend RNA 15

    4.2 Mono-allelische expressie? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

    4.2.1 X-chromosoom inactivatie . . . . . . . . . . . . . . . . . . . . . . . . . . 16

    4.2.2 Autosomale genen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    4.2.3 Imprinting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

    4.3 Epigenetica en ziekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

    4.3.1 Ziektes gerelateerd aan imprinting . . . . . . . . . . . . . . . . . . . . . . 21

    4.3.1.1 Prader-Willi en Angelman syndroom . . . . . . . . . . . . . . . 22

    4.3.1.2 Kanker . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

    4.3.1.3 Opmars van ‘imprintingziektes’ . . . . . . . . . . . . . . . . . . 24

  • INHOUDSOPGAVE v

    4.3.2 Imprinting-onafhankelijke rol van epigenetica in kanker . . . . . . . . . . 24

    4.3.3 Andere ziektes en epigenetische therapieën . . . . . . . . . . . . . . . . . 25

    4.4 DNA-methylatie analysemethodes . . . . . . . . . . . . . . . . . . . . . . . . . . 25

    4.4.1 DNA-methylatie specifieke stap . . . . . . . . . . . . . . . . . . . . . . . 25

    4.4.2 Platformen en analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    5 Materialen & Methodes 29

    5.1 Hardware . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

    5.2 Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

    5.2.1 Bowtie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

    5.2.2 Perl en Bioperl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

    5.2.3 MySQL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

    5.2.4 Perl DBI en DBD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

    5.2.5 R omgeving . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    5.3 Detectie van mono- en bi-allelische DNA-methylatie . . . . . . . . . . . . . . . . 33

    5.3.1 Introductie en doel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    5.3.2 Algemene bespreking statistisch kader . . . . . . . . . . . . . . . . . . . 34

    5.3.2.1 Schatten van de allelfrequenties . . . . . . . . . . . . . . . . . 34

    5.3.2.2 Schatten van de genotypefrequenties . . . . . . . . . . . . . . . 35

    5.3.2.3 Identificeren van loci met significante mono-allelische methyla-tie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

    5.3.2.4 Voorbeeld 1: aanwezigheid van mono-allelische DNA-methyla-tie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    5.3.3 Bio-informatica pipeline: data-analyse . . . . . . . . . . . . . . . . . . . 40

    6 Resultaten 48

    6.1 Bepalen van de basefrequenties . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

    6.2 Traceren van SNPs en aanmaak totale SNP-tabel . . . . . . . . . . . . . . . . . . 48

    6.3 Bepalen van de SNP-frequenties . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

    6.4 Aanmaak van de tabel ListSamples . . . . . . . . . . . . . . . . . . . . . . . . . . 51

    6.5 Poweranalyses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

    6.6 Filtering data met behulp van de poweranalyse . . . . . . . . . . . . . . . . . . . 58

    6.7 Statistisch algoritme: detectie mono-allelisch gemethyleerde loci . . . . . . . . . . 59

  • INHOUDSOPGAVE vi

    7 Discussie 65

    8 Conclusie 69

    Bibliografie 70

    A Appendix 1

    A.1 Voorbeeld 2: afwezigheid van mono-allelische DNA-methylatie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

    A.2 Stalen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

    A.2.1 Totale set van 92 stalen . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

    A.2.2 Subset van 24 vrouwelijke stalen voor X-chromosoom analyse . . . . . . 7

    A.3 Resultaten poweranalyses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

    A.3.1 Resultaten poweranalyse op basis van artificiële data: 24 stalen . . . . . . 10

    A.3.2 Resultaten poweranalyse op basis van artificiële data: 92 stalen . . . . . . 14

    A.3.3 Resultaten poweranalyse op basis van reële data: 24 stalen . . . . . . . . . 18

    A.3.4 Resultaten poweranalyse op basis van reële data: 92 stalen . . . . . . . . . 20

    A.4 Scripts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

    A.4.1 Aanmaak van een SNP- en frequentietabel . . . . . . . . . . . . . . . . . 22

    A.4.2 Splitsen van de frequentietabel per chromosoom . . . . . . . . . . . . . . 27

    A.4.3 Geslachtbepaling van 92 stalen . . . . . . . . . . . . . . . . . . . . . . . 30

    A.4.4 Opvullen van de SNP-databank . . . . . . . . . . . . . . . . . . . . . . . 32

    A.4.5 Aanmaak van count table . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    A.4.6 Aanmaak totale SNP-tabel . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    A.4.6.1 Script 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    A.4.6.2 Script 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

    A.4.7 Aanmaak van een lijst van gedetecteerde SNPs per positie(tabel ListSamples) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

    A.4.8 Poweranalyses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    A.4.8.1 Poweranalyse op basis van artificiële data . . . . . . . . . . . . 40

    A.4.8.2 Poweranalyse op basis van reële data . . . . . . . . . . . . . . . 44

    A.4.9 Maken van 3D- en 2D-plots . . . . . . . . . . . . . . . . . . . . . . . . . 48

  • INHOUDSOPGAVE vii

    A.4.10 Filtering data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

    A.4.10.1 Filtering na artificiële poweranalyse . . . . . . . . . . . . . . . 49

    A.4.10.2 Filtering na reële poweranalyse . . . . . . . . . . . . . . . . . . 52

    A.4.11 Statistisch algoritme: detectie van mono-allelisch gemethyleerde loci . . . 56

  • 1Lijst van afkortingen

    A adenosineADP adenosine difosfaatAID activation-induced cytosine deaminaseATR-X alpha thalassemia syndroom X-gelinktbp basenparenC cytosinecf. conferCG cytosine guanineCMT3 cytosine DNA-methyltransferase 3CPAN comprehensive perl archive networkCRAN comprehensive R archive networkDBD database driverDBI database interfaceDMR differentieel gemethyleerde regioDNA deoxyribonucleı̈ne zuurDNMT1 DNA-methyltransferase 1DNMT3A/3B/3L DNA-methyltransferase 3A/3B/3LDNMTs DNA-methyltransferasenEZH2 enhancer of zeste homolog 2FDR false discovery rateFMR1 fragile X mental retardation protein 1G guanineGAIIx (Illumina) genome analyser IIxGRCh37 genome reference consortium human genome build 37H1 histoneiwit 1

  • 2

    H2A/H2B histoneiwit 2A/histoneiwit 2BH3 histoneiwit 3H3K27 lysine 27 van histoneiwit H3H3K9 lysine 9 van histoneiwit H3H3K9me gemethyleerd lysine 9 van histoneiwit H3H4 histoneiwit 4HAPMAP haplotype map projectHAT histon-acetyltransferaseHDAC histon-deacetylasehg19 human genome release 19HKMT histonlysine-methyltransferaseHMT histon-methyltransferaseHP1 heterochromatine eiwit 1ICF immunodeficiëntie centromeerinstabiliteit faciale anomalieëni.e. id estIgf2 insulin-like growth factorIgf2r insulin-like growth factor receptorMaq mapping and assembly with qualitiesMBD methylcytosine bindend (eiwit)domeinMBD1 methylcytosine bindend (eiwit)domein 1MBD2 methylcytosine bindend (eiwit)domein 2MBD3 methylcytosine bindend (eiwit)domein 3MBD4 methylcytosine bindend (eiwit)domein 4MBD-seq methylcytosine-bindende (eiwit)domeinen sequeneringmCpG gemethyleerd CpGMeCP2 methylcytosine bindend eiwit 2MeDIP methyl-DNA immunoprecipitatieMGMT O-methylguanine-DNA-methyltransferaseMi-2/NuRD Mi-2 (humaan antigen) bevattend nucleosome remodeling deacetylaseMILI MIWI likeMIWI2 murine homoloog 2 van PiwiMLH1 MutL protein homolog 1MOV10L1 moloney leukemia virus 10-like 1MRE methylatie-gevoelige restrictie-enzymenMVH mouse vasa homologN-terminaal amino-terminaalp53 (tumor) protein 53PCR polymerase chain reactionPerl practical extraction and report language

  • 3

    PHP hypertext preprocessorpiRNA’s Piwi-interagerende RNA’sPiwi P-element induced wimpy testisRAG V(D)J recombination-activating proteinRb retinoblastoma tumor suppressor(R)DBMS (relationeel) databank management systeemRNA ribonucleı̈ne zuurRNAi RNA interferencerox RNA on chromsome XSNP single nucleotide polymorfismeSOAP short oligonucleotide analysis packageSQL structured query languageSUVH4/KYP Suppressor of variegation 3-9 homolog protein 4/kryptoniteT thymineTDG thymine-DNA-glycosylaseTDRDs Tudor-domein-bevattende eiwittenU uracilUBE3A ubiquitin-protein ligase E3AVDJ variable-diversity-jointXist chromsome X-inactive specific transcript

  • 2Samenvatting

    Het onderwerp en doel van deze masterproef was het ontwikkelen van een methode om mono-allelische DNA-methylatie te detecteren. Mono-allelische DNA-methylatie oefent mogelijks eenbeduidende invloed uit op mono-allelische expressie. Mono-allelische expressie treedt op wanneerslechts één van de twee allelen van gen (in deze masterproef worden enkel diploı̈de organismenbeschouwd) actief is en tot expressie komt. Welk van de twee allelen transcriptioneel actief is,kan afhankelijk zijn van de parentale afkomst van het chromosoom waar het allel op ligt. Ditfenomeen wordt imprinting genoemd. Sommige van deze imprinted genen komen dus enkel totexpressie via het paternale allel, terwijl bij andere imprinted genen het paternale allel net onder-drukt wordt en enkel geëxpresseerd worden via het maternale allel. De keuze welk van de tweeallelen transcriptioneel onderdrukt is en welk net actief is, kan echter ook random zijn. Deze vormvan mono-allelische expressie werd reeds vastgesteld bij bepaalde autosomale genen alsook bij hetproces van X-chromosoom inactivatie.

    Foutieve mono-allelische expressie van bepaalde genen werd reeds gelinkt aan een aantal over-erfbare aandoeningen zoals onder andere het Prader-Willi syndroom en bepaalde vormen kanker.Het ontrafelen van de mechanismen die aan de grond liggen van mono-allelische expressie zou-den van grote betekenis kunnen zijn in de eventuele bestrijding van deze aandoeningen. Gezienmono-allelische DNA-methylatie meer dan waarschijnlijk een rol speelt in de regulatie van mono-allelische genexpressie, vormt het zoeken van zulke mono-allelisch gemethyleerde loci een eerstestap.

    Op basis van van 92 humane stalen, verkregen via methylcytosine-bindende (eiwit)domeinen se-quenering (MBD-seq) werd in deze masterproef een methode ontwikkeld om eventueel mono-allelisch gemethyleerde loci te detecteren. Deze methode omvat een bio-informatica pipeline diein de eerste stappen de sequentiedata pre-processed en de single nucleotide polymorfisme (SNP)-profielen van de stalen bepaalt om dan, na het uitvoeren van een poweranalyse, in de finale stap deverkregen data (SNP-posities) te analyseren aan de hand van een statistisch algoritme. Dit algo-ritme combineert bijgevolg de methylatieprofielen van de 92 stalen samen met de SNP-profielenom SNP-posities te detecteren die significant mono-allelische DNA-methylatie vertonen.

  • 5

    Door het sterke computationele karakter van de methode, werd deze hier enkel geı̈llustreerd voortwee chromosomen, namelijk 21 en X. Na uitvoering van de pipeline werden er voor chromosomen21 en X respectievelijk 36 en 1 SNP-posities gevonden waarbij, met een significantieniveau van0,05, significante mono-allelische DNA-methylatie werd gedetecteerd. In de toekomst moet nogonderzocht worden in welke functionele DNA-regio’s deze SNP-posities liggen (exonen, intronen,promotors). Verder moet aan de hand van RNA-sequentiedata gevalideerd worden of deze regio’smono-allelische expressie reguleren. Pas dan kan er iets duidends gezegd worden over de invloeden mechanismen van mono-allelische DNA-methylatie op genexpressie.

    Hoewel er op verschillende plaatsen in de pipeline nog ruimte is voor verdere optimalisatie, tonende resultaten aan dat de methode op zich wel werkt en toelaat om genen te screenen op eventuelemono-allelische DNA-methylatie. Deze proof-of-concept kan bijgevolg een goede basis zijn omin de toekomst de methode uit te breiden/optimaliseren om zo de analyse uit te voeren op meerstalen.

  • 3Inleiding

    In de meeste gevallen zijn de twee allelen van een gen (of genkopijen) actief en worden deze beidetot expressie gebracht. Men spreekt dan van bi-allelische expressie. Genexpressie wordt als mono-allelisch aangeduid indien slechts één van de twee allelen actief is. Het andere allel is gesilenced(= onderdrukt) en wordt hierdoor niet tot expressie gebracht. De keuze van een allel om mono-allelisch tot expressie te komen kan random zijn maar kan ook afhankelijk zijn van de parentaleoorsprong, een fenomeen bekend onder naam imprinting.

    Epigenetica wordt gedefinieerd als de studie van overerfbare modificaties op zowel chomatine alsDNA die een invloed hebben op de regulatie van genexpressie en dit zonder het wijzigen van denucleotidensequentie in het DNA. DNA-methylatie, een gekend epigenetisch mechanisme, speelteen significante rol in de regulatie van genexpressie.

    In deze masterproef wordt een methodologie voorgesteld die toelaat om genen te screenen diemono-allelisch gemethyleerd zijn en dus mogelijks een rol spelen in de regulatie van mono-allelisch expressie. Deze methodologie omvat een bio-informatica pipeline met als basis eenstatistisch kader ontwikkeld in R en start bij sequentiedata verkregen via MBD-seq. In Hoofd-stuk 4 volgt een korte literatuurstudie met onder andere een beschrijving van epigenetica, DNA-methylatie, mono-allelische expressie en DNA-methylatie analysemethodes. Nadien komt hetpraktische werk van deze masterproef aan bod met in Hoofdstuk 5 een overzicht gegeven vande gebruikte hard- & software vergezeld van de verschillende stappen in de bio-informatica pipe-line. Ook wordt het statistische kader dat aan de grondslag ligt van deze methodologie uitgebreidbeschreven en geı̈llustreerd aan de hand van hypothetische voorbeelden. Vervolgens worden inHoofdstuk 6 de resultaten getoond van de toepassing van de pipeline op 92 humane kankerstalenmet als doel de detectie van mono-allelisch gemethyleerde loci. In Hoofdstuk 7 volgt een discus-sie van de methode en de bekomen resultaten en Hoofdstuk 8 sluit deze masterproef af met eenalgemene conclusie.

  • 4Mono-allelische expressie

    ‘In the wake of the Human Genome Project, epigenetics is at a critical crystallization stage. Theway that it is defined, the boundaries that are drawn, and the language that is used will have long-lasting effects on future research and on the place of epigenetics in biological thinking’ [1].

    Zowel genetische wijzigingen, zoals onder andere mutaties en deleties, als afwijkende epigeneti-sche veranderingen, bijvoorbeeld DNA-methylatie, kunnen leiden tot ziektes als kanker [2]. Hettoenemende besef van de bijdrage van epigenetische processen in de genomische functie in ge-zondheid en ziekte wordt ondersteund door decennia van wetenschappelijk onderzoek naar mo-delsystemen. Voornamelijk studies betreffende genomische imprinting hebben bijgedragen tot deontrafeling van vele principes van epigenetische regulatie. De recent geboekte vooruitgang en dereeds talrijke ontdekkingen in dit domein tonen hoe het bestuderen van imprinting helpt om onsbegrip omtrent de epigenetische controle van genomische functie verder uit te breiden [3].

    4.1 Epigenetica

    Klassieke Mendeliaanse overerving van fenotypische kenmerken, zoals bijvoorbeeld de kleur vanerwten, resulteert uit allelische verschillen die het gevolg zijn van mutaties in de DNA-sequentie.Al deze mutaties samen vormen de kern van fenotypische kenmerken. Deze concepten plaatsenmutaties in de kern van de klassieke genetica. De oorsprong van epigenetica is echter afkomstigvan studies in vele organismen die afwijkende, niet-Mendeliaanse patronen van overerving bloot-leggen. Epigenetica betekent letterlijk ‘bovenop de genetische informatie’. Gedurende de laatste50 jaar heeft de betekenis van de term ‘epigenetica’ een evolutie ondergaan die parallel loopt metons toenemende besef over de moleculaire mechanismen die aan de grondslag liggen van de regu-latie van genexpressie bij eukaryoten. Oorspronkelijk refereerde epigenetica naar de beschrijvingvan gebeurtenissen die niet konden verklaard worden door reeds gekende genetische principes [4].

  • 4.1 EPIGENETICA 8

    Eén van de eerste wetenschappers die een duidelijke definite bedacht voor de term was Wadding-ton. Hij definieerde epigenetica als de tak van de biologie die de causale interacties tussen de genenen hun producten bestudeert, die een bepaald fenotype tot stand brengen [5]. Volgens Waddingtonis er geen simpele relatie tussen het geno- en fenotype van een organisme. Dit door enerzijds deinvloed van de omgeving en anderzijds door de complexe interacties tussen de controlerende genendie aan de touwtjes trekken van het genetische landschap, alsook de plasticiteit daarvan (zie Figuur4.1).

    (a) (b)

    Figuur 4.1: (a) Volgens Waddington zijn de genen in interactie met de omgeving en trekken deze aande touwtjes van het epigenetisch oppervlak, zodat het balletje, dat de symbolische voorstelling is van hetfenotype, op verschillende plaatsen kan terechtkomen. (b) De interacties die samen het epigenetische land-schap vormen. Door de complexe interacties tussen de genen die aan touwtjes trekken en de invloed van deomgeving is er geen simpele relatie tussen het geno- en fenotype van een organisme [5].

    De voorbije decennia zijn vele biologische fenomenen, die op het eerste zicht niet gerelateerd zijn,benoemd als epigenetisch. Een eerste voorbeeld is de ontdekking van paramutatie in maı̈s doorAlexander Brink in 1950 [6]. Bij paramutatie is er een trans-interactie tussen homologe sequentiesof twee allelen waarbij het ene allel een overerfbare verandering tot stand brengt in het andereallel met regulatorische en fenotypische verschillen tot gevolg [7]. Een ander voorbeeld is deontdekking, via experimenten met de fruitvlieg Drosophila, dat de positie van een gen binnen eenchromosoom een effect heeft op de expressie van dat gen [8, 9]. Ook het fenomeen van imprintingin specifieke paternale en maternale loci bij zoogdieren is één van deze epigenetische biologischefenomenen (zie Sectie 4.2.3). De term epigenetica wordt tegenwoordig voornamelijk gebruikt bijde beschrijving van mechanismen waardoor cellen een bepaalde vorm of functie verkrijgen en demanier waarop deze structurele en functionele toestand worden doorgegeven tijdens de celdeling[1]. De hedendaagse definitie is de volgende: ‘De studie van mitotisch en/of meiotisch overerfbareveranderingen in fenotype die niet kunnen worden verklaard door verschillen in DNA-sequentie’[10]. Een multi-cellulair organisme bijvoorbeeld bestaat voor het grootste deel uit cellen met eenidentiek genotype, doch de ontwikkeling van het organisme genereert een diversiteit aan celtypesmet verschillende functies en ongelijke maar stabiele profielen in genexpressie. Door de recenteexplosie in het epigenetisch onderzoek worden de vele vraagtekens stap voor stap beantwoord meteen geleidelijke toename in de kennis over epigenetische mechanismen tot gevolg.

  • 4.1 EPIGENETICA 9

    4.1.1 Epigenetische mechanismen

    Het huidige epigenetisch onderzoek is voornamelijk gericht op de studie van covalente en niet-covalente modificaties van het DNA en de histonen, alsook van de mechanismen waardoor dezemodificaties de chromatinestructuur beı̈nvloeden. Chromatine is het complex van DNA en histo-nen (zie Figuur 4.2(a)) en is de template voor het creëren van het epigenetische landschap [11]. Hetnucleosoom is de fundamentele zich herhalende eenheid van chromatine [12, 13]. Het is een pa-relvormig histonoctameer bestaande uit telkens twee moleculen van de histoneiwitten H2A, H2B,H3 en H4, waarrond 200bp DNA gebonden is (zie Figuur 4.2(b)). Histonen zijn positief geladeneiwitten met arginine- en lysine-rijke basische regio’s en zijn opgebouwd uit een globulair domeinen een flexibele ongestructureerde histonstaart die uitsteekt aan het oppervlak van het nucleosoom.Het DNA dat rechtstreeks contact maakt met de histoneiwitten is 147bp lang, gevolgd door eentussenstuk (“linker”) van variabele lengte. Een extra perifeer histoneiwit, namelijk H1, helpt bijhet verder compacteren van de chromatinedraad [12].

    Chromatine is een dynamische molecule die veel configuraties kent. Historisch wordt chromatineopgedeeld in ofwel euchromatine ofwel heterochromatine, hoewel geweten is dat er in beide klas-ses meerdere vormen bestaan. Euchromatine is de ongecondenseerde en bijgevolg niet compactechromatine waarin de actieve genen liggen, doch het kan ook transcriptioneel inactief zijn. Bijzoogdieren is slechts 4% van het genoom vervat in euchromatine. Heterochromatine wordt gedefi-nieerd als zeer compacte en silenced chromatine en speelt een cruciale rol in de organisatie en hetcorrect functioneren van genomen. Er worden twee vormen onderscheiden, namelijk constitutieveen facultatieve heterochromatine, waarbij het chromatine respectievelijk permanent compact is enwaarbij de compactheid afhankelijk is van het celtype of het ontwikkelingsstadium van de cel [10].Heterochromatine speelt een essentiële rol in de chromosomale organisatie, zoals het ontstaan vancentromeer-, pericentromeer- en telomeerregio’s [14].De toegankelijkheid en dus de genexpressie van het DNA in het chromatine is afhankelijk van on-der andere histonmodificaties, DNA-methylatie en de aanwezigheid van nucleosomen op bepaaldestrategische posities in het DNA. Deze factoren kunnen met elkaar interageren en bij het bestu-deren van epigenetische mechanismen, zouden deze entiteiten indien mogelijk collectief moetenworden behandeld. [4, 15, 16]. Histonmodificaties bijvoorbeeld controleren samen met DNA-methylatie de opvouwing van de nucleosomale eenheid tot hogere orde structuren en spelen eenregulatorische rol in de signalisatie van cellulaire processen [17].

    4.1.1.1 Histonmodificaties

    Op basis van de aminozuursequentie blijkt dat histoneiwitten sterk geconserveerd zijn tussen ver-schillende organismen. Dit ondersteunt de hypothese dat deze eiwitten belangrijke functies ver-vullen. De N-terminale histonstaarten, vooral van H3 en H4, kunnen worden onderworpen aanallerlei post-translationele covalente modificaties zoals acetylatie, methylatie, fosforylatie, ubiqui-tinatie, sumoylatie, carbonylatie, glycosylatie, ADP-ribosylatie, biotinylatie, proline-isomerisatie

  • 4.1 EPIGENETICA 10

    (a) (b)

    Figuur 4.2: (a) Chromatine is opgebouwd uit DNA gewikkeld rond histonen. (b) De basiseenheid is een nu-cleosoom, een histonoctameer met DNA (zwarte lijn), dat telkens herhaald en compact opgevouwen wordt.Een nucleosoom ontstaat door binding van een H3/H4 tetrameer aan het DNA, gevolgd door twee sets vanH2A/H2B dimeren. De kern van het nucleosoom bestaat uit de globulaire domeinen van de acht histon-eiwitten. De periferie van het nucleosoom bestaat uit de ongestructureerde aminoterminale histonstaarten[10].

    en waarschijnlijk nog vele andere [18, 19]. Specifieke enzymes en enzymcomplexen zoals bijvoor-beeld histon-acetyltransferases (HAT’s), histon-deacetylases (HDAC’s) en histon-methyltransfera-ses (HMT’s) katalyseren deze covalente modificaties, die plaatsvinden op specifieke plaatsen enaminozuren in de histonstaart. Een bijkomende complexiteit is dat de histonmethylatie kan voor-komen in zowel een mono-, di- en trigemethyleerde vorm, elk bewerkstelligd door een specifiekHMT. Hoewel histonen en hun modificaties sterk geconserveerd zijn, toont onderzoek aan dat dechromosomale distributie van individuele modificaties sterk kan variëren in functie van de cel-cyclus, alsook binnen en tussen bepaalde groepen van eukaryoten [17]. In bepaalde chromatineregio’s kunnen nucleosomen varianten van de histoneiwitten bevatten. Momenteel zijn er al va-rianten van H2A en H3, maar nog geen van H2B en H4 gevonden. Hoewel deze varianten nietfrequent voorkomen, zijn ze waarschijnlijk essentieel voor de epigenetische regulatie [20].

    Vele studies tonen aan dat de aanwezigheid van euchromatine vaak positief geassocieerd is methyperacetylatie van lysineresidue’s op histoneiwitten alsook met andere actieve markeringen zoalsbijvoorbeeld methylatie op lysine 4, lysine 36 en lysine 79 in H3. Het voorkomen van hetero-chromatine is daarentegen vaak geassocieerd met deacetylatie van de histoneiwitten, met onder-drukkende markeringen zoals methylatie op lysine 9 en lysine 27 in H3 en lysine 20 in H4, metDNA-methylatie en met de aantrekking van onderdrukkende effectoren zoals het heterochromatineeiwit 1 (HP1) [14]. De schikking van de nucleosomen in het chromatine kan aangepast wordendoor trans- en cis-effecten van de gemodificeerde histonstaarten (zie Figuur 4.3). Cis-effecten zijnhet gevolg van aanpassingen in de fysische eigenschappen van histonmodificaties, zoals onder an-dere de ruimtelijke grootte of elektrische lading, die zorgen voor een verandering in het contacttussen de nucleosomen. Histonacetylatie bijvoorbeeld neutraliseert de positieve ladingen van desterk basische histonstaarten met een lokale expansie van de chromatinevezel als gevolg, waardoor

  • 4.1 EPIGENETICA 11

    de dubbele DNA-helix beter toegankelijk wordt voor het transcriptiecomplex. Histonmodificatieskunnen ook een chromatine-geassocieerd eiwit (modification binder) aantrekken dat vervolgenseen invloed uitoefent op de chromatinestructuur (trans-effect). Bepaalde histonmodificaties kun-nen ook een zodanige stimulus uitvoeren waardoor een histoneiwit in de kern van het nucleosoomvervangen wordt door een variant [10].

    Figuur 4.3: Transities in het chromatine patroon. Cis-effecten: een covalente modificatie van een his-tonstaart resulteert in een wijzing van de structuur of de lading met een verandering in de organisatie vanchromatine tot gevolg. Trans-effecten: een enzymatische modificatie van een aminozuur in de histonstaartkan resulteren in een affiniteit voor een chromatine-geassocieerd eiwit (modification binder). De associatievan een modification binder veroorzaakt stroomafwaarts wijzigingen in de chromatinestructuur. Histonsub-stitutie: een covalente histonmodificatie of andere stimulus kan aanleiding geven tot de vervanging van eenhistoneiwit door een variant histoneiwit via een nucleosoom-hermodeleringscomplex [10].

    4.1.1.2 DNA-methylatie

    DNA-methylatie is het tot nu toe best gekarakteriseerde epigenetische mechanisme en is betrok-ken in diverse biologische processen [4]. Het is in verschillende hoeveelheden aanwezig in zowelprokaryoten als in de meeste eukaryoten met de gist Saccharomyces cerevisiae en de nematodeCaenorhabditis elegans als belangrijke gekende uitzonderingen. Bij deze modificatie wordt er openzymatische wijze een methylgroep geplaatst op cytosineresidu’s in de DNA-sequentie zodat er5-methylcytosine gevormd wordt. In bacteriën biedt DNA-methylatie bescherming aan het gast-heerorganisme tegen zijn eigen restrictie-enzymen, die binnendringend faag-DNA knippen. In demeeste grote eukaryotische groepen, zoals planten, vele schimmels en dieren, is DNA-methylatiegeconserveerd en heeft het een functie in onder andere silencing van transposons, transcriptionelegensilencing, paramutatie en imprinting (zie Sectie 4.2.3) [21, 22].In planten vindt DNA-methylatie voornamelijk plaats op cytosines in een CG, CHG en CHHmet H=A, C of T, terwijl dit in zoogdieren voornamelijk plaatsvindt op de symmetrische CG-dinucleotide, hoewel er ook beperkte niet-CG-methylatie voorkomt, voornamelijk in stamcellen[23, 24]. Gezien in deze masterproef enkel gewerkt werd met samples van humane oorsprong zal

  • 4.1 EPIGENETICA 12

    in het komende deel van deze scriptie enkel DNA-methylatie bij zoogdieren besproken worden,tenzij uitdrukkelijk anders vermeld.Het DNA uit somatisch zoogdierweefsel is op 70% van alle CG’s gemethyleerd [25]. Verschillendemapping studies tonen aan dat sterk gemethyleerde sequenties voornamelijk voorkomen in satel-liet DNA, repetitieve elementen zoals transposons, niet-repetitief intergenerisch DNA en exons vangenen. Deze worden gemethyleerd naargelang het aantal CG-dinucleotiden, waarbij de voorkeuruitgaat naar het methyleren van exons. Een belangrijke uitzondering hierop zijn CpG-eilanden,regio’s in het genoom die relatief veel CG-dinucleotiden in hun sequentie bevatten. Het menselijkgenoom heeft een gemiddeld CG% van 41%, terwijl CpG-eilanden een CG% hebben van onge-veer 67%. Een DNA-regio wordt gedefinieerd als een CpG-eiland indien de regio 500 of meerbasenparen bezit met een CG-basenpaar percentage van meer dan 50% en een CpG-dinucleotideobserved/expected ratio iets groter dan 0,6. CpG-eilanden zijn normaal ongemethyleerd en wor-den voornamelijk stroomopwaarts gevonden van genen, namelijk in de promotorregio en het eersteexon. De meeste CpG-eilanden blijven dus vrij van methylatie. Ongeveer 60% van de promotorszijn gelinkt met een CpG-eiland. DNA-methylatie van deze eilanden is gelinkt met transcriptionelerepressie [26, 27].Deaminatie van een ongemethyleerde C geeft aanleiding tot een U die terug hersteld wordt naareen C, terwijl deaminatie van een gemethyleerde C resulteert in een T. De C’s blijven dus vooralbewaard in niet-gemethyleerd DNA. De deaminatie van een gemethyleerde C en bijgevolg de sub-stitutie van een C naar een T is een proces dat plaatsvindt op evolutionaire schaal (een soort vanmutatie). Deze substitutie is ook de reden dat er minder CpG-dinucleotiden aanwezig zijn (CpG-dinucleotide observed/expected ratio ∼ 0,6) dan er at random zouden verwacht worden op basisvan de nucleotidenfrequenties (CpG-dinucleotide observed/expected ratio van 1) [4, 28].

    Genomische patronen van cytosine methylatie, bewerkstelligd door zowel de novo als onderhouds-DNA-methyltransferasen, spelen een cruciale rol in de organisatie van chromatine en genregu-latie gedurende de embryo- en gametogenese, maar ook in de normale cellulaire werking [27,29]. In zoogdieren zijn er drie actieve DNA-methyltransferasen (DNMTs), namelijk DNMT1,DNMT3A en DNMT3B. DNMT1 is een onderhouds-DNA-methyltransferase en zorgt voor hetbehoud van DNA-methylatie terwijl DNMT3A en DNMT3B verantwoordelijk zijn voor de novoDNA-methylatie. Onderhouds-DNA-methyltransferases voegen een methylgroep toe aan hemi-gemethyleerd DNA voornamelijk tijdens DNA-replicatie met S-adenosyl-L-methionine als sub-straat. DNMT1 herkent de replicatievork waarna het efficiënt de CG-dinucleotiden methyleertwaar de reeds bestaande streng ook gemethyleerd was. Dit in tegenstelling tot de novo DNMTsdie methylgroepen toevoegen voornamelijk na DNA-replicatie (zie Figuur 4.4) [30, 31]. DNMT3Lheeft geen katalytische activiteit maar functioneert als een regulator van DNMT3A en DNMT3B[32]. DNMT2 is in feite geen DNMT maar een tRNA-methyltransferase en heeft hierdoor recentde naam tRNA-asparaginezuur-methyltransferase gekregen [33].

    Reeds tijdens de gametogenese vindt bij zoogdieren aanzienlijke de novo DNA-methylatie plaats.DNA-methylatie in zowel mannelijke als vrouwelijke geslachtscellen speelt een belangrijke rol ingenomische imprinting (zie Sectie 4.2.3). Naast genomische imprinting is DNA-methylatie in ga-

  • 4.1 EPIGENETICA 13

    Figuur 4.4: Een streng van genomisch DNA waarbij de CpG paren gemarkeerd zijn als verticale lijnen. On-gemethyleerd DNA (boven) wordt de novo gemethyleerd door DNMT3A en DNMT3B waardoor symme-trische methylatie bekomen wordt op bepaalde CG-dinucleotiden. Na DNA-replicatie worden twee nieuwedubbelstrengen gevormd met een nieuw gevormde DNA streng en een gemethyleerde ouderlijke streng. Inde figuur is slechts één van beide dubbelstrengen weergegeven. Het onderhouds-DNA-methyltransferaseDNMT1 zorgt ervoor dat de symmetrische methylatie geconserveerd wordt op loci die na replicatie nogslechts half gemethyleerd zijn, maar zal geen nieuwe niet-gemethyleerde CG’s methyleren [10].

    meten ook belangrijk voor de onderdrukking van transposons. Uit het onderzoek van Kato et al.[34, 35] bleek dat mannelijke muizen die deficiënt waren voor DNMT3L naast defecten in imprin-ting, tevens geen methylatie konden uitvoeren op transposons waardoor deze ongecontroleerd totexpressie kwamen. Naast dit ontwikkelingsstadium zijn er nog twee andere ontwikkelingsstadiain zoogdieren die de novo DNA-methylatie ondergaan. In zoogdieren wordt het methylatiepatroonreeds vroeg in de ontwikkeling gevestigd door een sterk georganiseerd proces van genoomwijdedemethylatie en de novo methylatie. Tijdens de preı̈mplantatiefase, voorafgaand aan de vasthech-ting van het embryo aan de uteruswand, wordt het overgeërfde methylatiepatroon in de gametengrotendeels omgezet naar hydroxymethylatie. Op basis van dit hydroxymethylatiepatroon onder-gaat het embryo een golf van de novo methylatie waardoor een nieuw methylatiepatroon wordtvastgelegd dat nadien overgenomen wordt in de opeenvolgende celreplicaties [36, 37].Eenzelfde fenotype komt voor in muizen deficiënt in MILI en MIWI2, twee eiwitten van de Piwi-familie. De Piwi-familie behoort tot de ARGONAUTE-superfamilie en de leden van de Piwi-familie binden met Piwi-interagerende RNA’s (piRNA’s), niet-coderende kleine RNA’s met eenlengte van ongeveer 24-32 nucleotiden. Tienduizenden piRNA’s zijn reeds gevonden in zoog-dieren, de zebravis en Drosophila, doch nog niet in planten. De twee Piwi-eiwitten MILI enMIWI2 zijn in muizen betrokken bij de generatie van piRNA’s in foetale mannelijke gonaden endeze piRNA’s spelen een belangrijke rol in de silencing van transposons met behulp van DNA-methylatie. Deze bevindingen suggereren dat Piwi-piRNA complexen en DNA-methylatie samen-werken in de onderdrukking van transposons in geslachtscellen [38, 39]. Naast Piwi-eiwiten zijnonder andere ook nog Tudor-domein-bevattende eiwitten (TDRDs), het MVH-ewit en MOV10L1

  • 4.1 EPIGENETICA 14

    essentieel voor een correcte generatie van piRNA’s en bijgevolg correcte DNA-methylatie [40–42].

    Naast het uitvoeren en onderhouden van DNA-methylatie, vindt er in planten en dieren ook DNA-demethylatie plaats. Er wordt een onderscheid gemaakt tussen passieve en actieve DNA-deme-thylatie. Passieve demethylatie treedt op wanneer de processen van DNA-methylatie verstoordworden, zodat de aanwezige DNA-methylatie na DNA-replicatie verdund wordt. In andere ge-vallen wordt DNA-methylatie door actieve DNA-demethylatie verwijderd. Passieve en actievedemethylatie kunnen tijdens specifieke ontwikkelingsstadia simultaan zorgen voor het reducerenvan de DNA-methylatie. Hoewel er sterke aanwijzingen zijn dat actieve DNA-methylatie ook indierlijke cellen voorkomt, zijn de moleculaire details van dit proces nog niet gekend [24, 43].

    Jost et al. [44] stellen een glycosylase-afhankelijke demethylatiepathway voor in dieren. Bij hetbestuderen van kippenembryo’s is er een thymine-DNA-glycosylase (TDG) gevonden met een 5-methylcytosine activiteit, die echter veel lager ligt dan de base excision activiteit gericht tegeneen verkeerdelijk gepositioneerd thymine. Naast TDG is er ook nog een methylcytosine-bindendeiwitdomein (MBD4) ontdekt met DNA-glycosylase activiteit. Ook hier is de 5-methylcytosine-glycosylase activiteit van MBD4 lager dan de base excision thymine-DNA-glycosylase activiteit[45]. Om in vivo DNA-demethylatie te verwezenlijken, zijn vermoedelijk bijkomende eiwittennoodzakelijk. Uit de resultaten van verdere studies blijkt dat DNMT3A, DNMT3B en het deami-nase AID in vitro 5-methylcytosine deamineren tot thymine waarna ofwel TDG ofwel MBD4 onaf-hankelijk van elkaar hun functie kunnen uitoefenen, namelijk het uitknippen van de T/G mismatch.Ook al staan DNMT3A en DNMT3B algemeen bekend als DNA-methyltransferases, onder lageS-adenosyl-L-methionine concentraties kunnen ze functioneren als deaminases [46–48]. Een alter-natieve mogelijkheid voor DNA-demethylatie is het proces waarbij de 5-methylgroep geoxideerdwordt. TET1 is een enzym teruggevonden in zoogdieren dat de conversie van 5-methylcytosinenaar 5-hydroxymethylcytosine kan katalyseren. Het is mogelijk dat 5-hydroxymethylcytosine op-treedt als een intermediair dat finaal vervangen wordt door een ongemethyleerd cytosine doorDNA-herstelmechanismen [49, 50].

    4.1.1.3 Niet-coderend RNA

    Studies op een aantal modelorganismen van schimmels, planten en dieren leverden nieuw bewijsdat RNA, in het bijzonder niet-coderend RNA, een significante rol speelt in de controle van epige-netische regulatie, chromosomale dynamica, interacties op lange afstand, alsook in fenomenen dieeen impact hebben op de normale cellulaire differentiatie en de ontwikkeling van het organisme.Processen waarbij niet-coderend RNA duidelijk betrokken is, zijn doseringscompensatie in Dro-sophila en zoogdieren, respectievelijk via rox en Xist RNA’s en silencing van genen en repetitieveDNA-sequenties in bijna alle eukaryoten door zowel posttranscriptionele als transcriptionele RNAinterference (RNAi)-mechanismen [14]. RNA beschouwen als een extra epigenetisch mechanismeis echter wel ‘epigenetica in de brede zin’ gezien de informatie van het RNA reeds volledig vervatzit in het genoom.

  • 4.1 EPIGENETICA 15

    4.1.2 Regulatie van genexpressie door DNA-methylatie

    In zoogdieren speelt DNA-methylatie een rol in diverse processen waaronder embryo- en gameto-genese, stamceldifferentiatie, genomische imprinting (zie Sectie 4.2.3), X-chromosoominactivatie(zie Sectie 4.2.1), silencing van repetitieve elementen en regulatie van de neurale ontwikkeling.Verder speelt aberrante DNA-methylatie een rol in bijvoorbeeld de ontwikkeling van verschillendetypes van tumoren [24]. Hoe kan DNA-methylatie interfereren met genexpressie?

    Een manier waarop DNA-methylatie de genexpressie kan reguleren is via recrutering van eiwit-ten met bindingsaffiniteit voor gemethyleerde CpGs (mCpG). Dergelijke proteı̈nen behoren totde methylcytosine bindend (eiwit)domein (MBD) familie bestaande uit MeCP2, MBD1, MBD2,MBD3 en MBD4. MBD2 en MBD3 zijn twee uitwisselbare units van het Mi-2/NuRD com-plex, een chromatine hermodelleringscomplex teruggevonden in eukaryoten [51]. Van drie vande MBD-eiwitten, namelijk MBD1, MBD2 en MeCP2 is aangetoond dat ze betrokken zijn bij demethylatie-afhankelijke onderdrukking van transcriptie. Ook van Kaiso, een ongerelateerd eiwit,is aangetoond dat het bindt op gemethyleerd DNA en zorgt voor een methylatie-afhankelijke re-pressie van genexpressie [10]. Een mechanisme van repressie werd ontdekt bij MeCP2: MeCP2gaat een interactie aan met het Sin3A HDAC corepressorcomplex, wat impliceert dat de repressieafhankelijk is van histon-deacetylatie. DNA-methylatie kan aldus gelezen worden door MeCP2dat een signaal geeft voor een wijziging in de chromatinestructuur [52]. Na deze ontdekking heeftmen ook de drie andere methyl-CpG-bindende eiwitten verder onderzocht en aangetoond dat elkvan de vier methyl-CpG-bindende eiwitten interageert met een verschillend corepressorcomplex.

    Onderzoek op de doelwitsequenties van deze MBD-eiwitten wijst uit dat de MBD-bindingsregio’sin het genoom weinig overlappend zijn. Dit resultaat is in overeenstemming met het toene-mende bewijs dat MBD-binding specificiteit vertoont voor bepaalde DNA-sequenties. Zo pre-fereert MeCP2 mCpG-regio’s die geflankeerd zijn door AT-rijk DNA, heeft MBD1 een extraDNA-bindend domein specifiek voor niet-gemethyleerd CpG en herkent Kaiso enkele aangren-zende mCpG-motieven [10, 53, 54]. Enkel MBD2 blijkt tot dusver een exclusieve affiniteit tevertonen voor mCpG.

    4.1.3 Interactie tussen histonmodificaties, DNA-methylatie en niet-coderend RNA

    De hierboven beschreven scenario’s veronderstellen dat CpG-methylatie de standaardtoestand isvan het genoom en dat ongemethyleerde CpG-eilanden ontstaan door de globale methylatieactivi-teit te ontwijken. Meer en meer wordt gedacht dat de patronen van DNA-methylatie bepaald wor-den door de modificatie van het onderliggende chromatine, zoals histonmodificaties. Bewijs voordit idee werd reeds gevonden in onder meer de modelplant Arabidopsis thaliana. In deze plant ismethylatie veel minder beperkt tot CpG-dinucleotiden en afhankelijk van de aanwezigheid van me-thylatie op lysine 9 op histoneiwit H3 (H3K9me). Deze modificatie wordt gekatalyseerd door hetHMT SUVH4/KYP. SUVH4/KYP is noodzakelijk voor het onderhoud van niet-CpG-methylatie.

  • 4.2 MONO-ALLELISCHE EXPRESSIE? 16

    SUVH4 kan direct binden op gemethyleerd DNA waardoor DNA-methylatie dus noodzakelijk isvoor voor de aantrekking van SUVH4. Het niet-CpG DNA-methyltransferase CMT3 daarentegenkan direct interageren met de N-terminale histonstaart van H3, maar enkel wanneer dit histonei-wit gemethyleerd is op zowel H3K9 als H3K27. Dit suggereert dat histonmethylatie op H3K9 enH3K27, gekatalyseerd door SUVH4/KYP, een histoncode verschaft die zorgt voor de aantrekkingvan CMT3 om DNA te methyleren alsook een positieve feedback loop ontwikkelt tussen H3K9- enDNA-methylatie [55–57]. Zowel DNA-methylaties als histonmodificaties zijn dus belangrijke epi-genetische markeringen voor genregulatie. Verder is er in planten ook nog aangetoond dat RNAikan zorgen voor histonmodificaties, gensilencing en DNA-methylatie [14, 58].

    In zoogdieren, waar CpG-methylatie dominant is, zijn deze relaties nog niet zo duidelijk be-vestigd. Toch is reeds aangetoond dat de afwezigheid van twee H3K9 specifieke histonlysine-methyltransferasen (HKMT’s) zorgt voor een gereduceerde CpG-methylatie [59]. Daarenbovenzorgt de uitputting van het Polycombgroep eiwit EZH2, een H3K27 specifiek HKMT, voor eenverlies aan CpG-methylatie van bepaalde promotors [60]. De novo methylatie afkomstig vanRNAi-mechanismen is ook reeds geobserveerd in vitro, doch het onderliggende mechanisme isnog niet ontrafeld [61]. Doseringscompensatie, het proces dat zorgt voor de compensatie van hetongelijk aantal X-chromosomen in mannen en vrouwen, is in zoogdieren nauw geassocieerd met dewerking van bepaalde niet-coderende RNA’s die uiteindelijk leiden tot veranderingen in chromati-nestructuur. Deze structuurveranderingen onderdrukken (zoogdier)genen van het X-chromosoom,zodat er zowel bij mannen als vrouwen een gelijk aantal transcripten van het X-chromosoom aan-wezig is (zie ook Sectie 4.2.1) [14].

    4.2 Mono-allelische expressie?

    In de meeste gevallen worden beide allelen van het gen gebruikt voor transcriptie, bi-allelischeexpressie genoemd. Een minderheid van de genen echter, vertoont mono-allelische expressie. Hieris slechts één van de twee kopieën van het gen transcriptioneel actief. Welk van de twee allelenactief is, wordt ofwel random gekozen of hangt af van de parentale oorsprong (imprinting) (zieFiguur 4.5) [62].

    4.2.1 X-chromosoom inactivatie

    Het best gekende voorbeeld van mono-allelische expressie is X-chromosoom inactivatie bij zoog-dieren. Vrouwelijke zoogdieren hebben twee kopieën van het X-chromosoom, terwijl mannen éénX- en één Y-chromosoom bezitten. In vrouwen worden de meeste genen gelegen op één kopie vanhet X-chromosoom in elke cel geı̈nactiveerd om zo de algehele gendosage, het transcriptieniveau,van de meeste X-gelinkte genen gelijk te stellen in mannen en vrouwen, een fenomeen dat dose-ringscompensatie wordt genoemd. X-inactivatie doet zich reeds vroeg in de ontwikkeling voor,namelijk in het 64- tot 128-cellig stadium van zygoten. Elke cel maakt hierbij een onafhankelijke

  • 4.2 MONO-ALLELISCHE EXPRESSIE? 17

    Figuur 4.5: Wanneer beide allelen tot expressie komen, spreekt men van bi-allelische expressie (links).Indien slechts één van de twee allelen transcriptioneel actief is, vertoont het gen mono-allelische expressie(rechts). Welk van de twee allelen actief is, wordt random gekozen of is afhankelijk van de parentaleoorsprong van het allel (imprinting) [62].

    random keuze welk van de twee chromosomen geı̈nactiveerd zal worden. Eens de keuze vastligtvoor een bepaalde cel zullen alle afstammelingen van deze cel hetzelfde patroon vertonen.

    4.2.2 Autosomale genen

    X-chromosoom inactivatie heeft een invloed op bijna alle genen van het desbetreffende X-chro-mosoom en vele jaren werd aangenomen dat dit een uniek proces was. Een paar decennia terugwerd echter een gelijkaardig effect waargenomen bij sommige autosomale genen. In het immuun-systeem zijn er een aantal epigenetische gebeurtenissen die leiden tot de mono-allelische expressievan genen betrokken in de productie van onder andere antilichamen, immunoglobuline receptorenen cytokines [63, 64].

    Het genoom van zoogdieren is georganiseerd in chromosomale banden die geprogrammeerd zijnom op verschillende tijdstippen te repliceren in de vroege S-fase van de celcyclus. In geval vanmono-allelisch geëxpresseerde genen zullen die allelen die tot expressie komen eerst replicerenterwijl de gerepresseerde allelen pas later verdubbelen. Dit verschil in replicatietijdstip dientals een markering om allel-specifieke epigenetische processen zoals histonmodificaties en DNA-methylatie te sturen [63, 65].

    Het adaptieve immuunsysteem kan een opmerkelijk aantal variante antilichamen genereren als re-actie op vreemde antigenen. De genetische basis voor deze diversiteit zit reeds gecodeerd in de

  • 4.2 MONO-ALLELISCHE EXPRESSIE? 18

    gameten maar de uitbreiding van de diversiteit is afhankelijk van somatische herschikking die ophaar beurt nog eens geamplificeerd wordt door somatische hypermutaties. Het hoofdmechanismeom diversiteit te genereren in de antigenreceptoren wordt gemedieerd door RAG-genen en behelstde variable-diversity-joint (VDJ) recombinatie [66]. Reeds in het vroege embryo dirigeren diffe-rentiële replicatietijdstippen een aantal allel-specifieke epigenetische gebeurtenissen op het vroeggerepliceerde allel zoals DNA-demethylatie en recombinatie. Deze verkozen mono-allelische re-combinatie wordt gestabiliseerd door een terugkoppelingsmechanisme met een inhiberend effectop de recombinatie van het andere allel. Eens dit gebeurd is, zal deze markering stabiel zijn en re-sulteren in twee merkbaar verschillende allelen die vervolgens differentieel toegankelijk zijn voormono-allelische expressie [67, 68]. VDJ-recombinatie is bijgevolg beperkt tot één allel, wat ver-zekert dat er slechts één antigenreceptor op het oppervlak van de cel terecht komt. Het chromatinebehorend tot het overblijvende gemethyleerde allel wordt omgezet tot heterochromatine en het al-lel wordt enkel afgeschreven en gerecombineerd indien het eerste allel faalt een functioneel eiwitte produceren [69].Hoewel alle mono-allelisch geëxpresseerde genen asynchroon repliceren, is asynchrone replicatieop zichzelf niet voldoende voor mono-allelische expressie. In sommige andere weefsels kan deasynchrone replicatie van hetzelfde gen nog steeds voorkomen terwijl het hier bi-allelisch of zelfshelemaal niet geëxpresseerd wordt. Er wordt gedacht dat het mechanisme dat de asynchrone chro-mosoomreplicatie verzorgt, een invloed uitoefent op polycomb eiwitten zoals bijvoorbeeld Eed,dat een deel is van het H3K27 histonmethyltransferase-complex [70].

    De selectieve expressie van één enkel receptorgen gelegen in een genencluster vindt niet plaats viavrij bewegende transcriptiefactoren, maar wendt grote multiproteı̈necomplexen aan die geassem-bleerd worden op specifieke loci. Vervolgens worden de promotors van de desbetreffende genenaangetrokken tot deze loci [71]. Op een soortgelijke manier worden de afzonderlijke patronenvan mono-allelische expressie in verschillende populaties van T-helper cellen verkregen. Hierbijinterageren regulatorische regio’s van het interferon-γ locus op chromosoom 10 met plaatsen opchromosoom 11 die regio’s bevatten die coderen voor interleukine genen [63]. Gedacht wordt dateen gelijkaardig mechanisme verantwoordelijk is voor de mono-allelische keuze van een speci-fieke geurreceptor in een genencluster van verschillende geurreceptoren. Bij elk neuron dat dienstdoet als geurreceptor komt er van de vele genenclusters die verspreid liggen op de chromosomenmaar één receptorgen van één genencluster mono-allelisch tot expressie. Dit kent aan elk gegevenneuron een specificiteit van herkenning toe [72].

    4.2.3 Imprinting

    In tegenstelling tot het random proces van X-inactivatie en mono-allelische expressie bij auto-somen, bleek de mono-allelische silencing op sommige autosomen afhankelijk van de parentaleafkomst van het chromosoom waar het allel op ligt. Dit fenomeen, imprinting genaamd, is dus eenepigenetisch gereguleerd proces dat ervoor zorgt dat specifieke genen enkel geëxpresseerd wordenals ze afkomstig zijn van één specifieke ouder. Bijgevolg komen sommige imprinted genen enkel

  • 4.2 MONO-ALLELISCHE EXPRESSIE? 19

    tot expressie van het paternaal allel, terwijl andere enkel tot expressie komen van het maternaalallel. Een voorbeeld van een imprinted gen is het gen dat codeert voor insulin-like growth factor2. Hierbij wordt enkel het allel afkomstig van de paternale kant tot expressie gebracht, terwijl hetallel gelegen op het maternale homologe chromosoom gemethyleerd is en niet tot expressie komt[73].

    Imprinting is essentieel voor een normale groei en ontwikkeling, zowel pre- als postnataal, vanzoogdieren. Ook bij planten en insecten zijn er reeds imprinted genen ontdekt [28]. Hoewel dezeeffecten reeds 40 jaar geleden geobserveerd werden, was het vooral door embryonale en genetischemanipulaties in de muis dat dit fenomeen in kaart werd gebracht. Dit, samen met gedetailleerdegenomische studies rond patiënten met atypisch overerfbare aandoeningen, zorgde voor de identi-ficatie van de eerste imprinted genen en de epigenetische mechanismen verantwoordelijk voor hunmono-allelische expressie [3]. Genomische imprinting was en blijft nog steeds één van de meestinformatieve processen voor het begrijpen van de gevolgen van de interacties tussen het genoomen het epigenoom.

    Uit nucleaire transplantatie experimenten op muizen bleek dat de afwezigheid van het paternaalgenoom en bijgevolg het dubbel voorkomen van het maternaal genoom, zorgt voor een kleineplacenta (endosperm) en een relatief klein, maar normaal embryo. Daarentegen geeft het dubbelvoorkomen van het paternaal genoom aanleiding tot een een reusachtige placenta en een abnor-maal embryo.Het gegegeven dat een embryo dat niet beschikt over twee verschillende parentale genomen faaltin zijn ontwikkeling, suggereert dat de twee parentale genomen reciproke functies vervullen, voor-namelijk gedurende de eerste helft van de zwangerschap en dat de overexpressie of afwezigheidvan bepaalde imprinted genen die op één van de twee parentale chromosomen liggen, zorgt vooreen foutieve ontwikkeling van het embryo [74–77]. Deze observaties staan bekend als de conflict-theorie tussen de twee geslachten die stelt dat het paternaal genoom ernaar streeft om maximaalgebruik te maken van de maternale bronnen, in het voordeel van die paternale nakomelingen, ter-wijl het maternale genoom er net naar streeft om de energie- en voedselbronnen gelijk te verdelenover alle potentiële nakomelingen. Om deze redenen stimuleren genen geëxpresseerd door het pa-ternale genoom de groei van de placenta en werken de maternaal geëxpresseerde genen dit effectnet tegen, enerzijds om zichzelf te sparen voor latere nakomelingen en anderzijds om al haar na-komelingen, ook van eventuele andere vaders, gelijke kansen te geven [78, 79].Eén van de genen die bij muizen maternaal tot expressie komt en verantwoordelijk is voor groei-reductie van het embryo en de placenta, is het gen dat codeert voor insulin-like growth factorreceptor (Igf2r). Het is de tegenhanger van het paternaal geëxpresseerde insulin-like growth factor(Igf2) dat verantwoordelijk is voor een sterke groei van het embryo en de placenta [73, 80]. HetIgf2r-gen ligt bij de muis in een cluster van imprinted genen op chromosoom 17 en fungeert ookals mannose-6-fosfaat receptor (zie Figuur 4.6). Het Igf2-gen ligt in een cluster op chromosoom 7.Stroomafwaarts in de cluster van het Igf2-gen bij de muis ligt het H19-gen, dat een niet-coderendRNA afschrijft met ongekende functie (zie Figuur 4.6) [81, 82]. Uit het onderzoek van Tilghmanet al. [83] bleek dat H19 enkel maternaal tot expressie komt. Bijgevolg vertonen twee naburige

  • 4.2 MONO-ALLELISCHE EXPRESSIE? 20

    genen tegengestelde patronen van imprinted expressie. Mutaties in het locus van Igf2 en Igf2rzorgen respectievelijk voor een groeireductie en voor een abnormaal groot embryo. Bij de menszijn er homologen aanwezig van deze genen [28].

    Figuur 4.6: Schematische overzicht van de insulin-like growth factor 2 receptor (Igf2r)-cluster bij de muisop chromosoom 17 (boven) die maternaal geëxpresseerd wordt, alsook de cluster van het Igf2-gen op chro-mosoom 7 die paternaal tot expressie wordt gebracht [3].

    De expressie van imprinted genen heeft op het mechanistische niveau gemeenschappelijke ken-merken met random mono-allelische expressie, doch het proces van imprinting is overerfbaar. Bijgenomische imprinting is een differentieel gemethyleerde regio (DMR) noodzakelijk die niet ver-vat zit in de eiwitcoderende regio’s van deze genen en fungeert als een soort van markering dieresulteert in genexpressie volgens parentale oorsprong. In tegenstelling tot de diversiteit en spe-cificiteit die gegenereerd wordt bij de mono-allelische genen, betrokken bij het immuunsysteemen de geurreceptoren, zijn imprinted genen zeer sterk geconserveerd. Ze behoren hoofdzakelijktot genenfamilies die coderen voor transcriptiefactoren, tumor suppressors, niet-coderende RNA’s,groeifactoren, apoptotische factoren en ubiquitinilatie en hebben invloed op vele andere genenalsook op de overleving en proliferatie van de celtypes waarin ze tot expressie gebracht worden.De reeds onderzochte imprinted genen hebben bijgevolg vooral een rol in verschillende ontwik-kelingsstadia. Niet alle individuen hebben hetzelfde repertoire aan imprinted genen en binnen éénindividu kan een gen in bepaalde weefsels mono-allelisch imprinted zijn, terwijl het in andereweefsels niet of bi-allelisch tot expressie komt. Dus hoewel er duidelijke gelijkenissen zijn metrandom mono-allelisch geëxpresseerde genen, brengt imprinting nog een extra niveau van com-plexiteit met zich mee [84].

  • 4.3 EPIGENETICA EN ZIEKTE 21

    4.3 Epigenetica en ziekte

    Hoewel epigenetische veranderingen noodzakelijk zijn voor een normale ontwikkeling, kunnenze in bepaalde gevallen ook aanleiding geven tot ziekte door abnormale activatie of silencing vangenen. Zulke aberraties zijn reeds geassocieerd met kanker, mentale retardatie en syndromen diechromosomale instabiliteiten beslaan (zie Tabel 4.1).

    Tabel 4.1: Epigenetische ziektes: oorzaken en symptomen [85].

    Ziekte Symptomen Genetische en epigenetische aberraties

    ATR-X syndroom Mentale handicap, Mutaties in het ATRX gen,α-thalassemia hypomethylatie van verschillende repeats

    en satellietsequentiesFragiele-X-syndroom Chromosomale instabiliteit, Expansie en methylatie van CGG-repeat

    mentale handicap in FMR1 5’ UTR, promotormethylatieICF-syndroom Chromosomale instabiliteit, DNMT3b mutaties,

    immunodeficiëntie DNA-hypomethylatieAngelman syndroom Mentale handicap Deregulatie van één of meerdere

    imprinted genen op 15q11-13 (maternaal)Prader-Willi syndroom Obesitas, Deregulatie van één of meerdere

    mentale handicap imprinted genen op 15q11-13 (paternaal)Beckwith-Wiedemann Overmatige groei van Deregulatie van één of meerderesyndroom organen imprinted genen op 11p15.5Diverse kankers Verstoring van de Rb- en De novo methylatie van bepaalde

    p53-pathway, genpromotorsongecontroleerde proliferatieMicrosatelliet instabiliteit De novo methylatie van MLH1Overexpressie van Igf2 Verlies van imprinting

    4.3.1 Ziektes gerelateerd aan imprinting

    Ook al zijn er telkens twee kopieën van een gen, in het geval van imprinting wordt er slechts éénkopie geëxpresseerd en is het alsof men haploı̈d is voor het desbetreffende gen. Er is bijgevolggeen functionele kopie, waardoor imprinted genen gevoeliger zijn voor mutaties of andere mecha-nismen van silencing. Op de koop toe kunnen allelen (en mutaties) die oorspronkelijk recessiefwaren tot expressie komen indien het gen imprinted is en het dominante allel is uitgeschakeld viasilencing. Hieruit volgt dat sommige ziektes ontstaan als gevolg van deleties en/of mutaties inimprinted genen. Verder kan ziekte door imprinting ook veroorzaakt worden door uniparentaledisomie, dit is het verschijnsel waarbij twee kopieën van een chromosoom van één ouder worden

  • 4.3 EPIGENETICA EN ZIEKTE 22

    overgeërfd en geen van de andere ouder, wanneer het betrokken gen imprinted is. Verder kun-nen ook mutaties voorkomen in genen die verantwoordelijk zijn voor het proces dat imprintingreguleert. Voorbeelden van gerelateerde ziektes zijn het Prader-Willi syndroom, het Angelmansyndroom en diverse types van kanker [86].

    4.3.1.1 Prader-Willi en Angelman syndroom

    Het Prader-Willi syndroom komt voor bij in 1 op de 20.000 geboortes en is geassocieerd metgedrags- en cognitieve problemen met inbegrip van mentale retardatie, afwijkingen in de seksueleontwikkeling en groei, een sterk toegenomen voedselinname en obesiteit [87]. Het Angelmansyndroom daarentegen komt voor in 1 op de 15.000 geboortes en wordt gekenmerkt door slaap- enontwikkelingsstoornissen, beroertes, mentale retardatie, ataxie, hyperactiviteit en een overgelukkiggemoed met lachuitbarstingen [87].

    Het Prader-Willi en Angelman syndroom waren de eerste ‘imprintingziektes’ ontdekt in mensen.Hoewel de symptomen van deze twee aandoeningen sterk verschillen, worden beide syndromenveroorzaakt door niet te onderscheiden deleties in chromosoom 15 in de 15q11-q13 regio, waarbepaalde loci imprinting vertonen [88]. Het grote verschil tussen deze afwijkingen is de parentaleoorsprong van het desbetreffende chromosoom. Het Prader-Willi syndroom wordt meer specifiekveroorzaakt door het verlies van een groep van paternaal overgeërfde genen op chromosoom 15,terwijl het Angelman syndroom het gevolg is van het verlies van maternaal overgeërfde genen ophetzelfde chromosoom en in dezelfde regio als het Prader-Willi syndroom. Door deze bevindingenconcludeerden Knoll et al. [88] dat beide syndromen te wijten zijn aan defecten in imprinted ge-nen.In de meeste gevallen wordt het Prader-Willi syndroom veroorzaakt door deleties van een geneti-sche regio die het nucleaire ribonucleoprotein polypeptide N gen bevat (necdin gen) naast moge-lijks ook andere genen. In de andere overblijvende gevallen is de afwijking te wijten aan het feitdat het betreffende individu twee kopieën bezit van het maternale chromosoom 15 en geen kopievan het paternale chromosoom 15, maternale uniparentale disomie genoemd [89].Het Angelman syndroom wordt veroorzaakt door het verlies van de expressie van een maternaalgeëxpresseerd gen UBE3A. Het gen is enkel imprinted in de hersenen en codeert voor het eiwit E3ubiquitin ligase dat een functie heeft bij de degradatie van eiwitten. Het verlies van de expressievan UBE3A kan zorgen voor complicaties bij de eiwitdegradatie tijdens de ontwikkeling van dehersenen, wat aanleiding geeft tot het Angelman syndroom [90]. Hoewel in de meeste gevallenhet Angelman syndroom het gevolg is van het verdwijnen (deletie) van het maternaal overgeërfdgen, zoals hierboven besproken, kan het ook veroorzaakt worden door paternale uniparentale diso-mie, mutaties in het UBE3A-gen alsook defecten in de imprinting zoals het verlies van maternaleDNA-methylatie [89].

  • 4.3 EPIGENETICA EN ZIEKTE 23

    4.3.1.2 Kanker

    Naast de hierboven besproken syndromen zijn defecten in imprinting ook reeds gelinkt aan be-paalde kankers. Wilms tumor is een type nierkanker bij de mens die geassocieerd is met hetIgf2/H19 locus op chromosoom 11. H19 is een niet-coderend RNA met nog ongekende functiesen eigenschappen die groei kunnen onderdrukken. Igf2 codeert voor het insulin-like growth factor2, een groeifactor die sterk tot expressie komt in vele tumoren. Er werd aangetoond dat één van defuncties van H19 het uitschakelen is van het bijhorende Igf2-gen. Deze twee genen vertonen beideimprinting en in een normale situatie worden enkel de maternale kopie van H19 en de paternalekopie van Igf2 tot expressie gebracht [91]. In kankercellen echter, kunnen H19 en Igf2 hun imprin-ting verliezen. In Wilms tumorcellen gaat de imprinting van het maternale chromosoom verlorenen is er een omschakeling in het paternale methylatiepatroon. Bovendien werd aangetoond datin deze cellen de expressie van H19 sterk gereduceerd of zelfs uitgeschakeld is. Dit resulteert inde overexpressie van Igf2. Aangezien H19 de celgroei vertraagt en Igf2 de celgroei net stimu-leert, zal het ontbreken van imprinting in het H19/Igf2-locus resulteren in een ongecontroleerdecelgroei met mogelijks tumorvorming als resultaat (zie Figuur 4.7) [91]. Naast Wilms tumoren ishet verdwijnen van de imprinting van het Igf2-gen aangetoond in vele andere kankers, zoals long-,colon- en ovariumtumoren [89]. Kanker kan tevens ontstaan wanneer een tumor suppressor genuitgeschakeld wordt door foutieve imprinting en de kopie van het tumor suppressor gen dat tochtot expressie komt, zijn functie verliest door mutaties of andere mechanismen [86].

    Figuur 4.7: Voorstelling van het ontbreken van imprinting in Igf2 en H19 alsook de methylatie van de H19-promotor in Wilms tumorcellen. In normale cellen worden het paternale Igf2-gen en het maternale H19geëxpresseerd (boven). Verschillende regio’s upstream van H19 zijn gemethyleerd op het paternale allel(zwart gevulde cirkels) en ongemethyleerd op het maternale allel (wit gevulde cirkels). In tumorcellen waarer geen imprinting aanwezig is, schakelt het maternale chromosoom om naar het paternale epigenotype,waarbij de H19-promotor gemethyleerd is en Igf2 aangeschakeld is [91].

  • 4.3 EPIGENETICA EN ZIEKTE 24

    4.3.1.3 Opmars van ‘imprintingziektes’

    De voorbije jaren is er een toenemende incidentie van afwijkingen die het gevolg zijn van foutieveimprinting. Vooral bij kinderen verwekt via in vitro fertilisatie wordt deze trend waargenomen.Aangezien imprinting wordt vastgelegd tijdens de gametogenese, is er een groeiende bezorgdheiddat deze vormen van geassisteerde reproductie de correcte imprinting van genen verhinderen [92].Het begrijpen van de onderliggende mechanismen van imprinting en het identificeren van condi-ties die interfereren met normale imprinting zouden ons kunnen helpen in de ontwikkeling vanstrategieën om het voorkomen van deze aandoeningen te reduceren.

    4.3.2 Imprinting-onafhankelijke rol van epigenetica in kanker

    Naast de hierboven besproken met imprinting geassocieerde epigenetische aberraties in kanker,zijn er eveneens epigenetische aberraties die niet gelinkt zijn aan imprinting. Kanker was de eersteziekte die gekoppeld werd aan aberrante epigenetica. In 1983 ontdekten Feinberg en Vogelstein[93] dat aangetast weefsel van patiënten met colorectale kanker minder DNA-methylatie bevattedan normaal weefsel van dezelfde patiënten. Men vond dat er in tumoren meestal algemene hy-pomethylatie was, geassocieerd met specifieke hypermethylatie (soms ook hypomethylatie) vanbepaalde promotorregio’s. Enerzijds kan de hypermethylatie en eventuele silencing van tumorsup-pressorgenen belangrijk zijn voor tumorgenese en anderzijds kan de algemene of locusspecifiekehypomethylatie van promotors leiden tot de reactivatie van oncogenen.

    Zoals reeds besproken in Sectie 4.1.1.2, komen CpG-eilanden meestal voor in een ongemethy-leerde toestand. In kankercellen echter, worden sommige CpG-eilanden extensief gemethyleerd,resulterend in de silencing van genen die normaal actief zijn. Deze abnormaliteit kan reeds in eenvroeg stadium in de ontwikkeling van kanker optreden en is op zijn minst één van de voornaamsteepigenetische verandering in tumoren [85]. Hypermethylatie van CpG-eilanden kan aanleidinggeven tot het ontstaan van tumoren door het uitschakelen van tumor suppressor genen.Daarenboven, hoewel epigenetische veranderingen geen rechtstreekse wijzigingen aanbrengen aande DNA-sequentie, kunnen ze onrechtstreeks wel mutaties veroorzaken. Ongeveer de helft van dereeds gevonden genen die overerfbare vormen van kanker veroorzaken, zijn epigenetisch gewijzigden uitgeschakeld door methylaties. Wanneer deze genen hun normale functie uitoefenen, onder-drukt de meerderheid ervan tumorformatie en helpen ze bij de DNA-herstelmechanismes. Eenvoorbeeld van zo een gen is O-methylguanine-DNA-methyltransferase (MGMT). Wanneer de pro-motor van MGMT gehypermethyleerd wordt, zorgt dit voor een toename van de G-naar-A mutaties[85].Hypermethylatie kan ook leiden tot instabiliteit van microsatellieten, die zijn samengesteld uit her-haalde sequenties van DNA. Microsatellieten zijn veelvuldig aanwezig in normale individuen enbestaan voornamelijk uit herhalingen van de dinucleotide CA. Een overvloed aan methylatie opde promotor van het DNA-herstellingsgen MLH1 kan een microsatelliet onstabiel maken en het

  • 4.4 DNA-METHYLATIE ANALYSEMETHODES 25

    verlengen of verkorten. Instabiliteit van microsatellieten is reeds in verband gebracht met velekankers, zoals onder andere colorectale, endometriale en ovariële kanker [94].

    4.3.3 Andere ziektes en epigenetische therapieën

    Hoewel epigenetica de laatste drie decennia vooral een impact had op het kankeronderzoek, is erde voorbije jaren aangetoond dat epigenetica en DNA-methylatie mogelijks ook een rol spelen inandere ziektes, zoals onder andere cardiovasculaire aandoeningen, diabetes, hypertensie, Alzhei-mer en obesitas [95].Omdat zovele ziektes geassocieerd zijn met epigenetische wijzigingen, zijn er reeds een paar epige-netische therapieën ontwikkeld die deze modificaties pogen tegen te werken. De meest populairebehandelingen trachten het DNA-methylatie patroon opnieuw te veranderen. Zo kunnen inhibi-toren van DNA-methylatie silenced genen reactiveren. Twee voorbeelden van zulke medicijnenzijn 5-azacytidine en 5-aza-2-deoxycytidine. Deze stoffen voeren hun DNA-methylatie inhibe-rend effect uit door zich tijdens DNA-replicatie in het DNA in te voegen, net als een cytosinenucleotide. Aangezien nucleotide analogen niet gemethyleerd kunnen worden zullen deze na in-corporatie in het DNA onrechtstreeks de werking van DNMT-enyzmes blokkeren en bijgevolg ookDNA-methylatie [85].

    Echter, omdat epigenetische mechanismen en veranderingen wijdverspreid zijn, is voorzichtigheidmet deze epigenetische behandelingen zeker geen overbodige luxe en zelfs een must. Deze be-handelingen kunnen pas succesvol zijn als ze selectief kunnen toegepast worden op de aangetastecellen. Indien dit niet het geval is, kunnen zich wijzigingen voordoen in normale cellen en kunnendeze op hun beurt een ziektebeeld veroorzaken. Afgezien van dit nadeel pogen onderzoekers ma-nieren te vinden om specifiek abnormale cellen te behandelen met minimale schade aan normalecellen. Hoewel er nog veel onderzoek en testen nodig zijn, lijken epigenetische therapieën op heteerste zicht veelbelovend [85].

    4.4 DNA-methylatie analysemethodes

    Aangezien het methylatiepatroon tijdens PCR verloren gaat, zijn er andere technieken nodig voorde detectie van gemethyleerde cytosineresidu’s. Verscheidene methodes werden reeds ontwikkelddie de profilering van DNA-methylatie mogelijk maken. De belangrijkste worden hieronder be-schreven [96].

    4.4.1 DNA-methylatie specifieke stap

    In een eerste stap worden de DNA-fragmenten behandeld door één van de vier onderstaande me-thodes die cytosinemethylatie detecteert of aanrijkt [96]:

  • 4.4 DNA-METHYLATIE ANALYSEMETHODES 26

    • Methylatie-gevoelige restrictie-enyzmen (MRE)

    • Een 5-methylcytosine antilichaam

    • Methylcytosine-bindende (eiwit)domeinen (MBD)

    • Chemicaliën zoals bisulfiet en hydrazine

    Er zijn ongeveer vijftig unieke MREs, maar slechts enkele hebben een passend methylatie-onge-voelig isoschizomeer. Deze isoschizomeren herkennen dezelfde doelsequentie maar knippen hetDNA op een andere manier door hun verschil in gevoeligheid voor methylcytosine. Een voor-beeld van twee dergelijke restrictie-enzymen zijn MspI en HpaII. Ze herkennen beiden CCGGmaar HpaII is niet in staat om het DNA te knippen indien de centrale CG gemethyleerd is, ter-wijl MspI het DNA kan knippen onafhankelijk van de methylatietoestand. Op die manier wordenbij de twee digesten fragmenten van verschillende grootte verkregen die via elektroforese kunnengescheiden worden in twee aparte lanen. Door de fragmenten van de twee digesten te laten hy-bridiseren tegen specifieke DNA-sequenties kan het verschil zichtbaar gemaakt worden. Hoewelde meeste restrictie-enzymen die gebruikt worden voor de profilering van DNA-methylatie nauw-keurig en goedkoop zijn, kan via deze methode enkel de methylatie opgepikt worden die binnende herkenningsplaats van het MRE vallen. Deze limitatie kan echter deels verholpen worden doorverschillende niet-redundante MREs in parallel te gebruiken [97, 98].

    In tegenstelling tot MREs laat het gebruik van zowel MBDs in affiniteitskolommen als het mo-noklonale antilichaam tegen 5-methylcytosine de aanrijking toe van gemethyleerd DNA [98]. Deanalyse waarbij gebruik gemaakt wordt van het 5-methylcytosine antilichaam, methyl-DNA immu-noprecipitatie (MeDIP) genoemd, is gebaseerd op de directe immunoprecipitatie van gemethyleerdDNA. Hierbij wordt het genomisch DNA in random stukken geknipt, vervolgens gedenatureerdomdat het antilichaam preferentieel bindt op enkelstrengig DNA, waarna het samen met het mo-noklonale antilichaam geı̈ncubeerd wordt. De incubatie wordt finaal gevolgd door een opzuiveringvan de aangerijkte fractie via proteı̈ne G-beads, die verder kunnen geanalyseerd worden met eenplatform van keuze [99]. Voor de selectieve binding aan 5-methylcytosine kan in plaats van antili-chamen ook gebruik gemaakt worden van MBDs, bijvoorbeeld MBD2 of MBD uit MeCP2. Hier-bij wordt het random geknipte DNA geı̈ncubeerd met een MBD2- (of een ander MBD-)bevattendematrix, meestal Sepharose, waarna het specifiek gebonden DNA wordt geëlueerd, gevolgd doorde analyse [100]. Bij deze methodes moet wel rekening gehouden worden met het feit dat voorregio’s met een hoger CpG-gehalte de aanrijking relatief groter is dan voor regio’s met een lagerCpG-gehalte. Bij deze reagentia wordt de resolutie van de methylatiestatus bepaald door enerzijdsde grootte van de random geknipte DNA-fragmenten en anderzijds door de eigenschappen van hetlater gebruikte analyseplatform [96].

    Chemicaliën zoals natriumbisulfiet en hydrazine vertonen een verschillende reactie met ongeme-thyleerde en gemethyleerde cytosines en laten de profilering toe van DNA-methylatie met eenresolutie op het niveau van één enkele CpG [101]. Van deze chemicaliën wordt natriumbisulfiet

  • 4.4 DNA-METHYLATIE ANALYSEMETHODES 27

    het meest gebruikt. Behandeling van DNA met bisulfiet zorgt voor de conversie van cytosine naaruracil, die vervolgens tijdens een PCR-amplificatie wordt vervangen door een thymine. Echter,indien een cytosine gemethyleerd is, zal deze conversie niet plaatsvinden en blijven de cytosinesbehouden na bisulfietbehandeling. Wanneer er tijdens de PCR-reactie gesequeneerd wordt, is hetbijgevolg mogelijk om de methylatiestatus van cytosines van de allelen van het oorspronkelijke ge-nomisch DNA-fragment te bepalen. De bisulfietmethode heeft vele voordelen zoals onder andereenkelvoudige CpG resolutie en detectie van zowel strengspecifieke methylatie als cytosinemethyla-tie buiten CpG’s. In vergelijking met andere reagentia laat bisulfiet op bepaalde platformen toe hetmethylatieniveau absoluut te kwantificeren. Zoals elke methode zijn er eveneens enkele nadelenzoals onder andere DNA-fragmentatie, een mogelijks incomplete conversie van cytosine naar ura-cil en een gereduceerde complexiteit van de sequentie waardoor het niet altijd mogelijk is om deoorsprong van de sequentie terug te vinden [96, 98].

    4.4.2 Platformen en analyse

    Na de behandeling van het DNA met één van voorgaande methodes wordt DNA-methylatie gede-tecteerd via een specifiek platform. Verschillende platformen werden reeds ontwikkeld om het aan-tal gemethyleerde cytosines te bepalen waarvan DNA-microarrays/bead arrays en next-generationsequencing tegenwoordig de meest courante zijn voor genoomwijde analyses [98].

    Een microarray bestaat uit een vast oppervlak, zoals een glas- of siliconchip, waar duizendenmicroscopische DNA-spots met gekende oligonucleotide probes aan vastgehecht zijn. Bij het aan-brengen van het opgezuiverde DNA verkregen via één van de hiervoor beschreven DNA-methylatiespecifieke methodes zal er hybridisatie optreden tussen de DNA-fragmenten met overeenkomstigeoligonucleotide probes die vastzitten op het vast oppervlak van de microarray. Indien de bindingvan zo’n DNA-fragment aan de microarray optreedt, wordt dit geregistreerd met behulp van eenfluorescent signaal waardoor de sequenties of de expressie van deze fragmenten kan bepaald wor-den. Afhankelijk van welke probes er op de array aanwezig zijn, wordt een onderscheid gemaakttussen CpG-eiland-, promotor-, MeDIP- (tiling)microarrays en Single Nucleotide Polymorphism(SNP)-bead arrays [96]. Bead arrays zijn een alternatieve vorm van array waarbij de specifiekeprobes niet op een groot vast oppervlak worden geplaatst, maar op microscopische polystyreenbeads. Elke bead wordt gekarakteriseerd door een specifiek ratio van twee of meer kleurstoffendie niet interfereren met de fluorescente kleurstoffen gebruikt voor de detectie van gehybridiseerdesequenties. Hoewel arrays kunnen toegepast worden bij de meeste methylatie detectiemethodesis bij gebruik van de bisulfietmethode enkel de infinium bead array geschikt. Dit is het gevolgvan de bisulfiet-geı̈nduceerde conversie van cytosine waardoor de bisulfietmethode niet geschiktis voor de andere commerciële arrays. De gehanteerde methylatie detectiemethode in combinatiemet een welbepaalde array zal de resolutie bepalen waarmee DNA-methylatie waargenomen wordt[96, 98].

  • 4.4 DNA-METHYLATIE ANALYSEMETHODES 28

    Vele van de microarray gebaseerde methodes produceren geen methylatie profilering met een reso-lutie tot op één base. Dit maakt het exact localiseren van een gemethyleerd cytosine zeer moeilijktot onmogelijk. Daarnaast zijn er nog twee belangrijke nadelen eigen aan microarray gebaseerdemethodes. Ten eerste is er, afhankelijk van het probedesign, meestal veel ruis waardoor de aan-wezigheid van SNPs zeker een impact zal hebben. Ten tweede is de analyse niet genoomwijd,aangezien het niet mogelijk is het volledige genoom te profileren. De parallelle sequenerings-platformen van onder andere Roche (454), Illumina (Solexa) en Applied Biosystems (SOLiD)hebben het genomisch en epigenomisch onderzoek een volledig nieuwe dimensie gegeven [102].Na het toepassen van één van de hierboven besproken DNA-detectie methodes, kunnen via dezenext generation sequeneringstechnologieën tientallen miljoenen DNA-fragmenten in parallel ge-sequeneerd worden. Dit laat een genoomwijde analyse toe van het DNA-methylatie profiel, zelfsvan interspersed repeats die ontoegankelijk zijn wanneer gebruik gemaakt wordt van microarrays.Indien sequenering gecombineerd wordt met een bisulfietbehandeling, laat dit naast de mogelijkeprofilering van interspersed repeats ook de genoomwijde DNA-methylatie analyse toe met eenresolutie tot op één base [96]. Hierbij moet men samen met de reeds hierboven vermelde nadelenvan de bisulfietmethode, wel rekening houden met het feit dat ‘whole genome bisulfite sequencing’op dit moment nog zeer duur is.

  • 5Materialen & Methodes

    Gedurende deze masterproef werd een pipeline ontwikkeld die toelaat om mono- en bi-allelischeDNA-methylatie op te sporen in sequentiedata verkregen via MBD-seq (zie Sectie 4.4). Vooraf-gaand aan de sequenering werd het DNA van de stalen met behulp van het Covaristoestel gefrag-menteerd tot op circa 200 nucleotiden. De resulterende fragmenten van de verschillende stalenwerden gemultiplexed, gevolgd door paired-end sequenering op de Illumina Genome Analyzer IIx(GAIIx). Gezien er gekozen werd om paired-end sequenering toe te passen, werden voor elk staaltwee datasets verkregen, namelijk een dataset voor elke end read. De bekomen reads van de GAIIxhadden in elke dataset een lengte van 45bp. De materialen en methodes die gebruikt werden bij deontwikkeling van de pipeline om bij deze reads mogelijkse mono-allelische methylatie te analyse-ren, worden hieronder beschreven. Het is echter geenszins de bedoeling om de lezer te overladenmet ingewikkelde programmeertaal. Bijgevolg wordt de nadruk in dit hoofdstuk niet gelegd opde gebruikte programmeercodes in de verschillende scripts maar wordt vooral de onderliggendegedachtengang beschreven.

    5.1 Hardware

    De programma’s waarmee de scripts geschreven zijn, werden lokaal geı̈nstalleerd op een laptopmet een Intel® CoreTM2 mobile processor T7500 2,2 GHz, 2GB DDR2 RAM en Windows 7 Ul-timate (64-bit) als besturingssysteem. Gezien de hoeveelheid en de complexiteit van de data werdvoor alle berekeningen gebruik gemaakt van zowel de athos- als aramisserver van labo BioBiX.Deze Linuxservers beschikken over respectievelijk 128 en 162 GB RAM en bevatten respectieve-lijk 16 en 32 processoren. Bijgevolg zijn deze servers veel beter geschikt om grote en complexedata te analyseren in vergelijking met een gewone laptop.

  • 5.2 SOFTWARE 30

    5.2 Software

    5.2.1 Bowtie

    Bowtie1 [103] is een enorm snel en geheugenefficiënt aligneringsprogramma geschreven in C++ enspecifiek ontwikkeld voor korte DNA-sequenties die gegenereerd worden door next-generation se-quencers. In vergelijking met andere aligneringsprogramma’s, zoals onder andere Maq en SOAP,is Bowtie gebaseerd op een nieuwe strategie om het referentiegenoom, waarop moet gemapt wor-den, te indexeren. Bowtie maakt gebruik van de Burrows-Wheeler index die toelaat om grotestukken tekst (DNA-sequenties) snel en efficiënt te doorzoeken zonder dat een similariteitsmatrixmoet berekend worden. Voor het mappen van de data werd in deze masterproef gebruikt gemaaktvan Bowtie versie 0.12.7.

    5.2.2 Perl en Bioperl

    Perl2 (Practical Extraction and Report Language) [104] is een krachtige, dynamische en inter-preteerbare programmeertaal ontworpen door Larry Wall. Het vat de eigenschappen van de C-en UNIX-talen (sh, AWK en sed) samen in één taal met als doel de eenvoudigere behandelingvan data (parsing). Onder het motto ‘there is more than one way to do it’ laat de taal een groteflexibiliteit toe bij het ontwerpen van programma’s. Verder is Perl ook een vorm van modularprogramming waarbij verschillende functies opgedeeld worden in aparte componenten, modulesgenaamd, die beschikbaar zijn via het Comprehensive Perl Archive Network (CPAN)3. CPAN iseen externe online bibliotheek met meer dan 100.000 software modules geschreven in Perl. Hetgebruik van deze modules om de algemene functionaliteit van Perl uit te breiden, is meestal gratisen open source. Naast het feit dat Perl zeer geschikt is voor de bewerking van allerlei soortenbestanden, bezit het ook de mogelijkheid om connectie te maken met externe databanken, datavan deze databanken in te lezen alsook data uit te lezen naar deze databanken. Door de opkomstvan gemoderniseerde en meer gespecialiseerde programmeertalen als Python en PHP is Perl watin vergetelheid geraakt. Echter, door zijn BioPerl4 pakket is het nog steeds zeer populair in de bio-informaticawereld. BioPerl is een verzameling van modules die handig zijn bij de ontwikkelingvan bio-informaticatoepassingen en vele typische functies bij bio-informatica programmering op

    1Bowtie: http://bowtie-bio.sourceforge.net/index.shtml2Download Perl: http://www.perl.org/get.html3CPAN bibliotheek: http://www.cpan.org/4Bioperl pakket: http://www.bioperl.org/

  • 5.2 SOFTWARE 31

    zich nemen, zoals bijvoorbeeld het inlezen van genomische (sequentie)data (nucleotiden én pep-tides) van zowel lokale als niet-lokale databanken (bijvoorbeeld Genbank) en het parsen van demeeste bestandsformaten die gebruikt worden in de moleculaire biologie.

    De merendeel van de scripts die gebruikt zijn in deze masterproef, zijn geschreven in Perl versie5.12.4 met versie 1.6.1 van Bioperl en doen voornamelijk dienst in de primaire dataverwerking,zoals bijvoorbeeld de manipulatie van bestandsformaten, parsen van de ruwe data, calculaties,aanmaak van lijsten en het in- en uitlezen van en naar MySQL-databanken. Deze scripts wordenmeer in detail besproken in Sectie 5.3.3 waar de volledige pipeline van deze masterproef uit dedoeken wordt gedaan.

    5.2.3 MySQL

    Het overgrote deel van deze masterproef omvatte het parsen van ruwe data die in de gewenstevorm werd opgeslagen in databanken. Er werd gekozen om te werken met MySQL-databanken5.Het vlot aanmaken en beheren van databanken gebeurde met behulp van de phpMyAdmin webap-plicatie versie 3.4.10.1. Deze maakte tijdens de masterproef gebruik van MySQL versie 5.5.20en biedt een eenvoudige interface voor het inloggen met de databanken op de aramisserver, hetaanmaken en beheren van tabellen, het im- en exporteren van data, het snel schrijven en uitvoerenvan MySQL-queries, etc. De databanken op de athosserver werden beheerd met behulp van hetprogramma Toad, die eveneens een gebruiksvriendelijke interface biedt. Toad maakte gebruikt vanMySQL versie 5.0.

    5.2.4 Perl DBI en DBD

    Relationele databanken zijn databanken waarbij de gegevens worden opgeslagen in tabellen. Indeze tabellen vormt elke rij een record van een object (of persoon) die in elke kolom verschillendestukken informatie van dit object bevatten, fields genaamd. Verschillende tabellen kunnen met el-kaar worden verbonden door een kolom toe te voegen die een verwijzing bevat naar een