Expressievectoren en proteïneproductiesystemen

47
Expressievectoren en proteïneproductiesystemen Expressie verwijst naar het gen, productie verwijst naar het proteïne, hoewel in het jargon 'expressie' ook vaak verkeerdelijk voor proteïnen wordt misbruikt. Aangezien productie van een gekloneerd proteïne in hoge hoeveelheden gebeurt, is detectie en analyse van het rendement meestal relatief eenvoudig, en kan dit makkelijk door rechtstreekse visualisering (door kleuring) op een SDS-PAGE. Hierbij kan expressie "voor" en "na" inductie in de cel vergeleken worden, evenals het celcompartiment of de toestand waarin het eiwitproduct zich bevindt : cytoplasmatisch versus periplasmatisch versus extracellulair, en oplosbaar of onoplosbaar. (Bijgaande figuur op volgende slide vergelijkt “met of zonder” inductie.) o.a. Primrose & Twyman, 7 e editie, pp.81-93 Primrose, Twyman & Old, 6 e editie, pp.70-

description

o.a. Primrose & Twyman, 7 e editie, pp.81-93 Primrose, Twyman & Old, 6 e editie, pp.70-83. Expressievectoren en proteïneproductiesystemen Expressie verwijst naar het gen , productie verwijst naar het proteïne , hoewel - PowerPoint PPT Presentation

Transcript of Expressievectoren en proteïneproductiesystemen

Page 1: Expressievectoren en proteïneproductiesystemen

Expressievectoren en proteïneproductiesystemen

Expressie verwijst naar het gen, productie verwijst naar het proteïne, hoewel

in het jargon 'expressie' ook vaak verkeerdelijk voor proteïnen wordt misbruikt.

Aangezien productie van een gekloneerd proteïne in hoge hoeveelheden gebeurt,

is detectie en analyse van het rendement meestal relatief eenvoudig, en kan dit

makkelijk door rechtstreekse visualisering (door kleuring) op een SDS-PAGE.

Hierbij kan expressie "voor" en "na" inductie in de cel vergeleken worden, evenals

het celcompartiment of de toestand waarin het eiwitproduct zich bevindt :

cytoplasmatisch versus periplasmatisch versus extracellulair, en oplosbaar of

onoplosbaar. (Bijgaande figuur op volgende slide vergelijkt “met of zonder” inductie.)

o.a. Primrose & Twyman, 7e editie, pp.81-93 Primrose, Twyman & Old, 6e editie, pp.70-83

Page 2: Expressievectoren en proteïneproductiesystemen

IPTG-geïnduceerde productie van RP4 proteïnen : (A) DNA primase (118 en 80 kDa proteinen) ; (B) 16.5 en 8.6 kDA proteinen. Waardcelstam : E. coli HB101. Analyse door SDS-polyacrylamidegel electroforese.

(A) insert in directe (c, d) of omgekeerde (e,f) orientatie ; geïnduceerd (c, e) of niet-geïnduceerd (d,f) met IPTG. (a) referentie proteïnen ; (b) gezuiverd RP4 DNA primase (118 en 80 kDa). (Lange electroforesetijd)

(B) insert in directe (b, c) or of omgekeerde (d,e) orientatie ; geïnduceerd (b, d) of niet-geïnduceerd (c,e) met IPTG. (f) referentie proteïnen ; (a) gezuiverd 16.5 kDa proteïne. (Korte electroforesetijd)

*

Expressie van deconstructen achtereen lac promoter,controle door LacIen inductie metIPTG.)

Page 3: Expressievectoren en proteïneproductiesystemen

uit : J. Sambrook & D.W. Russell : Molecular cloning, a laboratory manual. 3rd edition, 2001

1. Basisaspecten2. Belangrijke expressievectoren (3 vb.)3. Productiestrategieën4. Zuivering en verwerking (6 vb.)5. Optimalisatiestrategieën Addendum : genoomstrategie Hoe coderende gebieden (ORF’s) opsporen?

*

Page 4: Expressievectoren en proteïneproductiesystemen

1. Basisaspecten

regulatie

- hoge expressiewaarden kunnen

- toxisch zijn (door het eiwitproduct) voor de cel

- "metabolic drain" veroorzaken : dus verstoring van het metabolisme

=> iedere verandering die het expressieniveau verlaagt

(bvb. door mutaties, verlies van plasmide, ...) zal de

betrokken cel een selectief groeivoordeel geven

- vermijden van toxiciteit : groei de celpopulatie tot het geschikte niveau

(d.w.z. aantal cellen) vooraleer de synthese van het gekloneerde eiwit

aanvangt, m.a.w. induceer de expressie (en tot dan, hou het gen onder repressie)

- induceer expressie in de laat-logaritmische fase (terwijl de cellen nog

voldoende metabolisch actief zijn) maar nog niet in de stationaire fase

- regulatie is in hoofdzaak een zaak van transcriptiecontrole

- andere factoren: translatie, stabiliteit (van vector, transcript en product)

Page 5: Expressievectoren en proteïneproductiesystemen

lacUV5 is een mutant die veel minder gevoelig is aan de concentratie cAMPin de cel. Het niveau van cAMP neemt toe met de celdensiteit (concentratie glucose daalt). Met toevoeging van 1% glucose aan het medium wordt de afhankelijkheid aan CAP-cAMP nog extra onderdrukt. .

transcriptie :

- E.coli RNA polymerase : 2, , '

algemene promotorstructuur (‘consensus’ sequenties)

70 promotor : TTGACA (16-19 nt) TATAAT (5-8 nt) start (+1)

(zones / optimale afstanden) -35 (17) -10 (7)

UP-elementen (upstream) kunnen een extra invloed op efficientie hebben

- initiatie : vaak gebruikte efficiente promotoren en hun regulatie

- lacUV5 : IPTG, LacI (lacI en lacIq), uittitratie, 'leakiness'

- trp : tryptofaan + aporepressor (TrpR), IAA inductie

- Ptac : upstream -20 Plac + downstream -20 Ptrp

(ook PtacI, PtacII, Ptrc, en andere varianten)

inductie door IPTG mogelijk

- PL, PR : repressor CIts857 : inductie door temperatuurshift

of : CIwt + inductie door mitomycine C (nb. CIts857 is minder efficient als regulator (repressor) dan wild-type CI)

- araBAD : arabinose + AraC : positieve en negatieve regulatievervolgt

Page 6: Expressievectoren en proteïneproductiesystemen

Pribnow box (-10)

T89 A99 T50 A65 A65 T100

70 bindingsplaats (-35)

T85 T83 G81 A61 C69 A52

E. coli

E. coli promoters, en hybride promoters tacI en II

E. coli transcriptieterminatie (-onafhankelijk)

(in feite de lacUV5 promoter ; wild-type lac promoter heeft TATGTT als -10 gebied)

Page 7: Expressievectoren en proteïneproductiesystemen

T7 als expressiepromoter : vereist toelevering van T7 RNA polymerase

- gekodeerd op een ander (compatibel) plasmide

- gekodeerd door een profaag (cIts) (bvb. in een E.coli lysogen)

- door infectie met een M13mp-recombinant kloon van het

polymerasegen (het T7 gen1) (zie verder)

=> PL en PBAD worden zeer efficient geblokkeerd, Plac (en zijn derivaten)

zijn ‘leaky’; met de faag T7 promotor (en andere specifieke faagpromotoren),

wordt alle interferentie met het E.coli polymerase vermeden.

- terminatie kan zijn :

- factor-afhankelijk (Rho (, Tau (), NusA (van faag ))

- factor-onafhankelijk (GC-rijke stam-lusstructuur + oligoT-reeks)

=> meest gebruikt in expressievectoren zijn :

- de fd terminator (in Ff fagen tussen gIII en gVIII, zie figuur in deel 6)

- de rrnB operon terminatoren T1 en T2

- faag T7 terminator Tf

vervolg

Page 8: Expressievectoren en proteïneproductiesystemen

translatie

- initiatie: RBS (ribosome binding site), AUG (of GUG, 91 vs 8% in E.coli)

- sequentie motief : Shine-Dalgarno sequentie

RBS > < Shine-Dalgarno (SD) motief

RBS = ongeveer 55 nt tussen posities –35 en + 22 (versus AUG)

SD : 16S rRNA 5'….GUACACCUCCUAOH 3' (E.coli)

basispatroon : 5'….AGGA… +/- 7nt … AUG(start)… 3'

efficientie is vrij onvoorspelbaar

variaties : GAGG, GGAG, GGAGG

- secundaire structuur

- het AUG (GUG) initiatietriplet moet goed toegankelijk

zijn, bvb. gelegen op de top van een stam-lusstructuur (en dus niet in baseparing betrokken)

- triplets die volgen achter AUG beïnvloeden de efficientie (zoals ook de nucleotiden die het AUG voorafgaan, en uiteraard ook de secundaire structuur van dit gebied)

vervolgt

Page 9: Expressievectoren en proteïneproductiesystemen

- codongebruik

- het effect van codongebruik is zeer complex- zelfde aminozuur => multipele codons- zelfde codons => multipele tRNA's- verschillende codons => zelfde tRNA- codon-anticodon bindingssterkte

- vergelijking van frequentie (in E. coli) van codongebruik tussen genen met hoog expressieniveau en deze met laag expressieniveau, toont het effect van sommige triplets

(ongeacht of deze vaak gebruikt worden of niet) (zie Tabel)

- met synthetische genen : kan men bewust systematisch kiezen voor telkens het 'optimale' triplet : dit garandeert (meestal) een goed productierendement (hetgeen echter daarom niet het hoogst mogelijke is)

- gendosiseffect

- toename van aantal kopijen van de vector heeft- geen effect- een positief effect- een negatief effect (vb. expressie van het trypsinegen )

=> niet voorspelbaar, geen algemene regel, kan alleen empirisch bepaald worden

vervolg

*

Page 10: Expressievectoren en proteïneproductiesystemen

Kodewoordgebruik in E. coli van sterk en zwak tot expressie komende genen

"sterk" : 24 genen (5253 triplets), o.a. 12 voor ribosomale proteïnen, 7 voor "outer membrane" proteïnen,en voor sommige RNA polymerase subeenheden en translatie-initiatie- en terminatiefactoren.

"weak" : 18 genen (5231 triplets), o.a. voor verschillende repressorproteïnen, lac-permease, enz.

kleine kadertjes : een enkel tRNA voor synonieme codons ; dus voor deze is interactiesterkte anticodon-codon bepalend

*

Page 11: Expressievectoren en proteïneproductiesystemen

stabiliteit

- een transcriptieterminatiesignaal achter het doelwitgen is nodig voor

stabiliteit van het plasmide

- par locus (of loci) helpt voor plasmidestabiliteit (belangrijk op moment van inductie)

- transcript stabiliteit : mRNA degradatie is een complex proces

- zowel 5' als 3' UTR spelen een rol (bvb. een stam-lusstructuur

in het 5' UTR geeft stabilisatie)

- er is geen omgekeerde correlatie tussen grootte en halfwaardetijd

van een mRNA bijgevolg: degradatie is niet afhankelijk van a-specifieke endonucleolytische splitsing

- proteïne stabiliteit : degradatie is sterk gereguleerd in E.coli : er is een

groot aantal proteasen in het cytoplasma, periplasma

en aan de binnenste en buitenste membranen.

=> degron : is een element van degradatie : o.a. N-regel van Varshavsky

vervolgt

Page 12: Expressievectoren en proteïneproductiesystemen

Kenmerken die oorzaak zijn van instabiliteit van eiwitten in het metabolisme, noemt men “degradatiesignalen” of ‘degrons’. De essentiële component van het eerst-ontdekte degron is een destabiliserend N-terminaal aminozuur van het eiwit (N-degron). De set van N-degrons geeft een “regel”, de “N-end rule” genoemd (A. Varshavsky, 1997), die de relatie geeft tussen N-degron en de halfwaardetijd (“half-life”) van een eiwit in de cel. Dergelijke N-end regel komt voor bij alle organismen (waaronder E.coli, gist en zoogdiercellen). Bij eukaryoten is fusie met ubiquitine hierbij essentieel, maar niet bij prokaryoten (hoe het daar juist verloopt is nog

niet gans duidelijk).

N-regel van Varshavsky : maakte een reeks recombinante -galactosidasen met als N-terminaal aminozuur telkens een ander achter het Metf :

- varianten met R, K, L, F, Y, W => halfwaardetijd (T1/2) van 2 min

- varianten van andere aminozuren (behalve P)

=> T1/2 = 10 uur

Page 13: Expressievectoren en proteïneproductiesystemen

*De E. coli N-end rule pathway. Primair destabiliserende N-terminale residus L, F, W en Y staan in rood aangeduid, secundaire R en K in blauw. De gele geven de rest van het proteinesubstraat weer. Conjugatie van het primair destabiliserende residu L aan de secundair destabiliserende residus R en K wordt gemediëerd door Leu, Phe-tRNA-proteine-transferase (L/F-transferase), gecodeerd door aat. In vivo blijkt L/F-transferase vooral (of zelfs exclusief) aan L te conjugeren. De degradatie van een substraat dat een primair destabiliserend N-terminaal residu heeft, gebeurt door het ATP-afhankelijke protease ClpAP, gecodeerd door clpA en clpP. Het vraagteken geeft de onduidelijkheid weer omtrent de natuur van het N-recognine in E. coli.

Open cirkels : stabiliserend N-end aminozuur

Andere : destabiliserend ; verschillende types

Voor proline speelt blijkbaar ook het tweede aminozuur een rol.

Page 14: Expressievectoren en proteïneproductiesystemen

Wat met het initiërende methionine ? :

- meestal wordt het Metformyl (als eerste aminozuur van een celeigen eiwit) afgesplitst

- hoe makkelijk kan dit met 'cel-vreemde' eiwitten ? => niet meteen voorspelbaar

- gebeurt blijkbaar makkelijkst als het 2de aminozuur een korte zijketen heeft (vergemakkelijkt de splitsing door het methionine aminopeptidase)

Stresscondities veroorzaken inductie van genen voor bepaalde proteasen,

o.a. het protease La (lon gen)

deze staan onder controle van 32 promotoren :

- het gen voor de 32 subeenheid van dit RNA polymerase is rpoH

- mutanten in rpoH kunnen een dramatische toename van expressierendement geven (en van productstabiliteit)

(E.coli heeft 7 -factoren. De “house-keeping” factor is 70 (gen rpoD). Er zijn ook anti-sigma factoren, die de functie van een sigma-factor inhiberen, en anti-anti-sigma factoren die de activiteit weer herstellen. 32 is de factor bij heat-shock stress.)

Er zijn nog heel wat meer specifieke observaties gemaakt waarmee kan ofmoet rekening gehouden worden.

Page 15: Expressievectoren en proteïneproductiesystemen

2. Belangrijke expressiesystemen (inductie en regulatorische circuits) enkele voorbeelden

Het pET vectorsysteem voor proteïneproductie

- met T7 RNA polymerase - extra regulatie (repressie) door LacI (inductie door IPTG) - toelevering van T7 RNA polymerase vanuit een aparte expressieëenheid op

een (DE3) profaag met PlacUV5 als promoter (ook onder LacI controle : lacO)

- additionele controle door lysozyme van T7 LysS (of E) (gekodeerd op een (pACYC184-afgeleid) compatibel plasmide)

=> het lysozyme bindt aan en inhibeert (residueel) T7 RNA polymerase

lac verwijst naar de lacUV5 promoter

pLysS of E wijst op de orientatie in de BamHI van pACYC184 : E is in de expressie-orientatie vanhet tet gen ; S (silent) in de omgekeerde orientatie. Met pLysE worden grotere hoeveelheden T7 lysozyme aangemaakt, hetgeenniet steeds een voordeel is.

E. coliwaardcel

Page 16: Expressievectoren en proteïneproductiesystemen

...vervolg... 2. Belangrijke expressiesystemen (inductie en regulatorische circuits)

Het binaire trp-cI systeem : expressiecontrole op de Ptrp promoter door de CI repressor

- dubbel systeem met compatibele plasmiden - doelwitgen stroomafwaarts van de PL promotor

- synthese van CI (gekodeerd door cI repressorgen) wordt gereguleerd door Ptrp

- toevoeging van tryptofaan activateert expressie van het doelwitgen door afsluitenvan de CI synthese : vroeger reeds gezien : regulatie door CIts857 kan ook op basis van temperatuur, maar : die regulatie is minder strict (wt-CI bindt efficienter) én toevoeging van een inductor in grote fermentoren is eenvoudiger dan het verhogen van de temperatuur ; bovendien kan een temperatuurshift stressmechanismen (heat-shock) induceren.

(Po) O = operator van de overeenkomstige promoter

Page 17: Expressievectoren en proteïneproductiesystemen

*

lac operon : inductief systeem : activatie door (allo)lactose (en analogen)

“negative inducible operon”

trp operon ; repressief systeem : inhibitie door tryptofaan (met aporepressor)

”negative repressible operon” (co-repressor model) in aanwezigheid van tryptofaan wordt actieve repressor gevormd, door binding van tryptofaan aan zijn (inactieve) aporepressor. In afwezigheid van tryptofaan in het cultuurmedium is er dus constitutieve expressie van het operon (trpE : trpD : trpC : trpB : trpA).

(er is dus geen expliciete “activator”, zoals in het ara operon)

Negatieve en positieve regulatie : AraC is activator of repressor naargelang zijn bindingplaats, in aanwezigheid of afwezigheid van arabinose.

ara operon : araC : araO : araI : araB : araA : araD Afbraak van L-arabinose tot D-xylulose-5-fosfaat, dat verder gemetaboliseerd wordt via de

pentosefosfaatweg.

Operon voor synthese van de AraA, AraB en AraD enzymen. AraC is een activator eiwit.

araI promoter (induceerplaats).

AraA : L-arabinose : isomerase => L-ribulose (reversibel)

AraB : L-ribulose : ribuloskinase => L-ribulose-fosfaat (niet-reversibel)

AraD : L-ribulose-fosfaat : epimerase => D-xylulose-fosfaat (reversibel)

Page 18: Expressievectoren en proteïneproductiesystemen

...vervolg... 2. Belangrijke expressiesystemen (inductie en regulatorische circuits)

Het pBAD systeem : vooral goed voor expressie van zeer toxische eiwitten (op basis van keuze van expressieniveau)

Regulatie van de PBAD promoter en expressie in pBAD vectoren

1) repressie : het dimeer AraC bindt aan I1 en O2 operatorplaatsen

(de DNA lus blokkeert transcriptie)

2) activatie : het dimeer AraC + arabinose : bindt aan de I1 en I2 plaatsen

3) de activatie is bovendien gevoelig aan catabolietrepressie : CAP + cAMP

(cAMP = is laag als glucose concentratie hoog is)

=> het samenspel van arabinose- en glucose-concentraties

kan gebruikt worden als fijnregeling van het expressieniveau

(nb. CAP-regulatie is ook aanwezig in het lac operon,

maar tac promotoren zijn niet CAP-afhankelijk)

Page 19: Expressievectoren en proteïneproductiesystemen

Detectie met antilichamen

Goed controleerbaar met % arabinose(dosis-afhankelijke regulatie)

Lusvorming (210 bp) door interactie van een AraC dimeer tussen I1 en O2 : negatieve regulatie.

Positieve regulatie : arabinose bindt op AraC waardoor het O2 verlaat en maakt een complex met AraC op I1 en I2 en transcriptie start.

Glucose verlaagt cAMP, en aldus deefficïentie van binding aan I1-I2 en dus transcriptie (extra regulatie).

Autoregulatie van AraC op zijn eigen promoter (pC, waarvoor O1)

N en C wijzen op de N- en C-uiteinden van AraC (dus C is dus niet het ganse AraC).

O1

Page 20: Expressievectoren en proteïneproductiesystemen

The three structural genes are arranged in an operon that is regulated by the araC gene product. There are four important regulatory sites as shown in the following survey (figures on next slides) :

araO1 is an operator site. AraC binds to this site and represses its own transcription from the PC

promoter. In the presence of arabinose, however, AraC bound at this site helps to activate expression of the PBAD promoter.

araO2 is also an operator site. AraC bound at this site can simultaneously bind to the araI site to

repress transcription from the PBAD promoter

araI is also the inducer site. AraC bound at this site can simultaneously bind to the araO2 site to

repress transcription from the PBAD promoter. In the presence of arabinose, however, AraC bound at this site

helps to activate expression of the PBAD promoter.

CRP binds to the CRP binding site. It does not directly assist RNA polymerase to bind to the promoter in this case. Instead, in the presence of arabinose, it promotes the rearrangement of AraC when arabinose is present from a state in which it represses transcription of the PBAD promoter to one in which it

activates transcription of the PBAD promoter.

Regulation of the arabinose operon is, clearly, much more complex than the lactose operon.When arabinose is absent, there is no need to express the structural genes. AraC does this by binding simultaneously to araI and araO2. As a result the intervening DNA is looped. These two events block access to

the PBAD promoter which is, in any case, a very weak promoter (unlike the lac promoter):

AraC also prevents its own expression. Thus, it is an autoregulator of its own expression. This makes sense; there is no need to over-express AraC. If the concentration falls too low then transcription of araC resumes until the amount of AraC is sufficient to prevent more transcription again.

When arabinose is present, it binds to AraC and allosterically induces it to bind to araI instead of araO2. If

glucose is also absent, then the presence of CRP bound to its site between araO1 and araI helps to break the

DNA loop and also helps AraC to bind to araI:             

The ara operon demonstrates both negative and positive control. It shows a different function for CRP. It also shows how a protein can act as a switch with its activity being radically altered upon binding of a small molecule.

Regulation of the ara-operon

*

Page 21: Expressievectoren en proteïneproductiesystemen

*

Page 22: Expressievectoren en proteïneproductiesystemen

Light switch mechanism of AraC protein action.

In the absence of arabinose, the N-terminal arm interacts with the DNA-binding domains and holds the latter such that the protein loops between araO2 and araI1. This represses both pC and pBAD.

In the presence of arabinose, interactions between arabinose and the N-terminal arms hold the latter over the arabinose, thus freeing the DNA-binding domains. These domains are then free to bind to I1 and I2, which then leads to induction of the pBAD promoter. The binding of AraC to O1L and O1R, left and right, directly represses the pC.

*

Page 23: Expressievectoren en proteïneproductiesystemen

3. Productiestrategieën

E. coli : is het majeure "eerstelijns" organisme voor expressie

=> nadelen (beperkingen)- geen (of zeer weinig) post-translationele modificaties- nagenoeg geen efficiënte secretiewegen naar het medium

(secretie brengt het proteïne in de periplasmatische ruimte)

- extensieve S-S bruggen zijn moeilijk te vormen

Waarom dan recombinante expressie/productie ?=> opdrijven van het productierendement => zuivering vergemakkelijken => nieuwe eiwitvarianten creëren (mutaties, inserties, fusies, enz.)

Het expressieproduct is : - oplosbaar of onoplosbaar - als matuur proteïne of als fusieproduct - accumuleert in cytoplasma of wordt gesecreteerd naar periplasma (type II secretie) (met E. coli is mogelijke extracellulaire secretie (excretie) zeer beperkt ;

één voorbeeld : type I secretie van haemolysine)

vervolgt

Page 24: Expressievectoren en proteïneproductiesystemen

Expressieproduct :

- als matuur proteïne

- kan aggregeren en precipiteren als 'inclusion bodies'

- dit maakt zuivering gemakkelijk

- het beschermt tegen afbraak

- maar het vereist achteraf solubilisatie en hervouwing

=> denatureer (in bvb. guanidinium hydrochloride) en (tracht te) renatureren

- vertraging van synthesesnelheid kan dit aggregatieproces (deels)

inperken (bvb. door verlaging van de incubatietemperatuur)

- het expressieconstruct vereist kritische manipulatie van het RBS gebied

om efficiente (op hoog niveau) translatie-initiatie te verzekeren

- het MET-probleem : wordt de initiator (formyl-)methionine verwijderd ?

vervolg

vervolgt

Page 25: Expressievectoren en proteïneproductiesystemen

"Inclusion bodies" in E. coli

(Scanning electronmicrograph) (Thin section through the cells)

Hoe de vorming van inclusion bodies vermijden (of verminderen) ? (verbetering van de kans op eiwitvouwing)

- cellen groeien bij lagere temperatuur (vertraagt het expressieproces) (of gebruik andere groeivertragende condities, bvb. samenstelling van media & pH waarden)

- co-expressie van chaperonen : DnaK, GroES, GroEL

- verwijdering van kritische aminozuurposities (bvb. in interferon-)

- fusie aan thioredoxine, of sommige andere eiwitten (zoals MalE)

Page 26: Expressievectoren en proteïneproductiesystemen

- als fusieproteïne (bvb. random inserties in ScaI van cat : AGT'ACT)

- N-terminale en C-terminale fusies zijn mogelijk (of multipele partners)

- voordeel van C-terminale fusies : (d.i. aan C-terminus van fusiepartner)translatie-initiatieëfficiëntie wordt grotendeels behouden

- fusiepartner kan doelwit zijn voor zuivering (etiket)

- fusiepartner kan een activiteit hebben waarmee het productieniveau gevolgd kan worden

- fusiepartner kan verankering in de membraan bewerkstellingen

- een epitoop herkend door aan specifiek antilichaam kan voorzien worden (voor detectie of kwantificering of zuivering)

- fusie aan een signaalpeptidesequentie kan secretie geven => secretie laat vorming van (minstens sommige) S-S bruggen toe

- secretie = keuze tussen cytoplasmatische of periplasmische productie

vervolg

vervolgt

Page 27: Expressievectoren en proteïneproductiesystemen

Verschillende mogelijkheden van translatiefusieconstructen

S : signaalsequentie ; I : membraanintegratiedomein ; A, B : fusiepeptiden, o.a. affiniteitsetikettenHet gebruik van membraanintegratiedomeinen laat toe het proteïne te verankeren in één van de membraansystemen of in de celwand.

Page 28: Expressievectoren en proteïneproductiesystemen

Constitutieve expressie van het cat gen (baan 2), en (peptide)fusies door random klonering in de ScaI plaats (die dicht bij het C-terminus coderend gebied ligt) (banen 1, 6, 7, 9-15).Banen 4 en 5 zijn plasmide-vrije cellen ; banen 3 en 8 zijn proteïne-lengtemerkers.

*

Page 29: Expressievectoren en proteïneproductiesystemen

Secretie : is een bijzondere vorm van fusie

- de fusiepartner (signaalpeptide) wordt verwijderd tijdens secretie

- er is dus geen (extra) methionine aan de N-terminus

- (de voorspelde) positie van splitsing is niet altijd gegarandeerd

=> meestal moet men verschillende secretiesignalen testen : van OmpA,

OmpT, PelB, -lactamase, alkalische fosfatase, enz. Sommige hiervan

geven bij voldoende overexpressie ook lekkage naar het groeimedium.

- !!! maar : niet alle proteinen zijn ‘secreteerbaar’ (zelfs al is er een signaalpeptide)

Over het algemeen :

1) kleine peptiden : vaak stabiliteitsprobleem (afbraak van het peptide)

=> fusiebenadering te verkiezen : bvb. LacZ fusies

2) intermediaire grootte: weinig S-S : intracellulaire aanmaak

meer S-S : periplasmische aanmaak (secretie)

3) grote proteïnen : problematischer

vervolg

Page 30: Expressievectoren en proteïneproductiesystemen

4. Zuivering en verwerking

Fusies die makkelijke zuivering mogelijk maken:

o.a. aan glutathion-S-transferase, MalE (MBP : maltose bindingsproteïne),

oligo-His (hexa-His), enz. : partners of etiketten. Zuivering door

affiniteitschromatografie of door immobilisatie gevolgd door elutie.

Vrijzetting van het etiket/de partner door splitsing met specifieke proteasen

zoals factor Xa, enterokinase, enz., of gebruik van ‘intein processing’.

Voorbeelden van affiniteitsetiketten ("tags")

Page 31: Expressievectoren en proteïneproductiesystemen

Voorbeelden van expressie-fusie systemen :

1. C-terminale fusie in pBAD/His vectoren

- zes Histidine triplets

- insertie in het juiste leesraam : BglII knipplaats

- binding aan een kolom met geïmmobilizeerd Ni2+

- splitsingsplaats voor enterokinase (D-D-D-D-K* ) (* = splitsingsplaats)

(nb. enkele resterende aminozuren blijven aan de N-terminus na verwerking)

2. C-terminale fusie aan een biotine-afhankelijke carboxylase (biotine is een essentiële cofactor voor een aantal carboxylasen)

- biotine covalent aangehecht aan een lysine door biotine ligase (BirA)(E. coli heeft één gebiotinyleerd eiwit maar dit bindt in zijn natieve vorm niet aan streptavidine)

het “doelwit” (voor biotine ligase) is aan de N-zijde als “tag” voorzien

- immobilisatie aan streptavidine (batchgewijs of door affiniteitschromatografie)

- factor Xa splitsingsplaats : I-E-G-R* of I-D-G-R* (niet gevolgd door P of R) (* = splitsingsplaats) (secundaire plaatsen meestal op G-R*)

Page 32: Expressievectoren en proteïneproductiesystemen

Proteïneproductie en

verwerking met

pBAD/His vectoren

C-terminale fusie

6 His-resten voor affiniteits-zuivering

splitsing door enterokinase(D-D-D-D-K-*)

na verwerking blijven nog een paar extra aminozuren aande N-terminus

Page 33: Expressievectoren en proteïneproductiesystemen

C-terminale fusie aan biotine carboxylase

Binding op streptavidinekolommen voor zuivering.

Verwerking met factor Xa protease (I-E-G-R-* of I-D-G-R-* (niet gevolgd door P of R))

De tag hier is een biotine-afhankelijk carboxylasegen.

Na splitsing met factor Xa protease blijven ook hier meestal een aantal extra aminozuren aan het N-uiteinde over.

Zie ook verder “pinpoint vectoren”

Page 34: Expressievectoren en proteïneproductiesystemen

~100 aminozuren ~50 aminozuren

3. N-terminale fusie aan en verwerking door inteïne (i.t.t. meeste andere systemen die C-terminaal zijn)

(vermijdt het toevoegen van een protease bij de verwerkingsstappen)

- N-terminale fusie aan (aangepast) inteïne + chitine bindingsdomein (CBD)=> zelf-splitsing aan de N-terminus van het inteïne door een thiol

- expressie vanaf de T7 promotor, in fusie met lacO => inductie door IPTG

- bind het fusieproduct aan de chitinekolom- was de kolom, en equilibreer de kolom met een DTT-oplossing

=> in situ splitsing bij 4°C gedurende een nacht- elueer het doelwitproteïne- verwijder de fusiepartner (inteïne-CBD) van de kolom met SDS

Inteine :

- universeel voorkomend- 200-800 lang- diverse types met of zonder homing endonuclease- splitst autokatalytisch, geen cofactoren, ATP of andere elementen vereist

Splicing van het inteïne

Page 35: Expressievectoren en proteïneproductiesystemen

Verwerking van een N-terminale fusies aan inteïne, met immobilisatie op een chitinekolom

Page 36: Expressievectoren en proteïneproductiesystemen

4. MalE-fusies : vectoren pMAL-c2 en pMAL-p2 (met (c) of zonder (p) de signaalpeptidesequentie van het malE gen: cytoplasmische of periplasmatische expressie)

- expressie-eenheid tussen de Ptac promotor en rrnB terminatoren, met lacIq

op de vector om voldoende Lac-repressor te voorzien.

- fusie tussen de malE partner en lacZ, gescheiden door 10xD en een MCSvoor insertie van het doelwitgen.

De in-frame constructie produceert blauwe kolonies op BCIG-media.Het polaire 10xD peptide scheidt de twee proteïnedelen (eigen vouwing). Klonering in de MCS geeft witte (kleurloze) kolonies.

- affiniteitszuivering op een amylosekolom : na elutie met maltose en splitsing door

factor Xa, wordt fusiepartner MalE verwijderd door een 2e chromatografie op amylose.

- MCS bevat (aan de linkerzijde) een XmnI, die overlapt met de factor Xa knipplaats en een exacte fusie aan het doelwitgen mogelijk maakt : andere insertieplaatsen laten enkele extra aminozuren aan het N-terminale uiteinde na factor Xa splitsing.

- de EcoRI kloneerplaats ligt in hetzelfde leesraam als de EcoRI plaats in lacZ : dit vergemakkelijkt de uitwisseling van een gen dat als een expressiefusie gekloneerd is in (ondermeer) de vector gt11.

Page 37: Expressievectoren en proteïneproductiesystemen

pMAL expressievectoren malE : kodeert voor maltosebindend proteïne (MBP)

lacZ

Page 38: Expressievectoren en proteïneproductiesystemen

Karakteristieken van pMAL vectoren :

ColE1 ori ; M13 ori ; Ptac ; rrnB terminators ; lacIq ; bla

Fusieconstruct : malE - DDDDDDDDDD - IEGR - MCS(polylinker) - lacZ

(bij doorlezing in het leesraam : blauwkleuring met IPTG + BCIG)

pMAL-c2 : malE signaalpeptidesequentie is gedeleteerd

pMAL-p2 : met malE signaalpeptidesequentie : secretie naar het periplasma

fusie in fusie in XmnXmnI : exacte koppeling van het doelwitproteïne aan de factor Xa sequentieI : exacte koppeling van het doelwitproteïne aan de factor Xa sequentie

10 Asp eenheden (D) scheiden de twee fusiegedeelten10 Asp eenheden (D) scheiden de twee fusiegedeelten

insertie in insertie in EcoEcoRI is identisch (qua leesraam) als in RI is identisch (qua leesraam) als in gt11 (gt11 (lacZlacZ))

de vector is een fasmide : snelle enkelstreng bereiding mogelijkde vector is een fasmide : snelle enkelstreng bereiding mogelijk

Splitsingsplaats van factor Xa I - E - G - R Splitsingsplaats van factor Xa I - E - G - R **

XmnXmnI nnn nnn nI nnn nnn nGA AGA Ann nnnn nnT TCT TCn nnn n nnn ATC-GAG-GATC-GAG-GGA-AGA-AGG-ATGG-ATT-TCT-TCA-A-GAA-TTCGAA-TTC-- EcoEcoRI RI

Page 39: Expressievectoren en proteïneproductiesystemen

"Multiple cloning site" in (één van) de pMAL vectoren

Andere mogelijkheid (in sommige vectoren)

Pro-Gly-Ala-Ala-His-Tyr : splitsing door Genenase I (een geëngineerde vorm van subtilisine)

splitst achter His-Tyr (afhankelijke van het volgende aminozuur)(splitst His-Tyr-Glu en His-Tyr-Asp traag, en His-Tyr-Pro en His-Tyr-Ile niet)

Perfecte fusie met XmnI.Met EcoRI blijft alleen Ile-Ser- over (+ Glu-Phe vanop de EcoRI plaats)

Page 40: Expressievectoren en proteïneproductiesystemen

Verwerking van expressieproducten uit fusieconstructen in pMAL vectoren

Page 41: Expressievectoren en proteïneproductiesystemen

5. Pinpoint vectoren

- gelijkaardige elementen als in vorige voorbeelden (o.a. vb.2):

tac (en T7) promoter, insertieplaatsen, etiket, factor Xa doelwit, enz.

hier tevens SP6 (naast T7 vanop andere streng) promoter voor synthese van RNA

- N-terminaal is een etiket waarin een lysine gebiotinyleerd wordt door het

E. coli biotin ligase holoenzyme

Het lysine is toegankelijk voor (strept)avidine : => etiket voor detectie en zuivering

E. coli produceert slechts één enkel endogeen gebiotinyleerd proteïne dat, in zijn natieve conformatie, niet bindt aan (strept)avidine : => zeer specifiek zuiveringssysteem voor het recombinante fusieproteïne. Ook, detectie van het fusieproteïne mogelijk met streptavidine-alkalische fosfatase.

- het fusieproteïne bindt aan (strept)avidine, en kan geëlueerd worden door

toevoeging van 5mM biotine : => geen denaturerende condities vereist.

Page 42: Expressievectoren en proteïneproductiesystemen

(Commerciële) Pinpoint vectoren

twee promoters : T7 en tac

factor Xa knipplaats

N-terminale biotinylering (tag)

polylinker (MCS)

in vitro RNA sondes met de SP6 (of T7) promoter

secretiesignaal (sommige vectoren)

Detectie doorstreptavidine-alkalische

fosfatase

Elutie van fusieproteïne met5 mM biotine(dus : geen denaturatie vereist)

Page 43: Expressievectoren en proteïneproductiesystemen

22 aminozuren N-terminale fusie, waarin hexa-His en protease TEV knipplaats

M-H-H-H-H-H-H-S-S-G-V-D-L-G-T-E-N-L-Y-F-Q*S-M- (* is de TEV knipplaats)

LIC klonering (LIC-5 en LIC-3 plaatsen)

sacB als (negatieve) selectiemerker (nl. als stuffer) op 5% sucrose

De waardcel moet T7 RNA polymerase tot expressie brengen

(zie pET systeem)Fasmide vector.

6. Een recentere pET vector (zie hoger) voor LIC klonering en eiwitverwerking

TEV (van Tobacco etch virus) protease : herkent E-X-X-Y-X-Q-G/S en splitst tussen Q en G of S. Tolereert dus heelwat aminozuursequentievariatie maarde splitsingsefficientie varieert sterk. Meestal wordt E-N-L-Y-F-Q-S gebruikt dat het meest efficiënte substraat lijkt.

Zijn structuur is similair aan serineproteasen maar met C i.p.v. S in de katalytische triade Ser-Asp-His, hetgeen allicht zijn resistentietegen veel protease-inhibitoren verklaart.

N

Page 44: Expressievectoren en proteïneproductiesystemen

Ander, analoog aan het vorige, voorbeeld. Hier op basis van een vector voor TOPO-klonering, zie practicum, maar in deze vector ook alle elementen voorzien voor expressie en verdere verwerking van het eiwitproduct.

*N

Page 45: Expressievectoren en proteïneproductiesystemen

5. Optimalisatiestrategieën

bvb. C-terminale fusie aan een reportergen om expressierendement te testen

in functie van (kleine) wijzigingen. Ondermeer door regio-specifieke

willekeurige mutaties (o.a. in het gebied van ribosoombinding en initiatie) kan de

beste producer geïdentificeerd worden.

Op analoge wijze kan een N-terminale fusie aan een reportergen voorzien

worden, en dusdanig dat na optimalisatie (regio-mutagenese) kan het

reportergen geëxciseerd kan worden. Er wordt dan op gespeculeerd

dat het C-terminale deel van de fusie geen invloed heeft op de

expressieëfficientie.

GFP (green fluorescent protein) is een efficiënte, meer recente, reporter ; het oorspronkelijk geïsoleerde was een eiwit van 238 aminozuren (26,9 kDa) dat een groene fluorescentie (emissie bij 509 nm) geeft bij belichting met blauw licht (excitatie bij 395 nm en ook, in mindere mate, bij 475 nm). Het vereist Ca2+ ionen. Het werd geïsoleerd uit Aequorea victoria, maar heel wat andere mariene organismen bleken similaire eiwitten te bevatten. Er werden tevens tal van mutanten gemaakt (van het eerste en van latere) waarmee de eerste nadelen (2 excitatiegolflengtes en afhankelijkheid van cofactoren) konden uitgeschakeld worden. Expressies in nagenoeg alle organismen voor genmanipulatie werden bekomen.

*

Page 46: Expressievectoren en proteïneproductiesystemen

Addendum : Genoomstrategie : lokaliseren van coderende gebieden (ORFs) in een genoomsequentie

*N

Page 47: Expressievectoren en proteïneproductiesystemen

posities in codon

Toegepast op een genomische DNA-sequentie met hoog G+C gehalte (75%)

(in de DNA sequentie)

* N