Fråga:
Vad bestämmer ett framgångsrikt proteinuttryck i E. coli?
Gergana Vandova
2011-12-17 01:54:43 UTC
view on stackexchange narkive permalink

Vissa proteiner uttrycker sig väl i en heterolog värd; andra - gör det inte. Några krav är kända för att bestämma proteinuttrycket, som en stark promotor (som T7) för transkription och ett starkt ribosombindningsställe för translation. Jag arbetar med ett protein som består av två underenheter - alfa och beta. Båda är på en plasmid med T7-promotor framför beta-underenheten (dvs. konstruktionen är T7-promotor, CDS för beta-underenhet, CDS för alfa-underenhet). Beta-underenheten uttrycker bra, men alfa gör det inte. Tycker du att detta har något att göra med den lokala miljön (promotorer, RBS, etc.) och hur mycket beror det på det? Hur kan jag öka proteinuttrycket?

Vissa aspekter är inte helt tydliga för mig. De två underenheterna uttrycks på separata plasmider, eller? Och allt i plasmiderna är detsamma utom den faktiska proteinsekvensen?
De två underenheterna finns på samma plasmid. Plasmidsekvensen börjar med T7-promotor, RBS1, underenhet beta, RBS2, underenhet alfa. RBS-sekvenserna är lite annorlunda, så jag tänkte göra dem desamma, men detta borde inte ha någon stor effekt på proteinuttrycket. (de är mycket nära konsensus-sekvensen).
Fyra svar:
#1
+9
Mad Scientist
2011-12-17 02:31:16 UTC
view on stackexchange narkive permalink

En viktig aspekt när man uttrycker ett protein från en annan organism i E. coli är att kodonanvändningen av den ursprungliga organismen sannolikt skiljer sig från kodonanvändningen för E. coli som används för uttryck ( Codonanvändningsbias).

Även om den genetiska koden är degenererad är inte alla kodoner lika. De kan koda för samma aminosyra, men organismer tenderar att gynna specifika kodoner framför andra och tRNA för dessa kodoner tenderar att vara närvarande i olika koncentrationer. När du nu har många kodoner i din sekvens som är mycket sällsynta i E. coli kommer uttrycket att lida eftersom tRNA för dessa kodoner inte finns i tillräckligt höga koncentrationer för att upprätthålla översättningen.

Där är två sätt att kompensera för det, antingen får du din E. coli att producera mer av de sällsynta tRNA, eller så optimerar du din sekvens för att använda olika kodoner. För den första lösningen kan du köpa vissa E. coli-stammar som innehåller plasmider som kodar för tRNA som är sällsynta i E. coli, en av dessa stammar är t.ex. Rosetta BL21-stammen.

För att optimera kodonanvändningen finns det flera företag som erbjuder att syntetisera optimerade sekvenser. Det finns också verktyg tillgängliga online, men jag har ingen direkt erfarenhet av dessa.

Optimeringen är inte lika lätt som att bara använda det vanligaste kodonet varje gång, det har visat sig att optimering av kodonerna för att matcha översättningshastigheten i den ursprungliga organismen kan öka uttrycksutbytet. För vissa proteiner kan pausställen under översättningen vara nödvändiga för att säkerställa korrekt vikning. Om proteinet inte viks ordentligt nedbryts det snabbt och din avkastning kommer att drabbas. Detta beskrivs i artikeln "Heterologiskt proteinuttryck förbättras genom att harmonisera kodgenanvändningsfrekvenserna för målgenet med de för uttrycksvärden" från Angov et al.

Du hittar en fin översikt över hela ämnet i artikeln "Du är en i en googol: optimera gener för proteinuttryck" från walisiska et al.

Tack, Mad Scientist! Ja, jag har tänkt på kodonoptimering och detta är definitivt på min att göra-lista. Tyvärr glömde jag att nämna det. DNA 2.0 har en programvara som konverterar din sekvens till en optimerad. Jag har också hört talas om Rosetta BL21, men jag har aldrig använt den. Vi kanske också vill hålla fast vid vår egen belastning, för det är den heterologa producenten av eller ett läkemedel av intresse. Jag är lite orolig för kodonoptimering, just på grund av felvikning, men jag tänker att vi borde göra det.
Men detta förklarar fortfarande inte varför den andra subenheten uttrycker bättre, liksom andra proteiner från samma nativa organism uttrycks väl i E. coli. Det är därför jag tror att det är mer en fråga om kontrollelementen för transkription och översättning, snarare än sällsynt kodonanvändning.
@GerganaVandova Du bör jämföra kodonanvändningen för dina två underenheter, det kan bara vara av en slump att den ena använder mer sällsynta kodoner än den andra.
Jag deltar i ett föredrag av Claes Gustafsson från DNA2.0 - och jag antar att vi redan visste det - att kodonanvändning är till hjälp, men inte alltid fungerar. de har en egen metod som är mer pålitlig ...
#2
+6
Amy
2011-12-22 05:41:32 UTC
view on stackexchange narkive permalink

Har du försökt sätta dina två gener på två separata plasmider (med olika ursprung för replikering och antibiotikaval, naturligtvis) och co-uttrycka det sättet? Om den första av de två underenheterna uttrycker sig bra och den andra inte, beror det antagligen på att ribosomerna faller av mRNA innan de transkriberar den andra genen helt. Är generna eukaryota? Jag tror att det är svårt att "lura" E. coli ribosomer för att behandla heterologa sekvenser som en operon, men kanske någon med mer kunskap om prokaryotisk översättning kan hjälpa.

Egentligen, bara lägga till en andra T7-promotor framför av gen 2 skulle förmodligen hjälpa en hel del:

Gener transkriberas antingen från enskilda promotorer eller från en enda promotor, vilket leder till ett långt polycistronic mRNA. Polycistronic expression har rapporterats leda till lägre expression av det mer nedströms kodade proteinet, vilket kan utnyttjas för att påverka stökiometrin hos ett proteinkomplex (9). Flera gånger högre uttryck med enskilda promotorer jämfört med polycistronic transkription har rapporterats (10). ( Källa)

Jag vet av egen erfarenhet att samuttryck med två plasmider kan fungera mycket bra med rätt gener!

Tack för ditt svar. Jag gillar idén att lägga till ytterligare T7-promotor, även om det att ha upprepade sekvenser kan leda till andra framtida problem (jag vill inte gå in i detaljer). Men jag arbetar med gener som är 3 gånger större och en promotor för de två underenheterna fungerar bra. Kanske är det väldigt sekvensspecifikt.
#3
+2
Nick T
2011-12-17 11:19:41 UTC
view on stackexchange narkive permalink

Mad Scientist täckte potentiella codon-bias-problem (som kan förbättras med Rosettas), men mer generellt sett har jag sett en enorm variation i uttryckshastigheter mellan olika vektorer (pET-28 vs pET-24) utan någon uppenbar anledning. Vårt laboratorium har haft enorm framgång med IPTG-inducerbara vektorer (går från pBC-SK till pET-24 ökat uttryck 50 gånger).

Utöver uttrycket kan proteinet gå förlorat vid beredningen av det cellfria extraktet. Det kanske inte finns i cellpelleten om det exporteras med tillstånd av en signalpeptid eller kan kasseras i "skräp" -pelleten när det roterar ner lyserade celler om det är dåligt lösligt. Jag har hört en teori om att löslighetsfrågor kan överdrivas av vektorer som mättar exportmaskineriet, vilket både kan hindra syntes och / eller vara så effektivt att de bara orsakar nederbörd. pET-systemhandboken föreslår längre (över natten) uttryckstider vid lägre (15-20 ° C) kan hjälpa till med problem med lösligheten. Oavsett orsaken, genom att konstruera bort signalpeptiden ökade uttrycket drastiskt för många av våra proteiner.

#4
+2
Gergana Vandova
2012-01-07 01:15:01 UTC
view on stackexchange narkive permalink

Jag hittade ett mycket trevligt papper: Designing Genes for Successful Protein Expression, som täcker de flesta faktorer som bestämmer proteinuttryck. Jag lägger ut delar av det, för jag är säker på att det kommer att vara användbart för vissa av er.

Översättningen kan styras på initierings- och förlängningsnivå. Initiering av translation är i första hand beroende av sekvensen för ribosombindningsstället (RBS) och den tidiga mRNA-sekundära strukturen. Andra determinanter för proteinuttryck är mindre väl förstådda men lika potenta.

1. Initiering av översättning

En nyckelkomponent som påverkar initiering av översättning i prokaryoter är RBS som sker mellan 5 och 15 baser uppströms den öppna läsramen (ORF) AUG starta kodon. Bindning av ribosomen till Shine – Dalgarno (SD) -sekvensen inom RBS lokaliserar ribosomen till initieringskodonet ... Affinitet av RBS för ribosomen är en kritisk faktor som styr effektiviteten med vilken ny polypeptidkedjor initieras. Denna interaktion konkurrerar med möjliga baspar-interaktioner som involverar RBS-regionen som kan bildas inom mRNA-värdet. Således är SD-sekvenser med svagare basparning till ribosomen mer mottagliga för interferens från mRNA-struktur. Vissa experiment tyder dock på att SD-sekvenser med för stark affinitet kan vara skadliga, särskilt vid sänkning av temperaturer, genom att stoppa initial förlängning. Avgörande är också att avståndet mellan RBS och startkodonet med 5-7 baser från konsensus SD AGGAGG är optimalt.

Många bevisråd tyder på att de initiala 15-25 kodonerna för ORF förtjänar särskild hänsyn till genoptimering. Studier har visat att effekterna av sällsynta kodoner på translationstakten är särskilt starka i dessa första kodoner, för expression i både Escherichia coli och Saccharomyces cerevisiae. I E. coli verkar peptidyl-tRNA-drop-off under translation av de initiala kodonerna accentueras av närvaron av sällsynta NGG-kodoner. Dessa effekter verkar vara oberoende av lokal mRNA sekundär struktur. Det är också sant att uttryck kan återvinnas genom 5'-sekvensersättning även för sekvenser som inte visar särskilt stark mRNA-struktur eller innehåller sällsynta kodoner eller andra uppenbara skadliga element i denna region.

2. Codon bias

Det andra sättet på vilket värdkodonfrekvenser kan användas är att matcha värdkodonfrekvenserna i den designade genen. Detta kan göras helt enkelt genom att välja varje kodon med en sannolikhet som matchar värdkodonfrekvensen ... Genom att använda uppsättningar gener generellt varierade i gendesignfunktioner, Welch et al. fann att variationer i synonyma kodonanvändningsfrekvenser hade en djupgående effekt på mängden protein som producerades i E. coli, oberoende av lokala 5'-sekvenseffekter. Variationer av minst två storleksordningar i uttryck sågs på grund av substitution bortom de initiala 15 kodonerna för ORF. Denna variation var starkt korrelerad med generens globala kodonanvändningsfrekvenser, även om kodonfrekvenserna som hittades i de högst uttryckta varianterna inte motsvarade de som hittades i genomet eller i högt uttryckta endogena gener av E. coli. Multivariat analys visade att frekvenserna av specifika kodoner för cirka sex aminosyror kunde förutsäga de observerade skillnaderna i uttryck. Det är inte klart vad den biokemiska grunden är för denna korrelation.

3. mRNA-struktur och translationell förlängning

Även om mycket bevis tyder på att mRNA-struktur kan störa translationell initiering i både prokaryoter och eukaryoter, är effekterna av struktur på förlängning mindre väl förstådda. Detta kan delvis bero på ribosomernas inneboende helikasaktivitet, vilket möjliggör översättning genom till och med mycket starka hårnålar och kan hindra många strukturer från att begränsa översättningshastigheten i antingen prokaryoter eller eukaryoter. Ännu viktigare är att mRNA-strukturen är svår att förutsäga, särskilt för aktivt översatta meddelanden som är i kontinuerligt flöde mellan olika vikta och ovikta tillstånd.

4. Proteinspecifika faktorer som ger ytterligare komplexitet

Proteinet kan vara särskilt instabilt hos värden, speciellt om det är dåligt vikat på grund av inneboende instabilitet, brist på tillräckliga protetiska faktorer eller felaktig posttranslationell modifiering ... Uttryck av utsöndrade proteiner och membranproteiner kan begränsas av mekanismer för att rikta dessa proteiner till membranet. Det är till och med möjligt att proteinaminosyrasekvensen kan begränsa translationell effektivitet. Till exempel antas prolin långsamt översättas i E. coli, oavsett vilket kodon som används.

Uttryck av proteinet kan vara giftigt för cellen vilket leder till instabilitet hos uttrycksvektorn eller värdundertryckningen av proteinsyntes ... En vanlig strategi för att minska toxicitet är att sänka uttrycket till acceptabla nivåer. Arrangörer med olika styrka kan vara värdefulla verktyg för att hitta en optimal uttryckshastighet för maximal avkastning ... Ett potentiellt sätt att undvika toxicitet hos vissa proteiner är att rikta uttryck till periplasman eller mediet. Detta kan åstadkommas genom N-terminal fusion av en sekretionssekvens.

För mer information, läs hela dokumentet. Jag rekommenderar också att du läser Designparametrar för att kontrollera syntetiskt genuttryck i Escherichia coli.

Tack för länkarna! Jag har använt DNA 2.0 för kodonoptimering & gensyntes tidigare och har haft bra resultat - jag är definitivt intresserad av att läsa deras publikationer.
@Amy: Ja, en del av tidningen handlar om funktionerna i DNA2.0, vilket jag tycker är mycket användbart. Jag är en ny användare och vänjer mig fortfarande vid deras programvara, men det ser ganska bra ut hittills.


Denna fråga och svar översattes automatiskt från det engelska språket.Det ursprungliga innehållet finns tillgängligt på stackexchange, vilket vi tackar för cc by-sa 3.0-licensen som det distribueras under.
Loading...