Fråga:
Hur bestäms gränserna för en gen?
ghchinoy
2011-12-19 22:16:43 UTC
view on stackexchange narkive permalink

Vilka statistiska processer och metoder används av genetiker / molekylärbiologer för att veta var en gen börjar och en slutar?

Vad hänvisar den "grundläggande" taggen till?
Jag trodde att frågan var mer grundläggande att fröa gruppen, så jag taggade den _basic_. Om det inte är protokoll är du välkommen att ta bort den.
@ghchinoy: Jag tog om det, förutsatt att det är en [metatagg] (http://blog.stackoverflow.com/2010/08/the-death-of-meta-tags/) (även om det är en fråga om baspar)
Bara för att klargöra: vi pratar om * proteinkodande gener * här, eller hur? Det finns många fler för vilka metoderna är helt olika.
@KonradRudolph kan du kanske hänvisa till andra gentyper och metoder? Tack.
@ghchinoy Precis som ett exempel arbetar jag för närvarande med tRNA-gener och eftersom de använder en annan polymeras ser deras promotor och avslutningsplats markant annorlunda ut. Detsamma gäller för alla andra icke-kodande RNA och sedan finns det saker som pseudogener och LINE / SINE (de brukar inte anses vara gener men på grund av deras likhet med icke-kodande RNA-gener komplicerar de analysen). Ändå finns det faktiskt bioinformatiska metoder för att hitta dessa gener. De använder främst motivsökning så vitt jag vet.
Fyra svar:
#1
+12
agrimaldi
2011-12-20 00:02:46 UTC
view on stackexchange narkive permalink

Jag känner bara till ett naivt tillvägagångssätt för att bestämma gränserna för en gen: RACE-PCR. Det finns två typer, 3 'och 5' RACE, som gör det möjligt att hitta respektive extremiteter.

Motivet är följande:

  • Du utför en omvänd transkription av transkriptet av intresse med användning av en specifik primer. Vid detta steg har du ett specifikt enkelsträngat cDNA.

  • Sedan lägger du till en sträcka av identiska nukleotider som kallas homopolymeric tail i 5 'av cDNA.

  • Slutligen utför du en PCR med en specifik primer och en universal primer som känner igen den homopolymeriska svansen. Du kan sekvensera ditt förstärkta cDNA och hitta var det ligger i genomet med en 1 bp upplösning.

För 3'RACE är konceptet detsamma men poly-A-svansen används istället för att generera det själv med terminalöverföringen.

Se det här dokumentet för ett detaljerat protokoll:

Sambrook J, Russell DW . 2006. Snabb förstärkning av 5'-cDNA-ändar (5'-RACE). CSH-protokoll 2006.

Dessutom ger motsvarande wikipedia-artikel mer information om vad som händer i varje steg, men se upp, det finns ett fel: det är sa att för 5'RACE, ansluter terminalöverföringen den homopolymeriska svansen i 3 'medan den lägger till den i 5'

-1: det kan vara ett bra tillvägagångssätt för att se gränserna för en ORF (för att vara ärlig, du behöver inte alltid en RACE, en enkel PCR kan också fungera), inte av en gen. Vad sägs om promotor- och regleringselement? Vilken är också fördelen jämfört med, till exempel, en bioinformatikstrategi efter sekvensering?
@nico: så, med den definition du ger, har en gen inga gränser.
@nico: Ok, jag förstår er poäng, men jag tror inte att OP hade den här definitionen av en gen i åtanke. Jag håller också helt med om att ny teknik som RNA-seq ger dig ett mer omfattande svar för genomkommentarer.
vi kan diskutera i timmar om den korrekta definitionen av en gen, men jag tror inte att det finns mycket att diskutera om det faktum att promotorn är en del av en gen. Och genom retranskription av mRNA får du inte promotorn.
#2
+8
Gergana Vandova
2011-12-20 00:20:29 UTC
view on stackexchange narkive permalink

Det finns olika program där du kan ange din sekvens (låt oss säga hela genomssekvensen) och den kan identifiera de förmodade öppna läsramarna (ORF), dvs startkodonerna och stoppkodonerna. Genom att använda dessa förmodade gener kan du sedan göra en sekvensinriktning genom att använda BLAST och sedan, baserat på poängen, kan du bekräfta att de verkligen är ORF. Eftersom detta är det statistiska tillvägagångssättet kan du sedan verifiera dina resultat i det våta laboratoriet, som Agrimaldi föreslog.

Men * hur * bestämmer programvaran gengränserna? Vad letar de efter som är ett tecken på en gengräns?
Kanske bör en annan fråga startas specifikt om vilka programmatiska tekniker som används? Kanske med en bioinformatik-tagg.
@RichardSmith De letar i princip efter startkodoner (ATG, GTG) som definierar början på den öppna läsramen (ORF) och stoppkodon (TAG, TAA, TGA), som definierar slutet på ORF, och kontrollerar också om antalet baser mellan startkodonet och stoppkodonet är synligt med 3.
@ghchinoy Ja, det kan vara intressant, men jag tycker inte att det är mer komplicerat än vad jag redan förklarade för Richard. Du kan naturligtvis lägga till några fler "kontroller" som programvaran kan göra, som längden på ORF.
#3
+6
KAM
2011-12-24 18:28:09 UTC
view on stackexchange narkive permalink

Om ditt mål är att definiera gränserna för transkriptionsenheten (den del av DNA som transkriberas) är svaret ovan korrekt, även om många bara använder homologi för att klonade cDNA snarare än RACE-reaktioner. Detta tillvägagångssätt har fördelen att definiera alternativa skarvsformer samtidigt.

Om ditt mål är att definiera "ändarna" på genen kan det bara göras empiriskt och funktionellt eftersom kontrollelement (gränser, förstärkare, etc) är omöjliga att känna igen med hjälp av informatik, och även om man hittar förstärkare är det inte säkert att dessa förstärkare används med specifika gener. Vissa gener kan vara miljoner av baspar långa, så har hundratals andra gener blivit isär. "Guldstandarden" för att definiera gränserna för gener är att rädda fenotypens funktionsförlust av en mutation med en transgen som innehåller genen av intresse. Om DNA som transformeras tillbaka till en organism kan återhämta vildtypstillståndet för en mutation av en gen, antas det att alla viktiga delar av den genen finns i transgenen.

#4
+3
AnnaF
2011-12-19 23:04:57 UTC
view on stackexchange narkive permalink

Generellt sett sekvenserar du genomet och söker sedan efter ledtrådar. Det finns vanligtvis specifika sekvenser före en gen som hjälper translationell utrustning att veta "hej det är här vi börjar" samt regioner där proteiner kan bindas som används för att förbättra eller hämma translationen av genen. kan programmeras för att söka igenom sekvensen och ta upp möjliga kandidater för människor att titta närmare på.



Denna fråga och svar översattes automatiskt från det engelska språket.Det ursprungliga innehållet finns tillgängligt på stackexchange, vilket vi tackar för cc by-sa 3.0-licensen som det distribueras under.
Loading...