Fråga:
När misslyckas BLAST med att anpassa två DNA-sekvenser?
ablmf
2011-12-17 01:07:09 UTC
view on stackexchange narkive permalink

Det här är ett uppdrag som hade förvirrat mig länge. Så jag tror att ni som studerar beräkningsbiologi kan vara intresserade. Den ursprungliga frågan är:

Hitta de två mest likartade DNA-sekvenserna med längd 20 som Blast med en ordlängd på 5 misslyckas med att justera.

Två svar:
#1
+14
user59
2011-12-17 01:56:42 UTC
view on stackexchange narkive permalink

BLAST fungerar genom att hitta en perfekt matchning mellan sekvenser med en längd som är lika med denna "ordlängd" och sedan förstorar den på ett standardiserat sätt - ändå kommer det inte att finnas någon inriktning utan detta perfekt matchade ord.

Så i ditt fall måste du leta efter två 20bp-sekvenser utan någon gemensam 5bp-delsekvens; till exempel:

  AAAAAAAAAAAAAAAAAAAA  

och

  AAAACAAAACAAAACAAAAC  
Ja, det här är standardsvaret. Men notera att BLAST fungerar annorlunda med Protein. Det var därför det förvirrade mig ett tag.
Är "ordlängd" == k-tuple?
@StudentT Exakt k i k-tuple.
#2
-1
user1503
2012-10-08 02:18:06 UTC
view on stackexchange narkive permalink

Jag är inte säker på att jag förstår BLAST korrekt.

När du använder BLAST i DNA och protein är de olika. Det finns en tröskel T i protein "sådd" -steg, vilket innebär att såddsekvensen inte är perfekt matchad. Det verkar dock som om det inte finns något T i såddsteget och vi letar efter perfekt matchning och utvidgar dem till angränsande sekvens.

Så om det inte finns någon ordlängd 5 exakt matchning mellan dessa två sekvenser kommer BLAST att misslyckas.

Jag är rädd att jag inte förstår vad du försöker säga här. Skulle du kunna förtydliga?


Denna fråga och svar översattes automatiskt från det engelska språket.Det ursprungliga innehållet finns tillgängligt på stackexchange, vilket vi tackar för cc by-sa 3.0-licensen som det distribueras under.
Loading...