Fråga:
Hur många humana proteiner har en löst 3D-struktur?
Gergana Vandova
2011-12-23 10:27:46 UTC
view on stackexchange narkive permalink

Jag undrade hur många humana proteiner som har en löst 3D-struktur. Finns det en databas med endast humana proteiner? Jag tittade på pdb men kunde inte hitta ett filter.

Jag tror att du kommer att ha många problem med redundans, speciellt om du vill veta antalet unika proteiner.
@GWW Jag antar att att skriva ett litet manus kan bli av med redundansen.
Du kan ha bättre tur att ställa den här frågan på [biostar] (http://biostar.stackexchange.com).
Lägg märke till att "löst" är mycket subjektivt. Inte alla strukturer är av hög kvalitet, och några av dem är helt enkelt felaktiga på grund av experimentella fel.
Detta är en mycket ämnesfråga av två skäl: Proteindatabanken accepterar NMR- och kristallstrukturer av proteiner som erbjuder olika grader av upplösning och noggrannhet. Dessa strukturer är också något subjektiva eftersom proteinet kan anta olika konformationer beroende på dess relevanta biologiska sammanhang. För det tredje kan lösningsmedelsextraktionerna införa felaktig struktur.
många av dessa proteiner har bara en domän eller två löst som strukturer. animaliska proteiner är svåra på det sättet. det är där den här frågan blir lite svår imho.
Fyra svar:
#1
+19
Michael Kuhn
2011-12-23 17:17:45 UTC
view on stackexchange narkive permalink

6405 proteiner som kartläggs till 5220 gener, enligt Ensembl.

I Ensembls BioMart kan du välja PDB-ID som extern referens. Exportera resultaten och räkna de unika proteinerna / generna som har ett PDB-ID.

#2
+12
Aleksandra Zalcman
2012-01-15 06:06:53 UTC
view on stackexchange narkive permalink

PDB är en bra resurs för att svara på sådana frågor, eftersom det låter dig filtrera resultat efter många ytterligare parametrar. För att räkna och extrahera 3D-strukturer av humana proteiner:

  1. Öppna Avancerad sökflik på PDB-webbplatsen.
  2. Välj Biologi kod> -> Källorganism från menyn.
  3. Skriv Homo sapiens (mänsklig) .
  4. Du kan minska redundansen med kontrollera Ta bort liknande sekvenser vid n% identitet nedan.
  5. Skicka fråga.

Om du vill lägga till fler filter klickar du på Förfina fråga med Avancerad sökning . Där kan du extrahera strukturer efter deponeringsdatum, kvalitet (t.ex. upplösning eller R-faktorer för strukturer som löses genom röntgendiffraktion), ligander, enzymklassificering etc. (genom att markera Lägg till sökkriterier )

Sök efter humana proteiner med avlägsnande av homologer med 90% identitetsavbrott hämtar 7117 strukturer. Antalet röntgenproteinstrukturer av god kvalitet (upplösning < 2.5A) är för närvarande 3964 (med samma identitetsavgränsning).

Du kan sedan ladda ner den hämtade listan eller skapa anpassade rapporter (menyer nedan).

Ett bra verktyg (används också av PDB) för att generera icke-redundanta proteindatamängder är cd-hit.

#3
+3
GWW
2011-12-23 10:45:18 UTC
view on stackexchange narkive permalink

Från dina kommentarer verkar det inte som om du är negativt att skriva några anpassade skript så ett alternativ skulle vara att dra nytta av NCBI Structure-databasen. Du kan filtrera efter organism och sedan ladda ner resultaten som en textfil / XML. Om du behöver tillgång till de råa PDB-uppgifterna kan du ladda ner PDB-arkivet och undersöka dem i din filtrerade lista.

#4
  0
PDB annotator
2015-04-19 10:53:55 UTC
view on stackexchange narkive permalink

PDBes nya söksystem är utformat för att svara på just sådana frågor http://www.ebi.ac.uk/pdbe/entry/search/index?organism_synonyms:HUMAN&view=macromolecules

visar att det finns 6964 unika humana makromolekyler med strukturdata i PDB.

Naturligtvis kommer många att vara fragment av proteiner snarare än hela molekylen.



Denna fråga och svar översattes automatiskt från det engelska språket.Det ursprungliga innehållet finns tillgängligt på stackexchange, vilket vi tackar för cc by-sa 3.0-licensen som det distribueras under.
Loading...