RNA-seq Analyse-Datenbank

! ! ! ! Haftungsausschluss: Nicht original, ich mache es mir einfach leicht zu lernen, der Originaltext weist den Weg

NCBI-SRA-Datenbank und EBI-ENA-Datenbank

Die meisten Sequenzierungsdaten mit hohem Durchsatz in der veröffentlichten Literatur werden in eine Datenbank hochgeladen, damit andere Personen sie herunterladen, studieren und erneut studieren können. Die am häufigsten verwendete davon ist natürlich die SRA-Datenbank von NCBI. Gleichzeitig bietet die ENA-Datenbank von EBI viel Komfort beim Herunterladen von Daten. Bitte verstehen Sie die Situation dieser beiden Datenbanken, bevor Sie Dateien herunterladen.

NCBI und EBI gehören zu INSDC: International Nucleotide Sequence Database Collaboration, und die an die drei Datenbanken übermittelten Daten können interoperabel sein. Der Inhalt der Struktur ist wie folgt:

  • NCBI: Nationales Zentrum für biotechnologische Informationen
  • EBI: Europäisches Institut für Bioinformatik
  • DDBJ: DNA-Datenbank von Japan

SRA-Datenbank : Sequence Read Archive,

  • Es handelt sich um eine Datenbank, in der Sequenzierungsdaten mit hohem Durchsatz, Vergleichsinformationen und Metadaten gespeichert werden. Grundsätzlich werden alle Sequenzierungsdaten mit hohem Durchsatz in veröffentlichten Dokumenten in diese Datenbank hochgeladen. Diese Datenbank gehört zu NCBI.
    Fügen Sie hier eine Bildbeschreibung ein

  • Metadaten der SRA-Datenbank : Bezieht sich auf Daten, die sich auf Sequenzierungsexperimente und deren experimentelle Proben beziehen, wie z. B. Versuchszweck, Versuchsaufbau, Sequenzierungsplattform, Probendaten (Arten, Stämme, einzelne Phänotypen usw.). In der SRA-Datenbank Meta Daten werden auf folgenden Ebenen gespeichert:
    [1] Forschungsthema (Studie): In der SRA-Datenbank wird der Zugangsnummer des Forschungsthemas vorangestelltDRPERP oder SICHELAnfang.
    [2] Beispielinformationen (Beispiel): Die Abrufnummer des Beispiels beginnt mit dem Präfix DRS, ERS oder SRS. Die Probeninformationen können Arteninformationen, Stamminformationen (Stamminformationen), Familieninformationen, Phänotypdaten, klinische Daten, Gewebetyp usw. umfassen.
    [3] Versuchsinformationen (Versuch): Der Abrufnummer des Versuchs wird ein Präfix vorangestelltDRXERXoder SRXAnfang. Das Experiment ist die grundlegendste Einheit der SRA-Datenbank, ebenso wie jeder Artikel in der PubMed-Datenbank die Grundeinheit der PubMed-Datenbank ist. Ein Experiment ist Teil eines Forschungsthemas. Eine oder mehrere Proben werden sequenziert, und die resultierenden Sequenzierungsdaten werden in Form von Läufen in der SRA-Datenbank gespeichert.
    [4] Sequenzdaten: einschließlich Sequenz- und Qualitätsinformationen usw., die in der SRA-Datenbank gespeichert sind und als Einheit ausgeführt werden. Der Suchnummer des Laufs wird ein Präfix vorangestelltDRRIRREN oder SRR Anfang.

ENA-Datenbank : European Nucleotide Archive

  • Es gehört zu EBI und sollte in seiner Funktion SRA ähneln, aber seine Suchoberfläche ist benutzerfreundlicher und es ist freundlicher zum Herunterladen von Fastq-Dateien und zum Überprüfen der Integrität heruntergeladener Daten. Es wird daher dringend empfohlen, es zuerst zu verwenden .

Fügen Sie hier eine Bildbeschreibung ein

  • Der Vorteil der ENA-Datenbank
    [1] Sie können Fastq-Dateien direkt abrufen.
    [2] Ein weiterer Vorteil der Verwendung der ENA-Datenbank besteht darin, dass Sie die Integrität der heruntergeladenen Daten bestätigen können. Die lange Downloadzeit, die durch das große Volumen an biografischen Daten verursacht wird (das Netzwerk schwankt, wenn das Netzwerk während des Zeitraums abnormal ist), kann Probleme wie den Mangel an heruntergeladenen Daten verursachen, die im frühen Stadium des Abrufs im Allgemeinen schwer zu finden sind die Daten. Die ENA-Datenbank enthält den MD5-Code zur Überprüfung der Integrität der Daten.

  • Verwendung der ENA-Datenbank

Geben Sie zunächst die Ziel-SRA-Suchnummer in die Suchleiste in der oberen rechten Ecke der Datenbankseite ein und warten Sie nach der Bestätigung eine Weile, bis die Ergebnisseite angezeigt wird

Fügen Sie hier eine Bildbeschreibung ein

Zweitens klicken Sie, um Experiment auszuwählen, um alle Sequenzsequenzdateninformationen des Experiments abzurufen

Fügen Sie hier eine Bildbeschreibung ein

Wir können die beiden zum Experiment gehörenden Sequenzdateninformationen sehen und die FTP-Adresse zum Herunterladen der Fastq-Datei direkt in der Spalte FASRTQ-Dateien (FTP) abrufen.

Fügen Sie hier eine Bildbeschreibung ein

Holen Sie sich die FTP-Adresse zum direkten Herunterladen von Fastq-Dateien

Fügen Sie hier eine Bildbeschreibung ein

Ich denke du magst

Origin blog.csdn.net/qq_44520665/article/details/113743765
Empfohlen
Rangfolge