! ! ! ! Haftungsausschluss: Nicht original, ich mache es mir einfach leicht zu lernen, der Originaltext weist den Weg
NCBI-SRA-Datenbank und EBI-ENA-Datenbank
Die meisten Sequenzierungsdaten mit hohem Durchsatz in der veröffentlichten Literatur werden in eine Datenbank hochgeladen, damit andere Personen sie herunterladen, studieren und erneut studieren können. Die am häufigsten verwendete davon ist natürlich die SRA-Datenbank von NCBI. Gleichzeitig bietet die ENA-Datenbank von EBI viel Komfort beim Herunterladen von Daten. Bitte verstehen Sie die Situation dieser beiden Datenbanken, bevor Sie Dateien herunterladen.
NCBI und EBI gehören zu INSDC: International Nucleotide Sequence Database Collaboration, und die an die drei Datenbanken übermittelten Daten können interoperabel sein. Der Inhalt der Struktur ist wie folgt:
- NCBI: Nationales Zentrum für biotechnologische Informationen
- EBI: Europäisches Institut für Bioinformatik
- DDBJ: DNA-Datenbank von Japan
SRA-Datenbank : Sequence Read Archive,
- Es handelt sich um eine Datenbank, in der Sequenzierungsdaten mit hohem Durchsatz, Vergleichsinformationen und Metadaten gespeichert werden. Grundsätzlich werden alle Sequenzierungsdaten mit hohem Durchsatz in veröffentlichten Dokumenten in diese Datenbank hochgeladen. Diese Datenbank gehört zu NCBI.
Metadaten der SRA-Datenbank : Bezieht sich auf Daten, die sich auf Sequenzierungsexperimente und deren experimentelle Proben beziehen, wie z. B. Versuchszweck, Versuchsaufbau, Sequenzierungsplattform, Probendaten (Arten, Stämme, einzelne Phänotypen usw.). In der SRA-Datenbank Meta Daten werden auf folgenden Ebenen gespeichert:
[1] Forschungsthema (Studie): In der SRA-Datenbank wird der Zugangsnummer des Forschungsthemas vorangestelltDRP,ERP oder SICHELAnfang.
[2] Beispielinformationen (Beispiel): Die Abrufnummer des Beispiels beginnt mit dem Präfix DRS, ERS oder SRS. Die Probeninformationen können Arteninformationen, Stamminformationen (Stamminformationen), Familieninformationen, Phänotypdaten, klinische Daten, Gewebetyp usw. umfassen.
[3] Versuchsinformationen (Versuch): Der Abrufnummer des Versuchs wird ein Präfix vorangestelltDRX,ERXoder SRXAnfang. Das Experiment ist die grundlegendste Einheit der SRA-Datenbank, ebenso wie jeder Artikel in der PubMed-Datenbank die Grundeinheit der PubMed-Datenbank ist. Ein Experiment ist Teil eines Forschungsthemas. Eine oder mehrere Proben werden sequenziert, und die resultierenden Sequenzierungsdaten werden in Form von Läufen in der SRA-Datenbank gespeichert.
[4] Sequenzdaten: einschließlich Sequenz- und Qualitätsinformationen usw., die in der SRA-Datenbank gespeichert sind und als Einheit ausgeführt werden. Der Suchnummer des Laufs wird ein Präfix vorangestelltDRR,IRREN oder SRR Anfang.
ENA-Datenbank : European Nucleotide Archive
- Es gehört zu EBI und sollte in seiner Funktion SRA ähneln, aber seine Suchoberfläche ist benutzerfreundlicher und es ist freundlicher zum Herunterladen von Fastq-Dateien und zum Überprüfen der Integrität heruntergeladener Daten. Es wird daher dringend empfohlen, es zuerst zu verwenden .
-
Der Vorteil der ENA-Datenbank
[1] Sie können Fastq-Dateien direkt abrufen.
[2] Ein weiterer Vorteil der Verwendung der ENA-Datenbank besteht darin, dass Sie die Integrität der heruntergeladenen Daten bestätigen können. Die lange Downloadzeit, die durch das große Volumen an biografischen Daten verursacht wird (das Netzwerk schwankt, wenn das Netzwerk während des Zeitraums abnormal ist), kann Probleme wie den Mangel an heruntergeladenen Daten verursachen, die im frühen Stadium des Abrufs im Allgemeinen schwer zu finden sind die Daten. Die ENA-Datenbank enthält den MD5-Code zur Überprüfung der Integrität der Daten. -
Verwendung der ENA-Datenbank
Geben Sie zunächst die Ziel-SRA-Suchnummer in die Suchleiste in der oberen rechten Ecke der Datenbankseite ein und warten Sie nach der Bestätigung eine Weile, bis die Ergebnisseite angezeigt wird
Zweitens klicken Sie, um Experiment auszuwählen, um alle Sequenzsequenzdateninformationen des Experiments abzurufen
Wir können die beiden zum Experiment gehörenden Sequenzdateninformationen sehen und die FTP-Adresse zum Herunterladen der Fastq-Datei direkt in der Spalte FASRTQ-Dateien (FTP) abrufen.
Holen Sie sich die FTP-Adresse zum direkten Herunterladen von Fastq-Dateien