F2 Plant Evolution: Internal transcribed spacer

Nachdem wir uns mit der allgemeinen Frage "Was ist eigentlich ein Marker?" auseinander gesetzt haben, wollen wir nun auf die Frage eingehen, warum man gerade den/die Marker verwendet und nicht andere. In anderen Worten, wir wollen wissen warum ein Marker besser dafür geeignet ist, Arten zu unterscheiden oder die Beziehungen bestimmter taxonomischer Einheiten zu untersuchen als ein anderer.

Marker in der DNA Diagnostik und phylogenetischen Untersuchungen

Für die Identifizierung taxonomischer Einheiten werden entweder bekannte Sequenz-Marker verwendet oder es werden über DNA Fingerprint Techniken neue (anonyme) DNA Bereiche als Marker herangezogen. Wir verwenden dafür bevorzugt bekannte Sequenz-Marker, da diese zum einen gut charakterisiert sind und zum anderen bereits Daten zur Verfügung stehen. Mit Hilfe dieser Informationen kann man sich im Vorfeld ein Bild darüber machen, ob der Bereich zur Unterscheidung der entsprechenden Art bzw. zum Vergleich entsprechender taxonomischer Einheiten geeignet ist oder eher nicht.

Was genau erwarten wir von unserem Marker ?

Wenn wir einen DNA Bereich verschiedener Pflanzen Arten amplifizieren wollen benötigen wir - für entsprechende Primer - Bereiche, die in all diesen Arten konserviert sind. Für die Unterscheidung der Arten benötigen wir einen Bereich, der dafür ausreichend Variation enthält.

Eine Aufstellung von DNA Bereichen (Zellkern, Chloroplast, Mitochondrium), die in verschiedenen Arbeiten für die Unterscheidung bzw. Identifizierung unterschiedlicher taxonomischer Gruppen (Population, Unterart, Art, Gattung, Familie, Ordnung) verwendet wurden. Aus Yip et al. 2007

Neben diesen grundsätzlichen Eigenschaften gibt es weitere, die im Zuge eines Projektes relevant werden können. Ein Beispiel bezieht sich auf den Schritt der Sequenzierung. Nicht jeder Bereiche lässt sich in allen taxonomischen Gruppen erfolgreich sequenzieren. Der Chloroplast Marker psbA-trnH lässt sich mit universellen Primern unter anderem in Dracocephalum problemlos amplifizieren und sequenzieren. In Dianthus dagegen lässt sich dieser Bereich zwar amplifizieren, aber bei der Sequenzierung stößt man auf das Problem von Mononucleotid Wiederholungen (poly-T).

Ein weiteres Beispiel betrifft den Bereich der ribosomalen DNA (rDNA) welcher im Kerngenom liegt und zwar in vielen Kopien an unterschiedlichen Stellen. In manchem Fällen, wie zum Beispiel bei einigen Rheum Arten [Xie et al. 2014], wurde festgestellt, dass diese Kopien sich voneinander unterscheiden, was dazu führt das man verschiedene Fragmente in einer PCR amplifiziert und eine einfache Sequenzierung der PCR nicht möglich ist.

Solche Regionen lassen sich in den entsprechenden taxonomischen Gruppen nur über Umwege und damit verbundenen Mehrkosten sequenzieren. Je nachdem um was es in einem Projekt geht, können solche "Probleme" aber auch eine zusätzliche Quelle für Informationen darstellen und ein Mehraufwand könnte sich lohnen.

Zusammenfassung

Bei der Marker Wahl haben wir zum einen grundsätzliche Faktoren zu beachten, die abhängig davon sind, welche Art von Beziehungen wir untersuchen wollen. Zum anderen müssen wir Faktoren beachten, die auf Erfahrung (vorhandene Messergebnisse - Untersuchungen) beruhen. Dies macht eine ausgiebige Literatur und Datenbank Recherche zu einer wichtigen Grundvoraussetzung für unsere Projekte.

Referenzen

Yip, P. Y., Chau, C. F., Mak, C. Y., & Kwan, H. S. (2007). DNA methods for identification of Chinese medicinal materials. Chinese Medicine, 2, 9. doi:10.1186/1749-8546-2-9

Ma, X., Xie, C., Guan, M., Xu, X., Miki, E., Takeda, O., … Chen, S. (2014). High Levels of Genetic Diversity within One Population of Rheum tanguticum on the Qinghai-Tibet Plateau have Implications for Germplasm Conservation. Pharmaceutical Crops, (5), 1–8.

Rheum ITS ARMS design

Im Folgenden will ich beschreiben, wie ich für Rheum Arten, für die Wan et al. 2014 mehrere ITS Versionen nachgewiesen haben, ARMS Primer entwerfe, um diese ITS Versionen mittels diagnostischer PCR nachzuweisen.

Sequenz Daten

Wie üblich lade ich die Sequenzen von Rheum über NCBI Nucleotides im Genbank Format herunter, verwende ein Skript um die taxonomischen Namen zu überprüfen und die Sequenz Titel zu kürzen.

Rheum ITS.gb.fasta

Die resultierende Fasta Datei öffne ich mit JalView, entferne alle redundanten Sequenzen und benutze das Webservice Menü, um die Sequenzen mit Muscle zu alignen.

Über die Annotation einer der Sequenzen (z.B. KF514641) besorge ich mir die 5.8S Sequenz um das Alignment in ITS1, 5.8S und ITS2 zu teilen. Da für ITS1 und ITS2 unterschiedlich viele Sequenz-Informationen vorliegen erscheint mir eine getrennte Betrachtung am sinnvollsten.

In JalView suche ich nach der 5.8S Sequenz (Select - Find oder Strg-F).

Die Sequenz darf nach dem Einfügen keine "Line Breaks" oder Leerzeichen enthalten. Dazu am besten das Such-Fenster vergrößern und an den auftauchenden Zeilenenden "entfernen" drücken, damit die Sequenz kontinuierlich wird. Bsp.:

Vorher:

AATTATGGTGTAGCCATAT

TATGATTTCCAATTATAC

ATTTAAGGCGCGAGCAA

Nachher:

AATTATGGTGTAGCCATATTATGATTTCCAATTATACATTTAAGGCGCGAGCAA

Anschließend markiere ich die Spalte links neben dem ersten Nucleotid der gefundenen Sequenz. Über das Edit Menü entferne ich alles was rechts von der markierten Spalte steht (remove right).

Da nun manche Sequenzen keine Informationen (des ITS 1 Bereichs) enthalten entferne ich diese aus dem Alignment.

Eine der Sequenzen (AY207370) fällt hier aus dem Rahmen, da durch diese eine große Lücke in das Alignment gerissen wird (roter Kasten in der Abbildung). Wenn man diese Sequenz mit BLAST untersucht, stellt man fest, dass es sich hierbei höchstwahrscheinlich um eine ITS Sequenz eines Pilzes handelt, da die Treffer mit der höchsten Identität von Pilzsequenzen und nicht von anderen Rheum Arten stammen.

Nachdem diese Sequenz aus dem Alignment entfernt wurde führe ich über den Webservice nochmals eine Angleichung durch.

Zuletzt entferne ich auf der linken Seite alle Spalten in denen Information fehlt. In der Regel schneide ich Alignments anhand der Primer Sequenzen zu. In diesem Fall ist das schwer, da die gängigen Primer (ITS5, ITS1) nicht zu finden sind.

Bevor ich das Ergebnis speichere entferne ich nochmals redundante Daten und erstelle anschließend - als Übersicht - eine auf einer Ähnlichkeitsmatrix basierende PCA (Calculate - Principal Component Analysis).

Das selbe mache ich für ITS2.

Nun stehen uns die Datensätze zur näheren Betrachtung und der Suche nach diagnostischen Positionen zur Verfügung.

Rheum ITS1.gb.fasta

Rheum ITS2.gb.fasta

Ziel-Arten

Für folgende Arten, von denen uns Referenzpflanzen zur Verfügung stehen, wurden 2 stark abweichende ITS Versionen nachgewiesen (in Klammer die Genbank Accession IDs):

Rheum rhabarbarum (KF258684,KF258685)

Rheum officinale (KF258695,KF258696)

Rheum tanguticum (KF258698 KF258699)

Rheum punilum (KF258702,KF258703)

Um diese mit einer PCR zu diagnostizieren wolle wir nun entsprechende ARMS Primer entwerfen.

F2 Plant Evolution

Seiten

Freitag, 29. Mai 2015

Warum verwenden wir gerade DEN Marker ?