Posts mit dem Label Warum? werden angezeigt. Alle Posts anzeigen
Posts mit dem Label Warum? werden angezeigt. Alle Posts anzeigen

Montag, 3. August 2015

Warum man ein Experiment wie etwas Unbekanntes behandeln sollte...

...oder über Reproduktion und Qualität von Experimenten...

Am heutigen Tage kam die Frage auf, warum es nicht ausreicht das Ergebnis einer Gelelektrophorese in einem Bild "mit zufälligen Parametern" festzuhalten.

Das Experiment

Es wurden Schimmel Proben genommen und damit eine PCR (ITS) durchgeführt. Eine der Fragen die wir beantworten wollten war, ob wir ITS ohne DNA zu isolieren amplifizieren können.

Es ist vollkommen richtig, dass wir diese Frage mit einem Gelbild beantworten können, auf dem wir "ITS Banden" sehen. Dabei spielt es keine Rolle mit welchem Zoom oder welcher Belichtung das Foto aufgenommen wurde, solange wir eine Amplifikation erkennen und gleichzeitig die negativ Kontrolle bestätigt, dass die Amplifikation auf der Anwesenheit von DNA basiert, die nicht schon im Mastermix vorhanden war.

Soweit so gut. Kann man noch mehr mit dem Ergebnis anfangen ?

Reproduzierbarkeit

Jedes Experiment bzw. das Ergebnis eines solchen sollte als etwas Unbekanntes behandelt werden. Es kann durchaus sein, dass wir uns zum Zeitpunkt des Experiments nicht über alle Fragen im klaren sind, die wir mit diesem Experiment beantworten wollen bzw. können. Für eine solche Situation, wie auch für diejenige, in der wir tatsächlich nur eine Frage stellen und beantworten können, ist es gute Praxis, wenn man dieses Experiment so durchführt, dass man es reproduzieren kann. Um das zu können benötigt die entsprechende Person alle Parameter des Experiments welche für das Ergebnis verantwortlich sind. Die Dokumentation der Ergebnisse ist dabei ein Punkt wo es eigentlich keine Variation geben sollte. Leider ist es aber so, dass dieser Punkt regelmäßig vernachlässigt wird, und dadurch Ergebnisse nur sehr schwer miteinander vergleichbar sind, bzw. eine Reproduktion nicht möglich ist.

Datenqualität

Neben der Reproduzierbarkeit geht es darum, Ergebnisse mit der höchst möglichen Qualität zu erfassen. Bei Fotos spielt dabei die Auflösung eine wesentliche Rolle. Im Bezug zu den Gel Bildern sollte man versuchen den Platz effizient zu nutzen. Bei doppelten Gelen macht es Sinn, zwei Aufnahmen zu machen. Eins vom oberen und eins vom unteren Teil. Das Ergebnis sind zwei Fotos mit hoher Auflösung statt eins mit reduzierter. Der zusätzliche Aufwand beschränkt sich dabei auf das Verschieben des Blaulichtschirms.

Mehr als nur eine Frage

Im beschriebenen Experiment ging es neben der Frage ob eine Amplifikation möglich ist, auch darum zu sehen, welche Fragment Größen zu beobachten sind, wie stark die Amplifikation jeweils war und ob eventuell mehr als eine Bande pro Probe zu beobachten ist. Solche Fragen lassen sich generell besser beantworten wenn man Daten in hoher Qualität hat.

Fazit

Bald möglichst eine konsistente Dokumentation von Experimenten zu etablieren, ist ein immer wiederkehrender guter Rat. Die Zeit die jeder von uns, ob Student oder Betreuer, investiert, ist am wertvollsten wenn wir etwas damit erreichen. Eine konsistente Dokumentation stellt sicher, dass die Daten ohne große Umstände mit anderen verglichen werden können und somit viel eher dazu beitragen Fortschritt in einem Projekt zu erzeugen.

Zum Schluss noch ein paar...

Beispiele

Zwei 17-Taschen Gele übereinander. Die Höhe ist fast vollständig ausgenutzt.
Ein 17-Taschen Gel. Weder die Höhe noch die Breite sind ausgenutzt. Der Parameter "Lage des Gels" wäre hier: unten abschließend, etwas mehr links als rechts. Schwer zu reproduzieren.

Ein 17-Taschen Gel. Im Gegensatz zum Bild mit zwei Gelen wird bei der Aufnahme eines Gels die volle Breite des Kamera Sensors ausgenutzt. Insgesamt sind die Banden deutlicher zu sehen. Das Ergebnis wird in maximaler Auflösung erfasst und kann mit dem festen Parameter (Ladeschema, 17-Taschen Gel, schließt links und rechts ab) 1:1 reproduziert und verglichen werden.

23-Taschen Gel, Belichtungszeit 1.52 Sekunden

23-Taschen Gel, Belichtungszeit 1 Sekunde






Angenommen bei den beiden Bilder handelt es sich zum einen um das original Experiment und zum anderen um eine Wiederholung. Können wir anhand der beiden Fotos mit Sicherheit sagen, dass das Experiment erfolgreich wiederholt wurde ?
Angenommen bei den beiden Bildern handelt es sich zum einen um das 1. Experiment und zum anderen um ein modifiziertes Experiment. Können wir anhand der beiden Fotos mit Sicherheit sagen, dass die Modifikation einen bestimmten Effekt hatte ?

In beiden Situationen ist es schwer bis unmöglich eine klare Aussage zu den Fragen zu treffen. Wenn wir ein Experiment wiederholen, dann sollten ALLE Parameter gleich sein. Auch die der Daten Dokumentation. Vor allem wenn wir mit PCR Konditionen experimentieren, sollte neben dem Parameter den wir gezielt testen, kein anderer für Variation des Ergebnis sorgen. Daraus folgt, dass wir in diesen Situationen bei der Dokumentation die Belichtungszeit entsprechend unverändert verwenden.

Es gibt noch viele andere Faktoren, die selbst nichts mit der Dokumentation zu tun haben, aber ebenso zu unerwünschten Variationen in einem Experiment führen. Je früher wir lernen, welche Faktoren das sind, um so früher können wir verhindern, dass diese die Ergebnisse unserer Experimente beeinflussen. Erst anschließend können wir die eigentlichen Fragen beantworten.

Grüße
Thomas

Freitag, 29. Mai 2015

Was sind eigentlich Marker ?

Definition

Ein Marker im Sinne von DNA-Marker bezieht sich auf ein der DNA innewohnendes Phänomen, von dem aus man auf bestimmte Eigenschaft der Zelle, des Gewebes oder des gesamten Organismus schließen kann. Bei den Phänomenen handelt es sich um einfache Sequenz Unterschiede bis hin zu bestimmten Sequenz Motiven (z.B. Restriktionsschnittstellen, Protein kodierende Gene, Transposons, usw.). Zu den Eigenschaften auf die man schließen kann gehören z.B. genetische Krankheiten, Verwandtschaftsbeziehungen und Identitäten (taxonomische Zugehörigkeit).

Namen von DNA-Marker

DNA Marker sind z.B. der Restriction Fragment Length Polymorphism (RFLP), Amplified Fragement Length Polymorphism (AFLP), Random Amplified Polymorphic DNA (RAPD), Single Nucleotide Polymorphism (SNP), Short Sequence Repeats (SSR), Inter Simple Sequence Repeats (ISSR), Amplified Refractory Mutation System (ARMS), Ribulose-1,5-bisphosphate carboxylase oxygenase Large Subunit (rbcL), maturase K (matK), Internal Transcribed Spacer (ITS). usw.

Anonyme DNA Marker und DNA Sequenz-Marker

Die genannten Marker lassen sich grob in zwei Gruppen einteilen. In der einen befinden sich jene, die Phänomene innerhalb des gesamten Genoms unter die Lupe nehmen, und in der anderen jene, die sich auf bestimmte einzelne Bereiche beschränken. Erstere nennt man auch Anonyme DNA Marker, da weder die Position im Genom noch die DNA Sequenz der entsprechenden DNA Fragmente bekannt ist. Die zweite Gruppe beinhaltet entweder bestimmte Protein kodierende Bereiche wie z.B. rbcL und matK oder bestimmte genetische Spacer wie z.B. psbA-trnH und ITS.

Empfohlene Literatur

Arif, I. a., Bakir, M. a., Khan, H. a., Al Farhan, A. H., Al Homaidan, A. a., Bahkali, A. H., … Shobrak, M. (2010). A brief review of molecular techniques to assess plant diversity. International Journal of Molecular Sciences, 11, 2079–2096. doi:10.3390/ijms11052079

Agarwal, M., Shrivastava, N., & Padh, H. (2008). Advances in molecular marker techniques and their applications in plant sciences. Plant Cell Reports, 27, 617–631. doi:10.1007/s00299-008-0507-z

Warum verwenden wir gerade DEN Marker ?

Nachdem wir uns mit der allgemeinen Frage "Was ist eigentlich ein Marker?" auseinander gesetzt haben, wollen wir nun auf die Frage eingehen, warum man gerade den/die Marker verwendet und nicht andere. In anderen Worten, wir wollen wissen warum ein Marker besser dafür geeignet ist, Arten zu unterscheiden oder die Beziehungen bestimmter taxonomischer Einheiten zu untersuchen als ein anderer.

Marker in der DNA Diagnostik und phylogenetischen Untersuchungen

Für die Identifizierung taxonomischer Einheiten werden entweder bekannte Sequenz-Marker verwendet oder es werden über DNA Fingerprint Techniken neue (anonyme) DNA Bereiche als Marker herangezogen. Wir verwenden dafür bevorzugt bekannte Sequenz-Marker, da diese zum einen gut charakterisiert sind und zum anderen bereits Daten zur Verfügung stehen. Mit Hilfe dieser Informationen kann man sich im Vorfeld ein Bild darüber machen, ob der Bereich zur Unterscheidung der entsprechenden Art bzw. zum Vergleich entsprechender taxonomischer Einheiten geeignet ist oder eher nicht.

Was genau erwarten wir von unserem Marker ?

Wenn wir einen DNA Bereich verschiedener Pflanzen Arten amplifizieren wollen benötigen wir - für entsprechende Primer - Bereiche, die in all diesen Arten konserviert sind. Für die Unterscheidung der Arten benötigen wir einen Bereich, der dafür ausreichend Variation enthält.

Eine Aufstellung von DNA Bereichen (Zellkern, Chloroplast, Mitochondrium), die in verschiedenen Arbeiten für die Unterscheidung bzw. Identifizierung unterschiedlicher taxonomischer Gruppen (Population, Unterart, Art, Gattung, Familie, Ordnung) verwendet wurden. Aus Yip et al. 2007
Neben diesen grundsätzlichen Eigenschaften gibt es weitere, die im Zuge eines Projektes relevant werden können. Ein Beispiel bezieht sich auf den Schritt der Sequenzierung. Nicht jeder Bereiche lässt sich in allen taxonomischen Gruppen erfolgreich sequenzieren. Der Chloroplast Marker psbA-trnH lässt sich mit universellen Primern unter anderem in Dracocephalum problemlos amplifizieren und sequenzieren. In Dianthus dagegen lässt sich dieser Bereich zwar amplifizieren, aber bei der Sequenzierung stößt man auf das Problem von Mononucleotid Wiederholungen (poly-T).


Ein weiteres Beispiel betrifft den Bereich der ribosomalen DNA (rDNA) welcher im Kerngenom liegt und zwar in vielen Kopien an unterschiedlichen Stellen. In manchem Fällen, wie zum Beispiel bei einigen Rheum Arten [Xie et al. 2014], wurde festgestellt, dass diese Kopien sich voneinander unterscheiden, was dazu führt das man verschiedene Fragmente in einer PCR amplifiziert und eine einfache Sequenzierung der PCR nicht möglich ist.

Solche Regionen lassen sich in den entsprechenden taxonomischen Gruppen nur über Umwege und damit verbundenen Mehrkosten sequenzieren. Je nachdem um was es in einem Projekt geht, können solche "Probleme" aber auch eine zusätzliche Quelle für Informationen darstellen und ein Mehraufwand könnte sich lohnen.

Zusammenfassung

Bei der Marker Wahl haben wir zum einen grundsätzliche Faktoren zu beachten, die abhängig davon sind, welche Art von Beziehungen wir untersuchen wollen. Zum anderen müssen wir Faktoren beachten, die auf Erfahrung (vorhandene Messergebnisse - Untersuchungen) beruhen. Dies macht eine ausgiebige Literatur und Datenbank Recherche zu einer wichtigen Grundvoraussetzung für unsere Projekte.

Referenzen

Yip, P. Y., Chau, C. F., Mak, C. Y., & Kwan, H. S. (2007). DNA methods for identification of Chinese medicinal materials. Chinese Medicine, 2, 9. doi:10.1186/1749-8546-2-9

Ma, X., Xie, C., Guan, M., Xu, X., Miki, E., Takeda, O., … Chen, S. (2014). High Levels of Genetic Diversity within One Population of Rheum tanguticum on the Qinghai-Tibet Plateau have Implications for Germplasm Conservation. Pharmaceutical Crops, (5), 1–8.

Mittwoch, 22. April 2015

Warum erstellen wir phylogenetische Bäume ... und so weiter ?

Im Praktikum geht es bei allen Projekten um...
  1. Verwandtschaftliche Beziehungen der verwendeten Pflanzen
  2. Unterscheidung der Pflanzen mittels morphologischer und molekularer Marker
  3. Unterscheidung verschiedener Produkt Bestandteile
Neben der Morphologie, welche bei Produkten in vielen Fällen nicht für eine Unterscheidung geeignet ist, versuchen wir DNA Marker - bestimmte DNA Bereiche, die es bei allen beteiligten Arten gibt - dafür zu verwenden.

Wir verwenden bioinformatische Hilfsmittel aus zwei Gründen:

DNA Sequenzen im FASTA Format in einem Text Editor
Zum einen lassen sich Sequenzen - und Informationen über diese - in einer informativeren Form darstellen (z.B. farbliche Unterscheidung der Nucleotide).

Jalview und angeglichene DNA Sequenzen

Sliding-Window Ansicht des GC Gehalts von DNA


Zum anderen können Arbeitsschritte, die, wenn man diese manuell durchführen müsste, eine Unmenge an Zeit beanspruchen würden, automatisiert und somit effizienter ausgeführt werden (z.B. die Berechnung einer Distanz Matrix).

Distanz Matrix basierend auf matK Sequenzen von Ocimum
Ein weiterer Aspekt, der insbesondere mit den oben angesprochenen Themen innerhalb der Projekte zutun hat, ist die Visualisierung der Beziehungen der Sequenzen / Pflanzengruppen zueinander. Mit einem phylogenetischen Baum kann man darstellen, welche der Sequenzen näher miteinander verwandt sind (sich ähnlicher sind). Diese bilden sogenannte Cluster welche durch Knotenpunkte mit anderen Clustern verbunden sind.
Neighbor-Joining Bäume von Dracocephalum Sequenzen der Marker ITS2 und psbA-trnH

Eine andere Darstellungsform wäre zum Beispiel eine Principal Component Analyse (PCA), in der die Ähnlichkeiten in eine bestimmte Anzahl (n) an Faktoren zerlegt werden und in einem entsprechenden n-dimensionalen Raum dargestellt werden können.
Eine PCA bzw. MDS einer Ditanz Matrix, basierend auf psbA-trnH Sequenzen von Dracocephalum und anderen Lamiaceae.
Zusammenfassend kann man sagen, dass es bei der Verwendung von bioinformatischen Hilfsmitteln grundsätzlich darum geht, Daten auszuwerten und dabei die Interpretation zu erleichtern.

Ich hoffe das hilft etwas weiter :-)

Grüße
Thomas