Montag, 27. Juni 2016

Evaluation von DNA Extraktionen mittels Lichtabsorption

Einleitung

Wenn wir DNA aus Pflanzen isolieren wollen wir diese für gewöhnlich in weiteren Experimenten einsetzen. Je nachdem was für Experimente bzw. Methoden dies sind, benötigen wir DNA mit entsprechender Konzentration und Reinheit. Wir verwenden dazu ein Photospektrometer (Nanodrop, ND1000, Fisher Scientific) mit dem die Absorptionseigenschaften von DNA und anderen Molekülen dazu verwendet werden um aussagen über die Konzentration an DNA und deren Reinheit getroffen werden können. DNA absorbiert Licht mit einer Wellenlänge von 260 nm und Proteine mit 280 nm. Über den Wert der Absorption bei 260 nm wird die Konzentration der DNA berechnet (siehe Lambert-beersches Gesetz). Der Quotient 260 nm / 280 nm stellt die Konzentrationen an DNA der Konzentration von Proteinen gegenüber und erlaubt eine qualitative Aussage über die Reinheit der DNA. Ein Wert um 1.8 wird dabei als "reine" DNA interpretiert. Ein höherer Wert deutet meist darauf hin, dass im Extrakt auch RNA enthalten ist, welche Uracil statt Thymin als Base enthält und Absorptionseigenschaften eher wie Adenin hat (siehe Tabelle 1).


Tabelle 1: 260:280 ratios estimated for each nucleotide if measured independently

Guanine1.15
Adenine4.50
Cytosine1.51
Uracil4.00
Thymine1.47
Ein weiterer Faktor der für Abweichungen des 260 / 280 Quotienten sorgen kann, ist der pH-Wert. Da wir i.d.R. mit TE-Puffer arbeiten, sollte dieser aber keine Rolle spielen. Ein Wert unter 1.8 deutet auf Kontaminationen mit Proteinen, Phenolen oder anderen Substanzen hin. Diese können in folgenden Experimenten für Probleme sorgen. Der Quotient 260 nm / 230 nm wird als sekundärer Qualitätsmarker verwendet und sollte bei "reiner" DNA zwischen 1.8 und 2.2 liegen. Wenn dieser geringer ist, deutet das ebenfalls auf Kontaminationen hin, die ebenfalls problematische Auswirkungen auf z.B. eine PCR haben können. Zuletzt will ich explizit darauf hinweisen, dass diese Werte nur Anhaltspunkte sind, welche man dazu verwenden kann um abzuschätzen ob die isolierte DNA für eine Methode brauchbar ist oder nicht. Definitive Sicherheit erhält man nur, durch ausprobieren. Z.B. habe ich in meiner Zeit immer wieder DNA Isolationen gehabt, die laut Nanodrop KEINE DNA enthalten und dennoch eine PCR damit erfolgreich durchgeführt werden konnte. Bei sehr geringen DNA Konzentrationen sind die aufgeführten Quotienten meist unbrauchbar. Über Lichtabsorption lässt sich außerdem keine Aussage über die Integrität der DNA treffen. Die Frage, ob komplette genomische DNA oder hauptsächlich zerstückelte DNA vorliegt muss man über eine Gelelektrophorese ermitteln.

Weiterführende Infos:


In Protokollen zum Praktikum finde ich immer wieder Tabellen mit den Werten, die der Nanodrop ausgibt. Im Falle von guten Ergebnissen, ist das meist nicht notwendig, und es genügt, wenn man mit Worten darauf hinweist, dass die Qualität gut ist. Man bezieht sich dann auf die entsprechenden Quotienten und die Konzentrationen. Es gibt aber auch Fälle, da lohnt es sich, die Daten etwas aufzubereiten und so zu präsentieren, dass man den oder die Aspekte direkt sehen kann, auf die man hinweisen will.

Rohdaten

In den Rohdaten kann man im Prinzip alle Fakten ermitteln. Sobald es aber viele Proben werden, ist es meist schwierig ein Muster (z.B. Gruppen von "guten" und "schlechten" Extrakten) zu erkennen.

In einem vollständigen Nanodrop Bericht sind folgende Informationen in Spalten einer Tabelle enthalten:

  • Sample ID
  • User ID
  • Date Time
  • ng/ul
  • A260
  • A280
  • 260/280
  • 260/230
  • Constant
  • Cursor Pos.
  • Cursor abs.
  • 340 raw
  • Measurement Type
  • Serial #
  • Config.
  • Absorption bei 220,  221, 222, ..., 350 nm
Relevant sind dabei vor allem die Sample ID, die Konzentration (ng / µl) und die Quotienten (260/280 und 260/230). Mit den Absorptionen der Wellenlänge 220 - 350 lassen sich die Spektren, welche man auch am Nanodrop sehen kann, mit Excel reproduzieren.


Tabelle 2: Beispiel-Tabelle mit relevanten Nandrop Ergebnissen aus dem letzten Praktikum. ID entspricht dabei der Sample ID und die zusätzliche Spalte Taxon ordnet entsprechende Artnamen den IDs zu.

Diagramme

Mit einem Diagramm lassen sich Daten und deren innewohnende Tendenzen bzw. Muster darstellen.

Abbildung 1: Darstellung der DNA Konzentrationen (blaue Balken, ng / µl, linke y-Achse) sowie Qualitätsquotienten 260 / 280 (rote Linie) und 260 / 230 (grüne Linie) von DNA Isolationen aus Pelargonium Akzessionen.
Davon ausgehend, dass wir bei reiner DNA 260 / 280 Werte um 1.8 erwarten kann man hier auf Anhieb sehen, dass es starke Schwankungen gibt. Diese gehen aber in den meisten Fällen nach oben und nicht nach unten, was dann für Kontaminationen sprechen würde.

Dass es sich hierbei um eine DNA Isolation handelt, bei der es Probleme gab, lässt sich am besten im Vergleich zu einer anderen zeigen.

Abbildung 2: Vergleich zweier DNA Isolationen. A: wie Abbildung 1 (Pelargonium), B: wie Abbildung 1 (Tagetes).
In Abbildung 2 erkennt man im Vergleich besonders stark die Schwankungen sowie die niedrigen DNA Konzentrationen. In beiden Versuchen wurde die gleiche Masse Ausgangsmaterial verwendet. Was genau die Ursache für die stark schwankenden DNA Konzentrationen und Qualitäten der Pelargonium DNA Isolationen ist, kann man sicherlich nicht, anhand der Daten erkennen. Hier kann man nur spekulieren. Dafür kann man sich z.B. die Beschaffenheit des verwendeten Ausgangsmaterial genauer anschauen. Bei Pelargonium wurden z.B. mehr verschiedene Arten beprobt und auch das alter der entsprechenden Pflanzen ist deutlich heterogener als bei den Tagetes.
Im folgenden weitere Darstellungen die sich mit den Nanodrop Daten anfertigen lassen:

Abbildung 3: Histogramme der 260 / 280 Werte von Pelargonium (A) und Tagetes (B) DNA Isolationen.
In einem Histogramm sieht man die Häufigkeit von bestimmten Werten, bzw. Werten innerhalb eines Intervals. In Abbildung 3 wird wieder deutlich, dass die Werte bei der Pelargonium DNA Isolation deutlich stärker streuen. Es wird aber auch deutlich, dass auch bei den Tagetes einige Werte deutlich über 1.8 liegen. Histogramme lassen sich in Excel erzeugen, wenn man das entsprechende Add-In aktiviert.

Grüße
Thomas










Dienstag, 10. Mai 2016

Optimierung von phylogenetischen Bäumen

Siehe auch...
...Einen Neighbor-Joining Baum erstellen...
...Phylogentische Analysen - Grundlagen von Bäumen...

Nachdem man einen phylogenetischen Baum mit z.B. MEGA berechnet hat, stellt sich die Frage, was man mit dem Baum zeigen will. Phylogenetische Bäume lassen sich in der Regel unterschiedlich darstellen. Zum einen gibt es grundsätzliche Darstellungen (MEGA unterscheidet hier zwischen klassisch, radiär und kreisförmig) und zum anderen ist vielleicht nicht jede Information im Baum relevant für die aktuelle Fragestellung.

Abb. 1: NJ-Phylogeny von Bambus, basierend auf rbcL Sequenzen. Klassisches Phylogram. Rohfassung.
In Abbildung 1 sehen wir die direkte Ausgabe (Rohfassung) eines phylogenetischen Baumes (NJ) der mit 1000 Bootstrap Replikaten getestet wurde. An den Knotenpunkten stehen Prozent Angaben. Diese geben wieder, wie oft die nachfolgenden Einheiten bei den Baum-Replikaten in dieser Zusammensetzung vor kamen. Je höher die Zahl, desto sicherer ist es, dass diese Aufteilung von Bedeutung ist. Im dargestellten Phylogram wird Wert auf die Darstellung der genetischen Distanz (in Form von Veränderungen innerhalb des untersuchten Sequenz-Bereichs) gelegt. Deswegen findet man in der Abbildung auch einen Maßstab. Die Länge von Knotenpunkt zu Knotenpunkt bzw. zum Ende eines Zweiges ist relativ zur genetischen Distanz. Im angeführten Beispiel entspricht die Länge des Maßstabes 0.2 % genetischer Distanz. Bei einer Sequenz Länge von 500 Nucleotiden wäre das 1 Nucleotid, dass im Vergleich anders ist.
Will man mit seinem Baum besonders auf die genetische Distanz hinweisen, würde es sich anbieten, diese für die Zweige anzuzeigen und die Bootstrap Werte auszublenden. Das lässt sich bewerkstelligen indem man über das View-Menü die Optionen auswählt und im Branch-Tab die Anzeige der Statistik/Frequenz abwählt und statt dessen die Zweig-Längen anzeigen lässt.

Abb. 2: Branch Tab, Tree Options Menü von MEGA
Zur Veranschaulichung der 3 Hauptgruppen innerhalb der Bambus Gewächse habe ich diverse Gruppierungen zusammengeklappt.

Abb. 3: Modifizierter Baum aus Abb. 1 mit Schwerpunkt auf die Distanzen zwischen den Bambus Hauptgruppen Arundinarieae, Bambuseae und Olyreae.
Will man mehr auf die Gruppierungen eingehen, empfiehlt es sich den Baum als Cladogram darzustellen und Verzweigungen nur dann zu berücksichtigen, wenn die zugrunde liegenden Daten diese mit einer gewissen Sicherheit unterstützen. In MEGA lässt sich das erreichen indem man einen kondensierten Baum erstellt (Compute - Condensed Tree):

Abb. 4: Modifizierter (kondensierter) Baum aus Abb. 1 mit Schwerpunkt auf Gruppierungen (hier innerhalb der Arundinarieae) die mit mehr als 50% der Bootstrap Replikate unterstützt werden. 
Zuletzt will ich noch auf die Subtree Drawing Options hinweisen, mit denen man auf übergeordnete Gruppierungen hinweisen kann (Abb. 4, Arundinarieae).


Zusammen mit den Tree Options lässt sich so auf besondere Dinge hinweisen, die in der Rohfassung des Baumes nicht direkt ersichtlich sind.

Abb. 5: Modifizierter (kondensierter) Baum aus Abb. 1 mit Schwerpunkt auf Arundinarieae und Bambuseae einschließlich einer Blatt Charakteristik (40 X stereomikroskopische Aufnahme, getrocknertes Blatt, Unterseite).
Mehr Informationen, wie z.B. alternative Software für die Darstellung von phylogenetischen Bäumen findet man hier.

Grüße
Thomas