Sonntag, 9. August 2015

Tools der Morphometrie - Morpheus et al.

Morpheus et al.

 "Morpheus et al. is a cross-platform, general purpose software package for morphometric analysis."
  • Slice, Dennis E., 2013. Morpheus et al., Java Edition. Department of Scientific Computing, The Florida State University, Tallahassee, Florida, U.S.A. Available from http:/morphlab.sc.fsu.edu/
  • Download

Tools der Morphometrie - MorphoJ

MorphoJ


Eine umfangreiche auf Java basierte Sammlung von Werkzeugen für die Auswertung von Morphometrischen Daten.

Features
  • Variation
    • Principal Component Analysis (PCA)
      "PCA is a useful tool to display variation within a sample and to characterize the main features of shape variation. If the data contain different subgroups, PCA can be used as an ordination method, but users should be aware that PCA is not optimized to find differences among groups (for that purpose, consider canonical variate analysis)."
    • Matrix Correlation
    • Contrast Covariance Matrices
    • Procrustes ANOVA
  • Covariation
  • Comparison
    • Canonical Variate Analysis
    • Discriminant function analysis
    • Phylogenetic comparisons
    • Vector comparisons between analyses
Referenz und Programm Download

Tools der Morphometrie - Lamina

Lamina

Bylesjö, M. et al., 2008. LAMINA: a tool for rapid quantification of leaf size and shape parameters. BMC Plant Biology, 8(1), p.82.
Available at: http://www.biomedcentral.com/1471-2229/8/82 .
  • Programm basiert auf JAVA und benötigt das Java Advanced Imaging (JAI) package. Dieses ist laut Angaben der Programmierer im Download enthalten und muss nicht separat installiert werden.
  • Download der Software  (Java) über SourceForge.


Lamina hat manchmal die Eigenart, nicht mehr weiter zu arbeiten.

Winows 7

Eine Möglichkeit, die bei mir zu einer deutlichen Verbesserung geführt hat, ist folgendes:
Die installierten Verknüpfungen (z.B. C:\ProgramData\Oracle\Java\javapath\javaw.exe -Xms100m -Xmx400m -Xss48m -jar "C:\Program Files (x86)\Lamina\Lamina.jar"), die man zum Ausführen von Lamina aufruft, sind so eingestellt, dass dem Programm 100 - 400 MB Speicher zur Verfügung stehen.

Über den entsprechenden Startmenü-Eintrag gelangt man zu den Eigenschaften der Verknüpfung und kann die Lamina zur Verfügung stehende Speicher Menge erhöhen.


Windows 7, Start Menü, Eigenschaften der Lamina Verknüpfung aufrufen

Eigenschaften der Lamina Verknüpfung ändern...
ACHTUNG: Das Feld enthält mehr Informationen als man auf den ersten Blick sieht. Feld anklicken und mit linker Pfeiltaste den Cursor bewegen.
-Xmx400m verändern zu -Xmx1G
Übernehmen bzw. OK anklicken und ab sofort sollte Lamina besser arbeiten.

Windows 8

Bei Windows 8 gelangt man über die Suche des Start Screens zu den Lamina Verknüpfungen. Über die rechten Maustaste lässt dich der Speicherort öffnen. Dort angekommen kann man wie bei Windows 7 über Eigenschaften die Verknüpfung verändern.

Windows 8, Start Screen Suche nach Lamina
Windows 8, Lamina Speicherort geöffnet, Eigenschaften der Lamina Verknüpfung aufrufen

Unter Windows 8 trat nach der Modifikation allerdings ein weiteres Problem auf. Dieses kann man durch Reduzierung der "Thread Stack Size" (-Xssn) von 48m auf 24m beheben. Dazu die Option -Xss48m auf -Xss24m verändern und bestätigen.

Samstag, 8. August 2015

Morphologie - Morphometrie

Die Evolution hat viele verschiedene morphologische Phänomene hervorgebracht, die wir sehen, messen und vergleichen können. Im folgenden werden Programme vorgestellt, mit denen man entsprechende Daten erzeugen und auswerten kann.

Übersicht

ProgrammFunktionDaten
ShapeErfassung und AuswertungKonturen
LeafAnalyserErfassung und AuswertungKonturen
LaminaErfassungDimensionen, Konturen
MorphoJAuswertungKonturen
Morphomatica?Konturen
Morpheus et al?Konturen
CLICErfassung und AuswertungKonturen

Shape

Iwata, H. & Ukai, Y., 2002. SHAPE: A Computer Program Package for Quantitative Evaluation of Biological Shapes Based on Elliptic Fourier Descriptors. Journal of Heredity, 93(5), pp.384–385.
Available at: http://jhered.oxfordjournals.org/content/93/5/384.short .
  • Es handelt sich hierbei um ein Programm zur Analyse von geschlossenen Konturen.
  • Die im Paper angegebene URL , welche zum Programm Download führen sollte, funktioniert nicht. Über eine Google Suche nach "SHAPE Iwata" gelangt man aber zur derzeitigen Web Seite  auf der man das Programm runter laden kann.

LeafAnalyser

Weight, C., Parnham, D. & Waites, R., 2008. TECHNICAL ADVANCE: LeafAnalyser: a computational method for rapid and large-scale analyses of leaf shape variation. The Plant Journal, 53(3), pp.578–586.
Available at: http://dx.doi.org/10.1111/j.1365-313X.2007.03330.x .
  • Die im Paper angegebene URL , welche zum Programm Download führen sollte, funktioniert nicht. Es hat den Anschein, als wäre die Seite gehackt worden. Man findet das Programm aber bei SourceForge.

Morphomatica

"Morphomatica ist ein benutzerfreundliches Computerprogramm, dass zur morphometrischen Analyse der Konturen von Ostrakodenschalen entworfen wurde. Es wurde im Zeitraum von 2001 – 2007 von J. Linhart, W. Brauneis und W. Neubauer (Universität Salzburg) unter Verwendung der biologischen Grundlagen von Dan. L. Danielopol (Österreichische Akademie der Wissenschaften) entwickelt. Die Version Morphomatica 1.6.1 eignet sich besonders für vergleichende Studien von merkmalsarmen Ostrakodenschalen."

Collection of Landmark for Identification and Characterization (CLIC)


Freitag, 7. August 2015

Daten beschreiben und darstellen mit R und Co

Für die Arbeit mit DNA Sequenz Daten haben wir bereits Programme wie MEGA oder Jalview kennengelernt. Im folgenden sollen nun Programme vorgestellt werden, die etwas weniger speziell sind und mit anderen Daten, wie z.B. den Ausgaben von LAMINA, Smartgrain und ähnlichen Programmen umgehen können.

Tabellenkalkulation

Mit MS Excel oder dem kostenlosen OpenOffice Calc können wir ohne großen Aufwand verschiedene Diagramm Typen erstellen.
Für den etwas anspruchsvolleren Daten Jongleur lohnt es sich aber nach anderen Möglichkeiten Ausschau zu halten.

R - kostenloser Alleskönner für ... Nerds ?

R ist eine Programmiersprache für das statistische Arbeiten. Daten lassen sich in diversen Formaten einlesen, umwandeln, beschreiben, testen und darstellen. Seit 2011 gibt es für R neue Kleider, R Studio ist eine grafische Nutzeroberfläche für R.
Wer mit R (Studio) arbeiten will installiert sich R und anschließend R Studio.

How-to und Tutorials

Origin Professional

Als Student und Mitarbeiter des KIT hat man die Möglichkeit die Datenanalyse- und Grafiksoftware Origin Professional kostenlos zu nutzen. Die Professional Version beinhaltet dabei ebenfalls Multivariate Methoden wie z.B. die Principal Component Analyse.

Nach dem kostenlosen Kauf, stehen einem 3 Downloads zur Verfügung (2 mal MSI Dateien und eine EXE Datei). Mein Versuch das Programm über eine der MSI Dateien zu installieren, schlug fehl, bzw. führte dazu, dass ich beim Start des Programmes darauf hingewiesen wurde, dass die Lizenzdatei fehlt. Die Installation über die EXE Datei dagegen führte zum Erfolg. Man benötigt zur Installation den Lizensschlüssel, die Adresse und den Port des Lizensservers. Alle drei Angaben erhält man dem kostenlosen Kauf per Email zugeschickt.

Der Umgang mit Daten ist in Origin ähnlich wie in Excel und Calc. Man arbeitet mit Tabellen und der Maus anstatt mit Funktionsaufrufen über die Tatstatur. Diagramme können direkt formatiert werden. Origin bietet auch die Möglichkeit ala R mit Scripten bestimmte Arbeiten zu automatisieren.

How-to und Tutorials
To be extended...

Montag, 3. August 2015

Warum man ein Experiment wie etwas Unbekanntes behandeln sollte...

...oder über Reproduktion und Qualität von Experimenten...

Am heutigen Tage kam die Frage auf, warum es nicht ausreicht das Ergebnis einer Gelelektrophorese in einem Bild "mit zufälligen Parametern" festzuhalten.

Das Experiment

Es wurden Schimmel Proben genommen und damit eine PCR (ITS) durchgeführt. Eine der Fragen die wir beantworten wollten war, ob wir ITS ohne DNA zu isolieren amplifizieren können.

Es ist vollkommen richtig, dass wir diese Frage mit einem Gelbild beantworten können, auf dem wir "ITS Banden" sehen. Dabei spielt es keine Rolle mit welchem Zoom oder welcher Belichtung das Foto aufgenommen wurde, solange wir eine Amplifikation erkennen und gleichzeitig die negativ Kontrolle bestätigt, dass die Amplifikation auf der Anwesenheit von DNA basiert, die nicht schon im Mastermix vorhanden war.

Soweit so gut. Kann man noch mehr mit dem Ergebnis anfangen ?

Reproduzierbarkeit

Jedes Experiment bzw. das Ergebnis eines solchen sollte als etwas Unbekanntes behandelt werden. Es kann durchaus sein, dass wir uns zum Zeitpunkt des Experiments nicht über alle Fragen im klaren sind, die wir mit diesem Experiment beantworten wollen bzw. können. Für eine solche Situation, wie auch für diejenige, in der wir tatsächlich nur eine Frage stellen und beantworten können, ist es gute Praxis, wenn man dieses Experiment so durchführt, dass man es reproduzieren kann. Um das zu können benötigt die entsprechende Person alle Parameter des Experiments welche für das Ergebnis verantwortlich sind. Die Dokumentation der Ergebnisse ist dabei ein Punkt wo es eigentlich keine Variation geben sollte. Leider ist es aber so, dass dieser Punkt regelmäßig vernachlässigt wird, und dadurch Ergebnisse nur sehr schwer miteinander vergleichbar sind, bzw. eine Reproduktion nicht möglich ist.

Datenqualität

Neben der Reproduzierbarkeit geht es darum, Ergebnisse mit der höchst möglichen Qualität zu erfassen. Bei Fotos spielt dabei die Auflösung eine wesentliche Rolle. Im Bezug zu den Gel Bildern sollte man versuchen den Platz effizient zu nutzen. Bei doppelten Gelen macht es Sinn, zwei Aufnahmen zu machen. Eins vom oberen und eins vom unteren Teil. Das Ergebnis sind zwei Fotos mit hoher Auflösung statt eins mit reduzierter. Der zusätzliche Aufwand beschränkt sich dabei auf das Verschieben des Blaulichtschirms.

Mehr als nur eine Frage

Im beschriebenen Experiment ging es neben der Frage ob eine Amplifikation möglich ist, auch darum zu sehen, welche Fragment Größen zu beobachten sind, wie stark die Amplifikation jeweils war und ob eventuell mehr als eine Bande pro Probe zu beobachten ist. Solche Fragen lassen sich generell besser beantworten wenn man Daten in hoher Qualität hat.

Fazit

Bald möglichst eine konsistente Dokumentation von Experimenten zu etablieren, ist ein immer wiederkehrender guter Rat. Die Zeit die jeder von uns, ob Student oder Betreuer, investiert, ist am wertvollsten wenn wir etwas damit erreichen. Eine konsistente Dokumentation stellt sicher, dass die Daten ohne große Umstände mit anderen verglichen werden können und somit viel eher dazu beitragen Fortschritt in einem Projekt zu erzeugen.

Zum Schluss noch ein paar...

Beispiele

Zwei 17-Taschen Gele übereinander. Die Höhe ist fast vollständig ausgenutzt.
Ein 17-Taschen Gel. Weder die Höhe noch die Breite sind ausgenutzt. Der Parameter "Lage des Gels" wäre hier: unten abschließend, etwas mehr links als rechts. Schwer zu reproduzieren.

Ein 17-Taschen Gel. Im Gegensatz zum Bild mit zwei Gelen wird bei der Aufnahme eines Gels die volle Breite des Kamera Sensors ausgenutzt. Insgesamt sind die Banden deutlicher zu sehen. Das Ergebnis wird in maximaler Auflösung erfasst und kann mit dem festen Parameter (Ladeschema, 17-Taschen Gel, schließt links und rechts ab) 1:1 reproduziert und verglichen werden.

23-Taschen Gel, Belichtungszeit 1.52 Sekunden

23-Taschen Gel, Belichtungszeit 1 Sekunde






Angenommen bei den beiden Bilder handelt es sich zum einen um das original Experiment und zum anderen um eine Wiederholung. Können wir anhand der beiden Fotos mit Sicherheit sagen, dass das Experiment erfolgreich wiederholt wurde ?
Angenommen bei den beiden Bildern handelt es sich zum einen um das 1. Experiment und zum anderen um ein modifiziertes Experiment. Können wir anhand der beiden Fotos mit Sicherheit sagen, dass die Modifikation einen bestimmten Effekt hatte ?

In beiden Situationen ist es schwer bis unmöglich eine klare Aussage zu den Fragen zu treffen. Wenn wir ein Experiment wiederholen, dann sollten ALLE Parameter gleich sein. Auch die der Daten Dokumentation. Vor allem wenn wir mit PCR Konditionen experimentieren, sollte neben dem Parameter den wir gezielt testen, kein anderer für Variation des Ergebnis sorgen. Daraus folgt, dass wir in diesen Situationen bei der Dokumentation die Belichtungszeit entsprechend unverändert verwenden.

Es gibt noch viele andere Faktoren, die selbst nichts mit der Dokumentation zu tun haben, aber ebenso zu unerwünschten Variationen in einem Experiment führen. Je früher wir lernen, welche Faktoren das sind, um so früher können wir verhindern, dass diese die Ergebnisse unserer Experimente beeinflussen. Erst anschließend können wir die eigentlichen Fragen beantworten.

Grüße
Thomas