Künstliche Sequenzen:
S1: AAAAAAAAAA
S2: TTTTTTTTTT
S3: TTTTTTTTTT
S4: AAAAAAAAAA
![]() |
NJ-Baum 1 (original) |
![]() |
NJ-Baum 1 (Topologie) |
Im Vergleich zu den sehr unterschiedlichen Sequenzen wollen wir nun auf ein Beispiel mit sehr ähnlichen Sequenzen schauen.
S1: AAAAAAAAAA
S2: AAAAAAAAAT
S3: AAAAAAAAAT
S4: AAAAAAAAAA
NJ Baum 2:
![]() |
NJ-Baum 2 (original) |
![]() |
NJ-Baum 2 (Topologie) |
In den vorangegangenen Beispielen ist die proportionale Distanz (p-Distanz) zwischen den Sequenzen das Maß welches im Baum notiert wird. Im ersten Beispiel sind 10 der Basen von S1 und S4 anders als bei S2 und S3. Also 100 % unterschiedlich. Im Baum wird das erkenntlich an der Summe der Distanz der verbindenden Zweige (50 % = 0.5). Im zweiten Beispiel ist nur eine der 10 Basen unterschiedlich was 10 % (= 0.1) Distanz entspricht.
Was passiert, wenn wir nun innerhalb einer der beiden Cluster einen weiteren Unterschied einführen?
S1: AAAAAAAAAA
S2: AAAAAAAAAT
S3: AAAAAAAATT
S4: AAAAAAAAAA
![]() |
NJ-Baum 3 (original) |
![]() |
NJ-Baum 3 (Topologie) |
to be continued...
Keine Kommentare:
Kommentar veröffentlichen