Filogenetyczne Mini-HowTo;)

Dr Jakub Sawicki – tymek666

 

Przeglądając artykuły dotyczące pokrewieństwa i ewolucji organizmów na pewno spotkaliście się z rycinami, potocznie nazywanymi ‘drzewkami’. Są one dość przystępnym sposobem zobrazowania ewolucji danej grupy taksonomicznej za wzór drzew genealogicznych. Pierwsze dendrogramy pokazujące przebieg ewolucji i pokrewieństwa między taksonami powstawały w oparciu o cechy morfologiczne. Badacze zakładali, iż każda z analizowanych cech ma różną wagę, innymi słowy, że są cechy mniej i bardzie ważne taksonomicznie. Wraz w początkiem ery komputeryzacji rozwinęła się tzw. taksonomia numeryczna oraz powiązana z nią kladystyka. Naukowcy nie osądzali już znaczenia ewolucyjnego cech, które wszystkie były traktowane na równi. Takie podejście umożliwiało jednoczesną analizę nawet kilkuset cech, które zapisywane zwykle były w postaci binarnej. Metodą tą analizowano już nie tylko cechy morfologiczne, ale także pierwsze dane molekularne.

Prawdziwy rozwój filogenetyki rozpoczął się wraz z opracowaniem metody sekwencjonowania DNA oraz odkrycia termostabilnego enzymu syntetyzującego DNA – polimerazy Taq. Efektem tych okryć jest obecny stan wiedzy o genomach żyjących na ziemi (a także już wymarłych) organizmów. Wiedza tak, w ‘czystej formie’ zdeponowana jest w banku genów. Na podstawie danych w nim zawartych możemy sami stworzyć swoje własne drzewo filogenetyczne naszych ulubionych pupili. Aby stworzyć, dobre i miarodajne drzewo filogenetyczne będziemy potrzebowali dwóch programów:

1. BioEdit – jest to mocno rozbudowany notatnik 😉 Do pobrania z oficjalnej strony http://www.mbio.ncsu.edu/BioEdit/bioedit.html
lub (oficjalna często nie działa) z http://www.unb.br/ib/cel/download/BioEdit.zip

2. Mega4 – jeden z lepszych programów do analizy sekwencji, do pobrania z www.megasoftware.net. Wymagana jest bezpłatna rejestracja, na stronie dostępne są też manuale.

Uwaga, oba programy są w wersjach rozwojowych i zdarzają się błędy w ich działaniu. W 99% przypadków pomaga ponowne uruchomienie programu.

Kiedy ściągniemy i zainstalujemy powyższe programy musimy pobrać dane z banku genów.

Wchodzimy na stronę wyszukiwarki (http://www.ncbi.nlm.nih.gov/sites/entrez) i wpisujemy nazwę interesującego taksonu oraz wybieramy bazę sekwencji DNA (CoreNucleotide). W wyniku wyszukiwania dostaniemy listę sekwencji, z których najważniejsze ją dla nas dokładna nazwa taksonu oraz opis sekwencji, czyli jaki gen lub jego fragment ona przedstawia. Pamiętajmy, aby do jednej analizy pobrać sekwencje tylko JEDNEGO GENU. Nie możemy np.: porównywać sekwencji D-Loop z Cox czy NADP.

[pic: fig1.jpg]

Następnie klikamy na numer sekwencji i w menu ‘Display’ wybieramy ‘Fasta’. Okno przeglądarki powinno wyglądać następująco:

[pic: fig2.jpg]

Zaznaczamy wszystko od znaku ‘>’ włącznie do ostatniego nukleotydu, kopiujemy do schowka i wklejamy do notatnika. Powtarzamy tą czynność dla pozostałych sekwencji wklejając je do notatnika.

W tym miejscu należy także usunąć z nazw sekwencji przecinki, średniki i cudzysłowy. Najszybciej można to zrobić wybierając z menu Edycja opcję Zamień, następnie w pierwszym polu ‘Znajdź’ umieszczamy przecinek, drugie pole zostawiając puste. Warto także skrócić nazwę sekwencji, pozostawiając tylko nazwę taksonu, pamiętając zarazem o tym, aby nie było dwój jednakowych nazw sekwencji.

Otrzymany plik zapisujemy z rozszerzeniem ‘ .fas’ i uruchamiamy program BioEdit i otwieramy nasz plik. Z menu Edit wybieramy ‘Select All sequences’ lub CTRL+A. Następnie otwieramy menu ‘Accessory Aplications’ wybieramy ClustalW Multiple Aligment, zaznaczając tylko pierwszą opcję i klikamy na RunClustalW. Otrzymamy nowe okno (zarazem plik, który następnie zapisujemy) z uporządkowanymi sekwencjami. Sprawdzamy, czy sekwencje mają jednakową długość, jeśli nie to skracamy do najkrótszej sekwencji. Kilka uwag odnośnie aligmentu. Jest to kluczowy etap każdej analizy filogenetycznej, od którego poprawności zależą uzyskane przez nas wyniki. W pracach naukowych stosuje się bardzie wyrafinowane metody jego przeprowadzania, które stanowią w większości przypadków tylko pierwsze jego etap. Wynik generowany przez program podlega następnie ‘wzorkowej’ analizie i korekcie…ale to raczej temat na inny artykuł.

[pic: fig3.jpg]

Uruchamiamy program MEGA4, otwieramy nasz uporządkowany plik i konwertujemy do formatu ‘mega’. Wszystkie opcje zostawiamy domyślne. Zapisujemy przekonwertowany plik z rozszerzeniem ‘.meg’, zamykamy okno konwersji i otwieramy nasz plik w formacie mega. Na pytanie o sekwencję kodującą białka odpowiadamy ‘NO’. Mamy otwarty nasz plik i możemy przystąpić do tworzenia drzewka. Z menu ‘Phylogeny’ wybieramy ‘Construct phylogeny’, a następnie Minimum Evolution.

Opcje ustawiamy jak na poniższym zrzucie.

[pic: fig4.jpg]

Procesy ewolucyjne nie zachodzą jednak tylko w jednej płaszczyźnie, dlatego też utworzone dendrogramy, kladogramy, fenogramy i inne rodzaje ‘drzewek’ muszą być testowane, w celu określenia prawidłowości poszczególnych gałęzi powstałego drzewa. W naszym przypadku użyjemy tzw. Bootstrapu. W przypadku takiego testu za dobre i wiarygodne gałęzie uważa się te o wartości wyższej niż 50. Oczywiście im wyższa wartość tym możemy mieć większą pewność, że otrzymane drzewo odzwierciedla proces ewolucji naszych pupili. Opis i wyjaśnienie pozostałych opcji wybiega raczej poza ramy niniejszego mini-przewodnika. Klikamy na ‘Compute’ i po kilkunastu sekundach lub minutach (lub godzinach ;)) otrzymujemy nasze drzewko. Pamiętajmy, aby oglądać je w zakładce ‘Bootstrap Consensus Tree’. Oto nasze drzewko 🙂

[pic: fig5.jpg]

Przedstawione w niniejszym HowTo metody mogą być obarczone błędami, więc interpretacja wyniku nie może być podstawą do dalekosiężnych wniosków odnośnie taksonomii i ewolucji analizowanych organizmów. Wnikliwa analiza powinna obejmować kilka genów reprezentujących 3 genomy: jądrowy, chloroplastowy i mitochondrialny. Drzewa konstruowane są kilkoma metodami, z których niektóre wymagają przeprowadzenia innych analiz, taki jak np. określenie modelu ewolucyjnego. W przypadku obszernych danych i wyrafinowanych metod analizy obliczenia komputerowe trwają nawet kilka dni.