Bài giảng Tin sinh học: Chương 4 - ThS. Nguyễn Thành Luân

23 720 10
Bài giảng Tin sinh học: Chương 4 - ThS. Nguyễn Thành Luân

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài giảng Tin sinh học: Chương 4 - ThS. Nguyễn Thành Luân

4/9/2013 1 Phép phân tích hệ thống cây phát sinh loài (Phylogeny Analysis) TRƢỜNG ĐẠI HỌC CN THỰC PHẨM TPHCM KHOA CNSH & KTMT HỆ ĐẠI HỌC Chƣơng 4 ThS. Nguyễn Thành Luân luannt@cntp.edu.vn Bioinformatics Các ứng dụng thực tiễn Bioinformatics 4/9/2013 2 Bioinformatics Bioinformatics Câu hỏi Tại sao ngày nay vẫn còn tồn tại những động vật có cấu tạo phức tạp như động vật có xương sống bên cạnh động vật nguyên sinh có cấu tạo rất đơn giản? Bioinformatics Tìm hiểu các quan hệ loài 4/9/2013 3 Bioinformatics CÂY PHÁT SINH LOÀI LÀ GÌ?  Miêu     hóa   nhóm loài    tính khác nhau  có cùng  quan   hàng  nhau và cùng hình thành    tiên trong quá  PHYLOGENETIC TREE Bioinformatics Cây phát sinh loài (Phylogeny)  Cây phát sinh loài „kể lại‟các thời điểm „lâu đời nhất‟ trong mối quan hệ loài từ 1 tổ tiên chung.     tiên chung cho   các loài/gene trong cây phát sinh     Bioinformatics Ý nghĩa cây phát sinh loài  Phản ánh    quan   các nhóm loài sinh   Quá trình  hoá  các nhóm sinh     cao,      .       các nhóm   4/9/2013 4 Bioinformatics 10 Tác phẩm “Nguồn gốc các loài”  Tác : Charles Darwin     1859      các loài  hóa là    quá trình    nhiên   sách gây tranh cãi vì mâu    tin tôn giáo Bioinformatics 11 Charles Darwin (1809  1882) HMS Beagle Bioinformatics 12 Hành trình trên  tàu Beagle 1831 - 1836 4/9/2013 5 Bioinformatics 13 Cây phát sinh loài  tiên   Bioinformatics 14  Bioinformatics 15      hành trình 4/9/2013 6 Bioinformatics 16  Nhóm 1: 6 loài (1, 3,  cây Nhóm 2: 6 loài (7, 8,   Nhóm 3: 1 loài (9)  Nhóm 4: 1 loài (2)   Bioinformatics 17 Darwin‟s tree of life Bioinformatics 18 Quan  Darwin   hóa  loài  4/9/2013 7 Bioinformatics 19 Darwin vs Tôn giáo Bioinformatics 20   Hình thái        Gen Bioinformatics 21 Xây dựng cây phát sinh loài hiện đại  Hình thái  Hóa   Di      Gen 4/9/2013 8 Bioinformatics 22 Trình tự bảo tồn  Là  trình  mã hóa  không mã hóa protein  vai trò   quan    sinh  Bioinformatics 23 Ví dụ: promoter  -   tách nhau.  -    Bioinformatics 24  4/9/2013 9 Bioinformatics 25     các trình       gian  Xây  cây phát sinh loài Bioinformatics 26 Các phần mềm hỗ trợ     trình  BLAST  NCBI     trình  ClustalX, ClustalW    cây phát sinh loài TreeView  MEGA Bioinformatics Các thuật ngữ trong cây phát sinh loài  Phylogeny phylogenetic phylo Bootstrap Distance Parsimony Likelihood Rooted tree Unrooted tree 4/9/2013 10 Bioinformatics Các đột biến có thể xảy ra  Transition (Sự chuyển đoạn)   ra các nhóm    purine (A <-> G) hay pyrimidine (C <->T)  Transversion (Sự đảo đoạn)  purine sang pyrimidine (A<->T, C<->G, A<->C, T<->G)  đột biến điểm mất đoạn, chuyển đoạn, thêm đoạn, hoặc đảo đoạn Bioinformatics Bioinformatics Các dạng khác nhau của cây tiến hóa Các dạng cây tiến hóa loài với dạng cây phát sinh loài không biết rõ nguồn gốc (a) và cây biết rõ nguồn gốc (b) [...]... hypothesis) Là 1 dạng ứng dụng xây dựng cây phát sinh loài dựa trên trình tự, cây nào được suy ra có ít tỷ lệ đột biến nhất sẽ được chọn là cây phát sinh loài thích hợp Bioinformatics 14 4/9/2013 Ví dụ •Xây dựng cây phát sinh loài dạng Parsimony bằng cách vẽ ra mọi trƣờng hợp có thể có về cây phát sinh loài đó: 4 loài -> 3 cây •5 loài -> 15 cây •6 loài -> 105 cây • Sau đó vẽ sơ đồ cột đầu tiên của trình... Phân tích cây phát sinh loài Bioinformatics Chứng minh giả thiết dựa trên cây phát sinh loài Bioinformatics 21 4/ 9/2013 Các ứng dụng khác Bioinformatics Các tài liệu tham khảo thêm  Cây phát sinh loài không rõ nguồn gốc biểu hiện mối quan hệ giữa trình tự aa của F rubripes IL-6 cho toàn bộ chiều dài phân tử với các nhóm IL-6 đã biết trong trình tự thành viên của họ IL 6  Cây phát sinh loài được xây... phát sinh loài thích hợp nhất Bioinformatics 16 4/ 9/2013 Câu hỏi ôn tập  Theo bảng cột dữ liệu trình tự dưới đây,cây phát sinh loài nào thích hợp hơn nếu PP likelihood được sử dụng để phân tích dữ liệu Bioinformatics Độ tin cậy của cây phát sinh loài  Phương pháp chuẩn cho tất cả các cây (ma trận khoảng cách, parsimony, likelihood) là điểm lặp lại (bootstrap) Sequence1 Sequence2 Sequence3 Sequence4... quan hệ láng giềng (neighbourjoining) Bioinformatics Sự tiến hóa tƣơng lai??? Bioinformatics 66 22 4/ 9/2013 Các kiến thức cần nhớ  Định nghĩa cây phát sinh loài  Ý nghĩa của cấy phát sinh loài  Các dạng đột biến trong cây phát sinh  Các phương pháp xây dựng cây phát sinh loài  Các ứng dụng cây phát sinh loài Bioinformatics KẾT THÚC CHƢƠNG IV Bioinformatics 23 ... dạng đồng hồ) –Tỷ lệ đột biến gen ngang nhau trong mỗi giống loài – Khi tỷ lệ khác biệt 1 cách chắn chắn  không chính xác Bioinformatics 13 4/ 9/2013 Cách tính (1) a + b = 3 (2) a + e + c = 9 (3) b + e + c = 8 _ (2 )-( 3) a - b = 1 (1) a+ b = 3 ( 2-3 +1) 2a = 4 a=2 b=1 Tương tự: c=5 d=3 e=2 Bioinformatics Kết quả  Sự khác biệt giữa các nhánh có thể biểu hiện dạng số hay độ dài của các nhánh tiến... Bioinformatics 17 4/ 9/2013 Điểm lặp lại (Bootstrap)  Ngẫu nhiên khảo sát các cột từ trình tự n lần  1 số cột được trình bày nhiều lần, 1 số khác thì hoàn toàn không  Xác định cây phát sinh loài tốt nhất trong nguồn dữ liệu  Lặp lại ngẫu nhiên mẫu nghiên cứu và khảo sát cây phát sinh loài nhiều lần khác nhau (100 – 1000 lần)  Đếm số lần mỗi nhóm phục hồi lại cây phát sinh loài đó Bioinformatics Re-sampling... nguồn dữ liệu về AIDS trong người phụ nữ trở thành 1 ngành nghiên cứu về cây phân tích phát sinh loài Bioinformatics Luận điểm của Louisiana vs Schmidt Câu hỏi: Có phải dòng HIV từ ngƣời phụ nữ có phải có mối liên quan với dòng HIV đƣợc lấy từ máu bệnh nhân của nha sĩ? Bioinformatics 20 4/ 9/2013 Giả thiết 2 giả thiết đƣợc đƣa ra -Người phụ nữ ngay thẳng -Người phụ nữ gian dối Bioinformatics Chứng minh... là Hemoglobin B Bioinformatics 11 4/ 9/2013 Các dạng của cây phát sinh loài biết rõ nguồn gốc (Rooted tree) Cây phát sinh sơ đồ phân ly (Cladograms) biểu hiện tất cả các tỷ lệ quan hệ loài ngang nhau ở mức độ quan hệ họ hàng Cây phát sinh nhánh tiến hóa (phylograms) biểu hiện các nhánh có tỷ lệ khác nhau tiêu biểu cho sự khác biệt giữa gene/loài Bioinformatics Cây phát sinh nhánh tiến hóa Các nhánh dài... Phƣơng pháp Parsimony  Sequence 1 GCACCT  Sequence 2 GCACGT  Sequence 3 ATTCGA  Sequence 4 ACTCGA  Lặp lại các phân tích cho mỗi cột trình tự  Tổng hợp các thay đổi cho mỗi loại cây phát sinh có thể xảy ra tạo nên cây phát sinh loài:  Ví dụ: Tree 1 = 1 (Cột 1) + 1 (Cột 2) + 1(Cột 3) + 0(Cột 4)  Cây phát sinh thích hợp được lựa chọn dựa trên sự thay đổi ít nhất của số lần thay đổi Bioinformatics... đƣợc sinh ra từ dữ liệu mã hóa trình tự, có thể chỉ ra sự thay đổi về chức năng, hoặc về môi trƣờng sống… Bioinformatics Ví dụ Cây phát sinh loài 1, 2, 3 theo thứ tự là; (a) Dạng phân ly, nhánh tiến hóa và dendrogram (b) Không rõ nguồn gốc, nhánh tiến hóa và phân ly (c) Có nguồn gốc, phân ly và nhánh tiến hóa (d) Không có đáp án nào đúng Bioinformatics 12 4/ 9/2013 Các phƣơng pháp để xây dựng cây phát sinh . 4/ 9/2013 1 Phép phân tích hệ thống cây phát sinh loài (Phylogeny Analysis) TRƢỜNG ĐẠI HỌC CN THỰC PHẨM TPHCM KHOA CNSH & KTMT HỆ ĐẠI HỌC Chƣơng 4 ThS. Nguyễn Thành Luân. không chính xác 4/ 9/2013 14 Bioinformatics Cách tính (1) a + b = 3 (2) a + e + c = 9 (3) b + e + c = 8 _______________ (2 )-( 3) a - b = 1 (1) a+ b = 3 ( 2-3 +1) 2a = 4 a = 2 b = 1.      4/ 9/2013 15 Bioinformatics Ví dụ •Xây dựng cây phát sinh loài dạng Parsimony bằng cách vẽ ra mọi trƣờng hợp có thể có về cây phát sinh loài đó: 4 loài -& gt; 3 cây •5 loài -& gt;

Ngày đăng: 28/05/2014, 09:57

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan