bài giảng nhập môn tin sinh học của thầy Đặng Đức Long

32 573 2
bài giảng nhập môn tin sinh học của thầy Đặng Đức Long

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

bài giảng nhập môn tin sinh học của thầy Đặng Đức Long trường Đại học Bách Khoa Đà Nẵng.... giúp các bạn ngành công nghệ sinh học có thể học tốt hơn...............................................................................................................................................................................

Draft version - Confidential Giáo trình Nmôn tin sinh  80     5.1. ADN 5.1.1. ADN    Hình 5.1. Hình 5.1ADN   ADN  ADN 5.1. Draft version - Confidential Giáo trình Nmôn tin sinh  81 1 2 3 4 5 6 i T G A C G T Tinh tinh T G A C T T Kh t C G A C T Kh nâu G A C G 5.1: ADN    ADN  dài. ADN  và Tinh tinh nuclêôtít, chui ADN ca Kh t cha 5 nuclêôtít và chui ADN ca Khi nâu ch còn cha 4 nuclêôtít. Tóm li, quá trình tin hóa s làm cho các chung khác nhau c v ni dung  dài. Sp 5.1.2. Sp hàng hai chui  và  ho chúng ta bit mi quan h gia hai chui  và .   khác nhau, chúng ta   hành ADN  ADN.    nuclêôtít ADN  ADN sau: 1.   2. Các nuclêôtít  nuclêôtít  3. i nào    4.   5.2 ADN  ADN   Draft version - Confidential Giáo trình Nmôn tin sinh  82 1 2 3 4 5 6 i T G A C G T Tinh tinh T G A C T T Kh t C G A C  T Kh nâu  G A C G  5.2ADN h t và Kh nâu. Ta thy có các bii  v trí 1, 5 và 6. , chúng ta d dàng nhn thy  n (5.3 minh ).  1 2 3 4 5 6 i T G A C G T Tinh tinh T G A C T T Kh t C G A C  T Kh nâu G A C G   i T G A C G T Tinh tinh T G A C T T Kh t  C G A C T Kh nâu  G A C G  5.3ADN   5.1.3. ng ta s tìm hiu cách nh m ging nhau ca m chui sp hàng.  nuclêôtítnuclêôtít Gi        là tp n chui ADN    ;       nuclêôtítADN    Gi              ng,            .                 s. Draft version - Confidential Giáo trình Nmôn tin sinh  83 m ging nhau     ca mp hàng       t c các cp chu        pairs)               5.1 t        , và c tính c th :                  5.2  theo 5.1  dng , c th là:            5.3         sau:                5.4 Ví d: Vi ma trn m ging nhau  :      nuclêôtít ;          nuclêôtít ;  nuclêôtít ; tnh ADN   5.4   hàng -  1 2 3 4 5 6  i T G A C G T Draft version - Confidential Giáo trình Nmôn tin sinh  84 Tinh tinh T G A C T T Kh t C G A C  T Kh nâu  G A C G       -6 10 10 10 -6 0 18 i T G A C G T Tinh tinh T G A C T T Kh t C G A C  T Kh nâu G A C G        -2 3 3 3 -9 0 -2 i T G A C G T Tinh tinh T G A C T T Kh t  C G A C T Kh nâu  G A C G       -6 3 3 3 -2 0 -2 5.4ADN  i 5.1.4.       chui        bt ( sp) bt cp                sp hàng bt cp là: , 5.5    (xem 5.5). Draft version - Confidential Giáo trình Nmôn tin sinh  85 XY = AAAATTTT TTTTGGGG XYZ = AAAATTTT TTTTGGGG AAAAGGGG XZ = AAAATTTT AAAAGGGG YZ = AAAAGGGG TTTTGGGG 5.5    sp hàng    3 bt cp ,       5.6       , .    XY = AAAATTTT TTTTGGGG XYZ = ? XZ = AAAATTTT GGGGAAAA YZ = TTTTGGGG GGGGAAAA 5.6: Ba bt cp    Draft version - Confidential Giáo trình Nmôn tin sinh  86  5.2.      asp hàng                        i. ng   5.1 bao :    ba  ba là 0.    ba chui, nghim ta bài toán vi ba chui tin t     và   c xây dng trên nghim t   Nghim ca bài toán vi ba chui tin t        ài toán vi ba chui tin t        Nghim ca bài toán vi ba chui tin t        Nghim ca bài toán vi ba chui tin t        Nghim ca bài toán vi ba chui tin t        Nghim ca bài toán vi ba chui tin t        Nghim ca bài toán vi ba chui tin t           d liu vào. Draft version - Confidential Giáo trình Nmôn tin sinh  87 Thut  ba chui ADN D liu vào: Ba chui ADN             ; Ma trn m  th hin m  ging nhau gia các kí t thuc tp kí t   Yêu cu: Sp hàng ba chui  và   tm ging nhau là ln nht. D liu ra: Ba chui ,  và  là kt qu ca vic sp hàng. ng: Gi        : Chui tin t gm i nuclêôtít u tiên ca ;        : Chui tin t gm j nuclêôtít u tiên ca .        : Chui tin t gm v nuclêôtít u tiên ca .              ba      .     s  ba        Ta thba nuclêôtít       :                                        nh                                                                                                                 5.5 t                  m ging nhau khi sp 3 kí t Draft version - Confidential Giáo trình Nmôn tin sinh  88  vào cùng mt ct trên ba chui sp hàng.             .      ,       theo 5.5.    s là nghim tt nht ca bài toán cho ba chui . ng  thc hin chèn các d chui   c ba chui sp hàng , và   5.1: Thut toán quy hong gii quy  ADN.     5.7. 1 2 3 4 5 6  T G A C G T  T G A C T T  C G A C  T    0 6 6 6 -5 6 5.7ADN    . Tm ging nhau là 19.  phc tp ca thut toán quy hong cho bài toán sp hàng ba chui là       .   chui là O(    ) vi     Draft version - Confidential Giáo trình Nmôn tin sinh  89 n Ngôi sao 5.3.  ng ta   .  Ngôi sao    vào  so v   cho mc   vi các chui khác là ln nht.                 )                          5.6 t         Th5.2. Thut toán Ngôi sao (Star) D liu vào: Tp        n chui ADN Yêu cu: S   vi tng  ln nht. D liu ra: chui          là chui             theo   5.6      gi s chui trung tâm              Gi      là    ).  c 2: Lt sp hàng các chui      . Vii   vào  c thc hi  Bt cp chui    chuc sp hàng    [...]... Kết quả chạy chương trình trực tuyến Muscl với 5 chuỗi ADN Giáo trình Nhập môn tin sinh học 106 Draft version - Confidential 5.7 Bài tập chương 1 Tại sao cần phải sắp hàng đa chuỗi ADN? ho ví dụ minh họa về một đa sắp hàng của 4 chuỗi ADN 2 Trình bày thuật toán quy hoạch động đ giải bài toán sắp hàng ba chuỗi ADN Tính độ phức tạp của thuật toán quy hoạch động trên và áp dụng nó với ví dụ 3 chuỗi ADN...  Emboss Maf Mega Metafasta Nexus Pfam Stockholm Giáo trình Nhập môn tin sinh học 99 Draft version - Confidential hiều chương trình trực tuyến đã đư c phát tri n cho phép người dùng chuy n đổi định dạng các file chứa các đa sắp hàng Hình 5.5 minh họa hệ thống chuy n đổi định dạng cho các đa sắp hàng đư c phát tri n bởi Trung tâm tin sinh học V tại địa ch http://www.ibi.vu.nl/programs/convertalignwww/... Hình 5.10 là giao diện trang chủ của Muscle tại địa ch www.drive5.com/muscle Tại đây người dùng có th tải chương trình Muscle về máy tính cá nhân đ tiến hành sắp hàng đa chuỗi Giáo trình Nhập môn tin sinh học 104 Draft version - Confidential Hình 5.10: Giao diện trang chủ của Muscl tại địa chỉ www.drive5.com/muscle gười dùng c ng có th sử dụng chương trình trực tuyến của Muscle tại B theo địa ch website... nhau họn định dạng dữ liệu ra của đa sắp hàng (F ST , lustalW, ) hạy chương trình bằng cách ân n t “Submit”, sau đó đ i chương trình Muscle chạy và trả lại kết quả là một đa sắp hàng như ở Hình 5.12  Tải kết quả đa sắp hàng về máy tính của người dùng đ lưu giữ và tiến hành phân tích Giáo trình Nhập môn tin sinh học 105 Draft version - Confidential Hình 5.11: Giao diện của chương trình sắp hàng đa chuỗi... phức tạp của Bước 2 là ( ) Vậy tổng độ phức tạp của thuật toán Ngôi sao là Với độ phức tạp này, thuật toán gôi sao có th sắp hàng các tập dữ liệu lớn với hàng nghìn chuỗi Giáo trình Nhập môn tin sinh học 91 Draft version - Confidential 5.4 Thuật toán sắp hàng lũy tiến (aggressive alignment) 5.4.1 Giới thiệu Sắp hàng l y tiến là một trong các chiến lư c sắp hàng gần đùng tốt nh t đ giải quyết bài toán... giữ đa chuỗi sắp hàng của các chuỗi prôtêin hay các chuỗi ADN ác đa sắp hàng đư c lưu theo chuẩn lustalW đư c sử dụng rộng rãi trong các chương trình phân tích các chuỗi File văn bản theo định dạng dữ liệu lustalW có c u tr c tương đối đơn giản như sau: 1 Dòng đầu của file bắt đầu với từ “ L ST LW” ho c “ L ST L W”; tiếp theo có th là các dòng rỗng Giáo trình Nhập môn tin sinh học 96 Draft version -... nguyên tử, nhưng không có cùng các tính ch t hóa học chung Hình 5.3 là một ví dụ minh họa về một đa sắp hàng đư c lưu giữ trong file văn bản theo định dạng lustalW Giáo trình Nhập môn tin sinh học 97 Draft version - Confidential Hình 5.3: Định dạng CLUSTAL W 5.5.2 Định dạng dữ liệu Phylip ịnh dang dữ liệu Phylip đư c sử dụng đ lưu giữ đa chuỗi sắp hàng của các chuỗi prôtêin và các chuỗi ADN ác đa sắp... chuỗi ADN Thuật toán gôi sao đư c tiến hành như sau: Bước : Tìm chuỗi trung tâm i m giống nhau giữa các c p chuỗi:    i m trung tâm của các chuỗi là:    Giáo trình Nhập môn tin sinh học 90 như Draft version - Confidential Vậy là chuỗi trung tâm vì đi m trung tâm của nó lớn nh t Bước 2: Sắp hàng các chuỗi  Sắp hàng h ỗi ới h ỗi m h ắ y 1 2 3 4 5 6 7 8 9 10 A A T T T T T T – – – – T T T T T T G... chuỗi ADN sau khi đư c sắp hàng Giáo trình Nhập môn tin sinh học 108 Draft version - Confidential Ví dụ: multiple_sequence.in multiple_sequence.out 3 13 TGACGT TGACGT TGACTT TGACTT CGACT CGACT 2 -1 -1 -1 -2 -1 2 -1 -1 -2 -1 -1 2 -1 -2 -1 -1 -1 2 -2 -2 -2 -2 -2 0 6 Trình bày thuật toán sắp hàng l y tiến cơ bản đ giải bài toán sắp hàng đa chuỗi ADN Tính độ phức tạp của thuật toán trên và áp dụng nó với ví... đ sắp hàng đa chuỗi i m cải tiến của ClustalW so với thuật toán l y tiến cơ bản là lustalW xây dựng một cây phân loài th hiện mối quan hệ giữa các chuỗi đầu vào; sau đó việc tìm hai đa sắp hàng gần nhau nh t trong quá trình sắp hàng l y tiến đư c xác định theo c u tr c cây phân loài đã xây dựng Thuật toán lustalW đư c minh họa ở Hình 5.6 Giáo trình Nhập môn tin sinh học 100 Draft version - Confidential . -2 3 3 3 -9 0 -2 i T G A C G T Tinh tinh T G A C T T Kh t  C G A C T Kh nâu  G A C G       -6 3 3 3 -2 0 -2

Ngày đăng: 12/09/2014, 12:55

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan