Nghiên Cứu Các Phương Pháp Phân Tích Và Phát Triển Các Công Cụ Tin Sinh Học Nhằm Giải Quyết Các Bài Toán Quan Trọng Trong Sinh Học Phân Tử Và Ứng Dụng

43 412 1
Nghiên Cứu Các Phương Pháp Phân Tích Và Phát Triển Các Công Cụ Tin Sinh Học Nhằm Giải Quyết Các Bài Toán Quan Trọng Trong Sinh Học Phân Tử Và Ứng Dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Báo cáo nghiệm thu Đề tài độc lập cấp nhà nước Nghiên cứu phương pháp phân tích phát triển công cụ tin sinh học nhằm giải toán quan trọng sinh học phân tử ứng dụng Học viện CNBCVT 1/2012 Các nội dung đăng ký  ND1: xây dựng báo cáo  ND2-ND6: xây dựng phần mềm  ND7: thử nghiệm với liệu Việt Nam  ND8: xây dựng cổng thông tin tin sinh học  báo khoa học Các kết đạt ND2-ND6 ◦ Xây dựng đầy đủ phần mềm đăng ký ◦ Đạt tiêu chí độ xác, chức năng, hình thức ◦ Tích hợp số phương pháp tính tốn nhóm đề tài đề xuất phát triển ND7 ◦ Đã thu thập thử nghiệm với liệu tôm sú, lúa, gen người, virus cúm Kết thử nghiệm đạt yêu cầu ND8 ◦ Thiết lập cổng thông tin cụm tính tốn hiệu cao Các kết khác  Bài báo (đã cơng bố) ◦ Tạp chí quốc tế: ◦ Hội nghị quốc tế:  Đào tạo: ◦ Tiến sĩ: bảo vệ, thực ◦ Thạc sĩ: bảo vệ Sử dụng kinh phí Tổng kinh phí: 2,6 tỷ Thực tế sử dụng: 2,525 tỷ Tiết kiệm: 75 triệu (theo nghị 11) Tình hình tốn: ◦ Đã hồn thành hồ sơ tốn ◦ Đang thực thủ tục nhận tiền CÁC KếT QUả Cụ THể ND2 Nghiên cứu xây dựng phần mềm xác định gen  Trường hợp 1: cho trình tự hệ gen (genomic DNA)  Trường hợp 2: cho cDNA/EST Tìm kiếm  Trường hợp 3: trình tự hệ gen + cDNA/EST ND2 Giải pháp Kết hợp giải pháp cho trường hợp GHMM Blast CSDL cDNA Blat GHMM + thông tin ngồi ND2 Kết ND2 Kết ND4.2 Thuật tốn ND4.2 Kết Sử dụng BAliBASE 2.0 reference Phương pháp Độ nhạy TRUST ký tự RADAR ProDAPosterior ProDAViterbi Đặc trưng TRUST ký tự RADAR ProDAPosterior ProDAViterbi C1a C1b C2a C2b C2c C3 C4 Trung bình 0.38 0.58 0.59 0.42 0.52 0.60 0.26 0.42 0.32 0.22 0.38 0.40 0.31 0.47 0.40 0.31 0.60 0.45 0.19 0.35 0.39 0.28 0.45 0.42 0.62 0.62 0.37 0.41 0.44 0.51 0.47 0.45 0.57 0.60 0.76 0.56 0.53 0.73 0.65 0.55 0.64 0.62 0.57 0.73 0.59 0.65 0.73 0.56 0.62 0.67 0.34 0.61 0.67 0.60 0.59 0.71 0.83 0.69 0.67 0.75 0.70 0.67 0.69 0.71 ND5 So sánh bắt cặp toàn hệ gen Giới thiệu: Trong q trình tiến hóa, hai loại phép biến đổi dẫn đến khác biệt hai hệ gen là: 1.Biến đổi mức độ điểm (point mutation): Xóa/chèn nucleotide, biến đổi nucleotide 2.Biến đổi mức độ gen: Xóa/chèn gen, đảo chiều dịch chuyển gen Bài tốn: Bắt cặp tồn hai hệ gen với hai loại phép biến đổi ND5 Giải pháp Sử dụng BLASTZ để tìm vùng giống hai hệ gen Sử dụng vùng giống để chia hệ gen thành chuỗi đoan DNA liên tiếp Tính khoảng cách đoạn DNA Áp dụng thuật toán bắt cặp hệ gene với phép đảo chỗ để bắt cặp toàn hệ gen ND5 Kết với liệu mô  Dữ liệu: Thực tạo liệu mô cách lấy 13 đoạn polypeptide-encoding gen hệ gen ti thể (mitochondrial genome) Số lượng liệu tạo để kiểm tra chương trình: 320  Kết thực nghiệm: ◦ Tỷ lệ trung bình hàng xác theo nucleotide: ~97% ◦ Thời gian chạy chương trình: 3-7s Lưu ý: Đây hệ thống cho phép bắt cặp toàn hai hệ gen ND5 Kết với liệu thật  Dữ liệu: Sử dụng 15 liệu Metazoan Mitochondria: ◦ hệ gen người: người Việt (chủng da vàng), người Uganda (chủng da đen), người Đức (chủng da trắng), người thổ dân Mỹ (chủng da đỏ) ◦ 10 hệ Gen từ loài sinh vật khác trái đất Khỉ, Cá, Vịt xiêm, Tôm, Gấu ngựa, Hải cẩu, Ếch, Kỳ nhông, Voi châu Á rùa Biển  Kết quả: Thực 105 test để bắt cặp đôi cho hệ gen Kết so sánh với cận nghiệm tốt ưu: ◦ Tỷ lệ so với kết tối ưu: ~100 % ◦ Thời gian trung bình: 5s ND5 Kết luận  Đây phần mềm bắt cặp hai hệ gen đầu tiền thỏa mãn: ◦ Sử dụng phép biến đổi mức độ điểm ◦ Sử dụng phép biến đổi mức độ gen ◦ Bắt cặp tất nucleotide hai hệ gen  Thực nghiệm với liệu thật liệu mô cho kết tốt ND6 Phần mềm tự động xây dựng ma trận biến đổi axit amin Giới thiệu: Mơ hình biến đổi axit amin sử dụng nhiều nghiên cứu như: Xây dựng phân lồi, tính khoảng cách chuỗi protein… Hiện có nhiều mơ hình: Dayhoff, WAG, LG, FLU… Các mơ hình khơng đạt hiệu qủa cao với liệu cụ thể Bài toán: Xây dựng hệ thống cho phép người dùng tự động xây dựng mơ hình biến đổi axít amin từ liệu đầu vào ND6 Giải pháp Bước 1: Nhập chuỗi protein hàng Bước 2: (Q sử dụng ma trận LG cho lần đầu tiên): Ước lượng phát sinh lồi thơng số khác sử dụng ma trận Q Bước 3: Ước lượng mơ hình Q’ sử dụng phương pháp Quang&Gascuel phần mềm XRate Bước 4: So sánh hai mô hình Q Q’ Nếu Q’ gần giống với Q, kết thúc Nếu không, quay lại Bước ND6 Kết với vi rút cúm   FLU JTT WAG LG 1st 2nd 3rd 4th 26353 3336 967 330 1891 2029 3224 5575 2609 5740 7400 223 1584 1936 1523 9814 logLK/site LogLK/ M1 M2 FLU JTT 0.034 28808 2178 -4.886 FLU WAG 0.044 28076 2910 -4.891 FLU LG 0.049 29724 1262 -4.841 -4.875 site M1> M2 M2> M1 ND6 Kết luận  Chúng đề xuất xây dựng hệ thống cho phép người dùng tự động xây dựng mơ hình biến đổi axít amin từ liệu đầu vào  Thí nghiệm với vi rút cúm cho kết tốt ND7 Thử nghiệm với liệu Việt Nam  Dữ liệu gen ty thể người  Dữ liệu gen tôm sú  Dữ liệu gen lúa  Dữ liệu gen virus cúm ND7 Kết  Gen ty thể người Việt Nam ◦ Giải trình tự dựa PCR ◦ Trình tự đầy đủ hệ gen ty thể (đã gửi lên GenBank) ◦ Trình tự 20 đoạn D-loops gen khác  Gen tôm sú ◦ Trình tự 12 cDNA  Gen lúa ◦ Giải mã thu thập từ GenBank ◦ 12 gen lúa chủ yếu thuộc chủng Japonica  Gen virus cúm ◦ Tải từ GenBank ◦ 4127 chuỗi thuộc 11 loại protein virus cúm A từ Việt Nam ND7 Thử nghiệm phần mềm  Xác định gen ◦ Ty thể người: xác 100% ◦ Gen tơm sú: phù hợp với kết tìm kiếm từ GenBank Xác định chức ◦ Gen tôm sú: 99% so với kết từ GenBank ◦ Gen lúa: độ nhậy 98% so với kết kiểm chứng Xây dựng phân lồi cho virus cúm ◦ Chính xác so với phương pháp khác Kết luận Hoàn thành nội dung đăng ký Xây dựng phần mềm Đề xuất số phương pháp tính tốn Cơng bố báo khoa học Có số khó khăn định nghị 11 Chính phủ ... nhiều phương pháp với ưu/nhược điểm riêng ND4.1 Giải pháp Mục tiêu: thuận tiện cho người dùng Tự chọn phương pháp ◦ Lựa chọn phương pháp tốt ◦ Xây dựng định ◦ Sử dụng định chọn phương pháp phù... amin sử dụng nhiều nghiên cứu như: Xây dựng phân lồi, tính khoảng cách chuỗi protein… Hiện có nhiều mơ hình: Dayhoff, WAG, LG, FLU… ? ?Các mơ hình không đạt hiệu qủa cao với liệu cụ thể Bài toán: ... tương tác biến (so với phương pháp sử dụng thông tin từ tương tác biến) ND4.1 Bắt cặp đa chuỗi ? ?Bài tốn Khó khăn: ◦ Bài toán tối ưu, độ phức tạp hàm mũ ◦ Ý nghĩa sinh học hàm mục tiêu -> độ xác

Ngày đăng: 25/08/2017, 09:52

Từ khóa liên quan

Mục lục

  • Báo cáo nghiệm thu Đề tài độc lập cấp nhà nước Nghiên cứu các phương pháp phân tích và phát triển các công cụ tin sinh học nhằm giải quyết các bài toán quan trọng trong sinh học phân tử và ứng dụng

  • Các nội dung đăng ký

  • Các kết quả đạt được

  • Các kết quả khác

  • Sử dụng kinh phí

  • Các kết quả cụ thể

  • ND2. Nghiên cứu xây dựng phần mềm xác định gen

  • ND2. Giải pháp

  • ND2. Kết quả

  • Slide 10

  • ND3.1. Chú giải chức năng gen/protein dựa trên trình tự

  • ND3.1.

  • ND3.1. Giải pháp

  • Slide 14

  • ND3.1. Kết quả

  • Slide 16

  • ND3.2. Chú giải chức năng gen/protein dựa trên mạng chuyển hóa

  • ND3.2.

  • ND3.2. Giải pháp

  • ND3.2. Kết quả

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan