Đang tải... (xem toàn văn)
Xây dựng cư sở dữ liệu SSRs từ ESTs cuả cây dứa
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH BỘ MÔN CÔNG NGHỆ SINH HỌC ***000*** TRẦN NGUYỄN MINH ĐĂNG XÂY DỰNG CƠ SỞ DỮ LIỆU SSRs (SIMPLE SEQUENCE REPEATS) TỪ ESTs (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus) /2006 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH BỘ MÔN CÔNG NGHỆ SINH HỌC ***000*** XÂY DỰNG CƠ SỞ DỮ LIỆU SSRs (SIMPLE SEQUENCE REPEATS) TỪ ESTs (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus) Luận văn kỹ sƣ Chuyên ngành: Công Nghệ Sinh Học Giáo viên hƣớng dẫn: Sinh viên thực hiện: TS. TRẦN THỊ DUNG TRẦN NGUYỄN MINH ĐĂNG Cử Nhân LƢU PHÚC LỢI Khóa: 2002-2006 /2006 MINISTRY OF EDUCATION AND TRAINING NONG LAM UNIVERSITY, HCMC DEPARTMENT OF BIOTECHNOLOGY ***000*** BUILDING SSRs (SIMPLE SEQUENCE REPEATS) DATABASE FROM ESTs (EXPRESSED SEQUENCE TAGS) OF PINEAPPLE (Ananas comosus) Graduation thesis Major: Biotechnology Professor Student PhD. Tran Thi Dung TRAN NGUYEN MINH DANG BSc. LƢU PHÚC LỢI Term: 2002 - 2006 Ho Chi Minh City 09/2006 iv LỜI CẢM ƠN XIN CHÂN THÀNH CẢM ƠN Ban Giám Hiệu trƣờng Đại học Nông Lâm Tp. Hồ Chí Minh đã tạo mọi điều kiện cho tôi trong suốt thời gian học tập. Các thầy cô trong bộ môn Công Nghệ Sinh Học cùng các thầy cô đã trực tiếp giảng dạy trong suốt bốn năm qua. Xin bày tỏ lòng biết ơn sâu sắc đến: TS. Trần Thị Dung Cử Nhân Lƣu Phúc Lợi Đã tận tụy hƣớng dẫn, truyền đạt kiến thức giúp cho tôi hoàn thành khóa luận này. Cùng toàn thể lớp Công Nghệ Sinh Học 28 thân thiện đã hỗ trợ, giúp đỡ và động viên tôi trong suốt thời gian làm đề tài. Thành kính ghi ơn ba mẹ cùng những ngƣời thân trong gia đình luôn tạo điều kiện và động viên con trong suốt quá trình học tập tại trƣờng. Tháng 08 năm 2006 Trần Nguyễn Minh Đăng v TÓM TẮT KHOÁ LUẬN TRẦN NGUYỄN MINH ĐĂNG, đại học Nông Lâm TP. Hồ Chí Minh, tháng 08/2006. “XÂY DỰNG CƠ SỞ DỮ LIỆU SSRs (SIMPLE SEQUENCE REPEATS) TỪ ESTs (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus)” Ananas comosus Ananas comosus vi MỤC LỤC Nội dung Trang LỜI CẢM ƠN .iv TÓM TẮT KHOÁ LUẬN . v DANH SÁCH CÁC HÌNH x DANH SÁCH CÁC BẢNG xi DANH SÁCH CÁC TỪ VIẾT TẮT xii Phần 1. Mở đầu 1 1 . 1 . 2 . 2 1.2. Mục tiêu của khóa luận . 3 Phần 2. Tổng quan tài liệu 4 2.1. Giới thiệu về cây dứa . 4 4 . 4 . 5 . 5 . 5 . 5 2.1.3.4. Hoa . 5 . 6 6 6 2.1.4 6 . 6 . 7 7 8 . 8 9 9 vii . 10 . 11 11 2.2. Các Marker phân tử 12 2.2.1. Isozymes 12 2.2.2. ALP 12 2.2.3. AFLP 12 2.2.4. RAPD . 13 2.2.5. SSCP 14 2.2.6. SNP 14 2.2.7. SSR . 15 2.2.8. 15 2.2.9. RFLP 15 2.3. Chi tiết về microsatellite . 16 . 16 16 . 17 17 microsatellite 18 . 19 2.4. EST 19 . 19 . 20 2.5. Cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu . 20 . 20 2.5.2 21 2 21 21 . 23 23 23 . 24 25 25 viii 25 khai 25 2.6. Internet và Web . 26 . 26 26 . 26 . 28 . 28 . 28 28 2.7. Ngôn ngữ lập trình Perl và Javascript 28 . 28 2.7.1.1. T . 28 29 29 . 30 . 31 31 31 2.8. Cơ sở dữ liệu sinh học . 32 2.8.1. NCBI 32 . 32 . 33 . 33 Phần 3. Phƣơng pháp và chƣơng trình sử dụng . 35 3.1. Các chƣơng trình và ngôn ngữ lập trình đƣợc sử dụng 35 . 35 . 35 35 BLAST . 36 . 36 3.1.2.4. Apache web Server 37 3.2. Thu nhận trình tự SSRs 38 . 40 ix 3 . 41 3.3. Xây dựng CSDL, công cụ để giúp ngƣời dùng có thể khai thác tốt dữ liệu. 44 44 44 . 46 . 47 3.4. Thiết kế giao diện web để truy xuất thông tin tại cơ sở dữ liệu 47 3.5. Tích hợp các công cụ sinh học vào trang web . 48 Phần 4. Kết quả và thảo luận . 49 4.1. Kết quả thu nhận trình tự microsatellite 49 Ananas comosus 49 50 4.2. Xây dựng CSDL, công cụ để giúp ngƣời dùng có thể khai thác tốt dữ liệu . 51 Ananas comosus . 51 . 52 . 57 4.3. Trang web thể hiện thông tin cơ sở dữ liệu SSRs của Ananas comosus . 59 . 60 60 Ananas comosus (Ananas comosus PAGE) . 60 61 62 . 64 64 Phần 5. Kết luận và đề nghị 65 5.1. Kết luận 65 5.2. Đề nghị 65 Phần 6. Tài liệu tham khảo . 66 x DANH SÁCH CÁC HÌNH Hình Trang 2 . 3 - Red Spanish Cayenne 11 22 . 25 -DBI-DBD- 30 . 32 . 38 . 39 . 40 41 42 . 42 43 . 44 . 47 48 . 50 57 . 59 . 60 Ananas comosus 61 ESTs . 61 62 63 64 [...]... khóa luận Xây dựng cơ sở dữ liệu SSRs (Simple Sequence Repeats) từ ESTs (Expressed Sequence Tags) của cây dứa (Ananas comosus)” được thực hiện với các mục tiêu lần lượt như sau: Thu nhận trình tự SSR của cây dứa từ CSDL ESTs được lấy tại trang chính NCBI Hai là xây dựng CSDL và công cụ để giúp người dùng có thể khai thác tốt dữ liệu Ba là dùng giao diện web để truy xuất thông tin về cơ sở dữ liệu và... ưu tiên truy cập dữ liệu Phục hồi dữ liệu khi có sự cố 2.5.3 Các mô hình dữ liệu 2.5.3.1 Định nghĩa Mô hình dữ liệu là sự trừu tượng hóa thế giới thực, là sự biểu diễn dữ liệu mức quan niệm Mô hình dữ liệu được phân loại dựa trên các cách tiếp cận dữ liệu khác nhau của các nhà phân tích, thiết kế cơ sở dữ liệu Mô hình dữ liệu hoàn toàn độc lập giữa hệ thống máy tính và cấu trúc dữ liệu Hiện nay, có... phát triển ứng dụng và người dùng cuối Hệ quản trị cơ sở dữ liệu cung cấp một giao diện giữa người sử dụng và dữ liệu Hệ quản trị cơ sở dữ liệu biến đổi cơ sở dữ liệu vật lý thành cơ sở dữ liệu logic Hình 2 2 Sơ đồ một hệ quản trị cơ sở dữ liệu Dựa vào cách tổ chức dữ liệu, hệ quản trị cơ sở dữ liệu được chia thành năm loại: Loại phân cấp như hệ IMS của IBM Loại mạng như IDMS của Cullinet Software Loại... cơ sở dữ liệu tồn tại trong mỗi ứng dụng thông dụng Như vậy, các đặc tính của một cơ sở dữ liệu là: Tính nhất quán Tính toàn vẹn Tính tích hợp Tính chia sẻ Tính độc lập dữ liệu Tính an toàn Tính bảo mật 2.5.2.2 Hệ quản trị cơ sở dữ liệu Hệ quản trị cơ sở dữ liệu đầu tiên ra đời vào đầu những năm 60 dựa trên mô hình dữ liệu phân cấp và mô hình mạng Năm 1976 đánh dấu sự ra đời hệ quản trị cơ sở dữ liệu. .. năm loại mô hình dữ liệu chính Đó là: Mô hình dữ liệu mạng: thập niên 60-70 Mô hình dữ liệu phân cấp: thập niên 60-70 Mô hình dữ liệu quan hệ: thập niên 80 Mô hình dữ liệu thực thể kết hợp: thập niên 90 Mô hình dữ liệu hướng đối tượng: thập niên 90 2.5.3.2 So sánh các mô hình dữ liệu Sự ra đời của mô hình dữ liệu quan hệ đã khắc phục được những khó khăn khi thiết kế và quản lí cơ sở dữ liệu theo mô hình... hệ quản trị cơ sở dữ liệu và việc sử dụng loại này sớm trở nên phổ biến Hiện tại, loại hệ quản trị cơ sở dữ liệu chính được sử dụng trong công nghệ là loại hệ quản trị cơ sở dữ liệu quan hệ Loại này đã chiếm lĩnh trong công nghệ trên 10-15 năm cuối cùng khi đánh bật loại hệ quản trị cơ sở dữ liệu phân cấp và gần đây là hệ quản trị cơ sở dữ liệu mạng Hiện nay, một số hệ quản trị cơ sở dữ liệu mạnh đang... những đòi hỏi thông tin về cơ sở dữ liệu của người dùng thông qua dịch vụ web 2.5.4 Ngƣời dùng (User) Người dùng khai thác cơ sở dữ liệu thông qua hệ quản trị cơ sở dữ liệu có thể phân thành ba loại: người quản trị cơ sở dữ liệu, người phát triển ứng dụng và lập trình, người dùng cuối Người quản trị cơ sở dữ liệu, hàng ngày, chịu trách nhiệm quản lý và bảo trì cơ sở dữ liệu Người phát triển và lập trình... hệ quản trị cơ sở dữ liệu phải có khả năng giải quyết các vấn đề: 23 Tính chủ quyền của dữ liệu: đó là phải bảo đảm vấn đề an toàn dữ liệu và tính chính xác của dữ liệu Tính bảo mật và quyền khai thác thông tin của người sử dụng Tranh chấp dữ liệu: do có thể cùng một lúc có nhiều người cùng truy cập vào một nguồn tài nguyên dữ liệu với các mục đích khác nhau nên hệ quản trị cơ sở dữ liệu phải có cơ... (Database) và hệ quản trị cơ sở dữ liệu (Database Management System) 2.5.2.1 Định nghĩa cơ sở dữ liệu Cơ sở dữ liệu là một tập hợp dữ liệu được tổ chức theo một cấu trúc chặt chẽ nhằm phục vụ cho nhiều mục tiêu khác nhau một cách có chọn lọc, có tương quan, các mẫu tin và các cột Tập hợp dữ liệu sẽ được lưu trữ trên các thiết bị lưu trữ thông tin thứ cấp như băng từ, đĩa từ, … để thỏa mãn nhu cầu khai... truy vấn dữ liệu ở mức độ cao như SQL,… Do những ưu điểm trên cơ sở dữ liệu quan hệ ngày càng được sử dụng rộng rãi Tuy nhiên, trong một số trường hợp, mô hình quan hệ trở nên không thích hợp, nhất là khi sử dụng nó để thể hiện những dữ liệu có quan hệ cấu trúc như cây hệ thống sinh học đối với những loại dữ liệu loại này, sử dụng mô hình dữ liệu hướng đối tượng là thích hợp nhất Khi một cơ sở dữ liệu . TRẦN NGUYỄN MINH ĐĂNG XÂY DỰNG CƠ SỞ DỮ LIỆU SSRs (SIMPLE SEQUENCE REPEATS) TỪ ESTs (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus) . SINH HỌC ***000*** XÂY DỰNG CƠ SỞ DỮ LIỆU SSRs (SIMPLE SEQUENCE REPEATS) TỪ ESTs (EXPRESSED SEQUENCE TAGS) CỦA CÂY DỨA (Ananas comosus) Luận