Dự đoán và phân tích các trạng thái của histone trong chuỗi DNA bằng phương pháp conditional random fields

15 282 0
Dự đoán và phân tích các trạng thái của histone trong chuỗi DNA bằng phương pháp conditional random fields

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀNỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TRẦN ĐĂNG HƯNG DỰ ĐOÁN VÀ PHÂN TÍCH CÁC TRẠNG THÁI CỦA HISTONE TRONG CHUỖI DNA BẰNG PHƯƠNG PHÁP CONDITIONAL RANDOM FIELDS Chuyên ngành: Công Nghệ Thông Tin Mã số: 1.01.10 LUẬN VĂN THẠC SĨ NGƢỜI HƢỚNG DẪN KHOA HỌC GS.TSKH HỒ TÚ BẢO Hà nội – Năm 2006  Trường Đại học Công Nghệ - ĐHQGHN MỤC LỤC MỤC LỤC LỜI CẢM ƠN .5 DANH MỤC HÌNH VẼ DANH MỤC BẢNG DANH MỤC TỪ VIẾT TẮT MỞ ĐẦU .9 CHƢƠNG 1: GIỚI THIỆU CHUNG Error! Bookmark not defined 1.1 Các khái niệm Error! Bookmark not defined 1.1.1 Tin-sinh gì? Error! Bookmark not defined 1.1.2 DNA(deoxyribonucleic acid) Error! Bookmark not defined 1.1.3 RNA(ribonucleic acid) Error! Bookmark not defined 1.1.4 Protein Error! Bookmark not defined 1.2 Nucleosome Error! Bookmark not defined 1.2.1 Nucleosome gì? Error! Bookmark not defined 1.2.2 Sự choán chỗ nucleosome chuỗi DNAError! Bookmark not defined 1.2.3 Histone gì? Error! Bookmark not defined 1.2.4 Trạng thái thay đổi Histone Error! Bookmark not defined 1.3 Mục tiêu luận văn Error! Bookmark not defined  Luận văn tốt nghiệp cao học  Trường Đại học Công Nghệ - ĐHQGHN CHƢƠNG 2: MÔ HÌNH CONDITIONAL RANDOM FIELDError! Bookmark not defined 2.1 Giới thiệu Error! Bookmark not defined 2.2 Mô hình Markov ẩn Error! Bookmark not defined 2.2.1 Giới thiệu Error! Bookmark not defined 2.2.2 Bài toán gán nhãn cho liệu chuỗi Error! Bookmark not defined 2.2.3 Hạn chế mô hình Generative Error! Bookmark not defined 2.3 Mô hình Maximum Entropy Markov Error! Bookmark not defined 2.3.1 Giới thiệu Error! Bookmark not defined 2.3.2 Vấn đề Bias Error! Bookmark not defined 2.4 Mô hình Condition Random Field Error! Bookmark not defined 2.4.1 Mô hình đồ thị vô hƣớng Error! Bookmark not defined 2.4.2 Cấu trúc đồ thị CRFs Error! Bookmark not defined 2.4.3 Nguyên lý Maximum Entropy Error! Bookmark not defined 2.4.4 Hàm khả cho CRFs Error! Bookmark not defined 2.4.5 Một số thuật toán ƣớc lƣợng tham số cho CRFsError! Bookmark not defined CHƢƠNG 3: SỬ DỤNG MÔ HÌNH CRFs ĐỂ DỰ ĐOÁN SỰ CHIẾM CHỖ CỦA NUCLEOSOME VÀ TRẠNG THÁI THAY ĐỔI CỦA HISTONE TRONG CHUỖI DNA Error! Bookmark not defined 3.1 Bài toán Error! Bookmark not defined 3.1.1 Giới thiệu Error! Bookmark not defined 3.1.2 Phƣơng pháp thực nghiệm Error! Bookmark not defined 3.2 Dữ liệu Error! Bookmark not defined  Luận văn tốt nghiệp cao học  Trường Đại học Công Nghệ - ĐHQGHN 3.2.1 Dữ liệu thực nghiệm Error! Bookmark not defined 3.2.2 Chuyển liệu thực nghiệm liệu có nhãnError! Bookmark not defined 3.2.3 Huấn luyện kiểm thử với mô hình CRFs liệu chuẩn bị Error! Bookmark not defined CHƢƠNG 4: KẾT QUẢ VÀ THẢO LUẬN Error! Bookmark not defined 4.1 Kết Error! Bookmark not defined 4.1.1 Dự đoán choán chỗ nucleosome thay đổi trạng thái histone chuỗi DNA Error! Bookmark not defined 4.1.2 Tìm vùng chuỗi DNA ảnh hƣởng đến mức độ trạng thái khác Histone Error! Bookmark not defined 4.2 Thảo luận Error! Bookmark not defined 4.2.1 Dự đoán choán chỗ trạng thái thay đổi histone Error! Bookmark not defined 4.2.2 Phân tích vùng hữu ích chuỗi DNA ảnh hƣởng đến tính chất histone Error! Bookmark not defined KẾT LUẬN Error! Bookmark not defined 5.1 Nội dung luận văn Error! Bookmark not defined 5.1.1 Các kết đạt đƣợc Error! Bookmark not defined 5.1.2 Một số hạn chế cần khắc phục Error! Bookmark not defined 5.2 Công việc Error! Bookmark not defined PUBLICATION Error! Bookmark not defined TÀI LIỆU THAM KHẢO 11  Luận văn tốt nghiệp cao học  Trường Đại học Công Nghệ - ĐHQGHN LỜI CẢM ƠN Vui mừng hoàn thành luận văn, không quên công ơn thầy cô, bạn bè đồng nghiệp gia đình, người dạy bảo ủng hộ suốt trình học tập Trước hết muốn gửi lời cảm ơn đến thầy cô giáo trường Đại học Công Nghệ, Đại học Quốc gia Hà Nội Viện Công nghệ thông tin quan tâm tổ chức đạo trực tiếp giảng dạy khóa cao học Đặc biệt xin gửi lời cảm ơn sâu sắc đến thầy giáo hướng dẫn GS.TSKH Hồ Tú Bảo, người tận tình bảo góp ý chuyên môn cho suốt trình làm luận văn Ngoài ra, giúp đỡ thầy có hội thực tập sinh năm Viện Khoa học Công nghệ tiên tiến Nhật Bản (JAIST), nơi mà tiếp cận với môi trường nghiên cứu đại đầy đủ điều kiện để hoàn thành luận văn Đồng thời muốn gửi lời cảm ơn đến người thầy giáo cũ tôi, TS Phạm Thọ Hoàn, người giúp đỡ chuyên môn sống năm vừa qua Tôi xin chân thành cảm ơn GS Kenji Satou, chuyên gia lĩnh vực Tin-sinh học JAIST, cho góp ý quý báu thời gian thực tập sinh JAIST Cũng qua đây, xin chân thành cảm ơn lãnh đạo khoa Công nghệ Thông tin lãnh đạo trường Đại học Sư phạm Hà nội, nơi công tác, tạo điệu kiện thuận lợi cho thời gian làm nghiên cứu nước Cuối cùng, xin cảm ơn bố mẹ, vợ trai, người ủng hộ động viên để yên tâm nghiên cứu hoàn thành luận văn Tuy nhiên, thân bắt đầu đường nghiên cứu khoa học đầy thách thức, chắn luận văn nhiều thiếu sót Rất mong nhận góp ý thầy cô đồng nghiệp  Luận văn tốt nghiệp cao học  Trường Đại học Công Nghệ - ĐHQGHN DANH MỤC HÌNH VẼ Hình Cấu trúc xoắn kép DNA 12 Hình Một phân tử tRNA 14 Hình Các dạng cấu trúc protein 15 Hình Cấu tạo nucleosome 16 Hình Cấu trúc đóng gói chuỗi DNA tạo thành nhiễm sắc thể 17 Hình Các nucleosome liên tiếp đƣợc nối linker DNA 18 Hình Cấu tạo histone octamer 19 Hình Các protein có nhân histone 20 Hình Cấu trúc chi tiết nhân histone 20 Hình 10 Các vị trí đuôi histone đính thêm nhóm chức 22 Hình 11 Cấu trúc đồ thị HMM bậc Error! Bookmark not defined Hình 12 Cấu trúc đồ thị mô hình MEMM bậc 1.Error! Bookmark not defined Hình 13 Một ví dụ vấn đề bias Error! Bookmark not defined Hình 14 Cấu trúc đồ thị CRFs cho trƣờng hợp chuỗi.Error! Bookmark not defined Hình 15 Lƣợc đồ phƣơng pháp ChIP-chip [21] Error! Bookmark not defined Hình 16 Chuyển liệu định lƣợng liệu định tính.Error! Bookmark not defined Hình 17 Tạo liệu có nhãn từ liệu gene loài Yeast liệu định tính Error! Bookmark not defined Hình 18 Biểu diễn dãy DNA dƣới dạng vector (với k = 3).Error! Bookmark not defined  Luận văn tốt nghiệp cao học  Trường Đại học Công Nghệ - ĐHQGHN Hình 19 Dữ liệu có nhãn Gồm vector biểu diễn chuỗi DNA nhãn tƣơng ứng Error! Bookmark not defined Hình 20 Biểu diễn gene thành chuỗi quan sát p1,p2,p3,p4 vị trí đƣợc đo gene x1, x2, x3, x4 quan sát biểu diễn đoạn DNA chứa vị trí tƣơng ứng Error! Bookmark not defined DANH MỤC BẢNG Bảng Một số kiểu trạng thái histone Chữ ngoặc kí hiệu thay cho amino acid tƣơng ứng Error! Bookmark not defined Bảng Một số vị trí thay đổi trạng thái histone biết.Error! Bookmark not defined Bảng Danh sách kháng thể [27] Error! Bookmark not defined Bảng Các trƣờng file liệu thực nghiệm Error! Bookmark not defined Bảng Dữ liệu thực nghiệm [27] Error! Bookmark not defined Bảng Các tập liệu choán chỗ histone, acetyl hóa Error! Bookmark not defined Bảng Kết dự đoán khả choán chỗ, acetyl hóa, methyl hóa histone, với kích thƣớc cửa sổ k = 4, k = k = Error! Bookmark not defined Bảng Kết dự đoán khả choán chỗ, acetyl hóa, methyl hóa histone, với kích thƣớc cửa sổ k = 7; k = 4,5 k = 5,6 Error! Bookmark not defined Bảng Một số feature hữu ích cho lớp positive đƣợc chọn từ mô hình CRFs, trƣờng hợp k = k = T.số: trọng số feature tƣơng ứng sau huấn luyện mô hình CRFs Error! Bookmark not defined  Luận văn tốt nghiệp cao học  Trường Đại học Công Nghệ - ĐHQGHN Bảng 10 Một số feature hữu ích cho lớp negative đƣợc chọn từ mô hình CRFs, trƣờng hợp k = k = T.số: trọng số feature tƣơng ứng sau huấn luyện mô hình CRFs Error! Bookmark not defined  Luận văn tốt nghiệp cao học  Trường Đại học Công Nghệ - ĐHQGHN DANH MỤC TỪ VIẾT TẮT Cụm từ viết tắt Cụm từ chi tiết KPDL Khai phá liệu CRFs Conditional Random Fields HMM Hidden Markov Model MEMM Maximum Entropy Markov Model ME Maximum Entropy SVM Support Vector Machine  Luận văn tốt nghiệp cao học  Trường Đại học Công Nghệ - ĐHQGHN MỞ ĐẦU Trong vài thập niên gần toán khai phá liệu trở thành hƣớng nghiên cứu quan trọng lĩnh vực khoa học máy tính trí tuệ nhân tạo Điều dễ hiểu khối lƣợng liệu mà ngƣời có lớn nhƣng việc tìm liệu có ích lại vấn đề khó Trƣớc ngƣời ta thƣờng dùng phƣơng pháp thực nghiệm kinh nghiệm ngƣời để rút tri thức có nghĩa khối lƣợng liệu khổng lồ Có nhiều nghiên cứu đề xuất đƣợc ứng dụng đời sống khẳng định hƣớng nghiên cứu bền lâu có ý nghĩa thực tiễn lớn Khai phá liệu đƣợc hiểu cách đơn giản từ liệu có, phƣơng pháp tính toán khoa học trích rút liệu có ích ngƣời Các kỹ thuật đƣợc áp dụng lĩnh vực đƣợc kế thừa từ nhiều lĩnh vực khác nhƣ: Cơ sở liệu, học máy (machine learning), trí tuệ nhân tạo (artificial intelligence), lý thuyết thông tin (information theory), xác suất thống kê (probability and statistics) Cho đến nay, phƣơng pháp khai phá liệu đƣợc áp dụng nhiều lĩnh vực khác nhƣ xử lý ngôn ngữ tự nhiên, xử lý tiếng nói, tin-sinh học, … Dữ liệu sinh học giới ngày nhiều đa dạng, việc phân tích xử lý khối liệu khổng lồ cần phải sử dụng đến công cụ khai phá liệu hiệu Vì thế, thập niên gần xuất ngành khoa học có tên tin-sinh học Dù đời nhƣng tin-sinh học có vai trò quan trọng sống, nhƣ hỗ trợ việc chẩn đoán bệnh tật, tìm mối quan hệ di truyền loài sinh vật hay phát chức đại phân tử sinh học phân tử,… Trong tìm hiểu toán lĩnh vực tin-sinh học, phát vị trí, cấu tạo trạng thái histone chuỗi DNA ảnh hƣởng đến tiến trình sinh học tế bào Đã có nhiều nghiên cứu trƣớc nghiên  Luận văn tốt nghiệp cao học 10  Trường Đại học Công Nghệ - ĐHQGHN cứu vấn đề này, nhƣng nghiên cứu thực nghiệm Trong luận văn này, áp dụng phƣơng pháp tính toán để dự đoán choán chỗ nucleosome trạng thái thay đổi chuỗi DNA Chúng sử dụng mô hình Conditional Random Fields (CRFs), mô hình xác suất điều kiện đƣợc đánh giá hiệu nhiều lĩnh vực khác Ngoài ra, dựa vào mô hình này, phân tích đƣợc nhiều đặc trƣng quan trọng chuỗi DNA liên quan đến dấu hiệu trình thể gene Ngoài phần mở đầu kết luận, luận văn đƣợc chia làm chƣơng, cụ thể nội dung chƣơng nhƣ sau: Chương trình bày khái niệm chung sinh học phân tử Giải thích cấu tạo chức đại phân tử sinh học Mục đích chƣơng nhằm làm rõ khái kiệm liên quan đến toán mà luận văn đề cập Chương giới thiệu mô hình CRFs toán phân đoạn gán nhãn Trƣớc trình bày định nghĩa cấu tạo mô hình CRFs trình bày ngắn gọn mô hình trƣớc nhƣ mô hình Markov ẩn (HMM), mô hình Maximum Entropy Markov (MEMM) hạn chế mô hình Chương áp dụng mô hình CRFs vào toán dự đoán choán chỗ nucleosome trạng thái thay đổi histone chuỗi DNA Phần đầu chƣơng trình bày nội dung toán, yêu cầu cần đạt đƣợc Phần trình bày nghiên cứu thực nghiệm phần cuối trình bày cách chuyển từ liệu thực nghiệm liệu có nhãn áp dụng mô hình CRFs để huấn luyện kiểm thử tập liệu chuẩn bị Chương trình bày kết thu đƣợc sau áp dụng mô hình CRFs vào toán mô tả chƣơng Trong chƣơng này, trình bày nhận xét đánh giá kết so với nghiên cứu trƣớc  Luận văn tốt nghiệp cao học 11  Trường Đại học Công Nghệ - ĐHQGHN TÀI LIỆU THAM KHẢO Tiếng Việt Hồ Huỳnh Thùy Dƣơng (2003), Sinh học phân tử, NXB Giáo dục Nguyễn Tiến Thắng, Nguyễn Đình Huyên (1998), Giáo trình sinh hóa đại, NXB Giáo dục Tiếng Anh Alberts B et al (2002), Molecular Biology of the CELL, 4th edition, Gerland Science Publishing Ben B., Robert F., and et al (2000), “Genome-wide location and function of DNA binding proteins”, Science, 290(500) , pp.2306-2309 Berger S.L (2002), “Histone modifications in transcriptional regulation”, Curr Opin Genet Dev., (12), pp.142-148 Bernstein B.E., Humphrey E.L., Erlich R.L and Schreiber S.L (2002), “Methylation of histone H3 Lys in coding regions of active genes”, Pro Natl Acad Sci USA Bernstein B.E.,Liu C.L., Humphrey E.L and Schreuber S.L (2004), “Global nucleosome occupancy in yeast”, Genome Biology, 5(9),R62 Boeger H., Griesenbeck J., Strattan J.S., and Kornberg R.D (2003), “Nucleosomes unfold completely at a transcriptionally active promoter”, Mol.Cell 11,pp.1587-1598 Culotta A, Kulp D and McCallum A (2005), “Gene Prediction with Conditional Random Fields”, Techical Report IR-443, University of Massachusetts 10 Darroch J and Ratcliff D (1972), “Generalized iterative scaling”, The Annals of Mathematical Statistics, (43), pp.1470-1480  Luận văn tốt nghiệp cao học 12  Trường Đại học Công Nghệ - ĐHQGHN 11 Deckert J and Struhl K (2001), “Histone acetylation at promoters is differentially affected by specific activators and repressors”, Mol Cell Biol.,( 21),pp 2726-2735 12 Della S., Della V., and Lafferty J (1997), “Inducing features of random fields”, IEEE transaction on pattern analysis and machine intelligence models, 19(4), pp 380-393 13 Feng Q., Wang H, Ng H.H., Tempst P., Struhl K., Zhang Y (2002), “Methylation of H3-Lysine 79 is Mediated by a New Family of HMTases without a SET Domain”, Current Biology, 12(2), pp.10521058 14 Kouzarides T (2002), “Histone methylation in transcriptional control”, Curr Opin Genet Dev., 12(2), pp.198-209 15 Kurdistani S.K., Tavazoie S., and Grunstein M (2004), “Mapping global histone acetylation patterns to gene expression”, Cell, 117(6), pp.721-733 16 Lafferty L., McCallum A and Fereia F (2001), “Conditional Random Fields: Probabilistic Models for Segmenting and Labelling Seqence Data”, Proc International Conference on Machine Learning 17 Lee C.K., Shibata Y., Rao B., Strahl B.D, and Lieb J.D (2004), “Evidence for nucleosome depletion at active regulatory regions genome-wide”, Nat Genet., 36(8), pp.900-905 18 Luger K., Mader A.W., Richmond R.K., Sargent D.F., and Richmond T.J (1997), “Crystal structure of the nucleosome core particle at 2.8 A resolution”, Nature, 389(6648), pp.251-260 19 McCallum A (2003), “Efficiently Inducing Features of Conditional Random Fields”, Proc Uncertainty in Artifical Intelligence 20 McCallum A and Pereira F (2000), “Maximum Entropy Markov Models for Information Extraction and Segmentation”, Proc International Conference on Machine Learning 21 Michael J.B.,Jason D.L.(2004), “ChIP-chip: Considerstions for the  Luận văn tốt nghiệp cao học 13  Trường Đại học Công Nghệ - ĐHQGHN design, analysis, and application of genome-wide chromatin immunoprecipitation experiments”, Genomic (83), pp.249-360 22 Mitchell T (1997), Machine Learning, McGraw-Hill, Singapo 23 Nagy P., Cleary M.L., Brown P.O Leib J.D (2003), “Genomewide demarcation of RNA polymerase II transcription units revealed by physical fractionation of chromatin”, PNAS, 100(11), pp.6364-6369 24 Narlikar G.J., Fan H.Y., and Kingston R.E (2002), “Cooperation between complexes that regulate chromatin structure and transcription”, Cell, 108(4), pp.475-487 25 Peterson C.L., and Laniel M.A (2004), “Histones and histone modifications”, Curr Biol., 14(14), pp.:546-551 26 Pham T.H., Tran D.H., Ho T.B., Satou K and Valiente G (2005), “Qualitatively predicting acetylation and methylation areas in DNA sequences”, Genome informatics, 16(2), pp.3-11 27 Pokholok D.K, Harbison C.T, Levine S., Cole M., Hannett N.M, Lee T.I., Bell G.W., Walker K., Rolfe P.A., Herbolsheimer E., Zeitlinger J., Lewitter F., Gifford D.K., and Young R.A (2005), “Genome-wide map of nucleosome acetylation and methylation in yeast”, Cell, 122(4), pp.517-527 28 Rabiner L.R (1989), “A tutorial on hidden markov models and selected applications in speech recognition”, Proceedings of IEEE, pp.257-286 29 Robert F., Pokholok D.K, Hannett N.M., Rinaldi N.J., Chandy M., Rolfe A., Workman J.L., Gifford D.K and Young R.A (2004), “Global position and recruitment of HATs and HDACs in the yeast genome”, Mol.Cell, (16),pp.199-209 30 Robyr D Suka Y., Xenarios I., Kurdistani S.K., Wang A., Suka N., and Grunstein M (2002), “Microarray deacetylation maps determine genome-wide functions for yeast histone deacetylaces”, Cell, 109(4), pp.437-446 31 Roh T.Y, Ngau W.C., Cui K., Landsman D., and Zhao K (2004),  Luận văn tốt nghiệp cao học 14  Trường Đại học Công Nghệ - ĐHQGHN “High-resolution genome-wide mapping of histone modifications”, Nat Biotechnol (22), pp.1013-1016 32 Schubeler D., MacAlpine D.M., Scalzo D., Wirbelauer C., Kooperberg C and et al (2004), “The histone modifications patterns of active genes revealed through genome-wide chromatin analysis of a higher eukaryote”, Genes Dev (18), pp.1263-1271 33 Sha F and Pereira F (2003), “Shallow Parsing with Conditional Random Fields”, Proc International Conference on Machine Learning 34 Tran D.H, Pham T.H., Satou K and Ho T.B (2006), “Conditional Random Fields for Predicting and Analyzing Histone Occupancy, Acetylation and Methylation Areas in DNA Sequences”, 4th European Workshop on Evolutionary Computation and Machine Learning in Bioinformatics, Budapest, 10-12 April, Lecture Notes in Computer Science, LNCS 3907, Springer, pp.221-230 35 Wallach H (2002), Efficient Training of Conditional Random Fields, Master thesis on Computer Science, University of Edinburgh 36 http://www.ece.northwestern.edu/~nocedal/lbfgs.html 37 http://crf.sourceforge.net/ 38 http://www.jaist.ac.jp/~hieuxuan/flexcrfs/flexcrfs.html  Luận văn tốt nghiệp cao học 15 [...]... nhƣng đều là các nghiên cứu thực nghiệm Trong luận văn này, chúng tôi áp dụng một phƣơng pháp tính toán để dự đoán sự choán chỗ của nucleosome và các trạng thái thay đổi của nó trong chuỗi DNA Chúng tôi đã sử dụng mô hình Conditional Random Fields (CRFs), một mô hình xác suất điều kiện đƣợc đánh giá là hiệu quả trong nhiều lĩnh vực khác nhau Ngoài ra, dựa vào mô hình này, chúng tôi còn phân tích đƣợc... CRFs đối với bài toán phân đoạn và gán nhãn Trƣớc khi trình bày định nghĩa và cấu tạo của mô hình CRFs chúng tôi đã trình bày ngắn gọn về các mô hình trƣớc đó nhƣ mô hình Markov ẩn (HMM), mô hình Maximum Entropy Markov (MEMM) và hạn chế của các mô hình này Chương 3 áp dụng mô hình CRFs vào bài toán dự đoán sự choán chỗ của nucleosome và các trạng thái thay đổi của histone trong chuỗi DNA Phần đầu chƣơng... tích đƣợc nhiều đặc trƣng quan trọng của chuỗi DNA liên quan đến các dấu hiệu của quá trình thể hiện gene Ngoài phần mở đầu và kết luận, luận văn đƣợc chia làm 4 chƣơng, cụ thể nội dung các chƣơng nhƣ sau: Chương 1 trình bày các khái niệm chung của sinh học phân tử Giải thích cấu tạo cơ bản và chức năng của các đại phân tử sinh học Mục đích của chƣơng này nhằm làm rõ các khái kiệm liên quan đến bài toán... của bài toán, các yêu cầu cần đạt đƣợc Phần tiếp theo trình bày các nghiên cứu thực nghiệm và phần cuối trình bày cách chuyển từ dữ liệu thực nghiệm về dữ liệu có nhãn và áp dụng mô hình CRFs để huấn luyện và kiểm thử trên các tập dữ liệu đã chuẩn bị Chương 4 trình bày các kết quả thu đƣợc sau khi áp dụng mô hình CRFs vào bài toán đã mô tả trong chƣơng 3 Trong chƣơng này, chúng tôi cũng trình bày các. .. Genes Dev (18), pp.1263-1271 33 Sha F and Pereira F (2003), “Shallow Parsing with Conditional Random Fields , Proc International Conference on Machine Learning 34 Tran D.H, Pham T.H., Satou K and Ho T.B (2006), Conditional Random Fields for Predicting and Analyzing Histone Occupancy, Acetylation and Methylation Areas in DNA Sequences”, 4th European Workshop on Evolutionary Computation and Machine Learning... and McCallum A (2005), “Gene Prediction with Conditional Random Fields , Techical Report IR-443, University of Massachusetts 10 Darroch J and Ratcliff D (1972), “Generalized iterative scaling”, The Annals of Mathematical Statistics, (43), pp.1470-1480  Luận văn tốt nghiệp cao học 12  Trường Đại học Công Nghệ - ĐHQGHN 11 Deckert J and Struhl K (2001), Histone acetylation at promoters is differentially... transcriptional control”, Curr Opin Genet Dev., 12(2), pp.198-209 15 Kurdistani S.K., Tavazoie S., and Grunstein M (2004), “Mapping global histone acetylation patterns to gene expression”, Cell, 117(6), pp.721-733 16 Lafferty L., McCallum A and Fereia F (2001), Conditional Random Fields: Probabilistic Models for Segmenting and Labelling Seqence Data”, Proc International Conference on Machine Learning 17 Lee... hình CRFs vào bài toán đã mô tả trong chƣơng 3 Trong chƣơng này, chúng tôi cũng trình bày các nhận xét và đánh giá về các kết quả so với các nghiên cứu trƣớc đây  Luận văn tốt nghiệp cao học 11  Trường Đại học Công Nghệ - ĐHQGHN TÀI LIỆU THAM KHẢO Tiếng Việt 1 Hồ Huỳnh Thùy Dƣơng (2003), Sinh học phân tử, NXB Giáo dục 2 Nguyễn Tiến Thắng, Nguyễn Đình Huyên (1998), Giáo trình sinh hóa hiện đại, NXB... Ben B., Robert F., and et al (2000), “Genome-wide location and function of DNA binding proteins”, Science, 290(500) , pp.2306-2309 5 Berger S.L (2002), Histone modifications in transcriptional regulation”, Curr Opin Genet Dev., (12), pp.142-148 6 Bernstein B.E., Humphrey E.L., Erlich R.L and Schreiber S.L (2002), “Methylation of histone H3 Lys 4 in coding regions of active genes”, Pro Natl Acad Sci USA... Sargent D.F., and Richmond T.J (1997), “Crystal structure of the nucleosome core particle at 2.8 A resolution”, Nature, 389(6648), pp.251-260 19 McCallum A (2003), “Efficiently Inducing Features of Conditional Random Fields , Proc Uncertainty in Artifical Intelligence 20 McCallum A and Pereira F (2000), “Maximum Entropy Markov Models for Information Extraction and Segmentation”, Proc International Conference

Ngày đăng: 11/11/2016, 22:56

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan