Nghiên cứu phát triển các kỹ thuật tự động tóm tắt văn bản tiếng việt

168 417 2
Nghiên cứu phát triển các kỹ thuật tự động tóm tắt văn bản tiếng việt

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ NGUYỄN NHẬT AN NGHIÊN CỨU, PHÁT TRIỂN CÁC KỸ THUẬT TỰ ĐỘNG TÓM TẮT VĂN BẢN TIẾNG VIỆT LUẬN ÁN TIẾN SĨ TOÁN HỌC HÀ NỘI – 2015 BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ NGUYỄN NHẬT AN NGHIÊN CỨU, PHÁT TRIỂN CÁC KỸ THUẬT TỰ ĐỘNG TÓM TẮT VĂN BẢN TIẾNG VIỆT Chuyên ngành : Cơ sở toán học cho tin học Mã số : 62 46 01 10 LUẬN ÁN TIẾN SĨ TOÁN HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: TSKH NGUYỄN QUANG BẮC PGS.TS NGUYỄN ĐỨC HIẾU HÀ NỘI - 2015 i LỜI CAM ĐOAN Tôi cam đoan công trình nghiên cứu riêng Các số liệu, kết luận án trung thực chưa công bố công trình khác Tác giả Nguyễn Nhật An ii LỜI CẢM ƠN Luận án thực Viện Công nghệ thông tin - Viện Khoa học Công nghệ quân - Bộ Quốc phòng, hướng dẫn khoa học Thiếu tướng, TSKH Nguyễn Quang Bắc Đại tá PGS.TS Nguyễn Đức Hiếu Trước tiên xin bày tỏ lòng biết ơn sâu sắc tới tập thể giáo viên hướng dẫn, người đưa đến với lĩnh vực nghiên cứu Các thầy tận tình giảng dạy, hướng dẫn giúp tiếp cận đạt thành công nghiên cứu mình; tận tâm động viên, khuyến khích dẫn giúp hoàn thành luận án Tôi xin bày tỏ lòng biết ơn tới Đảng uỷ, ban lãnh đạo, cán Phòng Quản trị Cơ sở liệu - Viện Công nghệ thông tin Phòng Đào tạo - Viện Khoa học Công nghệ quân sự, tạo điều kiện thuận lợi giúp đỡ trình học tập nghiên cứu đơn vị Tôi xin cảm ơn PGS.TS Đào Thanh Tĩnh, TS Nguyễn Phương Thái, TS Nguyễn Thị Thu Hà, TS Đỗ Đức Đông TS Ngôn ngữ học Phan Thị Nguyệt Hoa chia sẻ tài liệu kinh nghiệm nghiên cứu Cuối cùng, tác giả xin chân thành cảm ơn thành viên Gia đình, người dành cho tác giả tình cảm nồng ấm sẻ chia lúc khó khăn sống, động viên giúp đỡ tác giả trình nghiên cứu Luận án quà tinh thần mà tác giả trân trọng gửi tặng đến thành viên Gia đình iii MỤC LỤC Trang DANH MỤC CÁC KÍ HIỆU, CÁC CHỮ VIẾT TẮT vi DANH MỤC CÁC BẢNG viii DANH MỤC CÁC HÌNH VẼ, THUẬT TOÁN x MỞ ĐẦU CHƯƠNG TỔNG QUAN VỀ TÓM TẮT VĂN BẢN VÀ TÓM TẮT VĂN BẢN TIẾNG VIỆT 1.1 Giới thiệu tóm tắt văn 1.1.1 Các giai đoạn tham số hệ thống tóm tắt văn 10 1.1.2 Phân loại hệ thống tóm tắt văn 12 1.2 Các phương pháp đánh giá tóm tắt văn 14 1.2.1 Đánh giá thủ công 15 1.2.2 Đánh giá đồng chọn 15 1.2.3 Đánh giá dựa nội dung 17 1.2.4 Đánh giá dựa tác vụ 19 1.3 Các hướng tiếp cận tóm tắt văn nước 20 1.3.1 Các phương pháp tóm tắt trích rút 20 1.3.2 Các phương pháp tóm tắt theo hướng tóm lược 23 1.4 Kho ngữ liệu tiêu chuẩn cho toán tóm tắt văn tiếng Anh 23 1.5 Hiện trạng nghiên cứu tóm tắt văn tiếng Việt 24 1.5.1 Đặc điểm tiếng Việt 24 1.5.2 Hiện trạng nghiên cứu xử lý ngôn ngữ tự nhiên tiếng Việt 27 1.5.3 Một số hướng tiếp cận tóm tắt văn tiếng Việt 28 1.5.4 Hiện trạng kho ngữ liệu huấn luyện đánh giá cho toán tóm tắt văn tiếng Việt 31 1.5.5 Đặc điểm phương pháp tóm tắt văn tiếng Việt .32 1.6 Các kiến thức sở liên quan 32 1.6.1 Giải thuật di truyền 32 iv 1.6.2 Giải thuật tối ưu đàn kiến 34 1.6.3 Phương pháp Voting Schulze 36 1.7 Kết luận Chương 39 CHƯƠNG TÓM TẮT VĂN BẢN TIẾNG VIỆT DỰA TRÊN BỘ HỆ SỐ ĐẶC TRƯNG 40 2.1 Mô hình tóm tắt văn tiếng Việt dựa hệ số đặc trưng 40 2.1.1 Quy trình tóm tắt văn theo hướng trích rút 40 2.1.2 Mô hình tóm tắt văn dựa hệ số đặc trưng 42 2.2 Lựa chọn tập đặc trưng cho văn tiếng Việt 43 2.2.1 Ví trí câu 44 2.2.2 Trọng số TF.ISF 45 2.2.3 Độ dài câu .46 2.2.4 Xác suất thực từ .47 2.2.5 Thực thể tên 48 2.2.6 Dữ liệu số 49 2.2.7 Tương tự với tiêu đề .51 2.2.8 Câu trung tâm 51 2.3 Xác định hệ số đặc trưng phương pháp học máy 52 2.3.1 Đặt toán .52 2.3.2 Xác định hệ số giải thuật di truyền 54 2.3.3 Xác định hệ số giải thuật tối ưu đàn kiến 61 2.4 Các kết thử nghiệm 68 2.4.1 Kho ngữ liệu thử nghiệm 68 2.4.2 Phương pháp đánh giá kết tóm tắt .68 2.4.3 Các kết thử nghiệm 69 2.4.4 Nhận xét kết thử nghiệm 78 2.5 Kết luận Chương 79 CHƯƠNG TÓM TẮT VĂN BẢN TIẾNG VIỆT SỬ DỤNG KỸ THUẬT VOTING 81 3.1 Mô hình tóm tắt văn sử dụng kỹ thuật Voting 81 v 3.1.1 Xác định hệ số phương pháp phương pháp học máy 85 3.1.2 Mô hình tóm tắt văn tiếng Việt sử dụng kỹ thuật Voting 89 3.2 Các kết thử nghiệm 91 3.2.1 Kho ngữ liệu thử nghiệm 91 3.2.2 Phương pháp đánh giá kết tóm tắt .92 3.2.3 Lựa chọn phương pháp tóm tắt văn đầu vào 92 3.2.4 Các kết thử nghiệm 94 3.2.5 Nhận xét kết thử nghiệm 97 3.3 Kết luận Chương 99 CHƯƠNG QUY TRÌNH XÂY DỰNG KHO NGỮ LIỆU CÓ CHÚ GIẢI CHO BÀI TOÁN TÓM TẮT VĂN BẢN TIẾNG VIỆT 101 4.1 Đặt vấn đề 101 4.2 Quy trình xây dựng kho ngữ liệu có giải 102 4.2.1 Mô hình đề xuất 102 4.2.2 Thu thập 102 4.2.3 Xây dựng tóm tắt người 104 4.2.4 Chú giải, cấu trúc hoá lưu trữ 105 4.2.5 Tổ chức quản lý, lưu trữ 108 4.3 Phương pháp đánh giá kho ngữ liệu 108 4.3.1 Đánh giá dựa vào độ đo đồng xuất thực từ 109 4.3.2 Đánh giá thủ công 109 4.4 Kết luận Chương 110 KẾT LUẬN 111 DANH MỤC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ 113 TÀI LIỆU THAM KHẢO 115 PHỤ LỤC 01: KHO NGỮ LIỆU VIEVTEXTSUM PHỤ LỤC 02: KHO NGỮ LIỆU CORPUS_LTH PHỤ LỤC 03: THỬ NGHIỆM vi DANH MỤC CÁC KÍ HIỆU, CÁC CHỮ VIẾT TẮT 𝑑 văn 𝐷 tập văn huấn luyện (gốc) 𝑚 số văn huấn luyện 𝑆𝐻 tập văn tóm tắt hệ thống 𝑠ℎ văn hệ thống tóm tắt 𝑠 câu văn 𝑎 tỷ lệ tóm tắt 𝑓 tập đặc trưng văn 𝑝 tập phương pháp tóm tắt văn 𝑘 tập hệ số đặc trưng phương pháp 𝑆𝑐𝑜𝑟𝑒(𝑠) giá trị trọng số câu s 𝑆𝑖𝑚(𝑠1 , 𝑠2 ) Hàm tính độ tương tự văn 𝑠1 𝑠2 𝐹(𝑘) Hàm thích nghi (mục tiêu) theo hệ số k 𝐺 𝑚𝑎𝑥 số vòng lặp (điều kiện dừng) ACO Tối ưu đàn kiến (Ant Colony Optimization) AS Tóm tắt tóm lược (Abstraction Summarization) CRF Miền ngẫu nhiên điều kiện (Conditional Random Field) CSSD Cloneproof Schwartz Sequential Dropping EA Giải thuật tiến hóa (Evolutionary Algorithm) ES Tóm tắt trích rút (Extraction Summarization) GA Giải thuật di truyền (Genetic Algorithm) GP Lập trình di truyền (Genetic Programming) HMM Mô hình Markov ẩn (Hidden Markov Model) LCS Chuỗi chung dài (Longest Common Subsequence) LSA Phân tích ngữ nghĩa tiềm ẩn (Latent Semantic Analysis) MEM Mô hình cực đại hóa Entropy (Maximum Entropy Model) vii NLP Xử lý ngôn ngữ tự nhiên (Natural Language Processing) NMF Phép nhân tử hóa ma trận không âm (Non-negative Matrix Factorization) PGA Giải thuật di truyền song song (Parallel Genetic Algorithms) ROUGE Độ đo đánh giá độ tương tự văn (Recall-Oriented Understudy for Gisting Evaluation) RST Lý thuyết cấu trúc tu từ (Rhetorical Structure Theory) SDD Khai triển ma trận nửa rời rạc (Semi-discrete Matrix Decomposition) SSD Schwartz Sequential Dropping SVD Phương pháp phân tích giá trị đơn (Singular Value Decomposition) SVM Máy vector hỗ trợ (Support Vector Machine) TF Tần suất thuật ngữ (Term Frequency) TF.ISF Tần suất từ - nghịch đảo tần suất câu (Term frequency- inverse sentence frequency) TTVB Tóm tắt văn TTĐVB Tóm tắt đơn văn n-gram Mô hình ngôn ngữ n-gram [81] unigram Mô hình n-gram với gram từ (1-gram) Voting Bầu chọn Vietworknet Mạng từ tiếng Việt Wordnet Mạng từ viii DANH MỤC CÁC BẢNG Bảng 1-1 Kết thử nghiệm đề tài “Nghiên cứu số phương pháp tóm tắt văn tự động máy tính áp dụng cho tiếng Việt” 30 Bảng 2-1 Kết khảo sát vị trí câu quan trọng kho ngữ liệu tiếng Việt 45 Bảng 2-2 Kết phân bố thực thể tên văn tóm tắt mẫu 49 Bảng 2-3 Kết phân bố thực thể tên câu văn gốc 49 Bảng 2-4 Kết phân bố liệu số văn tóm tắt mẫu 50 Bảng 2-5 Kết phân bố liệu số câu văn gốc 50 Bảng 2-6 Kết tóm tắt đặc trưng kho ngữ liệu Corpus_LTH 70 Bảng 2-7 Kết tóm tắt đặc trưng kho ngữ liệu ViEvTextSum 71 Bảng 2-8 Kết mô hình VTS_FC_GA dựa đặc trưng 73 Bảng 2-9 Kết mô hình VTS_FC_GA dựa đặc trưng 73 Bảng 2-10 Lựa chọn thông số cho thuật toán ACO 74 Bảng 2-11 Kết thử nghiệm mô hình VTS_FC_ACO dựa đặc trưng thường dùng 75 Bảng 2-12 Kết tóm tắt mô hình VTS_FC_ACO d ựa đặc trưng 76 Bảng 2-13 Kết tóm tắt mô hình VTS_FC_ACO lĩnh vực kho ngữ liệu ViEvTextSum 77 Bảng 2-14 Bảng tổng kết kết tóm tắt mô hình 78 Bảng 3-1 Ví dụ mô tả cách tính Score_Method(s) 83 Bảng 3-2 Bảng thống kê đặc trưng phương pháp đầu vào 92 Bảng 3-3 Kết tóm tắt phương pháp đầu vào 93 Bảng 3-4 Kết tóm tắt mô hình sử dụng kỹ thuật Voting hệ số phương pháp 94 Bảng 3-5 Kết tóm tắt mô hình sử dụng kỹ thuật Voting với hệ số phương pháp kho ngữ liệu Corpus_LTH 96 Bảng 3-6 Kết tóm tắt mô hình sử dụng kỹ thuật Voting với hệ số P -20- quanh gần thành rau cải rau sắn thích yêu_thích riêng riêng văn_hoá rộng_lớn hay rượu sắn muối sinh_hoạt sinh_sống sông sống lối suối nhỏ tang ma tất_cả tép rau tiết bò tìm_hiểu tìm_hiểu tính_cách lối toát lên tộc_người nói_chung tới nét tục uống thành thành thích ăn thích bày thích_hợp vị thịt bò thịt trâu thung_lũng có thức uống thức_ăn có thường dùng thường sinh_sống trâu tiết trâu thịt triền núi cách P -21- trong năm trong tất_cả văn_hoá truyền_thống uống rượu uống văn_hoá vào mùa văn_hoá ẩm_thực văn_hoá văn_hoá văn_hoá mường văn_hoá riêng văn_hoá rượu_cần văn_hoá toát vị cay vị chua vị đắng vị mà vị ớt với cá với vị xào_nấu yêu_thích gắn ROUGE-3 = 0,76 3-gram tóm tắt lý tưởng 3-gram tóm tắt hệ thống ăn riêng ăn như_thế_nào người ăn ăn riêng ăn thức uống ăn thức uống ăn thức_ăn có ăn thức_ăn có ẩm_thực mường ăn vào mùa ẩm_thực mường tục ẩm_thực mường cách họ ăn ẩm_thực mường tục cay người mường bao quanh gần có ớt bao_la rộng_lớn hay có vị chua bày cỗ riêng bểu chau vị bò ăn vào chua vị đắng bò bểu đắng bữa cỗ cộng_đồng đến ẩm_thực mường cá đồng muối P -22đúng thành gắn với vị họ ăn nói tới vị mà lên mà người mường người_mường ăn ăn thức ớt nổi_tiếng ăn nét văn_hoá mường có mường nói mường yêu_thích mường tục uống người_mường sáng_tạo nét văn_hoá riêng nét văn_hoá toát nói đến ẩm_thực nói tới nét nổi_tiếng văn_hoá người mường có người mường người_mường thích người_mường sáng_tạo ăn ớt nổi_tiếng ra thành thích ăn yêu_thích gắn riêng người_mường riêng văn_hoá rượu_cần rượu sáng_tạo toát lên tới nét văn_hoá tục uống rượu thành nét người_mường thích ăn thức_ăn cá lồm cà muối chua cá rau cải cách họ ăn cải muối dưa cay người cay người mường có ớt có triền núi có vị chua sông con suối nhỏ cỗ cộng_đồng lễ_hội cỗ cộng_đồng lễ_hội cưới_xin củ kiệu dân_tộc tộc_người người mường là vị cúng lớn thích_hợp vị cưới_xin tang ma chau khao nấu chế_biến thành chua củ kiệu chua với cá chuối tất_cả không làm dân_tộc nói dân_tộc khác truyền_thống dùng để chế_biến dưa cá dưa đu_đủ dưa tép rau tìm_hiểu đá_vôi bao quanh đắng để chế_biến thành đến ẩm_thực mường nói đến P -23- thức uống thức_ăn có vị cách họ trong văn_hoá ẩm_thực uống rượu uống cách văn_hoá ẩm_thực mường văn_hoá riêng văn_hoá văn_hoá toát lên vị cay người vị chua vị vị đắng vị mà người với vị cay yêu_thích gắn với bao_la đồng muối thịt đu_đủ muối dưa thành tính_cách lối gắn với vị gần gia_vị xào_nấu hay khó nắm_bắt họ ăn như_thế_nào lễ cúng kiệu cà khác truyền_thống khao nấu cá khó nắm_bắt như_vậy không làm gia_vị bểu chau khao chuối tìm_hiểu lồm nấu nói tới thích bày vị mà làm gia_vị xào_nấu lễ cúng lớn lễ_hội cưới_xin tang lên lối sinh_hoạt lối sống lối lồm nấu thịt lớn năm ma lễ mà người mường ăn riêng ăn thức ớt nổi_tiếng ăn nét văn_hoá tộc_người nói_chung một_số dân_tộc khác P -24mùa muối chua với muối dưa cá muối dưa muối dưa tép muối thịt trâu mường có mường nói mường thích mường nói_riêng không mường thích mường yêu_thích mường tục uống mường thường dùng mường thường sinh_sống thích_hợp năm văn_hoá nắm_bắt như_vậy tìm_hiểu nấu cá đồng nấu thịt trâu nét văn_hoá nét văn_hoá riêng nét văn_hoá toát nói đến ẩm_thực nói tới nét nói_chung văn_hoá nói_riêng nổi_tiếng vị ớt núi đá_vôi bao người mường có người mường người mường người mường thường nhỏ người mường một_số dân_tộc như_thế_nào người mường như_vậy tìm_hiểu bữa cỗ sông ăn thung_lũng có ớt cay ớt nổi_tiếng vị phải P -25quá bao_la rộng_lớn cà muối đu_đủ muối quanh gần thành rau cải muối rau sắn muối thích ăn yêu_thích gắn riêng không riêng văn_hoá rượu_cần rộng_lớn hay khó rượu sắn muối dưa sinh_hoạt dân_tộc sinh_sống sông suối sống lối sinh_hoạt suối nhỏ người tang ma tất_cả bữa tép rau sắn tiết bò ăn tìm_hiểu tính_cách tìm_hiểu nét tính_cách lối sống toát lên tộc_người nói_chung tới nét văn_hoá tục uống rượu thành nét thành thích ăn thức_ăn thích bày cỗ thích_hợp vị đắng thịt bò thịt trâu tiết thịt trâu thịt thung_lũng có triền thức uống thức_ăn có vị thường dùng để thường sinh_sống trâu tiết bò P -26trâu thịt bò chuối triền núi đá_vôi cách họ trong năm trong thung_lũng tất_cả văn_hoá ẩm_thực truyền_thống người uống rượu uống cách văn_hoá mường vào mùa văn_hoá ẩm_thực mường văn_hoá văn_hoá văn_hoá mường nói_riêng văn_hoá riêng văn_hoá văn_hoá toát lên vị cay người vị chua củ vị đắng vị mà người vị ớt cay với cá rau với vị cay xào_nấu một_số yêu_thích gắn với ROUGE-4 = 0,702702702702703 4-gram tóm tắt lý tưởng 4-gram tóm tắt hệ thống ăn riêng ăn như_thế_nào người mường ăn ăn riêng không ăn thức uống ăn thức uống ăn thức_ăn có vị ăn thức_ăn có vị ẩm_thực mường nói ăn vào mùa ẩm_thực mường tục uống ẩm_thực mường nói cách họ ăn ẩm_thực mường tục uống cay người mường có bao quanh gần có ớt nổi_tiếng bao_la rộng_lớn hay khó có vị chua vị bày cỗ riêng người_mường bểu chau khao vị mà bò ăn vào mùa P -27chua vị đắng đắng vị đến ẩm_thực mường thành gắn với vị cay họ ăn nói tới nét vị mà người lên mà người mường người_mường thích ăn riêng ăn thức uống ớt nổi_tiếng ăn thức nét văn_hoá riêng mường có ớt mường nói tới mường yêu_thích gắn mường tục uống rượu người_mường sáng_tạo nét văn_hoá riêng văn_hoá nét văn_hoá toát lên nói đến ẩm_thực mường nói tới nét văn_hoá nổi_tiếng văn_hoá ẩm_thực người mường có người mường yêu_thích người_mường thích ăn người_mường sáng_tạo người_mường ăn ớt nổi_tiếng văn_hoá ăn thành nét thích ăn thức_ăn yêu_thích gắn với riêng người_mường rượu thành sáng_tạo toát lên tới nét văn_hoá toát tục uống rượu thành nét văn_hoá bò bểu bữa cỗ cộng_đồng lễ_hội cá đồng muối thịt cá lồm nấu cà muối chua với cá rau cải muối cách họ ăn như_thế_nào cải muối dưa cay người mường cay người mường có có ớt nổi_tiếng có triền núi đá_vôi có vị chua củ sông suối suối nhỏ người cỗ cộng_đồng lễ_hội cưới_xin cỗ chuối cộng_đồng lễ_hội cưới_xin tang củ kiệu cà dân_tộc nói tộc_người nói_chung người mường người mường thường là vị mà cúng lớn năm thích_hợp vị đắng cưới_xin tang ma chau khao nấu cá chế_biến thành tìm_hiểu chua củ kiệu chua với cá rau chuối tất_cả không làm gia_vị dân_tộc nói đến dân_tộc khác truyền_thống dùng để chế_biến thành dưa cá lồm dưa đu_đủ muối dưa tép rau sắn tìm_hiểu tính_cách đá_vôi bao quanh gần P -28thế người_mường sáng_tạo thích ăn thức_ăn có thức uống cách thức_ăn có vị chua cách họ ăn ăn văn_hoá ẩm_thực mường uống rượu uống cách họ văn_hoá ẩm_thực mường tục văn_hoá riêng văn_hoá rượu_cần văn_hoá toát lên vị cay người mường vị chua vị đắng vị đắng vị mà người mường với vị cay người yêu_thích gắn với vị đắng vị để chế_biến thành đến ẩm_thực mường nói đến ẩm_thực bao_la rộng_lớn đồng muối thịt trâu đu_đủ muối dưa tép thành tính_cách lối sống gắn với vị cay gần sông bao_la gia_vị xào_nấu một_số hay khó nắm_bắt như_vậy họ ăn như_thế_nào người lễ cúng lớn kiệu cà muối khác truyền_thống người khao nấu cá đồng khó nắm_bắt như_vậy tìm_hiểu không làm gia_vị xào_nấu bểu chau chau khao nấu chuối tất_cả tìm_hiểu lồm nấu thịt nói tới nét thích bày cỗ vị mà người làm gia_vị xào_nấu lễ cúng lớn lễ_hội cưới_xin tang ma lên lối sinh_hoạt dân_tộc lối sống lối sinh_hoạt lồm nấu thịt trâu lớn năm ma lễ cúng mà người mường ăn riêng ăn thức uống ớt nổi_tiếng vị P -29mỗi ăn thức nét văn_hoá nét văn_hoá riêng tộc_người nói_chung một_số dân_tộc khác truyền_thống mùa thích_hợp muối chua với cá muối dưa cá muối dưa đu_đủ muối dưa tép rau muối thịt trâu tiết mường có ớt mường nói tới mường thích bày mường nói_riêng mường thích ăn mường yêu_thích gắn mường tục uống rượu mường thường dùng để mường thường sinh_sống thích_hợp vị năm văn_hoá ẩm_thực nắm_bắt như_vậy tìm_hiểu nấu cá đồng muối nấu thịt trâu thịt nét văn_hoá nét văn_hoá riêng văn_hoá nét văn_hoá toát lên nói đến ẩm_thực mường nói tới nét văn_hoá nói_chung văn_hoá mường nói_riêng nổi_tiếng vị ớt cay núi đá_vôi bao quanh người mường có người mường thích người mường thích người mường yêu_thích người mường thường dùng người mường thường sinh_sống nhỏ người mường một_số dân_tộc khác như_thế_nào người mường thường như_vậy tìm_hiểu nét P -30- bữa cỗ cộng_đồng sông ăn riêng thung_lũng có triền ớt cay người ớt nổi_tiếng vị ớt phải bao_la rộng_lớn hay cà muối chua đu_đủ muối dưa quanh gần thành nét rau cải muối dưa rau sắn muối dưa thích ăn thức_ăn yêu_thích gắn với riêng không làm rộng_lớn hay khó nắm_bắt rượu thành sắn muối dưa cá sinh_hoạt dân_tộc sinh_sống thung_lũng sông suối nhỏ sống lối sinh_hoạt suối nhỏ người mường tang ma lễ tất_cả bữa cỗ tép rau sắn muối tiết bò ăn vào tìm_hiểu tính_cách lối tìm_hiểu nét văn_hoá tính_cách lối sống lối toát lên tộc_người nói_chung văn_hoá tới nét văn_hoá toát tục uống rượu thành nét văn_hoá thành ăn thích ăn thức_ăn có thích bày cỗ thích_hợp vị đắng thịt bò bểu thịt trâu tiết bò thịt trâu thịt bò P -31thung_lũng có triền núi thức uống cách thức_ăn có vị chua thường dùng để chế_biến thường sinh_sống trâu tiết bò ăn trâu thịt bò chuối triền núi đá_vôi bao cách họ ăn ăn năm văn_hoá thung_lũng có tất_cả bữa văn_hoá ẩm_thực mường truyền_thống người mường uống rượu uống cách họ văn_hoá mường nói_riêng vào mùa văn_hoá ẩm_thực mường tục văn_hoá tộc_người văn_hoá văn_hoá mường nói_riêng không văn_hoá riêng văn_hoá rượu_cần văn_hoá toát lên vị cay người mường vị chua củ kiệu vị đắng vị mà người mường vị ớt cay với cá rau cải với vị cay người xào_nấu một_số dân_tộc yêu_thích gắn với vị Một số thuật toán luận án Thuật toán Voting Shulze_Method() trình bày sau: private List Schulze_Method(List Data) { List result = new List(); _enum = new List(Data[0].Split('>')); _enum.RemoveAt(_enum.Count - 1); P -32- _enum.Sort(); N = _enum.Count; int numEvaluators = rawDataN.Count; while (_enum.Count > 0) { int[,] defeats = MakeDefeatsN(Data, _enum.Count); int[,] strengths = MakePathStrengths(defeats, _enum.Count); bool[] winners = MakeWinners(strengths, _enum.Count); txtResult.Text += "== Best option(s) is: \r\n"; string winner = ""; string[] namewinner = _enum.ToArray(); { for (int k = 0; k < winners.Length; k++) { if (winners[k] == true) { winner = namewinner[k]; result.Add(winner); _enum.Remove(winner); Data = RemoveCandidateN(Data, winner); } } } } return result; } private int[,] MakeDefeatsN(List rd, int N) { int[,] result = new int[N, N]; for (int k = 0; k

Ngày đăng: 20/07/2016, 01:22

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan