Nghiên cứu mô hình PCFGs và ngôn ngữ AIML trong xây dựng chatbot hỗ trợ học tiếng anh

71 443 0
Nghiên cứu mô hình PCFGs và ngôn ngữ AIML trong xây dựng chatbot hỗ trợ học tiếng anh

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ BÙI ĐỨC ANH NGHIÊN CỨU MƠ HÌNH PCFGS VÀ NGÔN NGỮ AIML TRONG XÂY DỰNG CHATBOT HỖ TRỢ HỌC TIẾNG ANH LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội - Năm 2017 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ BÙI ĐỨC ANH NGHIÊN CỨU MƠ HÌNH PCFGS VÀ NGƠN NGỮ AIML TRONG XÂY DỰNG CHATBOT HỖ TRỢ HỌC TIẾNG ANH Ngành: Công nghệ thông tin Chuyên ngành: Truyền liệu mạng máy tính LUẬN VĂN THẠC SĨ CƠNG NGHỆ THƠNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: TS NGUYỄN NGỌC CƢƠNG Hà Nội - Năm 2017 LỜI CẢM ƠN Đầu tiên, em xin gửi lời cảm ơn đến Ban Giám hiệu trƣờng Đại học Công nghệ - Đại học Quốc gia Hà Nội tạo cho em môi trƣờng tốt để em học tập tiếp thu đƣợc kiến thức quý báu năm qua Em xin gửi lời cảm ơn sâu sắc đến Thầy giáo, Tiến sĩ Nguyễn Ngọc Cƣơng nhiệt tình hƣớng dẫn, định hƣớng, hỗ trợ em suốt trình thực luận văn, giúp đỡ em tiếp cận với cách tƣ duy, giải trình bày vấn đề cần nghiên cứu Những điều giúp em khắc phục đƣợc hạn chế thân khó khăn để hồn thành luận văn thành cơng, thời hạn Em gửi lời cảm ơn chân thành tới thầy cô trƣờng, đặc biệt thầy cô Khoa Công nghệ thông tin giảng dạy em suốt thời gian học tập trƣờng Với kiến thức, học có đƣợc hành trang giúp em tự tin công việc, sống mục tiêu tƣơng lai Tôi xin đƣợc cảm ơn tới gia đình, ngƣời thân, đồng nghiệp bạn bè thƣờng xuyên quan tâm, động viên; cảm ơn Tiến sĩ Ngô Quốc Dũng chia sẻ kinh nghiệm, cung cấp tài liệu hữu ích thời gian học tập, nghiên cứu nhƣ suốt trình thực luận văn tốt nghiệp Mặc dù em cố gắng hoàn thành luận văn tất nỗ lực khả mình, nhƣng chắn nhiều hạn chế thiếu sót Em mong nhận đƣợc cảm thơng góp ý quý giá từ thầy cô bạn Hà Nội, tháng 11 năm 2017 Học viên Bùi Đức Anh LỜI CAM ĐOAN Tôi xin cam đoan, kiến thức trình bày luận văn tơi tìm hiểu, nghiên cứu trình bày lại Trong trình làm luận văn tơi có tham khảo tài liệu có liên quan ghi rõ nguồn tài liệu tham khảo Những kết luận văn riêng tôi, không chép từ cơng trình khác Nếu có điều khơng trung thực, tơi xin hồn tồn chịu trách nhiệm Tác giả Bùi Đức Anh MỤC LỤC LỜI CẢM ƠN LỜI CAM ĐOAN MỤC LỤC DANH MỤC CÁC TỪ VIẾT TẮT DANH MỤC CÁC HÌNH ẢNH MỞ ĐẦU Tính cấp thiết đề tài Mục tiêu nghiên cứu Đối tƣợng phạm vi nghiên cứu đề tài Phƣơng pháp nghiên cứu Ý nghĩa khoa học, ý nghĩa thực tiễn đề tài Kết cấu luận văn CHƢƠNG 1: CÁC VẤN ĐỀ TỔNG QUAN 11 1.1 Chatbot 11 1.1.1 Trí tuệ nhân tạo 11 1.1.1 Chatbot gì? 17 1.1.2 Chatbot hỗ trợ học tiếng Anh 18 1.2 Ngữ pháp tiếng Anh 22 1.2.1 Các khái niệm 22 1.2.2 Phân loại lỗi 25 1.2.3 Một số lỗi ngữ pháp tiếng Anh 26 1.3 Tổng quan toán kiểm tra ngữ pháp tiếng Anh 26 1.3.1 Phân tích cú pháp 27 1.3.2 Bài toán kiểm tra ngữ pháp tiếng Anh 31 1.4 Kết luận chƣơng 33 CHƢƠNG 2: MƠ HÌNH PCFGs VÀ NGƠN NGỮ AIML 34 2.1 Mơ hình PCFGs 34 2.1.1 Văn phạm phi ngữ cảnh 34 2.1.2 Tính mập mờ phân tích cú pháp 36 2.1.3 Văn phạm phi ngữ cảnh hƣớng thống kê PCFGs 38 2.2 Ngôn ngữ AIML 45 2.2.1 AIML gì? 45 2.2.2 Các Category đặc tính AIML 46 2.2.3 Một số thẻ thông dụng AIML 47 2.2.4 ProgramAB 53 2.3 Kết luận chƣơng 54 CHƢƠNG 3: PHÂN TÍCH THIẾT KẾ, CÀI ĐẶT ỨNG DỤNG 55 3.1 Phân tích thiết kế 55 3.1.1 Xác định yêu cầu 55 3.1.2 Xây dựng tập luật dựa tập liệu có sẵn 57 3.2 Cài đặt ứng dụng 60 3.2.1 Giao diện chức hội thoại (Chatbot) 61 3.2.2 Giao diện chức tra cứu từ điển 61 3.2.3 Giao diện chức kiểm tra tả, ngữ pháp 62 3.3 Đánh giá ứng dụng 64 KẾT LUẬN 66 TÀI LIỆU THAM KHẢO 68 DANH MỤC CÁC TỪ VIẾT TẮT Từ viết tắt Từ đầy đủ AI Artificial Intelligence (Trí tuệ nhân tạo) AIML Artificial Intelligence Markup Language CKY Cocke-Kasami-Younger CNF Chomsky Normal Form CFG Context-Free Grammar (Văn phạm phi ngữ cảnh) DARPA Defense Advanced Research Projects Agency DT Determiner (Từ hạn định/Từ định) IBM International Business Machines IN Prepostion (Giới từ) NN Noun (Danh từ) NP Noun Phrase (Cụm danh từ) PCFGs Probabilistic Context-Free Grammars (Văn phạm phi ngữ cảnh hướng thống kê) PP Prepositional Phrase (Cụm giới từ) S Sentence (Câu) SCFG Stochastic Context-Free Grammar Vi Intrasitive Verb (Nội động từ) VP Verb Phrase (Cụm động từ) Vt Transitive Verb (Ngoại động từ) DANH MỤC CÁC HÌNH ẢNH Hình 1.1 Mơ hình Turing Test 12 Hình 1.2 Quá trình hình thành phát triển trí tuệ nhân tạo 13 Hình 1.3 Chatbot Miki 19 Hình 1.4 Chatbot Poli 20 Hình 1.5 Chatbot Sally 20 Hình 1.6 Chatbot Andy English 21 Hình 1.7 Chatbot Acobot 22 Hình 1.8 Mơ hình xử lý ngơn ngữ tự nhiên 27 Hình 1.9 Cú pháp câu “Claudia sat on a stool” 29 Hình 1.10 Phƣơng pháp Top - Down 30 Hình 1.11 Phƣơng pháp Bottom – Up 31 Hình 2.1 CFG đơn giản[9] 34 Hình 2.2 Cây cú pháp biểu diễn từ dẫn xuất 36 Hình 2.3 Tính mập mờ phân tích cú pháp[8] 37 Hình 2.4 Một PCFGs đơn giản[8] 39 Hình 2.5 Một PCFGs với CNF 42 Hình 2.6 Ngơn ngữ AIML 45 Hình 2.7 Ví dụ độ ƣu tiên thơng tin (1) 46 Hình 2.8 Ví dụ độ ƣu tiên thơng tin (2) 47 Hình 2.9 Ví dụ thẻ 48 Hình 2.10 Ví dụ thẻ 49 Hình 2.11 Ví dụ thẻ 49 Hình 2.12 Ví dụ thẻ , 50 Hình 2.13 Ví dụ thẻ 51 Hình 2.14 Ví dụ thẻ 52 Hình 2.15 Ví dụ thẻ 53 Hình 2.16 Ví dụ thẻ thẻ 53 Hình 3.1 Mơ hình hệ thống AI English 56 Hình 3.2 Dữ liệu Tatoeba 57 Hình 3.3 Dữ liệu câu tiếng Anh 58 Hình 3.4 Tập luật PCFGs 59 Hình 3.5 Giao diện khởi tạo AI English 61 Hình 3.6 Giao diện hội thoại ứng dụng AI English 61 Hình 3.7 Giao diện chức tra cứu từ điển 62 Hình 3.8 Giao diện chức kiểm tra ngữ pháp 62 Hình 3.9 Giao diện chi tiết lỗi sửa lỗi 63 Hình 3.10 Bảng động từ bất quy tắc 63 Hình 3.11 Các cụm từ thơng dụng 64 MỞ ĐẦU Tính cấp thiết đề tài Trong nhiều năm trở lại đây, với nhu cầu hội nhập ngày cao quốc gia kinh tế lẫn văn hóa, yêu cầu ngoại ngữ, đặc biệt tiếng Anh, trở thành vấn đề cấp thiết với ngƣời Nhƣng nhiều ngƣời khơng có đủ thời gian nhƣ điều kiện để tham gia lớp học thêm câu lạc để nâng cao trình độ Chính cần có phần mềm, công cụ để hỗ trợ ngƣời học tiếng Anh nơi đâu, vào thời gian Hiện có nhiều cơng cụ hƣớng tới mục đích đó, song cơng cụ, phần mềm có hạn chế riêng, đặc biệt tính thụ động Ngƣời học hầu nhƣ tham gia vào hoạt động đƣợc thiết kế từ trƣớc cơng cụ, có tƣơng tác hai chiều Với phát triển khoa học công nghệ, việc ngƣời sở hữu cho điện thoại thơng minh phổ biến Dựa tảng điện thoại thông minh mà xuất ứng dụng hỗ trợ học tiếng Anh có tƣơng tác cao ngƣời máy; ứng dụng phổ biến kể tới ứng dụng dựa Chatbot Tuy nhiên, phần lớn ứng dụng Chatbot tập trung vào phần từ vựng, từ điển, trắc nghiệm ứng dụng luyện kỹ nghe, kỹ đọc , có ứng dụng giúp ngƣời dùng kiểm tra tả nhƣ cú pháp câu để lỗi sai cho ngƣời đọc chỉnh sửa nó, tốn tƣơng đối quan trọng Vì vậy, Chatbot đáp ứng đƣợc yêu cầu, chạy điện thoại thông minh để hỗ trợ ngƣời học tiếng Anh giải pháp có hiệu để nâng cao chất lƣợng học tập tiếng Anh Chính lý đó, tác giả lựa chọn đề tài: “Nghiên cứu mơ hình PCFGs ngôn ngữ AIML xây dựng chatbot hỗ trợ học tiếng Anh” Mục tiêu nghiên cứu Nghiên cứu sở lý thuyết tảng toán kiểm tra tả cú pháp câu tiếng Anh; ứng dụng cài đặt, đánh giá giải thuật xây dựng ứng dụng hỗ trợ tính nhƣ kiểm tra tả, ngữ pháp, cú pháp thông qua hội thoại ngƣời dùng máy tảng Android Đối tƣợng phạm vi nghiên cứu đề tài Đối tƣợng nghiên cứu 55 CHƢƠNG 3: PHÂN TÍCH THIẾT KẾ, CÀI ĐẶT ỨNG DỤNG Trong chƣơng 3, luận văn trình bày nội dung thiết kế ứng dụng, xây dựng kho liệu cài đặt, đánh giá kết hoạt động ứng dụng dựa số mẫu kiểm thử 3.1 Phân tích thiết kế 3.1.1 Xác định yêu cầu 3.1.1.1 Chức Hội thoại ngƣời máy Ứng dụng cho phép ngƣời dùng giao tiếp, hội thoại với máy thông qua văn giọng nói Chi tiết chức năng: - Ngƣời dùng giao tiếp với máy thông qua đoạn hội thoại, đoạn hội thoại đƣợc nhập vào băng văn giọng nói Với câu hội thoại ngƣời dùng, máy tự động tìm câu trả lời thích hợp đƣa cho ngƣời dùng - Trong liệu máy có nhiều chủ đề, ngƣời dùng chọn chủ đề để nói chuyện thay đổi chủ đè nói chuyện Kiểm tra tả, ngữ pháp Ứng dụng tập trung kiểm tra tả ngữ pháp liệu từ ngƣời dùng Tuy nhiên, chức hỗ trợ kiểm tra tả kiểm tra ngữ pháp nghiêng chia động từ câu, không bao gồm kiểm tra cú pháp câu Chi tiết chức năng: - Ngƣời dùng tiến hành đƣa liệu vào ứng dụng để ứng dụng kiểm tra lỗi tả ngữ pháp - Ngƣời dùng xem lỗi câu xem chi tiết cách sửa lỗi từ ứng dụng - Dữ liệu đầu vào đầu từ ứng dụng theo dạng hội thoại 56 3.1.1.2 Mô hình hệ thống Hình 3.1 Mơ hình hệ thống AI English Máy chủ (Server) - Phụ trách xử lý liệu từ client gửi lên xử lý, trả kết cho client - Các chức thực server: Nhận hội thoại từ ngƣời dùng, tìm câu trả lời thích hợp trả cho ngƣời dùng, kiểm tra tả, ngữ pháp câu ngƣời dùng gửi lên, từ câu ngƣời dùng gửi lên, xây dựng cú pháp trả cho ngƣời dùng Thiết bị di động (Device) - Thiết bị di động thực nhiệm vụ hiển thị nội dung hội thoại, nhận yêu cầu ngƣời dùng gửi server chờ xử lý Các nội dung nhƣ lỗi chi tiết hay sửa lỗi, cú pháp đƣợc hiển thị thiết bị di động - Các thiết bị di dộng cần sử dụng tảng Android 4.2 trở lên để cài đặt sử dụng ứng dụng 3.1.1.3 Chức người dùng Ngƣời sử dụng có chức sau: - Đăng ký thông tin cá nhân - Hội thoại tin nhắn với chatbot - Tự động kiểm tra tả - Tự động kiểm tra ngữ pháp - Dịch tin nhắn sang tiếng Việt 57 - Nghe nội dung tin nhắn - Tra cứu động từ bất quy tắc - Tra cứu số câu thông dụng 3.1.2 Xây dựng tập luật dựa tập liệu có sẵn Nhƣ đề cập chƣơng 2, để xây dựng cú pháp câu theo phƣơng pháp PCFGs thuật toán CKY, ta cần có tập luật R theo chuẩn CNF Tại phần này, luận văn trình bày trình xây dựng tập luật CNF đƣợc sử dụng ứng dụng Quá trình xây dựng tập luật CNF PCFGs gồm bƣớc chính: - Xây dựng kho liệu câu tiếng Anh - Xử lý câu kho liệu tạo luật theo chuẩn CNF - Xây dựng tập luật theo văn phạm PCFGs từ luật 3.1.2.1 Xây dựng kho liệu câu tiếng Anh Nhiệm vụ phần yêu cầu xây dựng kho liệu gồm nhiều câu tiếng Anh để phục vụ xây dựng tập luật Để thực nhiệm vụ này, ta sử dụng tập liệu Tatoeba[20], trang web bao gồm nhiều tập liệu câu nhiều ngôn ngữ khác Tuy nhiên, tập liệu câu lấy từ Tatoeba có chứa nhiều ngơn ngữ khác Cụ thể, số câu liệu có dạng nhƣ sau: Hình 3.2 Dữ liệu Tatoeba 58 Ta thực tách liệu câu tiếng Anh theo thẻ “eng” thu đƣợc tập liệu câu tiếng Anh cần dùng có dạng nhƣ sau: Hình 3.3 Dữ liệu câu tiếng Anh Bằng cách nhƣ vậy, ta có đƣợc tập liệu gồm 885113 câu tiếng Anh từ tập liệu ban đầu (số lƣợng câu tiếp tục đƣợc tăng lên) Tập liệu đƣợc sử dụng để xây dựng tập luật phần 3.1.1.2 Xử lý câu kho liệu tạo luật theo chuẩn CNF Trong phần này, từ tập liệu có phần 3.1.2.1, ta tiến hành phân tích tạo luật cú pháp CFG Để thực điều này, ta sử dụng thƣ viện Stanford-parser[21] để xây dựng cú pháp từ câu bất kỳ, sau từ cú pháp có đƣợc, ta tách luật cú pháp thêm vào tập liệu cú pháp CFG Trong trình tách luật, ta cố gắng đƣa luật chuẩn CNF Xét ví dụ sau đây: Xét câu: I am good Cây cú pháp: 59 (ROOT (S (NP (PRP I)) (VP (VBP am) (ADJP (JJ good))))) Các luật sau tách đƣợc: VBP → am ADJP → good NP → I VP → VBP ADJP S → NP VP Ta tiến hành trình với tất câu thu đƣợc tập liệu luật tuân theo CNF, nhiên tất luật đƣợc lƣu trữ theo văn phạm CFG 3.1.1.3 Xây dựng tập luật theo văn phạm PCFGs Từ tập luật có từ phần 3.1.2.2, ta tiến hành xây dựng tập luật để sử dụng văn phạm PCFGs Để thực điều này, luật ta tiến hành tính xác suất chúng theo cơng thức (2.5) đƣợc đề cập nhƣ sau: q( A  B)  Count ( A  B) Count ( A) Kết tập luật có đƣợc sau xây dựng có dạng nhƣ sau: Hình 3.4 Tập luật PCFGs 60 Các luật đƣợc trình bày theo định dạng: S → A B # x S → A # x, S luật gốc, A B luật cấu tạo thành luật S, x xác suất luật Khi tập liệu câu tăng, thời gian cần thiết để xử lý xây dựng tập luật tăng theo Hơn nữa, kết cho thấy đa số luật đƣợc tạo thành luật gán nhãn, tức luật có dạng S → A # x Tập luật đƣợc xây dựng đƣợc sử dụng để xây dựng chức phân tích cú pháp câu ứng dụng AI English 3.2 Cài đặt ứng dụng Dựa lý thuyết nghiên cứu PCFGs AIML, với hỗ trợ bạn bè đồng nghiệp, tác giả xây dựng ứng dụng AI English Đây ứng dụng giao tiếp với ngƣời dùng thông qua hội thoại, tƣơng tự ứng dụng chatbot Ứng dụng có chức chính: Hội thoại, kiểm tra ngữ pháp (chủ yếu kiểm tra tả chia động từ), với số tính khác nhƣ: tra cứu từ điển, nghe nội dung hội thoại, tra cứu động từ bất quy tắc câu thông dụng Ứng dụng đƣợc thiết kế cài đặt thiết bị di động hệ điều hành Android Đây hệ điều hành mã nguồn mở, tảng điền thoại thông minh phổ biến giới, đƣợc nhiều công ty công nghệ nhà phát triển lựa chọn cần hệ thống không nặng nề, có khả tinh chỉnh, giá rẻ, chạy thiết bị công nghệ cao[3] Để sử dụng ứng dụng AI English, thiết bị yêu cầu cần có kết nối mạng 61 Hình 3.5 Giao diện khởi tạo AI English Ngƣời sử dụng lựa chọn thông tin cá nhân sau click Save 3.2.1 Giao diện chức hội thoại (Chatbot) Giao diện ứng dụng thực đoạn hội thoại ngƣời máy hiển thị nhƣ sau: Hình 3.6 Giao diện hội thoại ứng dụng AI English Giao diện gồm phần sau đây: - Thanh nhập liệu để ngƣời dùng nhập văn bản, nút bấm để thực gửi yêu cầu từ ngƣời dùng đến ứng dụng - Bên phải khung hinhg hiển thị liệu ngƣời dùng nhập vào - Bên trái khung hình hiển thị trả lời từ ứng dụng - Các nút bấm hỗ trợ ngƣời dùng đọc liệu tiếng Anh dịch liệu sang tiếng Việt 3.2.2 Giao diện chức tra cứu từ điển Giao diện chức đƣợc thực trực tiếp đoạn hội thoại, ngƣời sử dụng muốn tra cứu nghĩa từ 62 Hình 3.7 Giao diện chức tra cứu từ điển 3.2.3 Giao diện chức kiểm tra tả, ngữ pháp Giao diện chức dạng đoạn hội thoại tƣơng tự chức hội thoại, cụ thể: Hình 3.8 Giao diện chức kiểm tra ngữ pháp Giao diện chức có số khác biệt với chức hội thoại nhƣ sau: 63 - Bên trái khung hình hiển thị xử lý lỗi câu từ ngƣời dùng - Phần chữ đƣợc in đỏ thể lỗi sai câu - Bên cạnh khung hình có nút để ngƣời dùng xem chi tiết lỗi sửa lỗi Khi ngƣời dùng muốn hiển thị lỗi sửa lỗi, ứng dụng có giao diện nhƣ sau: Hình 3.9 Giao diện chi tiết lỗi sửa lỗi Cụ thể, giao diện chi tiết gồm phần: Câu lỗi câu sửa lỗi Phần lỗi đƣợc tô đỏ phần sửa lỗi đƣợc to xanh để phân biệt Ngồi ra, ứng dụng hỗ trợ ngƣời dùng với bảng động từ bất quy tắc danh sách, cách sử dụng cụm từ thơng dụng Hình 3.10 Bảng động từ bất quy tắc 64 Hình 3.11 Các cụm từ thông dụng 3.3 Đánh giá ứng dụng Ứng dụng AI English giải đƣợc vấn đề kiểm tra ngữ pháp phân tích cú pháp câu tiếng Anh Bằng cách sử dụng đoạn hội thoại giao diện đơn giản, ứng dụng tạo giao tiếp với ngƣời dùng cách dễ dàng tiện lợi Ứng dụng giúp ngƣời dùng kiểm tra câu đơn giản nhƣ xem xét cú pháp câu để nâng cao khả cách kết hợp thành phần câu Ngoài ra, ứng dụng ứng dụng hội thoại giúp ngƣời dùng trò chuyện để nâng cao vốn kiến thức Tuy nhiên, ứng dụng số vấn đề nhƣ: - Do kết hợp nhiều mã nguồn mở phƣơng pháp nên ứng dụng hạn chế mặt xử lý lúc nhiều yêu cầu nhƣ kiểm tra ngữ pháp, kiểm tra cú pháp tích hợp hội thoại - Thời gian xử lý cú pháp ngữ pháp tƣơng đối dài, đặc biệt nhƣng câu dài, gồm nhiều thành phần - Giao diện phần chi tiết cú pháp câu gây khó hiểu với ngƣời dùng không quen thuộc với thành phần câu nhƣ viết tắt thành phần câu 65 - Với tính nhận liệu đầu vào âm thanh, ứng dụng yêu cầu phụ thuộc vào phần cứng điện thoại với chức voice tốt điều kiện sử dụng môi trƣờng yên tĩnh - Đánh giá hiệu quả: với 100 câu tiếng Anh có lỗi liệu đầu vào ứng dụng phát 81 câu bị lỗi, đạt 81% 66 KẾT LUẬN Đóng góp luận văn Trong thực tế, việc kiểm tra ngữ pháp phân tích cú pháp câu tiếng Anh đƣợc áp dụng nhiều ứng dụng nhƣ chia động từ, kiểm tra ngoại ngữ, học ngữ pháp tiếng Anh Trong trình nghiên cứu xây dựng ứng dụng hỗ trợ kiểm tra ngữ pháp tiếng Anh, luận văn đạt đƣợc số nội dung sau: - Luận văn tìm hiểu số định nghĩa ngữ pháp tiếng Anh, số hƣớng tiếp cận tốn kiểm tra ngữ pháp - Tìm hiểu cách tiếp cận PCFGs áp dụng thuật toán CKY tốn phân tích cú pháp câu - Giới thiệu số mã nguồn mở hỗ trợ xây dựng Chatbot kiểm tra ngữ pháp Cài đặt ứng dụng đơn giản giải toán kiểm tra ngữ pháp với tập luật tự huấn luyện Hạn chế luận văn Trong q trình hồn thành luận văn ứng dụng, đạt đƣợc số kết định tốn phân tích ngữ pháp xây dựng cú pháp tiếng Anh, có hạn chế định: - Phƣơng pháp tiếp cận phụ thuộc nhiều vào tập luật, tập luật có kích thƣơng đủ lớn, thời gian xử lý ứng dụng lớn Hơn nữa, độ xác kết phụ thuộc vào độ xác tập luật - Kết q trình phân tích cú pháp đƣa cú pháp văn phù hợp, nhƣng chƣa thể đƣa lỗi cụ thể nhƣng văn lỗi - Tập liệu hội thoại sử dụng Chatbot đơn giản - Ứng dụng tập trung vào mặt cú pháp, chƣa thể đƣợc mặt ngữ nghĩa câu Hƣớng phát triển Với phong phú cấp thiết tiếng Anh, luận văn có nhiều hƣớng phát triển tiếp tục: - Tìm hiểu phƣơng pháp tối ƣu tập luật tại, mở rộng tập luật, giảm thiểu thời gian với tập luật gán nhãn, nâng cao hiệu phát hiễn lỗi ứng dụng 67 - Bổ sung tập liệu hội thoại cho hệ thống Chatbot, phong phú chủ đề - Phát triển tình hỗ trợ học ngữ pháp cụ thể nhƣ dạng câu chủ động, bị động hay tiếng Anh - Tìm hiểu phƣơng pháp xác định lỗi cụ thể với toán phân tích cú pháp câu với câu lỗi đƣa gợi ý sửa lỗi 68 TÀI LIỆU THAM KHẢO Tiếng Việt Đỗ Bá Lâm, Lê Thanh Hƣơng, Xây dụng hệ thống phân tích cú pháp tiếng Việt sử dụng văn phạm HPSG, http://www.jaist.ac.jp/~bao/VLSPtext/ICTrda08/ICT08-VLSP-SP85-2.pdf Hoàng Đức Thịnh, Ứng dụng mã nguồn mở AIML xây dựng hệ thống Chatbot trợ giúp phương pháp học tập cho sinh viên ngành kỹ thuật, Tóm tắt luận văn thạc sĩ, Đại học Đà Nẵng, 2011 Trần Võ Khôi Nguyên, Huỳnh Thái Dƣơng, Xây dựng ứng dụng hỗ trợ học tiếng Anh cho thiết bị di động chạy tảng Android, Đồ án tốt nghiệp, ĐHQG TP Hồ Chí Minh, ĐH Công nghệ thông tin, 2014 Mai Ngọc Chừ, Vũ Đức Nghiệu, Hồng Trọng Phiến, Cơ sở ngơn ngữ học Tiếng Việt, NXB Giáo dục, 2002 Phạm Thọ Hồn, Phạm Thị Anh Lê, Giáo trình Trí tuệ nhân tạo, ĐH Sƣ phạm Hà Nội, 2011 Vƣơng Hồi Thu, Phân tích cú pháp tiếng Việt theo tiếp cận thống kê, Khóa luận tốt nghiệp, Đại học Công nghệ - ĐHQG Hà Nội, 2009 Lê Anh Cƣờng, Xây dựng phân tích cú pháp tiếng Anh hệ dịch tự động Anh Việt, Luận văn Thạc sĩ, 2001 Tiếng Anh Michael Collins, ProbabilisticContext-Free Grammars (PCFGs), http://www.cs.columbia.edu/~mcollins/courses/nlp2011/notes/pcfgs.pdf Michael Collins, Context http://aritter.github.io/courses/5525 _slides/cfg.pdf Free Grammars, 10 Daniel Naber, A Rule-Based Style and Grammar Checker, http://www.danielnaber.de/languagetool/download/style_and_grammar_checker pdf Website tham khảo: 11 Ngữ pháp ngữ pháp học, http://ngonngu.net/index.php?p=160 12 http://alicebot.blogspot.com/2013/01/program-ab-aiml-20-reference.html 13 AIML Tutorial, https://www.tutorialspoint.com/aiml/ 69 14 https://123doc.org//document/2761191-tri-tue-nhan-tao-mot-phuong dien-cua-van-hoa-ung-dung.htm 15 http://hnue.tailieu.vn/doc/giao-trinh-tri-tue-nhan-tao-pham-tho-hoan pham-thi-anh-dai-hoc-su-pham-ha-noi-283064.html 16 http://www.dostquangtri.gov.vn/Upload/Thongtinchuyende/2017080 8-10081156.pdf 17 http://www.dostquangtri.gov.vn/Upload/Thongtinchuyende/2017080 8-10082810.pdf 18 http://startup.vitv.vn/tin-chu/21-09-2016/tri-tue-nhan-tao-la-gi-nguongoc-va-mot-so-ung-dung-cua-tri-tue-nhan-tao-trong-t/1321 19 Hồ Tú Bảo, Trí tuệ nhân tạo chặng đƣờng 50 năm www.jaist.ac.jp/~bao/Writings/AI50years.pdf 20 Bộ sƣu tập câu dịch, https://tatoeba.org/vie/ 21 Bộ phân tích http://nlp.stanford.edu:8080/parser/ cú pháp Stanford, ...ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ BÙI ĐỨC ANH NGHIÊN CỨU MƠ HÌNH PCFGS VÀ NGÔN NGỮ AIML TRONG XÂY DỰNG CHATBOT HỖ TRỢ HỌC TIẾNG ANH Ngành: Công nghệ thông... chọn đề tài: Nghiên cứu mơ hình PCFGs ngơn ngữ AIML xây dựng chatbot hỗ trợ học tiếng Anh Mục tiêu nghiên cứu Nghiên cứu sở lý thuyết tảng tốn kiểm tra tả cú pháp câu tiếng Anh; ứng dụng cài đặt,... Mơ hình PCFGs, ứng dụng xây dựng cú pháp - Ngôn ngữ AIML kỹ thuật xây dựng chatbot Phạm vi nghiên cứu Chatbot điện thoại thông minh sử dụng hệ điều hành Android đƣợc xây dựng dựa AIML mơ hình PCFGs

Ngày đăng: 07/03/2018, 09:32

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan