Luận văn thạc sĩ công nghệ thông tin phương pháp xử lý một số dạng câu hỏi tiếng việt cho công cụ tìm kiếm thư viện điện tử

85 557 0
  • Loading ...
1/85 trang

Thông tin tài liệu

Ngày đăng: 06/10/2014, 16:28

          Chuyên ngành:  thông tin     Trong thc hin lun vn này, ngoài n lc  chính bn thân, tôi   nhn  rt nhiu  giúp    . ây là m  lc vô cùng to l giúp tôi hoàn thành ln vn. , tôi xin bày  lòng bt  chân thành n: Thy TS. Nguyn Tn ng            truyn t cho tôi nhng kin thc chuyên ngành và kinh nghim trong nghiên cu khoa .     to mi u kin thn l cho trong su t gian tôi thc hin  tài.  . Các thành viên trong nhóm NLKE do thy Nguyn Tun ng làm ch nhim .                Gia ình là ngu lc và là ch da tinh thn vng ch . Đồng Nai, Tháng 6 năm 2011.   1 1.1  1 1.2  1 1.3  2 1.4  3 1.5  3 1.6  4  5 2.1   5 2.2  6 2.3  7 2.3.1  9 2.3.2  9 2.3.3  10 2.3.4  11 2.4  12 2.5  13  -BASED GRAMMAR 15 3.1 -BASED GRAMMAR 15 3.1.1 -Based Grammar 15 3.1.2  17 3.1.3  19 A. Phép So sánh (Subsumption) 19 B.  21 C.  22 3.1.4  23 3.2  UNIFICATION-BASED GRAMMAR 24 3.2.1  24 3.2.2   28 A.  28 B.  30 C.  32 D.  34 E.  37 F.  40 G.  41 H.   42  45 4.1.  45 4.2.  45 4.2.1  46 4.2.2  46 4.2.3  47 4.3.  50 4.3.1  50 4.3.2  54 4.3.3 Phát sinh cây cú pháp 55 4.4.  56 4.4.1  56 4.4.2  57 4.5.  58 4.5.1  59 4.5.2  59 4.5.3  59 4.5.4  60 4.6.  60 4.6.1  60 4.6.2  61  65 5.1  65 5.2  65 TÀI    UBG  Unification- CFG   BNF   EBNF    ANTLR   pháp. LEX   YACC  ân tích cú pháp. PROLOG   SQL   trúc. CSDL  Hình 2.1  Mô hình   7 Hình 2.2  Mô hình c  8 Hình 2.3   10 Hình 2.4  . 12 Hình 2.5   14 Hình 3.1   17 Hình 3.2   18 Hình 3.3   18 Hình 3.4  reentrancy. 19 Hình 3.5  reentrancy 19 Hình 3.6  nhau 20 Hình 3.7    20 Hình 3.8    20 Hình 3.9   21 Hình 3.10    21 Hình 3.11   tính. 22 Hình 3.12   23 Hình 3.13   24 Hình 3.14   reentrancy. 24 Hình 4.1  Các . 45 Hình 4.2  . 47 Hình 4.3   50 Hình 4.4  . 54 Hình 4.5  Phát sinh cây cú pháp. 56 Hình 4.6   58 Hình 4.7   61 Hình 4.8   62 Hình 4.9   63 Hình 4.10   63 Hình 4.11   64   g tin. 5   . 25 2   28 3   31 4    32 5   34 6    37 7    40 8   41 9    42    51 1   1.1                    quan     (CFG: Context-Free Grammar) ho     àn toàn khác, t    chúng tôi        (Unification-            .  ,  UBG  . 1.2      các      [...]... phát triển một công cụ tìm kiếm b ng truy vấn tiếng Việt cho thư viện điện tử của một trường đại học, áp dụng cho trường Đại học Lạc Hồng Công cụ này cho phép xử lý những câu hỏi tiếng Việt có nội dung liên quan đến các thông tin mô tả về tài liệu như: tên tài liệu, tác giả, nhà xuất bản, năm xuất bản 1.3 PHẠM VI NGHIÊN CỨU Như mục tiêu của đề tài đã xác định, trong phạm vi tương tự với các công trình... Chuyển câu hỏi về cú pháp UBG: từ câu truy vấn đã được phân tích, có thể chuyển sang cú pháp UBG thông qua một ký pháp cụ thể, ví dụ như Prolog - Phát sinh cây cú pháp: cây cú pháp được tạo ra tương ứng với câu truy vấn biểu diễn dưới dạng cú pháp văn phạm UBG thu được ở bước trên 10 Câu truy vấn b ng tiếng Việt 1 Tách các tham số, loại bỏ ký tự thừa 2 Chuyển câu hỏi tiếng Việt về dạng mã xử lý được... pháp của câu hỏi đã có đầy đủ các thông tin cần tìm kiếm và những thông tin được cung cấp Những thông tin trên đã được gán nhãn trong quá trình xây dựng cây cú pháp Chẳng hạn thông tin cung cấp gán các dấu hiệu như (, =), thông tin cần tìm kiếm được gán dấu ? ở ngay sau đối tượng Phương pháp phát sinh tự động các câu truy vấn SQL được thực hiện theo hướng sau: - Xác định các thông tin cần tìm kiếm. .. 2.3 H thống hỏi đáp Đặt câu hỏi b ng tiếng việt Tiền sử lý câu hỏi 1 Câu trả lời Phân tích cú pháp câu hỏi b ng UBG 2 Truy vấn dữ liệu Phát sinh câu truy vấn SQL 3 Xử lý kết quả truy vấn cơ sở dữ liệu Hình 2.2 – Mô hình kiến trúc của hệ thống Kết quả truy vấn 9 2.3.1 Tiền x lý câu hỏi - Tách các tham số có trong câu: trong câu truy vấn tự nhiên thư ng xuất hiện các tham số dùng để xác định câu trả lời... ĐỀ TÀI Đề tài xây dựng phương pháp xử lý các câu hỏi tiếng Việt cho công cụ tìm kiếm thư viện điện tử của trường Đại học Lạc Hồng với một số đặc thù riêng: - Xây dựng mới hoàn toàn một văn phạm hạn chế dựa trên UBG thay vì sử dụng CFG như các công trình trước đây đã triển khai ([1], [2], [3], [4], [5], [6], [7], [8], [9], [10], [11], [12]) - Sử dụng ngôn ngữ Prolog để cài đặt văn phạm UBG hạn chế đã... Mỗi câu truy vấn chỉ có một đối tượng thông tin được hỏi (tên tài liệu, tác giả, nhà xuất bản, năm xuất bản) hoặc câu hỏi dạng khẳng định (đúng/sai) - Chỉ xử lý các dạng câu hỏi được đề cập trực tiếp, không xử lý các câu hỏi có tính gián tiếp hoặc có chứa ẩn ý - Chỉ xử lý các câu truy vấn có cấu trúc đơn, câu không chứa nhiều thành phần ghép với nhau bởi các liên từ như và, hoặc, hay, … - Chỉ xử lý. .. các câu truy vấn có cấu trúc rõ ràng, không nhập nh ng, mơ hồ 3 - Trong giai đoạn nghiên cứu này chỉ xử lý các câu truy vấn có từ một đến hai tham số tìm kiếm 1.4 NỘI DUNG NGHIÊN CỨU Những vấn đề nghiên cứu trọng tâm của đề tài bao gồm: - Nội dung 1: Khảo sát cơ sở dữ liệu của thư viện điện tử nh m xác định các thông tin lưu trữ, từ đó sẽ xây dựng tập các câu hỏi tiếng Việt dùng để tìm kiếm các thông. .. diện từ loại 4 Chuyển câu hỏi về cú pháp UBG 5 Phát sinh cây cú pháp tương ứng Hình 2.3 – Sơ đồ quá trình phân tích cú pháp câu hỏi b ng UBG 2.3.3 Phát sinh câu truy vấn SQL - Giới hạn dạng câu hỏi có thể phù hợp: tuy hệ thống triển khai trong phạm vi hẹp nhưng cũng có rất nhiều dạng câu hỏi cần phải xử lý Để nâng cao tốc độ xử lý hệ thống thì trước khi đối chiếu để tìm ra cấu trúc câu phù hợp thì cần... Chuyển câu hỏi về cú pháp UBG 2 Phát sinh cây cú pháp 3 Xác định các thông tin 4 Phát sinh câu truy vấn SQL 5 Dữ liệu thư viện Thực thi câu truy vấn SQL Hình 2.5 – Sơ đồ chuyển câu hỏi về câu truy vấn SQL 15 CHƯƠNG 3 PHÂN TÍCH CÚ PHÁP CÂU HỎI TIẾNG VIỆT BẰNG UNIFICATION-BASED GRAMMAR 3.1 LÝ THUYẾT UNIFICATION-BASED GRAMMAR 3.1.1 Giới thi u Unification-Based Grammar Unification-Based Grammar (UBG) là một. .. việc xử lý các câu hỏi tiếng Việt có nội dung xoay quanh các thông tin mô tả về tài liệu trong thư viện: tên tài liệu, tác giả, nhà xuất bản, năm xuất bản Kết quả tìm kiếm vì vậy sẽ là một câu trả lời tương ứng với nội dung truy vấn được và các dữ liệu có liên quan (nếu có) chứ không phải là tài liệu chứa từ khóa như trong tìm kiếm so khớp dựa trên từ khóa Nội dung của các câu truy vấn b ng tiếng Việt . ng câu    Lý ,  ,  Tin , ).  . t cho tôi nhng kin thc chuyên ngành và kinh nghim trong nghiên cu khoa .     to mi u kin thn l cho.  pháp. LEX   YACC  ân tích cú pháp. PROLOG  
- Xem thêm -

Xem thêm: Luận văn thạc sĩ công nghệ thông tin phương pháp xử lý một số dạng câu hỏi tiếng việt cho công cụ tìm kiếm thư viện điện tử, Luận văn thạc sĩ công nghệ thông tin phương pháp xử lý một số dạng câu hỏi tiếng việt cho công cụ tìm kiếm thư viện điện tử, Luận văn thạc sĩ công nghệ thông tin phương pháp xử lý một số dạng câu hỏi tiếng việt cho công cụ tìm kiếm thư viện điện tử

Từ khóa liên quan

Gợi ý tài liệu liên quan cho bạn