Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB

50 612 2
Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang  ngôn ngữ đặc tả với mô hình COKB

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB MỤC LỤC PHẦN 1: TỔNG QUAN VỀ TIẾP NHẬN VÀ 3 BIỄU DIỄN TRI THỨC 3 1. Khảo sát bài toán xây dựng và phát triển các mô hình biểu diễn tri thức cho các hệ giải toán tự động 3 1.1 Giới thiệu 3 1.2. Vấn đề biểu diễn tri thức 4 1.3. Mô hình tri thức các đối tượng tính toán 5 1.4.2 Tổ chức cơ sở tri thức COKB 10 1.5. Bài toán giải toán một C-Object 11 1.6. Bài toán hình học phẳng 12 1.7. Ví dụ 12 2. Vấn đề còn tồn tại trong bài toán 13 3. Vấn đề cần tập trung nghiên cứu và giải quyết 13 PHẦN 2: CƠ SỞ LÝ THUYẾT 14 1. Tìm hiểu về ngôn ngữ tự nhiên 14 1.1. Định nghĩa 14 1.2. Bản chất của ngôn ngữ 15 1.3. Tính hệ thống của ngôn ngữ 15 1.4. Đặc điểm của ngôn ngữ tự nhiên tiếng Việt và Tiếng Anh 17 2. Các phương pháp xử lý ngôn ngữ tự nhiên ứng dụng trong dịch tự động 18 2.1. giới thiệu các ứng dụng của xử lý ngôn ngữ tự nhiên 18 2.2. Một số hệ dịch máy 19 2.3. Các bài toán trong dịch máy 19 PHẦN 3: NGHIÊN CỨU THỰC NGHIỆM 27 1. Mô tả bài toán cần xử lý 27 2. Giải quyết bài toán dịch ngôn ngữ tự nhiên sang ngôn ngữ đặc tả 28 2.1. Quy ước chung cho bài toán 29 2.2. Mô hình đặc tả tổng quát 31 3.2.3. Giải quyết vấn đề chuyển mẫu câu thành dạng tiền đặc tả 34 2.4. Chuyển văn bản từ ngôn ngữ tự nhiên sang dạng ngôn ngữ tiền đặc tả 37 3.2.5. Chuyển từ ngôn ngữ tiền đặc tả sang ngôn ngữ đặc tả bài toán 39 3. Thiết kế và cài đặt bài toán 43 GVHD: PGS.TS. ĐỖ VĂN NHƠN HVTH: LÊ NHỰT TRƯỜNG – CH1101150 1 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB 3.1. Thiết kế giao diện 43 3.2. Các chức năng chính 44 3.3. Công nghệ sử dụng 48 3.4. Nhận xét 48 PHẦN 4: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 49 1. Kết luận 49 1.1. Vấn đề đạt được 49 1.2. Vấn đề chưa đạt được 49 2. Hướng phát triển 50 TÀI LIỆU THAM KHẢO 50 GVHD: PGS.TS. ĐỖ VĂN NHƠN HVTH: LÊ NHỰT TRƯỜNG – CH1101150 2 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB PHẦN 1: TỔNG QUAN VỀ TIẾP NHẬN VÀ BIỄU DIỄN TRI THỨC 1. Khảo sát bài toán xây dựng và phát triển các mô hình biểu diễn tri thức cho các hệ giải toán tự động Trong phần này ta sẽ bàn luận các công trình lý thuyết cũng như ứng dụng đã có liên quan đến mục tiêu của đề tài từ đó nêu ra mục tiêu cụ thể mà đề tài tập trung nghiên cứu và giải quyết. 1.1 Giới thiệu Công nghệ tri thức là một lĩnh vực khoa học máy tính nhằm nghiên cứu và xây dựng các hệ thống ngày càng thông minh hơn và qua đó hỗ trợ tốt hơn cho việc xử lý thông tin và xử lý tri thức, tính toán điều khiển. Hai vấn đề lớn cần quan tâm trong việc phân tích và phát triển hệ thống thông minh, đặc biệt là hệ giải toán tự động là: - Biểu diễn tri thức - Phương pháp và kỹ thuật tìm kiếm hay suy diễn Bài toán xây dựng và phát triển các mô hình biểu diễn tri thức cho các hệ giải toán tự động giữ một vị trí rất quan trọng trong khoa học máy tính cũng như trong lĩnh vực trí tuệ nhân tạo. Mục tiêu của bài toán này là nhằm xây dựng và phát triển một số mô hình biểu diễn tri thức và các thuật giải tự động cho các dạng bài toán khác nhau dựa trên tri thức. Trong bài toán này ta chỉ quan tâm khảo sát đến việc xây dựng và phát triển một số mô hình biểu diễn tri thức cho hệ giải toán tự động. Các mô hình này được xây dựng và phát triển dựa trên các phương pháp biểu diễn tri thức đã có với những phát triển nhất định để tạo ra một số mô hình biểu diễn tri thức mới thể hiện được nhiều dạng kiến thức đa dạng hơn. Theo PGS.TS. Đỗ Văn Nhơn đã đưa ra một số mô hình biểu diễn tri thức như: mô hình mạng suy diễn và tính toán, mô hình một đối tượng tính toán (C-Object), mô hình tri thức về các C-Object, và mô hình mạng các C-Object. Các mô hình này được sử dụng trong thiết kế và cài đặt một số chương trình giải tự động, một số lớp bài toán về các tam GVHD: PGS.TS. ĐỖ VĂN NHƠN HVTH: LÊ NHỰT TRƯỜNG – CH1101150 3 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB giác, các tứ giác, các bài toán hình học phẳng, các bài toán hình học giải tích và một số bài toán trên các phản ứng hóa học. Trước hết ta cần phải biết cấu trúc của một hệ giải toán thông minh như thế nào và mô hình biểu diễn tri thức đóng vai trò ra sao. Cấu trúc cơ bản của một hệ giải toán tự động dựa trên tri thức bao gồm các thành phần được chỉ ra trên hình 1.1 bên dưới. Hình 1.1 cấu trúc của một hệ giải toán thông minh Có thể thấy rằng cơ sở tri thức giữ vai trò như bộ não của hệ thống trong đó chứa các kiến thức cần thiết cho việc giải một bài toán. Bộ suy diễn sẽ áp dụng các kiến thức trong cơ sở tri thức để tìm lời giải cho bài toán. 1.2. Vấn đề biểu diễn tri thức Biểu diễn tri thức đóng vai trò rất quan trọng trong hệ giải toán thông minh. Theo tổng kết thì có 4 loại biểu diễn tri thức khác nhau: biểu diễn dựa trên logic hình thức, biểu diễn tri thức thủ tục, biễu diễn dạng mạng, và biểu diễn cấu trúc. Mỗi phương pháp này chỉ biểu diễn được một khía cạnh nào đó của tri thức trong khi tri thức cần được biểu diễn da dạng trong các hệ ứng dụng. Các phương pháp biểu diễn tri thức nêu trên đều có ưu điểm nhất định trong biểu diễn từng dạng tri thức. Nhưng tất cả các phương pháp này đều có một nhược điểm chung là chỉ GVHD: PGS.TS. ĐỖ VĂN NHƠN HVTH: LÊ NHỰT TRƯỜNG – CH1101150 Người sử dụng Giao Diện Hệu chỉnh cơ sở tri thức Bộ suy diễn Hệ thống con giải thích Cơ sở tri thức 4 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB biểu diễn một khía cạnh tri thức rất đa dạng và chưa hướng tới biểu diễn một tri thức bao hàm nhiều dạng thông tin, nhiều dạng sự kiện khác nhau. Các hệ giải toán như: các chương trình tính toán hình học trong bộ phần mềm Engineering 2000, chương trình StudyWorks, chương trình Math Express chúng đều có một hạn chế lớn nhất là không cho ta những mô hình biểu diễn tri thức tốt giúp xây dựng một cơ sở tri thức, bộ suy diễn và các thành phần khác của hệ thống. Từ đó ông nêu ra các mô hình biểu diễn tri thức như: mô hình một đối tượng tính toán (C-Object), mô hình tri thức về các C-Object, và mô hình mạng các C- Object và các ứng dụng của chúng vào các bài toán giải toán một C-Object, các bài toán hình học phẳng, giải các bài toán hình học giải tích ba chiều, và giải một số các bài toán về phản ứng hóa học. Ta sẽ đi vào nghiên cứu cách biểu diễn tri thức của các hệ giải toán này. 1.3. Mô hình tri thức các đối tượng tính toán Để giúp hệ giải toán tự động tối ưu có thể ứng dụng rộng rãi cho nhiều bài toán phức tạp, PGS.TS Đỗ Văn Nhơn và GS.TSKH.Hoàng Kiếm đã nêu ra mô hình tri thức gọi là mô hình tri thức các đối tượng tính toán. Trước hết ta cần tìm hiểu thế nào là một đối tượng tính toán (C-Object): là một đối tượng O có cấu trúc bao gồm: – Một danh sách các thuộc tính Attr(O) ={x1, x2, , xn} và giữa các thuộc tính có liên hệ qua các sự kiện, các luật suy diễn hay công thức tính toán. – Các hành vi liên quan đến sự suy diễn và tính toán trên các thuộc tính của đối tượng như: o Xác định bao đóng của một tập thuộc tính A. o Xét tính giải được của một bài toán suy diễn tính toán có dạng A → B, với A và B là con của Attr(O). o Thực hiện các tính toán. o Thực hiện gợi ý bổ sung giả thiết cho bài toán o Xem xét tính xác định của đối tượng Một C-Object có thể được mô hình hóa bởi một bộ: GVHD: PGS.TS. ĐỖ VĂN NHƠN HVTH: LÊ NHỰT TRƯỜNG – CH1101150 5 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB (Attrs, F, Facts, Rules) Trong đó: Attrs là tập thuộc tính của đối tượng, F là các quan hệ suy diễn tính toán, Facts là tập hợp các tính chất vốn có của đối tượng, và Rules là tập hợp các luật suy diễn trên các sự kiện. Mô hình tri thức các đối tượng tính toán có thể dùng biểu diễn cho một dạng cơ sở tri thức bao gồm các khái niệm về các đối tượng có cấu trúc cùng với các loại quan hệ và các công thức tính toán liên quan. Ta gọi một mô hình tri thức các C-Object, viết tắt là một mô hình COKB (Computational Objects Knowledge Base), là một hệ thống (C, H, R, Ops, Rules) gồm: – Một tập hợp C các khái niệm về C-Object: mỗi khái niệm là một lớp C-Object có cấu trúc bên trong như sau: o Kiểu đối tượng o Danh sách các thuộc tính o Quan hệ trên cấu trúc thiết lập o Tập hợp các điều kiện ràng buộc trên các thuộc tính o Tập hợp các tính chất nội tại trên thuộc tính. o Tập hợp các quan hệ suy diễn - tính toán o Tập hợp các luật suy diễn có dạng: {các sự kiện giả thiết} → {các sự kiện kết luận} – Một tập H các quan hệ phân cấp giữa các loại đối tượng: có thể nói rằng H là một biểu đồ Hasse khi xem quan hệ phân cấp trên là một quan hệ thứ tự trên C. – Một tập R các loại quan hệ trên các đối tượng: mối quan hệ được xác định bởi <tên quan hệ> và các loại đối tượng của quan hệ, và quan hệ có thể có một số tính chất nhất định. – Một tập Ops các toán tử: các toán tử cho ta một số phép toán nhất định trên các biến thực cũng như trên các đối tượng – Một tập hợp Rules gồm các luật được phân lớp: mỗi luật cho ta một qui tắc suy luận để đi đến các sự kiện mới từ các sự kiện nào đó, và về mặt cấu trúc mỗi luật r có thể được mô hình dưới dạng GVHD: PGS.TS. ĐỖ VĂN NHƠN HVTH: LÊ NHỰT TRƯỜNG – CH1101150 6 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB r : {sk 1 , sk 2 , , sk n } → {sk 1 , sk 2 , , sk m } Một số loại sự kiện: o Sự kiện thông tin về loại của một đối tượng. o Sự kiện về tính xác định của một đối tượng (các thuộc tính coi như đã biết) hay của một thuộc tính. o Sự kiện về xác định của một thuộc tính hay một đối tượng thông qua một biểu thức hằng. o Sự kiện về phụ thuộc của một đối tượng hay của một thuộc tính theo những đối tượng hay các thuộc tính khác thông qua một công thức tính toán o Sự kiện về một quan hệ trên các đối tượng hay trên các thuộc tính của đối tượng. 1.4 Mô hình cơ sở tri thức COKB 1.4.1 Mô hình Ta gọi một mô hình tri thức về các đối tượng tính toán, viết tắt là một mô hình COKB (Computational Objects Knowledge Base), là một hệ thống (C, H, R, Ops, Funcs, Rules) gồm: ° Một tập hợp C các khái niệm về các đối tượng tính toán: – Mỗi khái niệm là một loại đối tượng tính toán có cấu trúc và được phân mức theo sự thiết lập của cấu trúc đối tượng, gồm: biến thực, đối tượng cơ bản, đối tượng mức 1 và đối tượng mức 2. – Các đối tượng cơ bản có cấu trúc rỗng hoặc có cấu trúc gồm một số thuộc tính thuộc kiểu thực. Các đối tượng loại nầy có thể làm nền cho sự thiết lập các đối tượng ở mức cao hơn. – Các đối tượng tính toán mức 1 có một thuộc tính loại <real> và có thể được thiết lập từ một danh sách nền các đối tượng cơ bản. – Các đối tượng tính toán mức 2 có các thuộc tính loại real và các thuộc tính thuộc loại đối tượng mức 1, và đối tượng có thể được thiết lập trên một danh sách nền các đối tượng cơ bản. ° Một tập hợp H các quan hệ phân cấp giữa các loại đối tượng GVHD: PGS.TS. ĐỖ VĂN NHƠN HVTH: LÊ NHỰT TRƯỜNG – CH1101150 7 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB – Trên tập hợp C ta có một quan hệ phân cấp theo đó có thể có một số khái niệm là sự đặc biệt hóa của các khái niệm khác, chẳng hạn như một tam giác cân cũng là một tam giác, một hình bình hành cũng là một tứ giác. Có thể nói rằng H là một biểu đồ Hasse khi xem quan hệ phân cấp trên là một quan hệ thứ tự trên C. ° Một tập hợp R các khái niệm về các loại quan hệ trên các loại đối tượng – Mỗi quan hệ được xác định bởi <tên quan hệ> và các loại đối tượng của quan hệ, và quan hệ có thể có một số tính chất trong các tính chất sau đây: tính chất phản xạ, tính chất đối xứng, tính chất phản xứng và tính chất bắc cầu. ° Một tập hơp Ops các toán tử – Các toán tử cho ta một số phép toán trên các biến thực cũng như trên các đối tượng, chẳng hạn các phép toán số học và tính toán trên các đối tượng đoạn và góc tương tự như đối với các biến thực. ° Một tập hợp Funcs các chức năng: – bao gồm các chức năng trên Com-Objects. Chức năng cũng là một loại kiến thức phổ biến trong các lĩnh vực thực tế, đặc biệt là lĩnh vực khoa học tự nhiên như các lĩnh vực của toán học, lĩnh vực vật lý. – Trong hình học phân tích, chúng ta có các chức năng: khoảng cách giữa hai điểm, khoảng cách từ một điểm đến một đường thẳng hoặc một máy bay, dự báo của một điểm hoặc một dòng lên máy bay, yếu tố quyết định của ma trận vuông cũng là một chức năng trên ma trận vuông trong đại số tuyến tính. ° Một tập hơp Rules gồm các luật – Các luật thể hiện các tri thức mang tính phổ quát trên các khái niệm và các loại sự kiện khác nhau. Mỗi luật cho ta một qui tắc suy luận để đi đến các sự kiện mới từ các sự kiện nào đó, và về mặt cấu trúc nó gồm 2 thành phần chính là: phần giả thiết của luật và phần kết luận của luật. Phần giả thiết và phần kết luận đều là các tập hợp sự kiện trên các đối tượng nhất định. GVHD: PGS.TS. ĐỖ VĂN NHƠN HVTH: LÊ NHỰT TRƯỜNG – CH1101150 8 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB Ví dụ: Phần kiến thức về các tam giác và các tứ giác trong hình học phẳng có thể được biểu diễn theo mô hình tri thức về các đối tượng tính toán như dưới đây. ° Các khái niệm về các đối tượng gồm : – Điểm. – Đoạn thẳng. – Góc. – Các loại tam giác và các loại tứ giác. ° Các quan hệ phân cấp giữa các loại đối tượng : Giữa các khái niệm về các loại tam giác và các loại tứ giác có các quan hệ phân cấp theo sự đặc biệt hóa của các khái niệm, được thể hiện bởi các biểu đồ sau đây: ° Các khái niệm về các loại quan hệ giữa các loại đối tượng : Các quan hệ giữa các khái niệm bao gồm các loại quan hệ như: – Quan hệ thuộc về của 1 điểm đối với một đoạn thẳng. – Quan hệ trung điểm của một điểm đối với một đoạn thẳng. – Quan hệ song song giữa 2 đoạn thẳng. – Quan hệ vuông góc giữa 2 đoạn thẳng. – Quan hệ bằng nhau giữa 2 tam giác. ° Các toán tử : Các toán tử số học và các hàm sơ cấp cũng áp dụng đối với các đối tựng loại “đoạn thẳng” và các đối tượng loại “góc”. ° Các luật : Các luật thể hiện các định lý hay qui tắc suy diễn trên các loại sự kiện khác nhau. GVHD: PGS.TS. ĐỖ VĂN NHƠN HVTH: LÊ NHỰT TRƯỜNG – CH1101150 9 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB Ví dụ: Một tam giác ABC có 2 cạnh AB và AC bằng nhau thì tam giac là tam giác cân tại A. Với 3 đoạn thẳng a, b và c, nếu a // b và a ⊥ c thì ta có b ⊥ c. 1.4.2 Tổ chức cơ sở tri thức COKB Cơ sở tri thức COKB có thể được tổ chức bởi một hệ thống tập tin văn bản có cấu trúc như sau: – Tập tin “Objects.txt” lưu trữ các định danh cho các loại đối tượng C-Object. – Tập tin “RELATIONS.txt” lưu trữ thông tin về các loại quan hệ khác nhau trên các loại C-Object. – Tập tin “Hierarchy.txt” lưu lại các biễu đồ Hasse thể hiện quan hệ phân cấp trên các khái niệm. – Các tập tin với tên tập tin để lưu trữ các cấu trúc của loại đối tượng. – Tập tin “Operators.txt” lưu trữ các thông tin về các toán tử trên các đối tượng. – Tập tin “FACTS.txt” lưu trữ thông tin về các loại sự kiện khác nhau. – Tập tin “RULES.txt” lưu hệ luật của cơ sở tri thức. GVHD: PGS.TS. ĐỖ VĂN NHƠN HVTH: LÊ NHỰT TRƯỜNG – CH1101150 Cấu trúc đối tượng Các loại sự kiện Biểu đồ phân cấp khái niệm Các quan hệ Các loại đối tượng Các luật Các toán tử . . . Cấu trúc đối tượng 10 [...]... Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB – Câu: gồm các từ/ ngữ có quan hệ ngữ pháp hay ngữ nghĩa với nhau và có chức năng cơ bản là thông báo – Văn bản: hệ thống các câu liên kết với nhau về mặt hình thức, ngữ pháp, ngữ nghĩa và ngữ dụng  Các quan hệ trong ngôn ngữ Mỗi loại đơn vị kể trên làm thành một tiểu hệ thống trong một hệ thống lớn là hệ thống. .. Dacta.xml Mô hình bài toán được biểu diễn như hình 4.1: Đề bài toán Bộ phận chuyển ngôn ngữ tiền đặc tả Phân loại giả thiết kết luận CSDL mẫu câu Mẫu câu với đặc tả mẫu câu với đặc tả Bộ làm sau đặc tả Ngôn ngữ đặc tả Dacta.xm l Hình 3.1: mô hình bài toán chuyển từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả GVHD: PGS.TS ĐỖ VĂN NHƠN 27 HVTH: LÊ NHỰT TRƯỜNG – CH1101150 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ. .. TRƯỜNG – CH1101150 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB – Ngữ nghĩa: mối quan hệ giữa đơn vị ngôn ngữ với nội dung (về mặt ý nghĩa) của đơn vị đó – Ngữ dụng: mối quan hệ giữa đơn vị ngôn ngữ với mục đích sử dụng của đơn vị đó 1.4 Đặc điểm của ngôn ngữ tự nhiên tiếng Việt và Tiếng Anh  Đặc điểm của tiếng Anh Tiếng Anh được xếp vào loại hình biến cách.. .Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB Hình 1.2 : biểu đồ liên hệ giữa các thành phần trong mô hình COKB Do cách tổ chức tri thức trong mô hình COKB rõ ràng và rành mạch với đầy đủ các thông tin cùng với các liên hệ khác nhau rất đa dạng Và cũng chính vì thế ta phải phân tích đầu vào rành mạch giống như các thành phần trong mô hình cơ sở... toán tự động được tự nhiên hơn, trong đề tài này em sẽ đi sâu vào nghiên cứu và xây dựng hệ thống Dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả Vấn đề ở đây có nghĩa là: khi ta nhập một đề bài toán bằng ngôn ngữ tự nhiên thì hệ thống sẽ tự động xử lý để đưa ra dạng ngôn ngữ đặc tả của bài toán để làm đầu vào cho hệ giải toán thông minh Hướng giải quyết vấn đề: – Dựa trên bộ từ điển toán học có ngữ. .. CH1101150 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB PHẦN 2: CƠ SỞ LÝ THUYẾT 1 Tìm hiểu về ngôn ngữ tự nhiên Trước hết ta cần phân biệt thuật ngữ ngôn ngữ tự nhiên ( Natural Language), như tiếng Việt, tiến Anh, tiếng Pháp, tiếng Nga với ngôn ngữ nhân tạo (Artificial Language), như: ngôn ngữ máy tính (C, Pascal, C# ) Có khoảng 5600 ngôn ngữ trên thế giới,... NHỰT TRƯỜNG – CH1101150 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB Tóm lại, ngôn ngữ có thể được hiểu là hệ thống những âm, những từ và những quy tắc kết hợp chúng mà những người trong cùng một cộng đồng dùng làm phương tiện để giao tiếp với nhau 1.2 Bản chất của ngôn ngữ Ngôn ngữ là một hiện tượng xã hội: không là hiện tượng tự nhiên, cá nhân, sinh vật... hình thái ngữ pháp và ngữ nghĩa ta sẽ xây dựng và chuyển đổi cây cú pháp từ ngôn ngữ nguồn sang ngôn ngữ đích như sau: NP P Det a Hình Adj new NP P N1 N0 Det computer system một N0 N1 hệ thống máy tính Adj mới 2.3: chuyển đổi cây cú pháp Anh – Việt của một danh ngữ GVHD: PGS.TS ĐỖ VĂN NHƠN 26 HVTH: LÊ NHỰT TRƯỜNG – CH1101150 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả. .. cho các hệ giải toán tự động mà những đặc tả đó phải do con người làm bằng tay Trong đề tài này, em sẽ sử dụng kết quả của xử lý ngôn ngữ tự nhiên ứng dụng vào hệ dịch tự động, nhưng không phải để xây dựng phần mềm dịch từ tiếng nước này sang tiếng nước khác mà là xây dựng phần mềm dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả để làm đầu vào cho các hệ giải toán tự động 2.3 Các bài toán trong dịch máy... ngôn ngữ đặc tả với mô hình COKB PHẦN 3: NGHIÊN CỨU THỰC NGHIỆM Qua việc khảo sát bài toán xây dựng và phát triển các mô hình biểu diễn tri thức cho hệ giải toán tự động” của GS.TSKH.Hoàng Kiếm và phần cơ sở lý thuyết về xử lý ngôn ngữ tự nhiên trong hệ dịch tự động Dựa trên những cơ sở đó, trong phần này tôi sẽ nghiên cứu và phát triển bài toán dịch ngôn ngữ tự nhiên sang ngôn ngữ đặc tả và nêu lên . 19 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB – Phân tích hình thái ngôn ngữ: tách từ nhận diện tên riêng, từ viết tắt. – Phân tích từ pháp ngôn. TRƯỜNG – CH1101150 15 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB – Câu: gồm các từ/ ngữ có quan hệ ngữ pháp hay ngữ nghĩa với nhau và có chức năng. 16 Nghiên cứu xây dựng hệ thống dịch từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả với mô hình COKB – Ngữ nghĩa: mối quan hệ giữa đơn vị ngôn ngữ với nội dung (về mặt ý nghĩa) của đơn vị đó. – Ngữ

Ngày đăng: 10/04/2015, 09:58

Từ khóa liên quan

Mục lục

  • PHẦN 1: TỔNG QUAN VỀ TIẾP NHẬN VÀ

  • BIỄU DIỄN TRI THỨC

    • 1. Khảo sát bài toán xây dựng và phát triển các mô hình biểu diễn tri thức cho các hệ giải toán tự động

      • 1.1 Giới thiệu

      • 1.2. Vấn đề biểu diễn tri thức

      • 1.3. Mô hình tri thức các đối tượng tính toán

        • 1.4.2 Tổ chức cơ sở tri thức COKB

        • 1.5. Bài toán giải toán một C-Object

        • 1.6. Bài toán hình học phẳng

        • 1.7. Ví dụ

        • 2. Vấn đề còn tồn tại trong bài toán

        • 3. Vấn đề cần tập trung nghiên cứu và giải quyết

        • PHẦN 2: CƠ SỞ LÝ THUYẾT

          • 1. Tìm hiểu về ngôn ngữ tự nhiên

            • 1.1. Định nghĩa

            • 1.2. Bản chất của ngôn ngữ

            • 1.3. Tính hệ thống của ngôn ngữ

            • 1.4. Đặc điểm của ngôn ngữ tự nhiên tiếng Việt và Tiếng Anh

            • 2. Các phương pháp xử lý ngôn ngữ tự nhiên ứng dụng trong dịch tự động

              • 2.1. giới thiệu các ứng dụng của xử lý ngôn ngữ tự nhiên

              • 2.2. Một số hệ dịch máy

              • 2.3. Các bài toán trong dịch máy

              • PHẦN 3: NGHIÊN CỨU THỰC NGHIỆM

                • 1. Mô tả bài toán cần xử lý

                • 2. Giải quyết bài toán dịch ngôn ngữ tự nhiên sang ngôn ngữ đặc tả

                  • 2.1. Quy ước chung cho bài toán

                  • 2.2. Mô hình đặc tả tổng quát

                  • 3.2.3. Giải quyết vấn đề chuyển mẫu câu thành dạng tiền đặc tả

Tài liệu cùng người dùng

Tài liệu liên quan