Tiểu luận MÔN BIỂU DIỄN TRI THỨC VÀ ỨNG DỤNG Xây dựng ontology về sách

22 889 6
Tiểu luận MÔN BIỂU DIỄN TRI THỨC VÀ ỨNG DỤNG Xây dựng ontology về sách

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Đại Học Công Nghệ Thông Tin Đại Học Quốc Gia Thành Phố Hồ Chí Minh TP. HCM 12/2012 GVHD : PGS.TS.Đỗ Văn Nhơn Học viên: Trương Lê Hưng MS: CH1101089 Lớp: Cao Học khóa 6 Môn học: Biểu diễn tri thức và Ứng dụng Lời mở đầu Để biểu diễn tri thức ngày nay có rất nhiều phương pháp biểu diễn như: biểu diễn tri thức bằng mạng ngữ nghĩa, biểu diễn tri thức bằng script, biểu diễn tri thức bằng luật dẫn, biểu diễn tri thức bằng frame, biểu diễn tri thức bằng logic vị từ, biểu diễn tri thức bằng ontology. Trong nội dung bài thu hoạch này em xin phép được trình bày phương pháp biểu diễn tri thức bằng Ontology và cách sử dụng công cụ Protégé để xây dựng Ontology về sách. Nội dung bài thu hoạch bao gồm : Phần 1 : Cơ sở lý thuyết về ontology Phần 2 : Xây dựng ontology về sách bằng công cụ protégé Phần 3 : Kết quả đạt được và hướng phát triển. Phần 4 : Tài liệu tham khảo Môn học: Biểu diễn tri thức và Ứng dụng Trang 2 Mục lục Môn học: Biểu diễn tri thức và Ứng dụng Trang 3 Phần I . Cơ sở lý thuyết về ontology 1. Tổng quan về ontology a. Giới thiệu Ontology trở thành một lĩnh vực nghiên cứu phổ biến có mặt trong nhiều lĩnh vực từ xử lý ngôn ngữ tự nhiên, công nghệ tri thức, các hệ thống trao đổi, tích hợp thông tin cho đến biểu diễn và quản lý tri thức. Ontology được xây dựng để cung cấp các nguồn thông tin có ngữ nghĩa mà máy tính có thể xử lý và thao tác được nhưng đồng thời vẫn có thể giao tiếp được giữa người và phần mềm. b. Định nghĩa Ontology là một thuật ngữ có nguồn gốc từ Triết học diễn tả các thực thể tồn tại trong tự nhiên và các mối quan hệ giữa chúng. Trong khoa học máy tính, Ontology là biểu diễn hình thức của một tập các khái niệm trong miền cụ thể và các mối quan hệ giữa các khái niệm. Ontology được dùng để suy luận về các thuộc tính của miền, có thể được dùng để định nghĩa miền. Theo lý thuyết, Ontology là một đặc tả hình thức, rõ ràng của một khái niệm được dùng chung. Một Ontology cung cấp một bảng từ vựng dùng chung, bảng từ vựng này có thể được sử dụng để mô hình hóa một miền, cung cấp các đối tượng và (hoặc) các khái niệm đang có, và các thuộc tính cùng với các mối quan hệ của chúng. Ontologies được sử dụng trong trí tuệ nhân tạo, Web ngữ nghĩa, công nghệ phần mềm, trong tin sinh, thư viện học, và kiến trúc thông tin như một dạng biểu diễn tri thức về thế giới hoặc một về một miền ứng dụng cụ thể. Ontology cung cấp một bộ từ vựng chung bao gồm các khái niệm, các thuộc tính quan trọng và các định nghĩa về các khái niệm và các thuộc tính này. Ngoài bộ từ vựng, Ontology còn cung cấp các ràng buộc, đôi Môn học: Biểu diễn tri thức và Ứng dụng Trang 4 khi các ràng buộc này được coi như các giả định cơ sở về ý nghĩa mong muốn của bộ từ vựng, nó được sử dụng trong một miền mà có thể được giao tiếp giữa người và các hệ thống ứng dụng phân tán khác. Việc tiếp cận ngữ nghĩa tài nguyên Web thông qua các Ontology thì mềm dẻo hơn vì người sử dụng có thể lựa chọn bộ từ vựng và các ràng buộc trong các Ontology. Ví dụ, các ứng dụng trong các miền khác nhau có thể sử dụng các Ontology khác nhau. Đặc biệt, các Ontology có thể được sử dụng để đặc tả ý nghĩa của các tài nguyên Web (thông qua các chú thích) bằng cách xác nhận các tài nguyên như các trường hợp cụ thể của một số khái niệm quan trọng và hay hoặc khẳng định các tài nguyên có quan hệ với các tài nguyên khác thông qua một số thuộc tính quan trọng đã định nghĩa trong các Ontology. Từ vựng trong một Ontology có thể được biểu diễn bằng các khái niệm và các quan hệ được đặt tên và các định nghĩa khái niệm có thể được biểu diễn bằng các giới thiệu tương đương. Các giả định cơ sở có thể được biểu diễn bằng các tiên đề khái niệm và quan hệ khái quát. Đôi khi một Ontology tương ứng với một cơ sở tri thức logic mô tả. Một Ontology cũng chứa các trường hợp của các khái niệm và các mối quan hệ quan trọng của các cá thể này, nó được biểu diễn bằng các khẳng định của logic mô tả Môn học: Biểu diễn tri thức và Ứng dụng Trang 5 2. Các thành phần trong ontology a. Các cá thể (Individuals) Các cá thể là các thành phần cơ bản, nền tảng của một ontology. Các cá thể trong một ontology có thể bao gồm các đối tượng cụ thể như con người, động vật, cái bàn cũng như các cá thể trừu tượng như các thành viên hay các từ. Một ontology có thể không cần bất kỳ một cá thể nào, nhưng một trong những lý do chính của một ontology là để cung cấp một ngữ nghĩa của việc phân lớp các cá thể, mặc dù các cá thể này không thực sự là một phần của ontology. b. Các lớp (Classes) – khái niệm Các lớp là các nhóm, tập hợp các đối tượng trừu tượng. Chúng có thể chứa các cá thể, các lớp khác, hay là sự phối hợp của cả hai. Các ontology biến đổi tuỳ thuộc vào cấu trúc và nội dung của nó: Một lớp có thể chứa các lớp con, có thể là một lớp tổng quan (chứa tất cả mọi thứ), có thể là lớp chỉ chứa những cá thể riêng lẻ, Một lớp có thể xếp gộp vào hoặc bị xếp gộp vào bởi các lớp khác. Mối quan hệ xếp gộp này được sử dụng để tạo ra một cấu trúc có thứ bậc các lớp, thường là với một lớp thông dụng nhất kiểu Thing ở trên đỉnh và các lớp rất rõ ràng ở phía dưới cùng. Ví dụ: Sách, Người, Tác_giả, Nhà_sách c. Các thuộc tính (Properties) Các đối tượng trong ontology có thể được mô tả thông qua việc khai báo các thuộc tính của chúng. Mỗi một thuộc tính đều có tên và giá trị của thuộc tính đó. Các thuộc tính được sử dụng để lưu trữ các thông tin mà đối tượng có thể có. Ví dụ, đối với một quyển sách có thể có các thuộc tính: tên, ngày_xuất_bản, giá_bìa, chiều_rộng Giá trị của một thuộc tính có thể có các kiểu dữ liệu phức tạp. d. Quan hệ (Relation) Môn học: Biểu diễn tri thức và Ứng dụng Trang 6 Một trong những ứng dụng quan trọng của việc sử dụng các thuộc tính là để mô tả mối liên hệ giữa các đối tượng trong ontology. Một mối quan hệ là một thuộc tính có giá trị là một đối tượng nào đó trong ontology. Một kiểu quan hệ quan trọng là kiểu quan hệ xếp gộp (subsumption). Kiểu quan hệ này mô tả các đối tượng nào là các thành viên của các lớp nào của các đối tượng. Hiện tại, việc kết hợp các ontology là một tiến trình được làm phần lớn là thủ công, do vậy rất tốn thời gian và đắt đỏ. Việc sử dụng các ontology là cơ sở để cung cấp một định nghĩa thông dụng của các thuật ngữ cốt lõi có thể làm cho tiến trình này trở nên dễ quản lý hơn. Hiện đang có các nghiên cứu dựa trên các kỹ thuật sản sinh để nối kết các ontology, tuy nhiên lĩnh vực này mới chỉ hiện hữu về mặt lý thuyết. 3. Ngôn ngữ OWL Web Ontology Language (OWL) là ngôn ngữ đánh dấu được sử dụng để xuất bản và chia sẻ dữ liệu sử dụng các ontology trên Internet. OWL là một bộ từ vựng mở rộng của khung mô tả tài nguyên (RDF) và được kế thừa từ ngôn ngữ DAML+OIL Web ontology – một dự án được hỗ trợ bởi W3C. OWL biểu diễn ý nghĩa của các thuật ngữ trong các từ vựng và mối liên hệ giữa các thuật ngữ này để đảm bảo phù hợp với quá trình xử lý bởi các phần mềm. OWL được xem như là một kỹ thuật trọng yếu để cài đặt cho Semantic Web trong tương lai. OWL được thiết kế đặc biệt để cung cấp một cách thức thông dụng trong việc xử lý nội dung thông tin của Web. Ngôn ngữ này được kỳ vọng rằng sẽ cho phép các hệ thống máy tính có thể đọc được thay thế cho con người. Vì OWL được viết bởi XML, các thông tin OWL có thể dễ dàng trao đổi giữa các kiểu hệ thống máy tính khác nhau, sử dụng các hệ điều hành và các ngôn ngữ ứng dụng khác nhau. Mục đích chính của OWL là sẽ cung cấp các chuẩn để tạo ra một Môn học: Biểu diễn tri thức và Ứng dụng Trang 7 nền tảng để quản lý tài sản, tích hợp mức doanh nghiệp và để chia sẻ cũng như tái sử dụng dữ liệu trên Web. OWL được phát triển bởi nó có nhiều tiện lợi để biểu diễn ý nghĩa và ngữ nghĩa hơn so với XML, RDF và RDFS, và vì OWL ra đời sau các ngôn ngữ này, nó có khả năng biểu diễn các nội dung mà máy có thể biểu diễn được trên Web. Môn học: Biểu diễn tri thức và Ứng dụng Trang 8 Phần II. Thiết kế ontology về sách bằng công cụ protégé 1. Giới thiệu công cụ Protégé. Một số công cụ phát triển và hiệu chỉnh có giá trị trong việc làm giảm độ phức tạp và thời gian dùng cho nhiệm vụ xây dựng ontology. Các công cụ như Kaon, OileEd và Protégé cung cấp các giao diện nhằm giúp đỡ người sử dụng thực hiện các hoạt động chính yêu trong trong quá trình phát triển một ontology. Việc lựa chọn một công cụ hiệu chỉnh phù hợp nhất có nhiều khó khăn vì mỗi kiểu ontology có các yêu cầu về kinh phí, thời gian, tài nguyên khác nhau. Để giúp cho việc giải quyết vướng mắc này, Singh & Murshed (2005) đưa ra các tiêu chuẩn đánh giá công cụ tạo ontology. Tiêu chuẩn bao gồm tính năng, khả năng sử dụng lại, lưu trữ dữ liệu, mức độ phức tạp, quan hệ, tính lâu bền, độ an toàn, độ chắc chắn, khả năng học, tính khả dụng, hiệu lực, và tính rõ ràng. Protégé và OntoEditFree được phát triển bởi Singh & Murshed sử dụng các tiêu chuẩn này. Một số công cụ hiệu chỉnh ontology phổ biến: Môn học: Biểu diễn tri thức và Ứng dụng Trang 9 Protégé là một phần mềm mã nguồn mở miễn phí cung cấp cho cộng đồng người sử dụng với một bộ công cụ để xây dựng các mô hình miền và các ứng dụng dựa trên tri thức với ontology. Về cơ bản, Protégé thực hiện một tập hợp phong phú của các cấu trúc mô hình tri thức và hành động hỗ trợ sự sáng tạo, trực quan, và thao tác của ontology trong các định dạng khác nhau. Protégé có thể được tùy chỉnh để cung cấp tên miền thân thiện hỗ trợ cho việc tạo ra các mô hình kiến thức và nhập dữ liệu. Hơn nữa, Protégé có thể được mở rộng như một plug-in và có một giao diện lập trình ứng dụng dựa trên Java (API) để xây dựng các công cụ và các ứng dụng dựa trên tri thức. Protégé hỗ trợ 2 mô hình ontology là Protégé-Frame và Protégé- OWL: Protégé-Frame cung cấp một giao diện người dùng đầy đủ và mô hình có sẵn để tạo, lưu trữ ontrology dưới dạng frame Protégé-OWL hỗ trợ về Web Ontology languge, được chứng thực dựa vào W3C, semantic web. Môn học: Biểu diễn tri thức và Ứng dụng Trang 10 [...]... được và hướng phát tri n 1 Kết quả đạt được Ontology xây dựng dựa trên Protégé 3.4.3 Đã xây dựng được một hệ thống Ontology sách với 75 lớp, 32 thuộc tính và các cá thể gồm 27 thể loại sách, hơn 700 quyển sách, 470 tác giả, 68 nhà xuất 2 bản và các thông tin chi tiết của quyển sách Hướng phát tri n Tiếp tục phát tri n và tiến đến xây dựng một hệ thống hoàn chỉnh tri thức biểu diễn Ontology sách Xây dựng. .. Đặc_điểm _sách nội dung về bí quyết kinh doanh Môn học: Biểu diễn tri thức và Ứng dụng Trang 16 - Tác_giả: lớp con của Đặc_điểm _sách, là tác giả quyển sách Tổng_biên_tập: lớp con của Đặc_điểm _sách, là tổng biên tập quyển sách Trình bày trong Protégé như hình: b Xây dựng các thuộc tính Môn học: Biểu diễn tri thức và Ứng dụng Trang 17 Trong qua trình phân tích các mối quan hệ giữa các lớp em đã xây dựng mô... tin vào các 3 thuộc tính của lớp đó Xây dựng Ontology về sách a Thiết kế lớp Sau khi nghiên cứu và phân tích em đưa ra các khái niệm Ontology về sách như sau: - Sách: Lớp tổng quan về sách - Sách_ bí_quyết_kinh_doanh: lớp con của Sách nội dung về bí quyết - kinh doanh Sách_ chính_trị_hồi_ký: lớp con của Sách nội dung về chính trị, hồi - ký chính trị v.v Sách_ chứng_khoán: lớp con của Sách nội dung về chứng... nào để phát tri n các ontology Quy trình phát tri n sau gồm 7 bước do Stanford Center for Biomedical Informatics Research đưa ra (đây là nhóm phát tri n phần mềm Protégé để trình diễn và soạn thảo Ontology) Môn học: Biểu diễn tri thức và Ứng dụng Trang 11 Xác định phạm vi và lĩnh vực ontology Cần xác định mục đích của việc xây dựng ontology là gì? Phục vụ đối a tượng nào? Ontology sắp xây dựng cần có... khoán Môn học: Biểu diễn tri thức và Ứng dụng Trang 14 - Sách_ cẩm_nang_nuôi_dạy_trẻ: lớp con của Sách nội dung về các - bí quyết cẩm nang nuôi dạy trẻ dành cho cha mẹ Sách_ du_lịch: lớp con của Sách nội dung về quản bá du lịch, - hướng dẫn du lịch, thủ thuật du lịch v.v… Sách_ giáo_khoa: lớp con của Sách nội dung về các loại sách cung - cấp kiến thức, với mục đích dạy và học Sách_ giáo_viên: lớp con của Sách. .. tiếng hàn v.v… Sách_ nông_nghiệp: lớp con của Sách nội dung về nông nghiệp, - trồng trọt, chăn nuôi v.v… Sách_ nữ_công: lớp con của Sách nội dung về nấu ăn, cắm hoa - v.v… Sách_ pháp_luật: : lớp con của Sách nội dung về pháp luật, quy định nhà nước v.v… Môn học: Biểu diễn tri thức và Ứng dụng Trang 15 - Sách_ tham_khảo_cấp_I: lớp con của Sách nội dung là sách tham - khảo dành cho bậc tiểu học Sách_ tham_khảo_cấp_II:... Sách_ bí_quyết_kinh_doanh sách mới Protégé sẽ tự tạo ra form Môn học: Biểu diễn tri thức và Ứng dụng Trang 19 tạo Sách với các thuộc tính ràng buộc đã được quy định trước như hình bên dưới: Thay tên sách trong trường “For individual” sau dấu # Chọn các thuộc tính ràng buộc với các lớp khác, có thể tạo một individual của lớp khác trong khi tạo các mối ràng buộc qua các thuộc tính này Môn học: Biểu diễn tri thức và Ứng dụng. .. v.v… Sách_ tôn_giáo: lớp con của Sách nội dung về tôn giáo, phật giáo, - công giáo v.v… Sách_ từ_điển: lớp con của Sách nội dung về từ điển các loại, anh- - việt, pháp-việt v.v… Sách_ văn_học: lớp con của Sách nội dung về văn học Sách_ âm_nhạc: lớp con của Sách nội dung về âm nhạc Sách_ đại_học: lớp con của Sách nội dung về kiến thức dành cho - bậc đại học Đặc_điểm _sách: lớp tổng quan về đặc điểm sách Biên_soạn:... khi bắt đầu xây dựng ontology, cần xét đến khả năng sử dụng lại các ontology đã có Nếu có thể sử dụng lại một phần các ontology đã có, chi phí bỏ ra cho quá trình xây dựng ontology sẽ giảm đi rất nhiều c Liệt kê các thuật ngữ quan trọng Ontology được xây dựng trên cơ sở các khái niệm trong một lĩnh vực cụ thể, vì vậy khi xây dựng ontology cần bắt đầu từ các thuật ngữ chuyên ngành để xây dựng thành các... sách Xây dựng các hệ thống truy cứu thông tin sách bằng cách câu truy vấn dựa trên Ontology Xây dựng các hệ thống quản lý sách cho các nhà sách, thư viện v.v… Môn học: Biểu diễn tri thức và Ứng dụng Trang 21 Tài liệu tham khảo Tài liệu tiếng Việt [1] Trần Thị Ngân, phương pháp xây dựng Ontology [2] Nguyễn Quốc Đại, hệ thống hỏi đáp tiếng Việt dựa trên Ontology, Đại học Công nghệ - 2009 [3] Giáp Thị . khóa 6 Môn học: Biểu diễn tri thức và Ứng dụng Lời mở đầu Để biểu diễn tri thức ngày nay có rất nhiều phương pháp biểu diễn như: biểu diễn tri thức bằng mạng ngữ nghĩa, biểu diễn tri thức bằng. ontology về sách bằng công cụ protégé Phần 3 : Kết quả đạt được và hướng phát tri n. Phần 4 : Tài liệu tham khảo Môn học: Biểu diễn tri thức và Ứng dụng Trang 2 Mục lục Môn học: Biểu diễn tri thức và. pháp biểu diễn tri thức bằng Ontology và cách sử dụng công cụ Protégé để xây dựng Ontology về sách. Nội dung bài thu hoạch bao gồm : Phần 1 : Cơ sở lý thuyết về ontology Phần 2 : Xây dựng ontology

Ngày đăng: 10/04/2015, 11:08

Từ khóa liên quan

Mục lục

  • Phần I . Cơ sở lý thuyết về ontology

    • 1. Tổng quan về ontology

    • 2. Các thành phần trong ontology

    • Phần II. Thiết kế ontology về sách bằng công cụ protégé

      • 1. Giới thiệu công cụ Protégé.

      • 2. Các bước xây dựng Ontology

      • 3. Xây dựng Ontology về sách

      • Phần III Kết quả đạt được và hướng phát triển

      • Tài liệu tham khảo

Tài liệu cùng người dùng

Tài liệu liên quan