Tổng quan ontology cho biểu diễn tri thức

22 902 2
Tổng quan ontology cho biểu diễn tri thức

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN CHƯƠNG TRÌNH ĐẠO TẠO THẠC SĨ CNTT QUA MẠNG ۞ University of Information Technology University of Information Technology Tổng quan ontology cho biểu diễn tri thức Lớp: CH-06 Môn Học: Biểu diễn tri thức và ứng dụng GVHD: PGS.TS. Đỗ Văn Nhơn HVTH: Dương Ngọc Nhân, MSHV: CH1101115 TP.HCM, Tháng 01 năm 2013 Tổng quan về ontology 3 1 Định nghĩa ontology và các khái niệm liên quan 6 2 Phân loại và vòng đời ontology 8 3 Phương pháp hình thức trong mô tả ontology 12 4 Các ứng dụng dựa trên ontology 19 Kết luận và hướng bổ sung 21 Tài liệu tham khảo 21 Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 2 Tổng quan về ontology 0.1 Nguồn gốc Thuật ngữ "Ontology" đã được xây dựng từ chữ “Ontos” của Hy Lạp nghĩa là "những gì", "những gì tồn tại" và chữ “Logos” nghĩa là "thuyết giảng" hay "nghiên cứu". Nó xuất hiện lần đầu tiên vào năm 1606 theo thuật ngữ Latin “Ontologia” trong tác phẩm Ogdoas Scholastica của Jacob Lorhard (1561- 1609). Trong triết học, ontology được tạm dịch là “bản thể học” là một nhánh triết học siêu hình cơ bản nghiên cứu liên quan đến các khái niệm về sự tồn tại, các phạm trù cơ bản của các thuộc tính hiện có và phổ biến nhất của các bản thể và mối quan hệ của chúng. Từ thế kỷ thứ 3 trước công nguyên, Aristotle một nhà bác học và triết học của Hy Lạp cổ đại đã có quan tâm đến biểu diễn các tri thức hiện có của thế giới với một phương pháp xác định các lớp đối tượng với các thuộc tính chung trong một cấu trúc phân cấp nơi mà một số lớp có thể đại diện cho các lớp khác. Đây cũng là nền móng cho sự ra đời ontology sau này. Khoa học máy tính mượn thuật ngữ Ontology từ các nhà triết học đầu những năm 80: nó có thể được tìm thấy trong một bài viết của McCarthy (McCarthy, 1980) và trong cuốn sách của John Sowa (Sowa, 1984) trước khi nó trở nên nổi tiếng với các bài viết của Thomas Gruber (Gruber, năm 1993). Tuy nhiên, đến những năm 90 thì từ “ontology” mới được thông qua toàn thể cộng đồng. Thật ra, khái niệm và tạo tác phần mềm (software artifact *) mà chúng ta bây giờ đặt tên “ontologies” đã tồn tại trong khoa học máy tính rất lâu trước khi thuật ngữ “ontology” được lấy từ triết học. Vào những năm 70, khái niệm ontology đã được sử dụng dưới những tên khác nhau trong biểu diễn tri thức của trí tuệ nhân tạo hình thức, ví dụ như T-Box description logics mô tả các loại từ ngữ dùng trong biểu diễn và đặc tính của chúng, hoặc các mạng ngữ nghĩa (Quillian, 1967), hoặc sự hổ trợ của đồ thị khái niệm (Sowa, 1984) mô tả đa thừa kế giữa các loại khái niệm và quan hệ. (*) software artifact – là một trong nhiều loại sản phẩm hữu hình được tạo ra trong quá trình phát triển phần mềm. Các sản phẩm bao gồm tài liệu, mã lệnh, sơ đồ, mô hình, kiến trúc, kế hoạch, v.v) Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 3 0.2 Sự cần thiết của ontology Việc dùng thuật ngữ ontology vào khoa học máy tính là tìm được một cái tên và định nghĩa phù hợp với nhu cầu cần thiết cho việc trừu tượng hóa các khái niệm về bản thể trong các trường hợp khác nhau trong phần mềm và chúng ta đã chuyển từ một lĩnh vực siêu hình, trừu tượng tới một đối tượng cụ thể cho việc nghiên cứu biểu diễn tri thức. Trong ngành khoa học máy tính và khoa học thông tin, ontology mang ý nghĩa là các loại vật và quan hệ giữa chúng trong một hệ thống hay ngữ cảnh cần quan tâm. Các loại vật này còn được gọi là khái niệm, thuật ngữ hay từ vựng có thể được sử dụng trong một lĩnh vực chuyên môn nào đó. Ontology cũng có thể hiểu là một ngôn ngữ hay một tập các quy tắc được dùng để xây dựng một hệ thống Ontology. Một hệ thống Ontology định nghĩa một tập các từ vựng mang tính phổ biến trong lĩnh vực chuyên môn nào đó và quan hệ giữa chúng. Định nghĩa này có thể được hiểu bởi cả con người lẫn máy tính. Một cách khái quát, có thể hiểu Ontology là "một biểu diễn của khái niệm hoá chung được chia sẻ" của một miền hay lĩnh vực nhất định. Nó cung cấp một bộ từ vựng chung bao gồm các khái niệm, các thuộc tính quan trọng và các định nghĩa về các khái niệm và các thuộc tính này. Ngoài bộ từ vựng, Ontology còn cung cấp các ràng buộc, đôi khi các ràng buộc này được coi như các giả định cơ sở về ý nghĩa mong muốn của bộ từ vựng, nó được sử dụng trong một lĩnh vực mà có thể được giao tiếp giữa người và các hệ thống ứng dụng phân tán khác. [1] Hãy xem xét hình 1-1 bên dưới, một khối lập phương ánh sáng được đặt trên bên phải của một khối lập phương tối. Các mô tả của cảnh này đòi hỏi hai điều: 1. một phát biểu của các sự kiện mô tả cảnh. 2. một vốn từ vựng rõ ràng được sử dụng cho phát biểu. Trong biểu diễn tri thức, mô tả khái niệm (Conceptual description) được gọi là sự kiện và từ vựng khái niệm (Conceptual vocabulary) được gọi là một ontology. Vì vậy, một ontology cung cấp một vốn từ vựng khái niệm để xây dựng cho việc mô tả. Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 4 Hình 1-1: một ontology cung cấp một từ vựng khái niệm để mô tả một thực tại (reality) [3] 0.3 Một số chức năng chính Ontology được sử dụng trong trí tuệ nhân tạo, công nghệ Web ngữ nghĩa (Semantic Web), các hệ thống kỹ thuật, kỹ thuật phần mềm, tin học y sinh và kiến trúc thông tin như là một hình thức biểu diễn tri thức về thế giới hoặc một số lĩnh vực cụ thể. Một Ontology cho phép chúng ta giới thiệu các kỷ thuật cho việc suy diễn, phân loại tự động, truy cập thông tin, và khi chia sẻ một ontology giữa các hệ thống khác nhau cũng có thể đảm bảo khả năng tương tác của họ. Hình 1-2: một số chức năng liên quan ontology Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 5 1 Định nghĩa ontology và các khái niệm liên quan 1.1 Các định nghĩa Ontology là một thuật ngữ bắt nguồn từ triết học và được dùng trong trí tuệ nhân tạo và khoa học máy tính với nhiều nghĩa và cách định nghĩa khác nhau: • Một ontology định nghĩa các thuật ngữ và các quan hệ cơ bản bao gồm các từ vựng của một chủ đề nào đó cũng như các luật cho việc kết hợp các thuật ngữ và các quan hệ để xác định các phần mở rộng tới vốn từ đó [Neches et al. 1991] • Một ontology là một hình thức rõ ràng có thể biểu diễn được của một khái niệm, một lớp trừu tượng về một ứng dụng, một lĩnh vực nào đó được chia sẻ giữa nhóm cá thể [Gruber 1993] • Một ontology là một mô tả hình thức của các khái niệm và quan hệ có thể tồn tại trong cộng đồng [Russell & Norving 1995] • Một ontology là một tập hợp các thuật ngữ có cấu trúc phân cấp để mô tả cho một miền hoặc lĩnh vực mà có thể được sử dụng như một nền tảng cơ bản cho cơ sở tri thức [Swarout et al. 1996] • Chủ đề của ontology là nghiên cứu các phạm trù vật chất tồn tại hoặc có thể tồn tại trong một số miền nào đó. Sản phẩm của nghiên cứu này còn được gọi là ontology là một danh sách các loại vật chất được cho là tồn tại trong một miền quan tâm D từ quan điểm của một người dùng ngôn ngữ L cho mục đích nói về D [Sowa, 2000] • Một ontology là một lý thuyết trong đó sử dụng một vốn từ vựng cụ thể để mô tả các thực thể, các lớp, các thuộc tính và các chức năng liên quan với một quan điểm nhất định [Fonseca et al. 2002] Từ những định nghĩa này, chúng ta có thể xác định một số khía cạnh chủ yếu của ontologies: • Các ontologies được sử dụng để mô tả cho một miền cụ thể (domain of interest) • Các thuật ngữ và quan hệ được định nghĩa rõ ràng trong miền đó • Có một cơ chế để tổ chức các thuật ngữ Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 6 • Có một sự đồng thuận giữa những người sử dụng ontology theo cách mà ý nghĩa của các thuật ngữ được sử dụng nhất quán 1.2 Các khái niệm liên quan Ontology: một nhánh của triết học liên quan tới đặc tính tự nhiên và tổ chức của các sự vật hiện tượng. Từ vựng (Vocabulary/lexicon): là một khái niệm thường được dùng trong ngôn ngữ học bao gồm các thuật ngữ được chuẩn hóa với một ngữ nghĩa đã được thừa nhận cho một lĩnh vực cụ thể nào đó trong giao tiếp, ví dụ như các từ điển chuyên đề. Một điểm chung giữa ontology và từ điển chuyên đề là đều bao gồm một số lượng lớn các khái niệm và thuật ngữ giúp chúng ta hiểu rõ ý nghĩa của các khái niệm đó trong một lĩnh vực. Miền hoặc lĩnh vực (Domain): là một đại diện trong những thứ (vật chất) tồn tại trong một lĩnh vực cụ thể của thực tại, ví dụ như: y học, địa lý, sinh thái, pháp luật, v.v Ý niệm (Notion): là cái gì đó hình thành trong ý nghĩ, chúng hợp thành suy nghĩ, tư duy. Nó dùng để cấu trúc tri thức và nhận thức về thế giới. Tăng cường và mở rộng (intension and extension): đây là sự khác biệt giữa cách một ý niệm được xem xét: tăng cường là tập các thuộc tính và đặc tính mô tả khái niệm còn mở rộng là tập những thứ được biểu diễn bởi khái niệm. Ví dụ: khái niệm “xe hơi”, sự tăng cường bao gồm các đặc điểm của một phương tiện đường bộ và một động cơ, thường có bốn bánh và chỗ ngồi cho từ một đến bốn người trong khi sự mở rộng bao gồm “xe màu trắng đậu ở trước trường CNTT”, một “xe Toyotal Rio với biển số 50N 5432” Phân loại (Taxonomy): sự phân lớp, phân cấp các thực/cá thể dựa trên tính tương tự, tương đồng Bộ thuật ngữ và bộ khẳng định (Terminology-Box hay T-box và Assertion box hay A-box): cơ sở tri thức gồm hai bộ phận T-box và A-box, T-box bao gồm các khái niệm và định nghĩa của chúng, nó cũng bao gồm các quan hệ phân cấp ‘is- a’, còn bộ phận A-box bao gồm các thể hiện của các khái niệm và một số khẳng định trên những thể hiện đó. Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 7 Tính đồng âm (Homonymy): một từ vựng có thể tham chiếu tới vài khái niệm hoặc quan hệ hay nói cách khác khái niệm giống nhau có thể có các nghĩa khác nhau Tính đồng nghĩa (Synonymy): một khái niệm hoặc một quan hệ được tham chiếu bởi vài từ vựng hay nói cách khác hai khái niệm khác nhau có thể có cùng một ý nghĩa Khái niệm hóa (Conceptualization): một cấu trúc ngữ nghĩa tăng cường mã hóa các luật ràng buộc lên cấu trúc các thực tại 2 Phân loại và vòng đời ontology 2.1 Phân loại ontology Ontology có thể có các loại khác nhau phụ thuộc trên một vài tiêu chí: • Mức độ chi tiết • Mức độ phụ thuộc 2.1.1 Mức độ chi tiết Căn cứ vào mức độ chi tiết và thô (tổng quan), người ta phân chia một ontology thành hai loại: • Các ontology tham khảo (Reference ontologies): một ontology chi tiết sẽ xác định chính xác hơn ý nghĩa của từ vựng và do đó nó có thể được sử dụng off- line cho mục đích tham khảo (reference). • Các ontology chia sẻ (shareable ontologies): một ontology thô sẽ dễ dàng chia sẻ (shareable) giữa các thành phần khác trên sự đồng thuận về các khái niệm tổng quan cơ bản và do đó nó có thể được sử dụng on-line để hổ trợ các dịch vụ của hệ thống. 2.1.2 Mức độ phụ thuộc Căn cứ vào mức độ phụ thuộc trên một công việc cụ thể hoặc quan điểm nhìn nhận, người ta phân chia một ontology thành bốn loại như hình 3-1: Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 8 Hình 2-2 synonymy Hình 2-1 homonymy • Top-level Ontology: còn gọi là ontology lớp cao, nhằm mô tả những khái niệm tổng quan và trừu tượng, ví dụ như: engineering, person, v.v. Các khái niệm đó độc lập với các bài toán hoặc lĩnh vực cụ thể. • Domain Ontology: mô tả chi tiết và cụ thể hơn các khái niệm đã chỉ ra ở phần top-level ontology cho một lĩnh vực chung nào đó, ví dụ như: mechanical- engineering, software-engineering. Domain ontology được thực hiện nhiều ở các lĩnh vực: y học, di truyền, địa lý, du lịch, thông tin môi trường, v.v. • Task Ontology: mô tả chi tiết và cụ thể hơn các khái niệm đã chỉ ra ở phần top-level ontology cho một tác vụ hoặc một hoạt động nào đó, ví dụ như: requirements analysis. Xem thêm ví dụ chi tiết ở hình 3-2 bên dưới Task ontology được thực hiện cho các tác vụ xây dựng, sắp xếp kế hoạch làm việc, giám sát trong một lĩnh vực khoa học, cơ sở tri thức máy tính dạy học, sự theo dõi phóng tên lửa, các tác vụ hướng dẫn điều trị bệnh, v.v. • Application Ontology: cung cấp một bộ từ vựng xác định được các yêu cầu để mô tả các tác vụ (task) chắc chắn trong một ngữ cảnh của ứng dụng cụ thể. Đặc biệt, nó sử dụng cả domain ontology và task ontology và mô tả vai trò của chúng trong một tác cụ thể. Chúng ta có thể thấy hệ thống phân cấp của ontology thông qua sự trình bày ở trên: ontology ở lớp thấp hơn kế thừa, chuyên môn hóa các khái niệm và mối quan hệ từ ontology lớp trên. Ontology lớp thấp cụ thể hơn và phạm vi ứng dụng thu hẹp hơn, còn ontology ở lớp cao có khả năng rộng hơn, chủ yếu dành cho việc kế thừa và sử dụng lại. Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 9 Hình 3-1 phân loại ontology Hình 3-2: task ontoloty 2.2 Vòng đời (life-cycle) của ontologies Ontologies là các đối tượng sống và mỗi giai đoạn của vòng đời đưa ra các vấn đề để phát triển và nghiên cứu. Vòng đời của ontology bao gồm các giai đoạn: • Khám phá nhu cầu (detection of needs) • Lập kế hoạch và quản lý (management and planning) • Thiết kế (design) • Phát triển (evolution) • Phổ biến (dissemination/diffusion) • Sử dụng (use) • Đánh giá (evaluation) Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 10 [...]... sở tri thức có thể được xây dựng trong các hệ thống khác nhau và theo cách biểu diễn khác nhau 3.4 Ngôn ngữ biểu diễn ontology Ngôn ngữ biểu diễn ontology (ontology representation languages) là các ngôn ngữ hình thức cho phép việc mã hóa tri thức trong một lĩnh vực cụ thể và thường bao gồm các quy tắc suy luận cung cấp cho việc xử lý các yêu cầu dựa trên tri thức đó Theo sau là các ngôn ngữ biểu diễn. .. • Phần tri n khai (Deployment): tri thức được trích ra được phản hồi lại môi trường nghiệp vụ, sự tích hợp tri thức mới và tri thức cũ được thông qua bởi Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 19 ontology nghiệp vụ (Business ontology) , kết quả khai phá được phân tán cho nhiều tổ chức và ánh xạ vào một ontology chung được chia sẻ Có thể tham khảo ứng dụng ontology. .. Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 17 3.5 Những lợi ích từ việc mô tả ontology Ngôn ngữ hình thức có vai trò quan trọng trong hai quá trình phát tri n ontology: mô tả và tri n khai Một bản mô tả ontology sẽ cung cấp các đặc điểm của ontology và nêu bật các đặc điểm này không phụ thuộc vào phương thức cài đặt ontology Bảng mô tả ontology cung cấp những lợi ích... biệt quan hệ theo các loại khác nhau, ví dụ: • Loại quan hệ dành cho các quan hệ giữa các lớp • Loại quan hệ dành cho các quan hệ giữa các cá thể • Loại quan hệ dành cho các quan hệ giữa một cá thể và một lớp • Loại quan hệ dành cho các quan hệ giữa một đối tượng đơn lẻ và một bộ sưu tập (collection) • Loại quan hệ dành cho các quan hệ giữa các bộ sưu tập Quan hệ giữa các đối tượng trong một ontology. .. niệm trong ontology cần được thiết kế một cách chặt chẽ và các phát biểu để định nghĩa phải đảm bảo đúng logic Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 16 • Khả năng mở rộng: ontology thiết kế sao cho đáp ứng được nhu cầu chia sẻ từ vựng Ta cần xây dựng một số khái niệm nền tảng cho cả một lớp các nhiệm vụ đã được dự đoán trước và biểu diễn ontology sao cho người sử... việc quyết định xem phần nào của ontology sẽ được tái sử dụng giữa các lĩnh vực và các tác vụ khác nhau Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 18 • Tiêu chí phân loại độ thích hợp: một bản mô tả ontology sẽ cung cấp các tiêu chí rõ ràng cho việc đánh giá độ phù hợp của ontology với nhu cầu đặt ra ban đầu 4 Các ứng dụng dựa trên ontology Ontology được ứng dụng rộng rãi... Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 11 dụng) và tính không đồng nhất của nó (cú pháp, ngữ nghĩa, các giao thức, ) đưa các bài toán nghiên cứu có khả năng tương tác và linh hoạt hơn Sử dụng: giai đoạn này bao gồm tất cả các hoạt động trực tiếp dựa trên tính sẳn có của ontology, ví dụ như chú thích các nguồn tài nguyên (resources) , suy diễn tri thức, hổ trợ quyết định,... Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 20 4.4 Tích hợp dữ liệu Một ứng dụng khác của ontology là tích hợp dữ liệu Trong hệ thống như vậy bao gồm nhiều nguồn cơ sở dữ liệu khác nhau (khác nhau về cách thức lưu trữ và nội dung thông tin), mỗi nguồn dữ liệu đó sẽ có một ontology mô tả về nó Các ontology này sau đó được hợp nhất vào một ontology chung, khi người dùng cần... và đưa ví dụ cụ thể cho phương pháp hình thức trong mô tả ontology • Trình bày tóm tắt các ngôn ngữ ontology đã liệt kê ở mục “4.4 – Ngôn ngữ biểu diễn ontology và một số môi trường phát tri n Tài liệu tham khảo [1] Nguyễn Hữu Nhật – Trường ĐH CNTT « Tổng quan về Ontology » [2] Đỗ Văn Nhơn « bài giảng: Ontology Learning - Thomas Wächter » [3] Faiez Gargouri and Wassim Jaziri « Ontology Theory, Management... hình thức trong mô tả ontology 3.1 Các thành phần của ontology Ontology đưa ra một tập hợp phổ biến các đặc tính và các thành phần để thực hiện biểu diễn tri thức và suy diễn tri thức Các thành phần bao gồm: • Các cá thể (instances/individuals/particular things/objects) • Các khái niệm (concepts/classess/entity types) • Các thuộc tính (attributes/properties/slots/features) • Các quan hệ (relationships/associations/roles) . Hoạch: Tổng quan ontology cho biểu diễn tri thức 17 3.5 Những lợi ích từ việc mô tả ontology Ngôn ngữ hình thức có vai trò quan trọng trong hai quá trình phát tri n ontology: mô tả và tri n khai chức năng liên quan ontology Dương Ngọc Nhân – Bài Thu Hoạch: Tổng quan ontology cho biểu diễn tri thức 5 1 Định nghĩa ontology và các khái niệm liên quan 1.1 Các định nghĩa Ontology là một. Technology Tổng quan ontology cho biểu diễn tri thức Lớp: CH-06 Môn Học: Biểu diễn tri thức và ứng dụng GVHD: PGS.TS. Đỗ Văn Nhơn HVTH: Dương Ngọc Nhân, MSHV: CH1101115 TP.HCM, Tháng 01 năm 2013 Tổng

Ngày đăng: 10/04/2015, 09:58

Từ khóa liên quan

Mục lục

  • Tổng quan về ontology

    • 0.1 Nguồn gốc

    • 0.2 Sự cần thiết của ontology

    • 0.3 Một số chức năng chính

    • 1 Định nghĩa ontology và các khái niệm liên quan

      • 1.1 Các định nghĩa

      • 1.2 Các khái niệm liên quan

      • 2 Phân loại và vòng đời ontology

        • 2.1 Phân loại ontology

          • 2.1.1 Mức độ chi tiết

          • 2.1.2 Mức độ phụ thuộc

          • 2.2 Vòng đời (life-cycle) của ontologies

          • 3 Phương pháp hình thức trong mô tả ontology

            • 3.1 Các thành phần của ontology

              • 3.1.1 Cá thể

              • 3.1.2 Khái niệm

              • 3.1.3 Thuộc tính

              • 3.1.4 Quan hệ

              • 3.1.5 Tiên đề

              • 3.1.6 Quy tắc

              • 3.2 Các bước xây dựng

              • 3.3 Các tiêu chuẩn thiết kế ontology

              • 3.4 Ngôn ngữ biểu diễn ontology

              • 3.5 Những lợi ích từ việc mô tả ontology

              • 4 Các ứng dụng dựa trên ontology

                • 4.1 Khai phá dữ liệu

                • 4.2 Web ngữ nghĩa

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan