Nghiên cứu công nghệ semantic web và chuẩn dublin core metadata, ứng dụng trong việc triển khai hệ thống tài liệu số chuyên ngành tích hợp trên cổng thông tin điện tử của khoa công nghệ thô

69 179 0
Nghiên cứu công nghệ semantic web và chuẩn dublin core metadata, ứng dụng trong việc triển khai hệ thống tài liệu số chuyên ngành tích hợp trên cổng thông tin điện tử của khoa công nghệ thô

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIAO THÔNG VẬN TẢI BỘ GIÁO DỤC ĐÀO TẠO TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM LÊ HOÀNG DƢƠNG NGHIÊN CỨU CÔNG NGHỆ SEMANTIC WEB CHUẨN DUBLIN CORE METADATA, ỨNG DỤNG TRONG VIỆC TRIỂN KHAI HỆ THỐNG TÀI LIỆU SỐ CHUYÊN NGÀNH TÍCH HỢP TRÊN CỔNG THÔNG TIN ĐIỆN TỬ CỦA KHOA CÔNG NGHỆ THÔNG TIN – TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM LUẬN VĂN THẠC SỸNGÀNH KỸ THUẬT HẢI PHÒNG - 2015 BỘ GIAO THÔNG VẬN TẢI BỘ GIÁO DỤC ĐÀO TẠO TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM LÊ HOÀNG DƢƠNG NGHIÊN CỨU CÔNG NGHỆ SEMANTIC WEB CHUẨN DUBLIN CORE METADATA, ỨNG DỤNG TRONG VIỆC TRIỂN KHAI HỆ THỐNG TÀI LIỆU SỐ CHUYÊN NGÀNH TÍCH HỢP TRÊN CỔNG THÔNG TIN ĐIỆN TỬ CỦA KHOA CÔNG NGHỆ THÔNG TIN – TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM LUẬN VĂN THẠC SĨ NGÀNH KỸ THUẬT NGÀNH: CÔNG NGHỆ THÔNG TIN; MÃ SỐ: CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN Người hướng dẫn khoa học: TS Trần Đăng Hoan HẢI PHÒNG - 2015 Lời cam đoan Tôi xin cam đoan công trình nghiên cứu riêng Các kết nêu luận văn trung thực chưa công bố công trình khác Tôi xin cam đoan thông tin trích dẫn luận văn rõ nguồn gốc Hải Phòng, ngày 15 tháng 09 năm 2015 i Lời cám ơn Để hoàn thành tiểu luận này, xin chân thành cảm ơn thầy cô giáo tận tình hướng dẫn, giảng dạy suốt trình học tập, nghiên cứu rèn luyện Trường Đại học Hàng Hải Việt Nam Xin chân thành cảm ơn thầy giáo hướng dẫn TS Trần Đăng Hoan tận tình, chu đáo hướng dẫn thực luận văn Mặc dù có nhiều cố gắng để thực đề tài cách hoàn chỉnh nhất, song hạn chế kiến thức kinh nghiệm nên tránh khỏi thiếu sót định mà thân chưa thấy Tôi mong góp ý quý thầy, cô giáo bạn đồng nghiệp để luận văn hoàn chỉnh Tôi xin chân thành cảm ơn ii Mục lục Lời cam đoan .i Lời cám ơn ii DANH MỤC CÁC CHỮ VIẾT TẮT KÝ HIỆU vi DANH MỤC CÁC BẢNG vii DANH MỤC CÁC HÌNH viii Mở đầu Chƣơng 1: Tổng quan thƣ viện số ngữ nghĩa .3 1.1 Thư viện số gì? 1.2 Thư viện số ngữ nghĩa 1.3 Nội dung nghiên cứu đề tài Kết luận Chƣơng Công nghệ Web ngữ nghĩa hệ thống thƣ viện số .9 2.1 Web ngữ nghĩa (Semantic Web) 2.1.1 Khái niệm Web ngữ nghĩa 2.1.2 Kiến trúc Web ngữ nghĩa 10 2.1.3 RDF, RDF Schema Ontology 12 a RDF (Resource Description Framework) 12 b RDFs (Resource Description Framework Schema) 18 c Ontology 25 2.2 Dublin Core Metadata 27 2.2.1 Siêu liệu (Metadata) 27 2.2.2 Siêu liệu Dublin Core 29 a Đặc điểm Dublin Core 29 b Ý nghĩa Dublin Core Thư viện số 30 iii c Các yếu tố Dublin Core 30 d Các yếu tố mở rộng 32 2.3 Web ngữ nghĩa thư viện số 33 2.3.1 Thư viện số ngữ nghĩa 33 2.3.2 Tổ chức tri thức thư viện số ngữ nghĩa 34 2.3.3 Web ngữ nghĩa thư viện số 35 2.3.4 Kiến trúc thư viện số ngữ nghĩa 36 2.3.5 Ontology cho thư viện số ngữ nghĩa 37 a Ontology biểu ghi thư mục 37 b Ontology cho cấu trúc nội dung 38 c Nguyên tắc xây dựng Ontology cho hệ thống thư viện số 38 2.3.6 Tìm kiếm thư viện số ngữ nghĩa 39 a Tìm kiếm dựa phân loại 39 b Tìm kiếm ngữ nghĩa 40 Kết luận 41 Chƣơng Phân tích, thiết kế cài đặt hệ thống tài liệu số chuyên ngành công nghệ thông tin 42 3.1 Phân tích thiết kế hệ thống 42 3.1.1 Phân tích yêu cầu thực tế toán 42 3.1.2 Phân tích chức toán 43 3.1.3 Xây dựng Ontology cho hệ thống thư viện số: 44 3.1.3.1 Ontology cho tài nguyên thư viện số: 44 3.1.3.2 Ontology thông tin người dùng hệ thống: 49 3.2 Cài đặt hệ thống 51 3.2.1 Công cụ ngôn ngữ 51 iv 3.2.2 Kết cài đặt: 52 Kết luận: 56 KẾT LUẬN .57 Tài liệu tham khảo .59 v DANH MỤC CÁC CHỮ VIẾT TẮT KÝ HIỆU Chữ viết tắt Giải thích XML Extensible Markup Language DC Dublin Core RDF Resource Description Framework RDFs Resource Description Framework Schema WWW World Wide Web HTML HyperText Markup Language URI Uniform Resource Identifier OWL Web Ontoloty Language vi DANH MỤC CÁC BẢNG Số bảng Tên bảng Trang 2.1 Các lớp RDFs 21 2.2 Các thuộc tính RDFs 22 2.3 Danh sách yếu tố Dublin Core 30 2.4 Danh sách yếu tố mở rộng Dublin 33 Core 3.1 Danh sách thuộc tính Ontology 48 hệ thống thư viện số ngữ nghĩa 3.2 Các lớp Ontology Foaf 49 3.3 Các thuộc tính Ontology Foaf 51 vii DANH MỤC CÁC HÌNH Số hình Tên hình Trang 2.1 Kiến trúc hệ thống Web ngữ nghĩa 11 2.2 Đồ thị RDF 15 2.3 Quan hệ kế thừa 19 2.4 Kiến trúc thư viện số ngữ nghĩa 36 2.5 Kiến trúc hệ thống thư viện số ngữ nghĩa 37 đề xuất 2.6 Tìm kiếm ngữ nghĩa thư viện số 40 3.1 Mô hình Ontology hệ thống thư viện số 46 3.2 Giao diện trang quản lý hệ thống 52 3.3 Giao diện quản lý danh sách tài liệu 52 3.4 Giao diện thêm siêu liệu cho tài liệu 53 3.5 Giao diện trang chủ 55 3.6 Giao diện danh sách tài liệu chuyên 55 ngành 3.7 Giao diện xem tài liệu 56 viii - Các thuộc tính lớp gồm: thuộc tính kế thừa từ lớp PublishedMaterial, thuộc tính publishedWithin, hasISSN (4) Lớp Book:là lớp lớp PublishedMaterial,dùng để chứa thông tincác ấn phẩm sách, - Các thuộc tính lớp gồm:các thuộc tính kế thừa từ lớp PublishedMaterial, thuộc tính hasISSN (5) Lớp MeetingProceeding: lớp lớp Book, dùng để chứa thông tin kỷ yếu, báo thông qua hội nghị xuất sách - Các thuộc tính lớp gồm: thuộc tính kế thừa từ lớp Book (6) Lớp IssueOfPeriodical:lớp lớp PublishedMaterial, dùng để chứa thông tin ấn phẩm định kỳ, số báo hay tập xuất định kỳ tạp chí, báo - Các thuộc tính lớp gồm: thuộc tính kế thừa từ lớp PublishedMaterial, thuộc tính hasNumber, hasISSN (7) Lớp Magazine:là lớp lớp IssueOfPeriodical, dùng để chứa thông tin ấn phẩm tạp chí - Các thuộc tính lớp gồm: thuộc tính kế thừa từ lớp IssueOfPeriodical (8) Lớp Newspaper: lớp lớp IssueOfPeriodical, dùng để chứa thông tin báo - Các thuộc tính lớp gồm: thuộc tính kế thừa lớp IssueOfPeriodical (9) Lớp Thesis:là lớp lớp Resource, dùng để chứa thông tin luận văn, báo cáo - Các thuộc tính lớp gồm: thuộc tính kế thừa từ lớp Resource, thuộc tính hasSchool, hasDepartment, hasAccessionNumber, hasCity (10) Lớp Place: thể vị trí tổ chức hay tài nguyên - Các thuộc tính lớp gồm: hasPlace (11) Lớp City:lớp lớp Place, thể tên thành phố (12) Lớp ResourceType: lớp thể loại nội dung tài nguyên 45 (13) Lớp Topic: lớp chủ đề tài nguyên thông tin Việc phân cấp chủ đề thể qua thuộc tính subTopic (14) Lớp ContactInformation: chứa thông tin tổ chức hay cá thể, thông tin liên lạc nhà sản xuất - Lớp lớp Place: hasContactInformation, hasAddress, hasEmail, hasFax, hasPhoneNumber (15) Lớp Language: lớp chứa ngôn ngữ thể tài nguyên Hình 3.1 mô hình Ontology hệ thống thư viện số ngữ nghĩa đề xuất với lớp, quan hệ lớp thuộc tính lớp tương ứng Hình 3.1 Mô hình Ontology hệ thống thư viện số Mô tả thuộc tính: Thuộc tính hasAbstract (Tóm tắt tài nguyên) hasDescription (Mô tả tài nguyên) hasVolume (Tập tập san OWL Type Domain Range DatatypeProperty Resource Xsd:string DatatypeProperty Resource Xsd:string DatatypeProperty PublishedMaterial xsd:Int 46 Thuộc tính OWL Type Domain Range DatatypeProperty PublishedMaterial xsd:Int DatatypeProperty Resource xsd:string DatatypeProperty PublishedMaterial xsd:Int DatatypeProperty Resource xsd:string DatatypeProperty Book xsd:string DatatypeProperty Article xsd:string DatatypeProperty Resource foaf:Agent DatatypeProperty Resource Topic sách) hasEdition (Lần xuất bản) hasTitle (Tiêu đề tài nguyên) hasNumber (Tập, số tạp chí, báo) hasDate (Năm xuất tài nguyên) hasISBN (ISBN cho sách) hasISSN (ISSN cho tạp chí, báo) hasPublisher (Nhà xuất bản) hasSubject (Chủ đề tài nguyên) hasPlace (Vị trí) hasCity hasContactInformatio n (Thông tin liên hệ) hasAddress DatatypeProperty Place DatatypeProperty Thesis ObjectProperty foaf:agent ObjectProperty foaf:agent 47 City ContactInform ation Address Thuộc tính OWL Type Domain Range (Thông tin địa chỉ) hasEmail ObjectProperty foaf:agent Email ObjectProperty foaf:agent PhoneNumber ObjectProperty foaf:agent Fax ObjectProperty Resource ResourceType ObjectProperty Resource foaf:agent ObjectProperty Resource Resource ObjectProperty Resource Language (Tác giả tài ObjectProperty Resource foaf:agent (Email liên lạc) hasPhoneNumber (Số điện thoại) hasFax (Thông tin số Fax) hasType (Loại tài nguyên) hasContributor (Tác giả phụ) hasSource (Nguồn tài nguyên) hasLanguage (Ngôn ngữ tài nguyên) hasCreator nguyên) publishedWithin (Article thuộc tài ResoureCollect ObjectProperty Article ObjectProperty Resource hasDepartment ObjectProperty Thesis hasSchool ObjectProperty Thesis University hasCopyRight ObjectProperty Resource CopyRight isPartOf ObjectProperty nguyên đó) hasOrgannization (Thông tin liên hệ) 48 ion foaf:Organizati on Thuộc tính OWL Type Domain Range (Mối quan hệ thành phần tài nguyên) Bảng 3.1 Danh sách thuộc tính Ontology hệ thống thư viện số ngữ nghĩa 3.1.3.2 Ontology thông tin ngƣời dùng hệ thống: Để lưu trữ thông tin người dùng hệ thống, tác giả sử dụng Ontology FOAF (Friend Of A Friend) FOAF cung cấp từ vựng mô tả thông tin người, nhóm, tổ chức loại thông tin khác liên quan FOAF định nghĩa thông qua ngôn ngữ OWL định danh namespace có URI: http://xmlns.com/foaf/0.1/ Bảng 3.1 mô tả danh sách lớp định nghĩa FOAF Các lớp đƣợc định nghĩa FOAF: TT Ý nghĩa Foaf class Foaf:agent Lớp tác nhân (con người, nhóm, tổ chức) Foaf:document Lớp tài liệu (các loại tài liệu Web) Foaf:group Lớp nhóm người Foaf:image Lớp hình ảnh Foaf:OnlineAccount Lớp tài khoản mạng Foaf:OnlineChatAccount Lớp tài khoản chat mạng Foaf:OnlineEcommerceAccount Lớp tài khoản thương mại Foaf:OnlineGamingAccount Lớp tài khoản game mạng Foaf:Organization Lớp tổ chức 10 Foaf:Person Lớp người 11 Foaf:ProfileDocument Lớp tài liệu cá nhân 12 Foaf:Project Lớp dự án Bảng 3.2 Các lớp Ontology Foaf Các thuộc tính đƣợc định nghĩa FOAF: Thuộc tính Ý nghĩa Domain 49 Range Ý nghĩa Thuộc tính foaf:accountName Domain Range Chỉ tên liên quan đến foaf:OnlineAcco Literal tài khoản unt foaf:aimChatID Chỉ aim chatid foaf:agent foaf:currentProject Chỉ dự án foaf:person Literal Resource người foaf:depicts Chỉ vật foaf:Image Resource miêu tả foaf:family_name Họ người foaf:firstName Chỉ tên foaf:Person Literal foaf:Person Literal người foaf:fundedBy Một tổ chức làm chủ Resource project Resource hay person foaf:geekcode Chỉ số geekcode foaf:Person Literal cho người foaf:gender Chỉ giới tính foaf:Person Literal người foaf:givenname Tên người foaf:holdsAccount Tài khoản tác foaf:Agent foaf:OnlineAcc nhân ount Địa trang Web Resource foaf:Document foaf:homepage foaf:Person Literal tài nguyên foaf:img Hình ảnh mô tả foaf:Person foaf:Image foaf:interest Mối quan tâm foaf:Person foaf:Document foaf:knows Mối quan hệ foaf:Person foaf:Person người với người foaf:Member Chỉ thành viên foaf:Group 50 foaf:Agent Ý nghĩa Thuộc tính Domain Range nhóm foaf:nick Chỉ nick foaf:Person Literal người Số điện thoại foaf:Agent foaf:Phone Literal người Tên đệm foaf:Person foaf:Surname Literal người foaf:title Mr, Mrs Ms, Dr, foaf:Person foaf:topic_interest Chỉ tài nguyên mà foaf:Person Literal Resouce người quan tâm foaf:workplaceHom Địa nơi làm việc foaf:Person foaf:Document epage Bảng 3.3 Các thuộc tính Ontology Foaf 3.2 Cài đặt hệ thống 3.2.1 Công cụ ngôn ngữ Để thực cài đặt hệ thống, tác giả sử dụng công cụ ngôn ngữ lập trình: -Các ngôn ngữ thiết kế Web: HTML, CSS, Jquery để tạo nên giao diện cho hệ thống - Ngôn ngữ lập trình Web: PHP giúp thực xử lý yêu cầu toán, xử lý truy vấn liệu - Thư viện hỗ trợ truy vấn SPARQL: ARC2, thư viện viết ngôn ngữ PHP hỗ trợ thực nhận kết trả câu lệnh truy vấn SPARQL EndPoint - WampServer: máy chủ Web hỗ trợ cho việc thực thi file PHP - Jena Fuseki Server: máy chủ hỗ trợ thực thi câu lênh truy vấn SPARQL cho phép thiết lập Endpoint để thực truy vấn - Phần mềm Eclipse: hỗ trợ lập trình quản lý project 51 - Phần mềm Protege: hỗ trợ việc tạo xuất Ontology 3.2.2 Kết cài đặt: Kết nghiên cứu hệ thống Webiste thư viện số ngữ nghĩa với chức đáp ứng yêu cầu đặt toán Một số giao diện hệ thống cài đặt: (1) Giao diện quản lý Đây giao diện làm việc quản trị hệ thống, hỗ trợ người quản trị thao tác: cấu hình hệ thống, quản lý người dùng, quản lý danh sách tài liệu, tìm kiếm tài liệu,… Hình 3.2 Giao diện trang quản lý hệ thống (2) Giao diện quản lý danh sách tài liệu Trên giao diện quản lý danh sách tài liệu, quản trị hệ thống thực tải lên tài liệu mới, cập nhật thông tin tài liệu, xóa tài liệu khỏi hệ thống Hình 3.3 Giao diện quản lý danh sách tài liệu 52 (3) Giao diện thêm siêu liệu cho tài liệu Khi quản trị người dùng tải tài liệu lên hệ thống phải thực thao tác thêm siêu liệu mô tả cho tài liệu, thông tin giúp lưu vào File RDF giúp đặc tả liệu hệ thống, hỗ trợ cho việc tìm kiếm Hình 3.4 Giao diện thêm siêu liệu cho tài liệu (4) Giao diện trang chủ hệ thống Trang chủ hệ thống trang dành cho người dùng sử dụng hệ thống thư viện tài liệu số ngữ nghĩa, trường hợp giáo viên sinh viên khoa Công nghệ thông tin Tài liệu trang chủ hệ thống phân chia theo danh mục giúp dễ dàng tìm kiếm Ngoài hệ thống hỗ trợ thao tác tìm kiếm tài liệu, giúp người dùng tìm tài liệu cần thiết cho nhu cầu 53 54 Hình 3.5 Giao diện trang chủ hệ thống (5) Giao diện danh sách tài liệu số chuyên ngành Hình 3.6 Giao diện danh sách tài liệu chuyên ngành 55 (6) Giao diện trang xem tài liệu Người sử dụng xem trực tiếp tài liệu Online tải tài liệu để xem Offline máy Hình 3.7 Giao diện trang xem tài liệu Kết luận: Trong chương trình bày trình phân tích yêu cầu toán thực tế, từ đưa thiết kế hệ thống mặt chức năng, đồng thời xây dựng Ontology cho hệ thống thư viện số ngữ nghĩa kết cài đặt số chức hệ thống 56 KẾT LUẬN Web ngữ nghĩa đời đánh dấu bước phát triển công nghệ Web, tạo cách thức việc tiếp cận thông tin Tuy nhiên việc ứng dụng Web ngữ nghĩa vào cách lĩnh vực cụ thể nhiều thách thức, cần hỗ trợ lĩnh vực chuyên ngành khác Luận văn trình bày ứng dụng điển hình cụ thể Web ngữ nghĩa thư viện số ngữ nghĩa Tuy chưa bao hàm hết vấn đề, song từ kết đặt rút số kết luận:  Web ngữ nghĩa cung cấp chế cho phép máy tính “hiểu” xử lí thông tin  Thư viện số ngữ nghĩa kết hợp công nghệ Web ngữ nghĩa Web 2.0 Bằng cách tích hợp ngữ nghĩa vào thư viện số làm cho thư viện số ngữ nghĩa có nhiều ưu điểm trội so với thư viện khác, hỗ trợ chế tìm kiếm ngữ nghĩa chia sẻ tài nguyên với hệ thống khác cách thuận lợi  Các biểu ghi thư mục siêu liệu quan trọng, việc xây dựng Ontology cho biểu ghi thư mục vấn đề then chốt việc xây dựng thư viện số ngữ nghĩa Hệ thống thư viện số ngữ nghĩa tác giả cài đặt đáp ứng chức đặt ra: xem, tìm kiếm tài liệu, đăng tải tài liệu chức quản lý khác; chức tìm kiếm ngữ nghĩa giúp cho việc tìm kiếm đạt kết cao hơn, bên cạnh việc tìm kiếm thông thường theo từ khóa, hệ thống thực phân tích từ khóa thực tìm kiếm theo ngữ nghĩa Tuy nhiên luận văn tồn mặt hạn chế:  Việc xây dựng Ontology cho hệ thống thư viện số chưa thực đầy đủ, chưa đáp ứng nhiều yêu cầu truy vấn ngữ nghĩa  Luận văn chưa đánh giá, so sánh hiệu hệ thống áp dụng công nghệ Web ngữ nghĩa vào thư viện số so với mô hình thư viện số thông thường 57 Hướng phát triển đề tài tương lai: Trong tương lại, việc xây dựng hệ thống ngữ nghĩa điều cần thiết nhằm thay đổi cách tiếp cận nguồn thông tin người máy tính Việc xây dựng hoàn chỉnh hệ thống thư viện số ngữ nghĩa cung cấp tài liệu chuyên ngành cho khoa Công nghệ thông tin nhu cầu cấp thiết Trong thời gian tiếp theo, tác giả tiếp tục thực xây dựng hoàn chỉnh Ontology cho hệ thống, giúp tăng cường tính ngữ nghĩa cho hệ thống để hệ thống thực hiệu việc hỗ trợ người dùng tìm kiếm tài nguyên kho liệu 58 Tài liệu tham khảo H Peter Alesso, Craig F Smith (2006) “Thinking on the Web: Berners-Lee, Godel and Turing” John Wiley & Sons, Inc Thomas B Passin (2004) “Explorer’s Guide to the Semantic Web” Manning Publications Co Grigoris Antoniou, Frank van Harmelen (2008) “A Semantic Web Primer” Massachusetts Institute of Technology Sebastian Ryszard Kruk, Bill McDaniel (2009) “Semantic Digital Libraries” Springer Toby Segaran, Colin Evans & Jamie Taylor (2009) “Programming the Semantic Web” Oreilly http://semanticWeb.org http://www.w3schools.com/semWeb/default.asp http://xmlns.com/foaf/spec/ 59 ... cứu công nghệ Semantic Web chuẩn Dublin Core Metadata, ứng dụng việc triển khai hệ thống tài liệu số chuyên ngành tích hợp cổng thông tin điện tử khoa Công nghệ thông tin – Trường Đại học Hàng... TÀI LIỆU SỐ CHUYÊN NGÀNH TÍCH HỢP TRÊN CỔNG THÔNG TIN ĐIỆN TỬ CỦA KHOA CÔNG NGHỆ THÔNG TIN – TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM LUẬN VĂN THẠC SĨ NGÀNH KỸ THUẬT NGÀNH: CÔNG NGHỆ THÔNG TIN; MÃ SỐ:... siêu liệu Dublin Core Metadata công nghệ Semantic Web để triển khai hệ thống thư viện số hiệu phù hợp với việc phát triển công nghệ nay, tác giả lựa chọn đề tài Nghiên cứu công nghệ Semantic Web

Ngày đăng: 14/10/2017, 16:19

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan