Bài giảng Công nghệ XML và WEB ngữ nghĩa - Bài 5

20 35 1
Bài giảng Công nghệ XML và WEB ngữ nghĩa - Bài 5

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài giảng Công nghệ XML và WEB ngữ nghĩa - Bài 5: Giới thiệu về WEB Ngữ nghĩa thông tin đến các bạn những kiến thức về thông tin và internet; bài toán tìm kiếm thông tin information retrieval; công cụ tìm kiếm trực tuyến; search engine; vấn đề cấu trúc dữ liệu text...

Công nghệ XML WEB ngữ nghĩa Introduction to The Semantic WEB Trần Nguyên Ngọc - HVKTQS - 2012 Thơng tin internet • World Wide Web (WWW) môi trường tốt cho việc biểu diễn truy cập thơng tin dạng số • Thơng tin WWW biểu diễn chủ yếu dạng ngôn ngữ tự nhiên (các trang Web ngơn ngữ HTML) • Máy tính người hiểu khác nhau! • Mong muốn: machine-readable & machine analysis Trần Nguyên Ngọc - HVKTQS - 2012 Bài tốn tìm kiếm thơng tin Information Retrieval • Information retrieval (IR) trình tìm kiếm liệu (thường tìm dạng đoạn văn bản) từ tập hợp lớn đối tượng khơng có cấu trúc tường minh (thường text lưu trữ máy tính) nhằm đáp ứng nhu cầu thông tin Trần Ngun Ngọc - HVKTQS - 2012 Cơng cụ tìm kiếm trực tuyến Trần Nguyên Ngọc - HVKTQS - 2012 Thực chất google làm gì? • Gửi yêu cầu (query) sau • http://www.google.com.vn/#sclient=psyab&hl=vi&source=hp&q=seantic+web+l%C3% A0+gi%3F&pbx=1&oq=seantic+web+l%C3%A0 +gi%3F&aq=f&aqi=&aql=&gs_sm=e&gs_upl=9 10l13129l0l14005l24l20l3l0l0l1l827l4892l0.13 3.2.0.1.1l23l0&bav=on.2,or.r_gc.r_pw.,cf.osb &fp=2b8791cc67af876b&biw=1280&bih=683 Trần Nguyên Ngọc - HVKTQS - 2012 Hiện làm để máy tính hiểu yêu cầu? • Boolean retrieval: thiết kế cấu trúc liệu cho hệ thống thu thập thông tin đơn giản Quy trình Hoạt động: Xây dựng Boolean model, mơ hình logic dùng để thu thập thơng tin Biểu diễn yêu cầu dạng biểu thức logic Search engine trả tất tài liệu thỏa mãn biểu thức logic Kho liệu khổng lồ • Với 1M tài liệu văn lưu trữ, văn có khoảng 1000 từ tách rời • Suy ra: tổng số tỷ từ tách rời (tính trùng nhau) • Trung bình k|h|o|ả|n|g| bytes cho từ tách rời (tính dấu cách dấu biểu cảm) • Suy kho liệu khoảng 6GB • Giả sử có khoảng 500K từ -> cần lập bảng thống kê với số lượng: 500000*1000000=5*10^11 Search engine Vấn đề cấu trúc liệu text • HTML (Hyper text markup language) • XML (Extensible Markup language) • SIML (Synchronized Multimedia Integration Language) http://www.w3.org/Audio HTML • • • • • • • • HTML chữ viết tắt Hyper Text Markup Language (Ngôn ngữ hiển thị siêu văn bản) - Một file HTML file text bao gồm tag nhỏ - Những tag hiển thị nói cho trình duyệt biết phải hiển thị trang - Một file HTML phải có phần mở rộng htm html - Một file HTML tạo trình soạn thảo đơn giản

Đây đoạn văn

Đây đoạn văn khác

Vấn đề HTML thiết kế ý nghĩ người Cho dù thông tin HTML khơng thể trình duyệt đoán biết Con người có trí thơng minh để hiểu ý nghĩa mục đích hầu hết văn Tuy nhiên cỗ máy lại không Khi thẻ tài liệu cho trình duyệt cách thể thơng tin, thân thẻ lại khơng cho trình duyệt thơng tin XML • Lớp XML Extensible Markup Language mở rộng ngôn ngữ đánh dấu cho các cấu trúc tài liệu • I just got a new pet dog • • I • just got a new pet • dog • Web có ngữ nghĩa • Người sáng lập: Tim Berners_Lee giám đốc tổ chức World Wide Web Consortium (http://www.w3c.org) Trần Nguyên Ngọc - HVKTQS - 2012 12 Định nghĩa Tim Berners – Lee • Semantic web mở rộng web mà thơng tin xử lý cách tự động máy tính, làm cho máy tính người hợp tác với Trần Nguyên Ngọc - HVKTQS - 2012 13 Semantic gì? • Tơi u em = Tui iu iem = I love you = Tôi iêu em= Anh yêu em = Em yêu anh = Trần Nguyên Ngọc - HVKTQS - 2012 14 CẤU TRÚC Trần Nguyên Ngọc - HVKTQS - 2012 15 CHI TIẾT • Tầng Unicode & URI: Nhằm đảm bảo việc sử dụng tập kí tự quốc tế cung cấp phương tiện nhằm định danh đối tượng Semantic Web • Tầng XML, Namespace & XMLSchema: Tầng bảo đảm tích hợp định nghĩa Semantic Web với chuẩn dựa XML khác • Tầng RDF & RDFSchema [RDFS]: Tầng dùng siêu liệu để mô tả tài liệu web mà máy tính hiểu Đây lớp mà gán kiểu cho tài nguyên liên kết Và lớp quan trọng Semantic Web Trần Nguyên Ngọc - HVKTQS - 2012 16 CHI TIẾT • Tầng Ontology : cung cấp từ vựng chung cho việc trao đổi thông tin ứng dụng dịch vụ Web • Lớp Digital Signature: Lớp dùng cho tầng( tầng RDF –RSFS, Ontonogy, Logic, Proof) dùng để xác định chủ thể tài liệu, nhằm đảm bảo độ tin cậy tài • Tầng Logic: Tầng logic xem sở luật Semantic Web • Tầng Proof: dùng để chứng minh suy diễn hệ thống cách liên kết kiện • Tầng Trust: Trust engine hệ thống đang xây dựng dựa tảng ký điện tử Trần Nguyên Ngọc - HVKTQS - 2012 17 ĐỂ CÓ WEB NGỮ NGHĨA CẦN GÌ? • Ontology ngơn ngữ dùng để biểu diễn ngữ nghĩa thơng tin • Các cơng cụ tạo nên phần ngữ nghĩa cấu trúc hạ tầng Web có ngữ nghĩa • Các ứng dụng sử dụng Web có ngữ nghĩa Trần Nguyên Ngọc - HVKTQS - 2012 18 SEMANTIC WEB SERVICES VÀ WEB SERVICES Trần Nguyên Ngọc - HVKTQS - 2012 19 TỰ HỌC • Nghe giảng youtube • http://www.youtube.com/watch?v=rhgUDGtT 2EM&feature=related Trần Nguyên Ngọc - HVKTQS - 2012 20 ... WEB NGỮ NGHĨA CẦN GÌ? • Ontology ngơn ngữ dùng để biểu diễn ngữ nghĩa thơng tin • Các cơng cụ tạo nên phần ngữ nghĩa cấu trúc hạ tầng Web có ngữ nghĩa • Các ứng dụng sử dụng Web có ngữ nghĩa Trần... sử dụng Web có ngữ nghĩa Trần Nguyên Ngọc - HVKTQS - 2012 18 SEMANTIC WEB SERVICES VÀ WEB SERVICES Trần Nguyên Ngọc - HVKTQS - 2012 19 TỰ HỌC • Nghe giảng youtube • http://www.youtube.com/watch?v=rhgUDGtT... có ngữ nghĩa • Người sáng lập: Tim Berners_Lee giám đốc tổ chức World Wide Web Consortium (http://www.w3c.org) Trần Nguyên Ngọc - HVKTQS - 2012 12 Định nghĩa Tim Berners – Lee • Semantic web

Ngày đăng: 24/09/2020, 04:21

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan