Nâng cao tính thấu đáo nghiệp vụ và khả năng mở rộng của dữ liệu XML với các đặc tính pureXML của DB2 phiên bản mới 9.7 pptx

40 291 0
Nâng cao tính thấu đáo nghiệp vụ và khả năng mở rộng của dữ liệu XML với các đặc tính pureXML của DB2 phiên bản mới 9.7 pptx

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nâng cao tính thấu đáo nghiệp vụ và khả năng mở rộng của dữ liệu XML với các đặc tính pureXML của DB2 phiên bản mới 9.7 Matthias Nicola, Chuyên gia về hiệu năng CSDL, IBM Silicon Valley Laboratory Cynthia M. Saracco, Kiến trúc giải pháp cao cấp, IBM Tóm tắt: Các tính năng mới về thiết kế, quản trị và về phát triển cơ sở dữ liệu cho pureXML đã có sẵn tại cơ sở dữ liệu DB2® phiên bản 9.7 của IBM cho các hệ điều hành Linux®, UNIX® và Windows®, (được công bố ngày 22 tháng Tư 2009). Bạn hãy tìm hiểu thêm về cách các công nghệ này có thể giúp các công ty tích hợp dữ liệu XML một cách hiệu quả hơn vào các môi trường kinh doanh thông minh như thế nào và làm sao các công ty có thể đối phó với khối lượng dữ liệu XML ngày càng tăng lên. Bài viết này tóm tắt các khả năng mới của pureXML, giải thích cách chúng có thể được sử dụng và thảo luận về một kịch bản ứng dụng mẫu. Mục lục  Giới thiệu  Nhìn lại quá trình phát triển của DB2 pureXML  Khám phá các trường hợp sử dụng mẫu  Sử dụng phân đoạn (cơ sở dữ liệu) dựa trên băm để có khả năng mở rộng tối đa  Sử dụng phân đoạn theo dải để cuộn vào và cuộn ra dữ liệu theo dòng thời gian  Sử dụng phân cụm nhiều chiều để thực hiện truy vấn  Khám phá việc nén dữ liệu XML và chỉ mục để đạt hiệu quả lưu trữ và hiệu năng  Hiểu biết các hàm do người sử dụng định nghĩa để tăng tính linh hoạt của ứng dụng  Khám phá thêm các cải tiến về quản trị, phát triển ứng dụng và hiệu năng  Kết luận  Tài nguyên  Đôi nét về các tác giả Giới thiệu Đối với nhiều tổ chức đang cố gắng để tạo một môi trường CNTT linh hoạt và đáng tin cậy, một môi trường cung cấp một cái nhìn thấu đáo hơn đối với các hoạt động kinh doanh trọng yếu, thì các hệ thống quản lý thông tin cốt lõi đang chịu áp lực nhiều hơn để thích ứng với nhu cầu kinh doanh luôn thay đổi. Để giúp các công ty đối phó với các thách thức, IBM đã nâng cao các đặc tính của DB2 9.7 của mình cho pureXML trong nhiều hướng quan trọng. Các đặc tính mới trong DB2 9.7 cho phép quản trị viên sử dụng các tuỳ chọn mới cho việc thiết kế cơ sở dữ liệu dành cho dữ liệu XML, bao gồm việc phân đoạn dựa vào băm (phân đoạn cơ sở dữ liệu), phân đoạn theo dải (phân đoạn bảng) và phân cụm nhiều chiều. Các tùy chọn này có thể giúp các công ty chứa đựng khối lượng dữ liệu lớn, khai thác môi trường xử lý song song, đơn giản hóa việc bổ sung hoặc loại bỏ các dữ liệu nhạy thời gian, nâng cao tốc độ thực hiện của nhiều kiểu truy vấn. Được sử dụng riêng rẽ hoặc kết hợp với nhau, các tùy chọn thiết kế này của DB2 cho phép các tổ chức kết hợp dữ liệu XML vào kho dữ liệu quan hệ của họ; tạo kho lưu trữ dữ liệu vận hành cho các thông điệp, tài liệu và cấp dữ liệu XML; và cải thiện khả năng mở rộng tải công việc xử lý giao dịch XML. Các tùy chọn thiết kế cơ sở dữ liệu mới này chỉ là một phần của những cải tiến về pureXML trong DB2 9.7. Bài viết này giới thiệu cho bạn những tùy chọn đó và các khả năng mới khác của pureXML, giải thích khi nào thì chúng có ích nhất và cung cấp các mẹo để giúp bạn bắt đầu. Bài viết này bàn về các vấn đề sau:  Một tổng quan ngắn về DB2 pureXML cho những ai chưa quen với công nghệ này.  Các ca sử dụng mẫu và kịch bản ứng dụng cho DB2 pureXML.  Phân đoạn cơ sở dữ liệu dựa vào băm, mang lại khả năng mở rộng đáng kể.  Phân đoạn dựa theo dải, giúp các công ty cuộn vào và cuộn ra (roll in và roll out) dữ liệu theo thời gian (một yêu cầu phổ biến trong kho dữ liệu).  Phân cụm nhiều chiều, phương thức này thường cải thiện hiệu suất của các truy vấn phân tích.  Nén dữ liệu XML và các chỉ mục, cải thiện hiệu quả lưu trữ và hiệu năng chạy thi hành cho những tải công việc nhất định.  Các hàm do người dùng định nghĩa chúng tiêu thụ, xử lý và trả lại dữ liệu XML. Những hàm như vậy khuyến khích tái sử dụng mã và đơn giản hóa việc phát triển và bảo trì các truy vấn.  Các thủ tục lưu sẵn mới, các hàm do hệ thống cung cấp, nâng cao hiệu năng và các đặc tính năng khác, đơn giản hóa việc phát triển ứng dụng và quản trị của DB2 pureXML. Nhìn lại quá trình phát triển của DB2 pureXML Từ năm 2006, DB2 phiên bản 9 đã cung cấp cho các công ty một giao diện lập trình ứng dụng phổ biến và nền tảng quản lý cơ sở dữ liệu cho dữ liệu được mô hình hóa trong các bảng và trong các phân cấp XML. Kiến trúc quản lý cơ sở dữ liệu lai này, như được minh họa trong hình 1, cho phép các công ty mở rộng môi trường cơ sở dữ liệu quan hệ truyền thống của mình để quản lý trực tiếp các thông điệp và các tài liệu XML mà không cần phải chia nhỏ hoặc ánh xạ dữ liệu này vào các cột riêng lẻ của các bảng khác nhau (do vậy sẽ chuyển đổi XML thành các kiểu dữ liệu SQL truyền thống). Thay vào đó, dữ liệu XML có thể được lưu giữ nguyên vẹn ở định dạng phân cấp nguyên sinh của nó cùng với các dữ liệu quan hệ. Các ứng dụng có thể lấy ra những phần có liên quan của dữ liệu XML một cách dễ dàng và hiệu quả. Ứng dụng cũng có thể dễ dàng tích hợp dữ liệu XML và dữ liệu quan hệ. Hình 1. Kiến trúc DB2 phiên bản 9 với hỗ trợ được xây dựng sẵn cho các dữ liệu quan hệ và XML Để sử dụng khả năng pureXML của DB2, các quản trị viên tạo một bảng với một hoặc nhiều cột kiểu XML. Dịch vụ lập chỉ mục XML, tối ưu hóa truy vấn, quản lý lưu trữ, và các dịch vụ khác của DB2 giúp đảm bảo hiệu quả và hiệu suất thời gian chạy thi hành mạnh. Liệt kê 1 cho thấy làm việc với dữ liệu XML trong DB2 đơn giản như thế nào. Các mã trong liệt kê 1 làm các việc sau: 1. Tạo ra một bảng với các cột quan hệ và các cột XML 2. Lập chỉ mục cho một phần cụ thể của cột XML 3. Chèn dữ liệu vào bảng 4. Đưa ra các truy vấn (bằng các câu lệnh SQL, SQL/XML và Xquery đơn giản) 5. Cập nhập giá trị của một phần tử XML được lưu giữ trong một tài liệu XML Liệt kê 1. Làm việc với DB2 pureXML Create a table with an integer and an XML column CREATE TABLE customer (cid INTEGER, info XML); Create an XML index for customer zip code data CREATE INDEX idx1 ON customer(info) GENERATE KEYS USING XMLPATTERN '/customerinfo/addr/zip' AS SQL VARCHAR(5); Populate the table with data using a simple INSERT statement INSERT INTO customer (cid, info) VALUES (?,?); Retrieve relational data and full XML documents for customers using simple SQL SELECT cid, info FROM customer WHERE cid > 1234; Retrieve names of customers in a specific zip code who have an ID of > 1234 using SQL/XML SELECT XMLQUERY('$INFO/customer/name') FROM customer WHERE cid > 1234 and XMLEXISTS('$INFO/customer/addr[zip = 95123]'); Retrieve an XML element that lists the names of customers in a given zip code using XQuery xquery for $i in db2- fn:xmlcolumn("CUSTOMER.INFO")/customer where $i/addr/zip = 95123 return <myresult>{$i/name}</myresult> ; Update XML element value related to zip code UPDATE customer SET INFO = XMLQUERY('copy $new := $INFO modify do replace value of $new/customer/addr/zip with 95141 return $new') WHERE ; Khám phá các trường hợp sử dụng mẫu Kiến trúc hướng dịch vụ (SOA), các ứng dụng lấy Web làm trọng tâm, và các dự án tích hợp dựa trên tiêu chuẩn đặc thù công nghiệp thường dựa vào dữ liệu XML để xác định các dữ liệu kinh doanh quan trọng được biểu diễn và được trao đổi như thế nào. Hơn nữa, việc kiểm định và tự tuân thủ thường yêu cầu là các hồ sơ đầy đủ của các giao dịch kinh doanh vẫn có thể truy cập được cho một khoảng thời gian nào đó. Việc sử dụng XML ngày càng tăng lên khiến nhiều công ty phải đánh giá xem liệu cơ sở dữ liệu của họ có thể được điều chỉnh để đối phó với những cấu trúc phức tạp, hay thay đổi, là tính chất cố hữu của các thông điệp và tài liệu XML. Việc quản lý dữ liệu XML đang tác động đến cả môi trường hướng giao dịch lẫn các ứng dụng phân tích. Tích hợp các dữ liệu vận hành Bản chất linh hoạt, tự miêu tả của XML làm cho nó rất phù hợp để trình bày các tạo tác nghiệp vụ khác nhau. Các tạo tác này thường được lưu trữ trong hệ quản lý cơ sở dữ liệu quan hệ hiện có hoặc hệ thống tệp tin, hoặc các tạo tác được tạo ra một cách động bởi các dịch vụ Web, nguồn cấp dữ liệu thời gian thực, hoặc phần mềm khác . Việc xử lý và phân tích thông tin từ các nguồn khác nhau này là một thách thức rõ ràng. Các công ty có thể được lợi do việc duy trì một kho chứa dữ liệu dựa trên XML cùng chia sẻ. Bản chất biến đổi của cấu trúc XML đáp ứng được một phạm vi rộng các nhu cầu nghiệp vụ. Kho lưu trữ dữ liệu vận hành (Operational Data Storage-ODS) được xây dựng trên XML có thể giảm chi phí phát triển ứng dụng và có thể cung cấp một cơ sở hạ tầng lanh lẹn để thích ứng với nhu cầu quản lý dữ liệu đang tiến triển. Hình 2 minh họa một kiến trúc mẫu, trong đó công nghệ pureXML của DB2 được sử dụng như một kho lưu trữ dữ liệu vận hành để tích hợp dữ liệu từ nhiều nguồn đại diện cho nhiều ứng dụng kinh doanh. Các nguồn dữ liệu và các ứng dụng mới hơn có thể thậm chí không cần bộ tiếp hợp XML, bởi vì chúng có thể sử dụng XML làm định dạng trao đổi dữ liệu nguyên sinh của chúng. Hình 2. DB2 pureXML hoạt động như một kho dữ liệu vận hành tích hợp Mở rộng kho dữ liệu Kể từ khi được chấp nhận vào những năm 1990, kho dữ liệu đóng một vai trò ngày càng quan trọng trong việc giúp đỡ các công ty phân tích các xu hướng và cải thiện chiến lược kinh doanh của họ. Trong khi việc quản lý cơ sở dữ liệu quan hệ vẫn là sự lựa chọn công nghệ thích hợp cho các kho dữ liệu, thì việc bổ sung khả năng quản lý dữ liệu XML có thể mang lại tính linh hoạt cao hơn, cho phép các công ty hỗ trợ báo cáo kinh doanh đang tiến triển và các yêu cầu phân tích mà không phải thay đổi đáng kể lược đồ cơ sở dữ liệu hoặc viết lại mã ứng dụng hiện có. [...]... cơ sở dữ liệu Hình 3 mô tả cách mà kho dữ liệu có thể được mở rộng bằng XML Hình 3 Kho dữ liệu quan hệ được mở rộng bằng khả năng quản lý dữ liệu XML Bảng sự kiện và tất cả các bảng chiều dữ liệu có thể bao gồm các cột XML, tuy nhiên ví dụ này chỉ cho ta thấy một bảng cho một loại dữ liệu với một cột XML Trong hình 3, một kho lưu trữ dữ liệu vận hành cấp thông tin mới theo định kỳ cho kho dữ liệu Một... dung của một cơ sở dữ liệu trên nhiều bộ xử lý và thiết bị lưu trữ có thể giúp các công ty đạt được khả năng mở rộng tuyến tính DB2 phiên bản 9.7 mở rộng tính năng phân đoạn cơ sở dữ liệu của DB2 (DPF) để hỗ trợ cả XML và dữ liệu quan hệ Trước đây, DPF chỉ hỗ trợ dữ liệu quan hệ Hình 4 Kiến trúc DB2 mẫu với phân đoạn dựa trên băm, cho phép xử lý song song các truy vấn và các hoạt động cơ sở dữ liệu. .. nhiều tài liệu XML Các phiên bản mới của DB2 mở rộng các tiện ích được xây dựng sẵn để phân rã (hoặc chia nhỏ) dữ liệu làm việc với nhiều tài liệu XML Các bản phát hành DB2 trước cho phép một tài liệu XML đầu vào cho mỗi hoạt động phân rã Trong bản phát hành mới của DB2, một thủ tục được lưu sẵn mới do hệ thống cung cấp là (XDB_DECOMP _XML_ FROM_QUERY) lấy một bảng DB2 hiện có làm đầu vào, cho phép các quản... thể là XML, trong khi các thông tin khác có thể là thông tin quan hệ Các cột XML có thể được bổ xung vào bảng sự kiện hoặc bảng chiều dữ liệu khi cần thiết, mặc dù hình 3 minh hoạ dữ liệu XML tại chỉ một bảng chiều dữ liệu (bảng để theo dõi các chi tiết của các sản phẩm khác nhau) Hỗ trợ các ứng dụng lấy XML làm tâm điểm Trong khi công nghệ DB2 pureXML có thể mở rộng các cơ sở dữ liệu phân tích và hỗ... nén Khả năng xử lý dữ liệu nằm nội tuyến này, được đưa vào DB2 phiên bản 9.5, vẫn là một tùy chọn có ích  Các tài liệu XML có dung lượng lớn hơn, cư trú trong một khu vực dữ liệu tách biệt với dữ liệu quan hệ, cũng có thể được nén Theo mặc định, DB2 lưu dữ liệu XML tại một nơi riêng biệt được gọi là Vùng dữ liệu XML (XML Data Area - XDA) để xử lý các tài liệu có dung lượng lên đến 2GB Khả năng nén dữ. .. giúp các công ty quản lý khối lượng tăng lên của các thông điệp và tài liệu XML mà nhiều kiến trúc hướng dịch vụ tạo ra cho các ứng dụng xử lý giao dịch Việc sử dụng ngày càng tăng của các biểu mẫu điện tử và dịch vụ Web là hai yếu tố đóng góp vào việc tăng khối lượng dữ liệu XML DB2 giúp các công ty đối phó với việc tăng khối lượng của dữ liệu XML bằng cách loại bỏ việc phải chia nhỏ XML vào các cột của. .. ước tính chiều dài nội tuyến tối thiểu, cần phải được xác định để cho phép DB2 lưu trữ một tài liệu XML đã cho trên cùng một trang với dữ liệu quan hệ trong một hàng Các đặc tính này có thể giúp các quản trị viên tinh chỉnh thiết kế của cơ sở dữ liệu vật lý của họ Liệt kê 8 cho thấy cách sử dụng các hàm mới này của DB2 như thế nào Liệt kê 8 Phân tích dữ liệu XML nội tuyến với các hàm mới của DB2 ... yêu cầu của người dùng ban đầu Khả năng mở rộng tuyến tính đạt được bằng cách bổ sung thêm phân đoạn mới khi khối lượng dữ liệu tăng lên Trình Cố vấn thiết kế của DB2, một công cụ quản trị được xây dựng sẵn, có thể đưa ra lời khuyên cho quản trị viên về thiết kế phân đoạn của họ Để đơn giản hóa việc quản trị dữ liệu XML và cung cấp khả năng mở rộng tối đa, DB2 phiên bản 9.7 cho phép dữ liệu XML được... dữ liệu XML lưu trữ trong XDA được đưa thêm vào trong phiên bản mới của DB2 Trong DB2 phiên bản 9.7, khả năng nén dữ liệu XML được kích hoạt đơn giản chỉ cần thông qua mệnh đề COMPRESS YES của câu lệnh CREATE TABLE câu lệnh này nén cả hai loại cột quan hệ và cột XML có trong bảng Để đạt được kết quả nén tốt nhất, DB2 sử dụng hai bộ từ điển nén riêng biệt, một cho các cột quan hệ và một cho vùng dữ liệu. .. gồm các biến XML và các câu lệnh SQL /XML Viết các hàm do người dùng định nghĩa làm việc với XML không khác với việc viết các hàm do người dùng định nghĩa làm việc với các loại dữ liệu quan hệ Các hàm có thể được mã hoá để trả lại một giá trị duy nhất (đối với các các hàm vô hướng) hay nhiều giá trị (đối với các hàm bảng) Các hàm bảng có thể đặc biệt hữu ích nếu bạn cần phải trích ra và trả lại các . Nâng cao tính thấu đáo nghiệp vụ và khả năng mở rộng của dữ liệu XML với các đặc tính pureXML của DB2 phiên bản mới 9. 7 Matthias Nicola, Chuyên gia về hiệu năng CSDL, IBM Silicon. đạt được khả năng mở rộng tuyến tính. DB2 phiên bản 9. 7 mở rộng tính năng phân đoạn cơ sở dữ liệu của DB2 (DPF) để hỗ trợ cả XML và dữ liệu quan hệ. Trước đây, DPF chỉ hỗ trợ dữ liệu quan. của cơ sở dữ liệu. Hình 3 mô tả cách mà kho dữ liệu có thể được mở rộng bằng XML. Hình 3. Kho dữ liệu quan hệ được mở rộng bằng khả năng quản lý dữ liệu XML. Bảng sự kiện và tất cả các bảng

Ngày đăng: 07/08/2014, 09:22

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan