Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

31 838 0
Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng LỜI MỞ ĐẦU Ngày nay, thời đại bùng nổ cách mạng thông tin, hoạt động sản xuất kinh doanh ln cần có đáp ứng nhanh nhạy, tức thời thay đổi liên tục, nhà quản lý buộc phải thường xuyên đưa nhiều định đắn lúc cách nhanh chóng Do vấn đề trợ giúp định trở lên cần thiết Người ta phải thu thập, tổng hợp phân tích liệu từ nhiều nguồn khác cách nhanh hiệu đưa định nhanh chóng phù hợp Điều dẫn đến việc cần phát triển hệ thống thơng minh, biết cách trích chọn phân tích liệu cho người sử dụng Hiện có nhiều phần mềm cung cấp cho người sử dụng khả truy vấn lập báo cáo thông tin, đặc biệt hệ quản trị CSDL quan hệ Tuy nhiên CSDL quan hệ với cấu trúc hai chiều (hàng cột) không thiết kế để cung cấp góc nhìn đa chiều liệu đầu vào tốn phân tích phức tạp Sử dụng hệ thống này, gặp nhiều khó khăn bất tiện trọng việc tổ chức liệu đa chiều vào bảng hai chiều, triển khai liệu phân tích với số lượng lớn, cơng cụ phân tích để tạo liệu định khơng thực mạnh, khơng có linh hoạt, nhanh chóng quan trọng khơng dễ dàng sử dụng với nhà quản lý, người định Như vậy, việc xây dựng hệ thống có khả tổ chức liệu đa chiều có khả phân tích liệu linh hoạt để trả lời truy vấn đa chiều cách dễ dàng, nhanh chóng nhằm hỗ trợ cho việc định nhà quản lý cần thiết Thị trường vàng vốn thị trường nóng bỏng, phân tích dự báo giá vàng nhu cầu khơng thể thiếu Nhưng để làm điều này, có liệu khứ lưu trữ CSDL thường chưa đủ, cần có CSDL giúp cho người phân tích có cách nhìn trực quan, từ tổng thể đến chi tiết vấn đề quan tâm, CSDL phải tổ chức cho thơng tin truy nhập với tốc độ nhanh Cách hiệu để trợ giúp cho vấn đề tổ chức liệu thành kho liệu (data warehouse) để phục vụ cho nhà kinh tế việc phân tích dự báo giá vàng Chính thế, sau thời gian học tập nghiên cứu, em định chọn đề tài “Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng” nhằm ứng dụng kiến thức công nghệ thông tin kinh tế để xây dựng lên kho liệu chứa thông tin giá vàng năm gần với cách tổ chức liệu hoàn toàn Mặc dù cố gắng để hoàn thành đề tài cịn hạn chế kinh nghiệm kiến thức nên chương trình cịn nhiều sai sót cần bổ sung Vì vậy, em mong thầy bạn xem đóng góp ý kiến giúp cho chương trình trở nên hồn thiện Cuối cùng, em xin chân thành cảm ơn thầy, giáophịng quản lý nghiên cứu khoa học, Trường đại học CNTT Truyền Thông, đặc biệt cố vấn khoa học TS Vũ Xuân Nam, trực tiếp hướng dẫn tận tình giúp đỡ em hồn thành đề tài Em xin chân thành cảm ơn! Thái Nguyên, Tháng 11 Năm 2012 CHƯƠNG : TỔNG QUAN VỀ XỬ LÝ PHÂN TÍCH TRỰC TUYẾN Giới thiệu phương pháp khai thác liệu 1.1 - Khai thác liệu trình phát mối quan hệ liên thuộc, mơ hình xu hướng (Patterns & Trends) việc khảo sát số lượng lớn liệu lưu trữ nhà kho (Repository) sử dụng công nghệ nhận dạng mẫu kỹ thuật thống kê toán học Khai thác liệu hiểu khoan liệu theo chiều sâu tổng hợp liệu theo chiều ngược lại, trình đào bới xem xét liệu với nhiều góc độ nhằm tìm mối liên hệ thành phần liệu phát xu hướng, hình mẫu, kinh nghiệm khứ tiềm ẩn kho liệu Vì phù hợp với mục đích phân tích liệu hỗ trợ điều hành định - Phần lớn phương pháp khai thác liệu dựa lĩnh vực thống kê số công cụ khác Một số kỹ thuật thường dùng mạng Neuron (Neuron network), giải thuật di truyền (Genetic Algorithms) xử lý phân tích trực tuyến (OnLine Analytical Processing - OLAP) - Xử lý phân tích trực tuyến sử dụng kho liệu cho mục đích định Ý tưởng mô chiều mở rộng: bảng với n thuộc tính coi không gian n chiều Người quản lý đặt câu hỏi mà phân tích phân tích đa chiều Các thơng tin khó phân tích bảng biểu diễn hai chiều CSDL chuẩn đáp ứng tốt cho công việc này, vây nên, trường hợp vậy, OLAP tỏ thích hợp với việc phân tích hỗ trợ định phương pháp khác Tổng quan kho liệu (Dataware house) 1.2 - Kho liệu tuyển tập CSDL tích hợp, hướng chủ đề, thiết kế với chức trợ giúp định, mà đơn vị liệu liên quan tới khoảng thời gian cụ thể Kho liệu thường lớn, tới hàng trăm GB hay chí hàng Terabyte - Kho liệu xây dựng để tiện lợi cho việc truy cập theo nhiều nguồn, nhiều kiểu liệu khác cho kết hợp ứng dụng công nghệ đại kế thừa từ hệ thống sẵn có từ trước Dữ liệu phát sinh từ hoạt động hàng ngày thu thập xử lý để phục vụ công việc nghiệp vụ cụ thể tổ chức gọi liệu tác nghiệp (operational data) hoạt động thu thập xử lý loại liệu gọi xử lý giao dịch trực tuyến (Online Transaction Processing - OLTP) 1.2.1 - Đặc điểm kho liệu Tính tích hợp: Dữ liệu Dataware house tổ chức theo nhiều cách khác cho phù hợp với quy ước đặt tên, thống số đo, cấu mã hóa cấu trúc vật lý liệu Một Datawarehouse khung nhìn thơng tin mức tổng thể, tồn tổ chức, thống khung nhìn khác thành khung nhìn theo chủ đề Tính tích hợp thể chỗ : Dữ liệu kho liệu tập trung từ nhiều nguồn ghép với tạo thành thể thống Hình 1.1 Tích hợp liệu - Hướng chủ đề: Dữ liệu Dataware house tổ chức theo chủ đề phục vụ cho tổ chức dễ dàng xác định thông tin cần thiết hoạt động Ví dụ doanh nghiệp, Dataware house tổ chức thành chủ đề : Khách hàng, tài chính, sản phẩm…, nhiên Dataware house khác CSDL thông thường không lưu liệu chi tiết, lưu liệu có tính tổng hợp để phục vụ chủ yếu cho trình phân tích hỗ trợ định - Dữ liệu gắn thời gian có tính lịch sử: Một kho liệu bao hàm khối lượng lớn khối lượng lịch sử Dữ liệu Dataware house gọi ảnh chụp liệu (data snapshort), ghi phản ánh giá trị liệu thời điểm định thể khung nhìn một chủ điểm giai đoạn Yếu tố thời gian đóng vai trị phần khóa để đảm bảo tính đơn ghi cung cấp đặc trưng thời gian cho liệu Dữ liệu CSDL tác nghiệp cần phải xác thời điểm truy cập, Dataware house cần có hiệu lực khoảng thời gian đó, khoảng năm đến 10 năm lâu Dữ liệu CSDL sau thời gian định trở thành liệu lịch sử chúng chuyển vào kho liệu Hình 1.2 Tính thời gian liệu - Dữ liệu có tính ổn định: Dữ liệu Dataware house liệu đọc kiểm tra, không sửa đổi bới người sử dụng đầu cuối Datawarehouse cho người dùng phép nạp thêm liệu vào truy cập tới vùng Hình 1.3 Cơ chế hoạt động Dataware house - Dữ liệu không biến động: Thông tin tải vào Dataware house coi cũ CSDL tác nghiệp với hệ thống điều hành doanh nghiệp, nhiên liệu Dataware house khơng có liệu coi cũ, Dataware house khơng có thao tác xóa liệu, liệu cung cấp thông tin khoảng thời gian dài, cung cấp đủ số liệu cho hệ thống dự báo, phân tích, từ có định hợp lý 1.2.2 Các khái niệm kho liệu Data Mart (Kho liệu cục bộ) 1.2.2.1 - - - 1.2.2.2 - - - - Kho liệu cục (Data Mart -DM) CSDL có đặc điểm giống với kho liệu với quy mô nhỏ lưu trữ liệu lĩnh vực, chuyên ngành Datamart kho liệu hướng chủ đề Các DM hình thành từ tập liệu kho liệu xây dựng độc lập sau xây dựng xong, DM kết nối tích hợp lại với tạo thành kho liệu Vì xây dựng kho liệu bắt đầu việc xây dựng DM hay ngược lại xây dựng kho liệu trước sau tạo DM DM chia hai loại: + Data mart phụ thuộc (Dependent Data Mart): Chứa liệu lấy từ DW liệu trích lọc tinh chế, tích hợp lại mức cao để phục vụ chủ đề định Datamart + Data mart độc lập (Independent Data Marts): Không giống Data Mart phụ thuộc, Data mart độc lập xây dựng trước DW liệu trực tiếp lấy từ nguồn khác Metadata ( Siêu liệu) Siêu liệu (metadata) dùng để mô tả tài nguyên thông tin Thuật ngữ “meta” xuất xứ từ Hy Lạp đùng để có chất cao Vì metadata liệu liệu.Tứclà thông tin mô tả nội dung sở liệu (CSDL) Metadata báo cho người dùng biết thời gian cập nhật sau liệu, định dạng mục đích sử dụng Những thơng tin hướng dẫn người dùng duyệt qua CSDL giúp họ hiểu ý nghĩa ngữ cảnh liệu tài chính, ghi khách hàng giao dịch kinh doanh Một ghi metadata bao gồm tập hợp thuộc tính tập hợp phần tử cần thiết để mô tả tài nguuyên thông tin theo yêu cầu nghiệp vụ Ví dụtrong hoạt động nghiệp vụ thơng tin – thư viện bao gồm yếu tố như: Nhan đề tài liệu, tác giả, thông tin xuất bản, nơi/vị trí lưu giữ, kiểu/dạng tài liệu Metadata cung cấp cho người sử dụng truy nhập tương tác để giúp cho họ hiểu nội dung tìm thấy liệu cần thiết Một vấn đề thực tế khả kết hợp công cụ trích lọc liệu metadata cịn thơ Do cần phải tạo giao diện dùng megadata cho người sử dụng Tất thành phần Dataware house lấy liệu từ megadata Megadata lưu trữ trung tâm Dataware house 1.2.2.3 - - Kho liệu tác nghiệp (Operational Data Store – ODS) Kho liệu tác nghiệp hệ thống tác nghiệp tích hợp dùng cho cơng việc trợ giúp định phân tích liệu giao dịch tác nghiệp Nói cách khác, ODS khái niệm có cấu trúc để hỗ trợ cho việc tạo định tác nghiệp hàng ngày lưu trữ giữ liệu có giá trị thời chuyển đến từ ứng dụng tác nghiệp ODS cung cấp lựa chọn cho ứng dụng trợ giúp định tác nghiệp, truy cập liệu cách trực tiếp từ hệ thống xử lý giao dịch trực tuyến Trong tất trường hợp, ODS cần xây dựng riêng biệt phần Dataware house Hình 1.4 Sự phân cách ODS DW - ODS tập trung vào lưu trữ liệu có giá trị thời, cịn Dataware house chứa nhiều liệu không nhiều mức độ Hình 1.5: Sự phong phú chúng loại liệu Dataware house 1.3 1.3.1 - - - 1.3.2 1.3.3 1.3.3.1 - Phân tích liệu trực tuyến (Online Analytical Processing – OLAP) Giới thiệu OLAP kỹ thuật sử dụng thể liệu đa chiều gọi khối (cube) nhằm cung cấp khả truy xuất nhanh đến liệu kho liệu Tạo khối(cube) bảng chiều (dimension table) bảng kiện (fact table) kho liệu cung cấp khả thực truy vấn tinh vi phân tích cho ứng dụng client Trong kho liệu data mart lưu cho phân tích, OLAP kỹ thuật cho phép ứng dụng client truy xuất hiệu liệu OLAP cung cấp nhiều ích lợi cho người phân tích, ví dụ như: + Cung cấp mơ hình liệu đa chiều trực quan cho phép dễ dàng chọn lựa, định hướng khám phá liệu + Cung cấp ngơn ngữ truy vấn phân tích, cung cấp sức mạnh để khám phá mối quan hệ liệu kinh doanh phức tạp + Dữ liệu tính tốn trước truy vấn thường xuyên làm cho thời gian trả lời nhanh truy vấn đặc biệt + Cung cấp công cụ mạnh giúp người dùng tạo khung nhìn liệu dựa tập hàm tính tốn đặc biệt OLAP đặt để xử lý truy vấn liên quan đến lượng liệu lớn mà cho thực thi truy vấn hệ thống OLTP cho kết làm nhiều thời gian Đặc điểm OLAP Được biết đến phần kho liệu Cung cấp báo cáo, phân tích tiền tính tốn, đồ thị, biểu đồ Cho phép phân tích trực tuyến liệu Thăm dị tương tác liệu Cung cấp giao diện đa dạng cho người dùng Cung cấp khả phân tích liệu phức tạp phương pháp đơn giản Các mơ hình OLAP MOLAP (Multidimensional OLAP) Mơ hình MOLAP lưu trữ liệu sở (dữ liệu từ bảng kho liệu) thông tin tổng hợp (là độ đo tính tốn từ bảng) khối (cube) -Các chiều tạo cách độc lập chia sẻ OLAP Cube nhằm xây dựng Cube dễ dàng để chắn thơng tin tổng hợp cho phân tích ln ổn định Hình 2.3 Ví dụ chiều - Chiều có phân cấp : Phân cấp cột sống việc gộp liệu hay nói cách khác dựa vào phân cấp mà việc gộp liệu thực Phần lớn chiều có cấu trúc đa mức hay phân cấp 2.1.3 Measure - Các đơn vị đo khối cột bảng Fact Các đơn vị đo lường xác định giá trị số từ bảng Fact mà tổng hợp phân tích định giá, trị giá, số lượng bán - Là đơn vị đo để đánh giá, phân tích liệu 2.1.4 Fact Table - Fact bảng mô tả kiện mà hệ thống muốn phân tích, kết hợp với dimension xây dựng sẵn nhằm tổ chức liệu cách có hệ thống - Một fact gồm trường chứa khố dimension mà kết hợp, đồng thời chứa measure cube Mỗi fact có measure khác - Fact lưu cấp liệu thơ Hình 2.4 Ví dụ Fact Table (Sales_Fact) 2.1.5 Slice - Slice “lát cắt”, tương ứng giá trị cho chiều “được chiếu với giá trị thành viên chiều khác Hình 2.5 Ví dụ slice 2.1.6.Partition - Tất khối có tối thiểu phân hoạch (Partition) để chứa liệu Một partition đơn tự động tạo khối định nghĩa - Khi ta tạo partition cho khối, partition thêm vào tập hợp partition tồn khối - Khối phản ánh liệu kết nối có tất partition Một bảng partition khối vơ hình người dùng - Các partition tiêu biểu cho công cụ mạnh, mềm dẻo cho việc quản trị khối OLAP, đặc biệt khối lớn 2.1.7 Role - Bảo mật Analysis Services tích hợp sẵn dựa bảo mật Microsoft Windows Để Analysis Services bảo mật, ta tạo role database OLAP Mỗi role chứa nhiều user (group) tạo hệ điều hành Mỗi role tạo liên kết với cube database OLAP Nhờ vậy, ta quản lý bảo mật cube cách hạn chế truy cập metadata (các member dimemsion) truy cập data (các giá trị lưu trữ cube) - Analysis Services có role cốđịnh tạo sẵn, bao gồm thành viên group Administrators máy chủ server, gọi server role Để thực thi tác vụ hệ thống Analysis Services, user dùngphải thành viên group Administrators Tất thành viên group toàn quyền cube database server Trong thực tế, người ta tạo role database, gọi database role, cho phép user quyền quản trị database Ngoài ra, ta cịn tạo role cấp độ cube (truy cập toàn số cube quy định) cấp độ dimension (truy cập data số dimension số cube định) 2.1.8 Schedule (Lập lịch) - Tại thời điểm đó, hệ thống OLAP server cần phải process lại để update thay đổi từ phía Database Server, đảm bảo cho Client truy xuất liệu đầy đủ hệ thống Có cách process: thủ cơng tự động • Thủ cơng: tiến hành process thủ công cần thiết ( có thay đổi liệu hay cấu trúc hệ thống) • Tự động: lập lịch cho hệ thống tự động process sau khoảng thời gian quy định trước 2.2 Quy trình thiết kế đối tượng SSAS Hình 2.5 Các đối tượng SSAS 2.2.1 Sơ lược quy trình tạo Datawarehouse 2.2.1.1 Quy trình chung - Nhận dạng liệu nguồn (Identify the data source): • Một bước để xây dựng Data Warehouse phải nhận biết nguồn liệu Ta cần phải tính tốn xem xét liệu cần thiết đểđưa vào Data Warehouse • Trong Data Warehouse, có hai loại nguồn liệu cần xem xét, nguồn liệu bên (internal data source) bên (external data source) Dữ liệu bên liệu có sẵn hệ thống Dữ liệu bên liệu từ nhiều nguồn khác hệ thống - Chọn lọc liệu (Extracting Transactional Data): • Đây bước chi phối hầu hết thời gian quy trình, cần phải lấy liệu từ nhiều nguồn nhận dạng để đưa vào kho lưu trữ trung tâm • Do nguồn liệu xuất phát từ nhiều hệ thống khác nên hệ quản trị CSDL chúng khác nhau, chẳng hạn MS Access, MS SQL Server, Oracle, Sybase, flat files, spreadsheets, mail systems nhiều dạng lưu trữ liệu khác Vì thế, ta cần định sử dụng hệ CSDL cho việc tổ chức kho liệu - Chuyển đổi liệu (Transforming Transactional Data): • Là trình chuyển đổi nhằm đảm bảo tính quản liệu sau chọn lọc từ nhiều nguồn khác • Để chuyển đổi liệu vào Data Warehouse cách xác, ta cần phải xác định ánh xạ trường (field) từ nguồn liệu bên đến trường data warehouse • Sự chuyển đổi thực trình chọn lọc (extracting) liệu đưa vào data warehouse - Tải liệu (Loading the Data): • Khi q trình chọn lọc, chuyển đổi làm hoàn tất, liệu tải vào data warehouse • Việc tải liệu phân thành hai loại: tải tồn liệu có CSDL nguồn tải liệu có thay đổi CSDL nguồn vào data warehouse • Dữ liệu data warehouse phải ln làm tươi, có nghĩa phải cập nhật thay đổi liệu • Trong cập nhật data warehouse cần phải đảm bảo khơng có liệu bị mất, đồng thời chi phí cho q trình duyệt file tồn phải đạt mức thấp 2.2.1.2 Cơng cụ thực - Extract-Transform-Load (ETL): điển DTS (Data Transformation Services) SQL Server, Informatica, Về cơng cụ ETL dạng Open source kểđến Talend, Kettle… - Lập lịch: SQL Server Agent dùng để lập lịch cho việc tựđộng chuyển đổi từ CSDL nguồn vào data warehouse 2.2.2 Quy trình tạo cube - Cơng cụ database mẫu sử dụng: • Business Intelligence Studio (đi kèm với MS SQL Sever) • Adventure Work Cycle Sample Database 2.2.2.1 Tạo DataSource Các bước sau: Trong khung Solution Explorer, phải chuột Data Sources chọn New Data Source Tại hình Welcome to Data Source Wizard, nhấn Next để chuyển sang cửa sổ Select how to define the connection Tại cửa sổ Select how to define the connection page, ta định nghĩa data source cách tạo connection connection có sẵn Trong hướng dẫn này, ta sẽđịnh nghĩa data source cách tạo connection, kiểm tra checkbox Create a data source based on an existing or new connection chọn nhấn New Trong dialog box Connection Manager, ta sẽđịnh nghĩa giá trị thuộc tính cho Data Source Trong danh sách Provider, chọn Native OLE DB\SQL Server Native Client 10.0 Trong Server Name, gõ vào localhost Kiểm tra giá trịUse Windows Authentication chọn, danh sách Select or enter a database name, ví dụ ta chọn database Adventure Works DW2008 Nhấn Test Connection để kiếm tra kết nối đến với SQL Server Chọn OK nhấn Next Tại cửa sổ Impersonation Information, ta thiết lập Security Credential cho SSAS để kết nối tới Data Sources, ta chọn Use the Service account, nhấn Next 10.Tại hình Completing the wizard, thiết lập tên Data Source Adventure Work DW chọn Finish 2.2.2.2 Tạo DataSource View - Các bước sau: Trong khung Solution Explorer, phải chuột Data Sources Views, chọn New Data Source Views Cửa số Welcome to Data Source View Wizard xuất hiện, nhấn Next Dialog Select data source xuất hiện, mục Relational Data Sources, chọn Adventure Work DW mà ta tạo chọn Next Tại Dialog Select Tables and Views, ta chọn bảng liệu views từ danh sách đối tượng, ta chọn đối tượng sau: DimCustomer (dbo) DimDate (dbo) DimGeography (dbo) DimProduct (dbo) FactInternetSales (dbo) Nhấn nút “>” để thêm bảng vào danh sách Included Objects Nhấn Next Tại thuộc tính Name, ta thiết lập Adventure Wordk DW nhấn Finish để hoàn tất việc đĩnh nghĩa data source view Data Source View Adventure Work DW hiển thị Data Source View Designer Business Intelligence Development Studio gồm thành phần sau: o Diagram Pane thể mối quan hệ bảng liệu trực quan o Tables Pane: bảng liệu schema thể theo tree view o Diagram Organizer Pane hỗ trợ tạo subdiagram mà thông qua ta có dc subsets data source view Sau hoàn tất bước này, ta có khung nhìn tồn diện bảng liệu mối quan hệ chúng 2.2.2.3 Tạo Dimension Các bước sau: Trong pane Solution Explorer, phải chuột Dimentsions, chọn New Dimensions Tại cửa sổ Welcome to Dimension Wizard, chọn Next Tại cửa số Select Creation Method, đảm bảo tùy chọn Use an Existing Table chọn, chọn Next Tại cửa sổ Specify Source Information, đảm bảo data source Adventure Works DW chọn Trong danh sách Main Table, chọn Date Tại trang Select Dimension Attributes, chọn Attributes sau: Date Key Full Date Alternate Key English Month Name Calendar Quarter Calendar Year Calendar Semester Thay đổi Attribute Type cho thuộc tính Full Date Alternate Key từ Regular sang Date cách chọn vào Regular tiến hành thay đổi Thực tương tự cho thuộc tính khác English Month Name –> Month Calendar Quarter –> Quarter Calendar Year –> Year Calendar Semester –> Half Year Nhấn Next Tại hình Completing the Wizard, Preview Pane, ta thấy dimension Date thuộc tính 10.Nhấn Finish để hồn tất việc định nghĩa Dimension 11.Tiến hành Save All Project 2.2.2.4 Tạo cube Các bước sau: Trong Solution Explorer Pane, phải chuột Cubes, chọn New Cubes Tại cửa sổ Welcome to the Cube Wizard, chọn Next Tại cửa sổ Select Creation Method, chọn Use existing tables nhấn Next cửa sổ Select Measure Group Tables, đảm bảo Adventure Works DW data source view chọn, nhấn Next Các bước sau: Trong Solution Explorer Pane, phải chuột Cubes, chọn New Cubes Tại cửa sổ Welcome to the Cube Wizard, chọn Next Tại cửa sổ Select Creation Method, chọn Use existing tables nhấn Next cửa sổ Select Measure Group Tables, đảm bảo Adventure Works DW data source view chọn, nhấn Next Nhấn Suggest để cửa số Suggest Table hiển thị đề xuất table cần thiết để xây dựng measure group Nhấn Next cửa sổ Select Measure, xem lại InternetSales measure group deselect checkbox cho giá trị sau a Promotion Key b Currency Key c Sales Territory Key d Revision Number Chọn Next cửa sổ Selecting Existing Dimensions, chọn Date dimension dc định nghĩa chọn Next 10.Trong cửa sổ Select New Dimension, chọn dimension để thiết lập, đảm bảo Customer, Geography Product chọn deselect InternetSales 11.Nhấn Next 12.tại cửa sổ Completing the Wizard, thiết lập name Cube Analysis Services Tutorial, 13.Chọn Finish để hoàn tất 14.Tiến hành Save All - Deploy Cube lên server Trong Solution Explorer Pane, phải chuột Analysis Services Tutorial chọn Properties Configuration Properties pane bên trái, chọn Deployment Chọn OK Phải chuột Analysis Service Tutorial project chọn Deploy Review lại cửa sổ Output Deployment Progress – Analysis Service Tutorial đểđảm bảo cube build khơng có lỗi build Như project SSAS deploy lên server Browsing Cube : Chuyển sang Dimension Designer cho Product Dimension Business Intelligence Studio cách double click vào Product dimension Dimension Node Click Browse để hiển thị cấu trúc Product Key Chuyển sang Cube Designer Business Intelligence Development Studio cách double click vào Analysis Service Tutorial cube node Chuyển sang Browse tab nhấn vào biểu tượng reconnect, cửa sổ Browse tab gồm phần Left Pane: thể đối tượng Analysis Service Tutorial Cube Right Pane gồm phần: phần Filter Pane, phần Data Pane việc phân tích, thể liệu sẽđược thực 2.3 Thiết kế cấu trúc Dataware House chứa giá vàng Cấu trúc DW gồm có Datamart lưu trữ giá vàng biến động ngày giá vàng giới, bao gồm giá cao nhất, giá nhỏ giá cuối ngày Hình 2.6 Cấu trúc Datamart Gold Price - Các chiều Datamart : + DimDate : Chiều thông tin thời gian ngày tháng, ngày thứ tháng, tháng, quý, năm +DimCurrency: Chiều thông tin tiền tệ, kho liệu tạm thời lưu trữ cho đơn vị USD +DimGold: Chiều thông tin loại vàng - Bảng FactGoldPrice bảng tổng hợp thông tin từ chiều chứa liệu giá vàng tương ứng.CHƯƠNG : CHƯƠNG TRÌNH THỰC NGHIỆM 3.1 Tổng quan công cụ sử dụng chương trình 3.1 Tổng quan cơng cụ sử dụng chương trình 3.1.1 Ngơn ngữ lập trình Csharp C# ngôn ngữ đơn giản, với khoảng 80 từ khoá mười kiểu liệu dựng sẵn, C# có tính diễn đạt cao C# hỗ trợ lập trình có cấu trúc, hướng đối tượng, hướng thành phần (component oriented) Trọng tâm ngôn ngữ hướng đối tượng lớp Lớp định nghĩa kiểu liệu mới, cho phép mở rộng ngôn ngữ theo hướng cần giải C# có từ khố dành cho việc khai báo lớp, phương thức, thuộc tính (property) C# hỗ trợ đầy đủ khái niệm trụ cột lập trình hướng đối tượng: đóng gói, thừa kế, đa hình - C# ngôn ngữ đơn giản C# ngôn ngữ đại C# ngôn ngữ hướng đối tượng C# ngôn ngữ mạnh mẽ mềm dẻo C# ngơn ngữ có từ khóa C# ngơn ngữ hướng module C# trở nên phổ biến C# loại bỏ vài phức tạp rối rắm ngôn ngữ Java c++, bao gồm việc loại bỏ macro, template, đa kế thừa, lớp sở ảo (virtual base class) Chúng nguyên nhân gây nhầm lẫn hay dẫn đến vấn đề cho người phát triển C++ Nếu người học ngôn ngữ chắn ta khơng trải qua thời gian để học nó! Nhưng ta hiệu ngôn ngữ C# loại bỏ vấn đề 3.1.2 Hệ quản trị sở liệu SQL Hệ quản trị sở liệu (tiếng Anh: Database Management System - DBMS), phần mềm hay hệ thống thiết kế để quản trị sở liệu Cụ thể, chương trình thuộc loại hỗ trợ khả lưu trữ, sửa chữa, xóa tìm kiếm thơng tin sở liệu (CSDL) Có nhiều loại hệ quản trị CSDL khác nhau: từ phần mềm nhỏ chạy máy tính cá nhân hệ quản trị phức tạp chạy nhiều siêu máy tính Tuy nhiên, đa số hệ quản trị CSDL thị trường có đặc điểm chung sử dụng ngôn ngữ truy vấn theo cấu trúc mà tiếng Anh gọi Structured Query Language (SQL) Các hệ quản trị CSDL phổ biến nhiều người biết đến MySQL, Oracle, PostgreSQL, SQL Server, DB2, Infomix, v.v Phần lớn hệ quản trị CSDL kể hoạt động tốt nhiều hệ điều hành khác Linux, Unix MacOS ngoại trừ SQL Server Microsoft chạy hệ điều hành Windows - Ưu điểm HQTCSDL:  Quản lý liệu dư thừa  Đảm báo tính quán cho liệu  Tạo khả chia sẻ liệu nhiều  Cải tiến tính tồn vẹn cho liệu - Nhược điểm:  Hệ quản trị sở liệu tốt phức tạp  Hệ quản trị sở liệu tốt thường lớn làm cho chiếm nhiều dung lượng nhớ  Giá khác tùy theo môi trường chức 3.2 Các chức chương trình -Form main Giao diện chương trình, cung cấp cho người sử dụng chức Xem cube, xem dự báo giá vàng tính phương pháp dự báo bản, kết xuất báo cáo Hình 3.1: Giao diện chương trình - Xem cube Chức cho phép người sử dụng xem cube (Online cube server file cub (Offline cube)) bảng có khả xoay chiều Hình 3.2: Giao diện xem cube -Dự báo giá vàng Chức cho phép người dùng xem giá vàng với giao diện tùy chọn có thêm vài chức hỗ trợ hiển thị biểu đồ, nên thông tin dự báo tháng năm sau theo phương pháp hồi quy tuyến tính Hình 3.3 : Chức dự báo giá vàng -Kết xuất in ấn Chức cho phép người sử dụng lấy liệu nhiều định dạng excel, pdf, … để sử dụng cho mục đích khác Hình 3.4: Dữ liệu sau kết xuất excel TÀI LIỆU THAM KHẢO [1] Vincent Rainardi (2008) -Building a Data Warehouse: With Examples in SQL Server, Apress [2]William H Inmon(2005) - Building the Data Warehouse, Wiley ... liệu (data warehouse) để phục vụ cho nhà kinh tế việc phân tích dự báo giá vàng Chính thế, sau thời gian học tập nghiên cứu, em định chọn đề tài ? ?Xây dựng ứng dụng DataWareHouse phục vụ cho việc. .. kho liệu xây dựng độc lập sau xây dựng xong, DM kết nối tích hợp lại với tạo thành kho liệu Vì xây dựng kho liệu bắt đầu việc xây dựng DM hay ngược lại xây dựng kho liệu trước sau tạo DM DM chia... dự báo giá vàng? ?? nhằm ứng dụng kiến thức công nghệ thông tin kinh tế để xây dựng lên kho liệu chứa thông tin giá vàng năm gần với cách tổ chức liệu hoàn toàn Mặc dù cố gắng để hồn thành đề tài

Ngày đăng: 12/02/2014, 20:20

Hình ảnh liên quan

Hình 1.1 Tích hợp dữ liệu - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 1.1.

Tích hợp dữ liệu Xem tại trang 5 của tài liệu.
Hình 1.2 Tính thời gian của dữ liệu - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 1.2.

Tính thời gian của dữ liệu Xem tại trang 6 của tài liệu.
Hình 1.4 Sự phân cách giữa ODS và DW - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 1.4.

Sự phân cách giữa ODS và DW Xem tại trang 9 của tài liệu.
Hình 1.5: Sự phong phú về chúng loại dữ liệu trong Datawarehouse - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 1.5.

Sự phong phú về chúng loại dữ liệu trong Datawarehouse Xem tại trang 9 của tài liệu.
Hình 1.6 Mô hình dữ liệu MOLAP - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 1.6.

Mô hình dữ liệu MOLAP Xem tại trang 11 của tài liệu.
Hình 1.7 Tổ chức dữ liệu trong mô hình MOLAP - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 1.7.

Tổ chức dữ liệu trong mô hình MOLAP Xem tại trang 11 của tài liệu.
Hình 1.9 Tổ chức dữ liệu trong mô hình ROLAP - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 1.9.

Tổ chức dữ liệu trong mô hình ROLAP Xem tại trang 12 của tài liệu.
Hình 1.8 Mô hình dữ liệu ROLAP - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 1.8.

Mô hình dữ liệu ROLAP Xem tại trang 12 của tài liệu.
Hình 1.10 Lược đồ hình sao - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 1.10.

Lược đồ hình sao Xem tại trang 13 của tài liệu.
- Lược đồ hình bông tuyết (snowflake): Mỗichiều được xây dựng từ nhiều bảng chiều. - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

c.

đồ hình bông tuyết (snowflake): Mỗichiều được xây dựng từ nhiều bảng chiều Xem tại trang 13 của tài liệu.
Hình 1.12 Mô hình HOLAP - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 1.12.

Mô hình HOLAP Xem tại trang 14 của tài liệu.
Hình 2.1 Ví dụ về một khối(cube) có 3 chiều - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 2.1.

Ví dụ về một khối(cube) có 3 chiều Xem tại trang 15 của tài liệu.
Hình 2.2 Ví dụ về ô rỗng trong khối - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 2.2.

Ví dụ về ô rỗng trong khối Xem tại trang 16 của tài liệu.
Hình 2.3 Ví dụ về các chiều - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 2.3.

Ví dụ về các chiều Xem tại trang 17 của tài liệu.
Hình 2.5 Ví dụ về slice - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 2.5.

Ví dụ về slice Xem tại trang 18 của tài liệu.
Hình 2.4 Ví dụ về Fact Table (Sales_Fact) - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 2.4.

Ví dụ về Fact Table (Sales_Fact) Xem tại trang 18 của tài liệu.
Hình 2.5 Các đối tượng trong SSAS - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 2.5.

Các đối tượng trong SSAS Xem tại trang 20 của tài liệu.
Hình 2.6. Cấu trúc Datamart GoldPrice - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 2.6..

Cấu trúc Datamart GoldPrice Xem tại trang 25 của tài liệu.
Hình 3.1: Giao diện chính của chương trình - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 3.1.

Giao diện chính của chương trình Xem tại trang 28 của tài liệu.
Hình 3.3 : Chức năng dự báo giá vàng - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 3.3.

Chức năng dự báo giá vàng Xem tại trang 29 của tài liệu.
Hình 3.2: Giao diện xem cube - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 3.2.

Giao diện xem cube Xem tại trang 29 của tài liệu.
Hình 3.4: Dữ liệu sau khi được kết xuất ra excel - Tài liệu Tiểu Luận Xây dựng ứng dụng DataWareHouse phục vụ cho việc dự báo giá vàng docx

Hình 3.4.

Dữ liệu sau khi được kết xuất ra excel Xem tại trang 30 của tài liệu.

Từ khóa liên quan

Mục lục

  • 3.1. Tổng quan về các công cụ sử dụng trong chương trình

    • 3.1.1. Ngôn ngữ lập trình Csharp

    • 3.1.2. Hệ quản trị cơ sở dữ liệu SQL

    • 3.2. Các chức năng của chương trình

Tài liệu cùng người dùng

Tài liệu liên quan