TIỂU LUẬN MÔN QUẢN TRỊ HỆ THỐNG THÔNG TIN SỰ THÀNH LẬP B.I CƠ SỞ DỮ LIỆU VÀ QUẢN LÝ THÔNG TIN

34 402 0
TIỂU LUẬN MÔN QUẢN TRỊ HỆ THỐNG THÔNG TIN SỰ THÀNH LẬP B.I CƠ SỞ DỮ LIỆU VÀ QUẢN LÝ THÔNG TIN

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC KINH TẾ- LUẬT KHOA QUẢN TRỊ KINH DOANH MÔN QUẢN TRỊ HỆ THỐNG THÔNG TIN  Bài tập nhóm FOUNDATIONS OF BUSINESS INTELLIGENCE: DATABASES AND INFORMATION MANAGEMENT SỰ THÀNH LẬP B.I: CƠ SỞ DỮ LIỆU VÀ QUẢN LÝ THÔNG TIN Giảng viên hướng dẫn: ThS. Hồ Trung Thành Nhóm thực hiện: Nhóm 7 & 8 – K10407A Thành phố Hồ Chí Minh Tháng 11 năm 2013 DANH SÁCH NHÓM 7&8 – K10407A  NHÓM 7 1. Nguyễn Thị Thanh Hoa K104071056 2. Đàm Vân Khánh K104071062 3. Vũ Văn Nhật K104071091 4. Phạm Ý Nhi (Nhóm trưởng) K104071093 5. Bùi Thị Bích Phượng K104071103 6. Vũ Thị Thắm K104071125 NHÓM 8 1. Lê Thị Kim Hương K104071061 2. Nguyễn Thị Trà My (Nhóm trưởng) K104071080 3. Đào Văn Nhi K104071092 4. Nguyễn Xuân Quyết K104071108 5. Trương Đào Trọng Tín K104071136 6. Phạm Quốc Tỉnh K104071137 MỤC LỤC Chương 5 FOUNDATIONS OF BUSINESS INTELLIGENCE: DATABASES AND INFORMATION MANAGEMENT SỰ THÀNH LẬP B.I: CƠ SỞ DỮ LIỆU VÀ QUẢN LÝ THÔNG TIN A. LÝ THUYẾT 1. Phương pháp tiếp cận cơ sở dữ liệu để quản lý dữ liệu 1.1 Các khái niệm 1.1.1 Cơ sở dữ liệu (Database) - Là một tập các mẩu tin có mối quan hệ với nhau được ghi lại một cách cụ thể về con người, nơi chốn hay một thứ gì đó. Nói ngắn gọn Cơ sở dữ liệu là một tập hợp thông tin có cấu trúc. - VD: Danh bạ điện thoại là một cơ sở dữ liệu mà con người đã thu thập được. Trong danh bạ, chứa thông tin người sử dụng: họ, tên, địa chỉ, số điện thoại. Với danh bạ điện thoại của một công ty thì chứa những thông tin của các đơn vị kinh doanh và loại hình kinh doanh; thông tin về khách hàng, loại hình doanh nghiệp, mã vùng, vị trí địa lí. 1.1.2 Đối tượng (Entity) - Là đối tượng (người, vật hoặc đồ vật) đại diện cho một loại thông tin, như: khách hàng, nhà cung cấp, nhân viên … 1.1.3 Thuộc tính (Attributes) - Mỗi đối tượng (entity) có những đặc điểm, tính chất riêng biệt, gọi là thuộc tính (attributes) của đối tượng đó. - VD: Entity SUPPLIER có các attributes đại diện là Tên nhà cung cấp, địa chỉ của nhà cung cấp đó bao gồm tên đường, quận, thành phố, mã bưu điện 1.2 Hạn chế của Cơ sở dữ liệu truyền thống Trước các loại hình cơ sở dữ liệu số hiện đại như ngày nay, các doanh nghiệp thường làm việc và lưu trữ thông tin bằng các hồ sơ giấy. Các thông tin, dữ liệu của Trang 4 doanh nghiệp được lưu trữ ở nhiều phòng ban và thiếu sự liên kết, thống nhất với nhau. Vì vậy, tổ chức dữ liệu theo cách truyền thống này có rất nhiều hạn chế. - Thường được viết bằng tay, việc thu thập dữ liệu khó khăn - Cồng kềnh, kém hiệu quả - Tốn thời gian và chi phí duy trì cao - Dữ liệu thường thiếu chính xác, thiếu cập nhật và khó khăn trong việc truy cập hay chia sẻ dữ liệu kịp thời - Thiếu tính bảo mật 1.3 Cơ sở dữ liệu quan hệ (Relational Database) Đối với cơ sở dữ liệu số, việc tìm kiếm thông tin rất dễ dàng, nhanh chóng bằng việc tạo liên kết giữa dữ liệu này với những dữ liệu khác có liên quan. Thông qua đó, đảm bảo tính chính xác, thống nhất và tính cập nhật cho dữ liệu. Khái niệm cơ sở dữ liệu quan hệ (Relational Database) ra đời từ đó. 1.3.1 Đặc điểm - Tổ chức dữ liệu theo 2 chiều là dòng và cột dưới dạng bảng. Mỗi bảng duy trì dữ liệu cho một Entity và các Attributes đại diện cho entity đó. - Mỗi bảng đại diện cho 1 Entity, như là: Khách hàng, Nhà cung cấp … 1.3.2 Thành phần - Trường (Fields): lưu trữ dữ liệu dưới dạng cột (Column), đại diện cho một Attribute của entity - Khóa chính (Primary Key): là một field nằm trong mỗi bảng, không chứa các giá trị trùng lắp giữa các thực thể với nhau. Vì vậy, được dùng để phân biệt các thực thể với nhau trong cùng 1 bảng. - Bản ghi (Records, Tuples): lưu trữ dữ liệu dưới dạng dòng (Row), là tập hợp các attributes của từng thực thể nằm trong entity đang xét Sau đây, hãy cùng xem xét một ví dụ về một đối tượng là SUPPLIER (Nhà cung cấp) để phân tích đâu là các thuộc tính của đối tượng này. Những thông tin liên quan đến đối tượng được lưu trữ dưới dạng Table 2 chiều là dòng và cột như thế nào. Trang 5 Table SUPPLIER - Bảng SUPPLIER bao gồm các cột và dòng. Mỗi yếu tố gồm dữ liệu về nhà cung cấp, như: tên nhà cung cấp, đường, thành phố, bang, mã vùng, được lưu trữ ở những field riêng biệt. Mỗi feild đại diện là một attribute của Entity SUPPLIER. - Thông tin của các nhà cung cấp nằm trong bảng được gọi là “row”. - Khóa chính của bảng là trường Supplier_Number. Khóa chính này giúp nhận diện tất cả các thông tin ở bất kì dòng nào trong bảng. Và khóa chính không thể trùng lặp. - Ngoài ra, chúng ta cũng có thể sử dụng tên của nhà cung cấp – Supplier_Name làm khóa chính. Tuy nhiên, nếu có hai nhà cung cấp có cùng tên thì trường tên của nhà cung cấp sẽ không còn là duy nhất, vì vậy, cần thiết phải gán một trường nhận diện đặc biệt cho mỗi mục đích khác nhau. Ví dụ, nếu bạn có 2 nhà cung cấp, cả 2 đều có tên là CBM, nhưng một cái có cơ sở ở Dayton và cái còn lại ở Louis , nó rất dễ dàng gây nhầm lẫn. Tuy nhiên nếu có một số thứ tự nhà cung cấp duy nhất, sự nhầm lẫn là có thể tránh. - Chúng ta cũng có thể nhận thấy rằng thông tin địa chỉ cũng được tách biệt thành 4 trường: Supplier_street, Supplier_city, Supplier_state và Supplier_ Zip. Dữ liệu được chia ra thành những yếu tố nhỏ nhất để có thể truy cập riêng biệt, dễ dàng lựa chọn một dòng trong bảng nhằm nối với Trang 6 một nội dung trong một trường; ví dụ khi muốn tìm tất cả các nhà cung cấp tại Ohio. Mỗi dòng dữ liệu cũng có thể được sắp xếp bởi nội dung của trường Supplier_state để lấy danh sách các nhà cung cấp thuộc bang gần với chỗ của họ. Mặt khác, SUPPLIER không có bất kì thông tin nào về những phần mà nhà cung cấp riêng lẻ cung cấp cho công ty của họ. Chính vì vậy người ta sẽ lập thêm table PART là entity riêng biệt từ SUPPLIER, và các trường với những thông tin về từng phần phải được lưu trữ trong bảng này. - PART có thể chứa các trường có chứa ở bảng SUPPLIER, có thể không cần giữ những thông tin về nhà cung cấp tại mỗi bản ghi trong mỗi Part vì có trường Supplier_number trong bảng PART cho phép bạn tìm kiếm dữ liệu trong trường của bảng SUPPLIER, tức là Supplier_Number sẽ có trong 2 bảng SUPPLIER và PART. - Supplier_number xuất hiện trong bảng PART được gọi là foreigner key và nó cần thiết để tìm kiếm dữ liệu về nhà cung cấp trong một phần đặc biệt. PART có khóa chính là Part_number, để nhận diện mỗi phần. Khóa này không được sử dụng để liên kết PART với SUPPLIER nhưng có thể để liên kết PART với một entity khác. Trang 7 - Lưu ý: Phải chắc chắn rằng tất cả các attributes của mỗi entity riêng biệt đăng kí đến 1 entity. Nếu bạn đã giữ địa chỉ của nhà cung cấp trong bản ghi PART, thông tin đó không chỉ có mối liên hệ với PART, nó còn liên hệ với cả SUPPLIER. Nếu địa chỉ nhà cung cấp đã thay đổi, nó sẽ thay đổi dữ liệu của SUPPLIER và tất cả các bản ghi trong PART. 1.3.3 Tạo liên kết Sơ đồ liên kết thực thể (Entity-Relationship Diagram) - Khi chúng ta phân dữ liệu thành các bảng SUPPLIER và PART thì phải chắc chắn là chúng ta biết mối quan hệ giữa chúng. Sơ đồ quan hệ này được gọi là Sơ đồ liên kết thực thể (Entity-Relationship Diagram). - Sơ đồ liên kết này được sử dụng để gạn lọc các bảng có mối quan hệ với nhau trong dữ liệu. Phần thông tin được cung cấp quan trọng nhất bởi sơ đồ này là 2 bảng có liên quan với nhau. - Các loại quan hệ giữa các bảng là: Một-một (One-to-one), Một-nhiều (One-to-many), Nhiều-nhiều (Many-to-many) Mối quan hệ giữa SUPPLIER và PART trong dữ liệu là quan hệ Một-nhiều, mỗi nhà cung cấp có thể cung cấp nhiều phần nhưng 1 phần chỉ có 1 nhà cung cấp. Với mỗi thực thể trong bảng SUPPLIER, có thể có bản ghi liên quan trong bảng PART. Sơ đồ trên thể hiện mối quan hệ Một-nhiều. Hộp đại diện cho các thực thể, đường nối thể hiện mối quan hệ. Đường nối kết thúc với 2 dấu ngạch là quan hệ 1-1, đường hết thúc bằng dấu chân chim và 1 gạch là quan hệ 1-nhiều. Qua đó, ta thấy mỗi PART chỉ có một SUPPLIER, nhưng một SUPPLIER có thể cung cấp được nhiều PART. Trang 8 Chúng ta cũng thấy mối quan hệ Một-nhiều nếu thêm 1 bảng ORDER (Đơn hàng) vào dữ liệu; vì 1 SUPPLIER sẽ có nhiều ORDER. Nội dung của bảng ORDER bao gồm: Mã số order và Ngày order. Một ORDER có thể có nhiều sản phẩm (PART) từ cùng một SUPPLIER, một sản phẩm có thể được đặt nhiều lần với nhiều đơn đặt hàng khác nhau; đây là mối quan hệ Nhiều-Nhiều giữa sản phẩm và đơn đặt hàng. Bất cứ khi nào có quan hệ này tồn tại giữa 2 bảng thì nó đều cần thiết để liên kết giữa 2 bảng có dữ liệu liên quan. Việc tạo 1 bảng riêng để chứa các thông tin quan hệ giữa các bảng gọi là bảng nối hay quan hệ tương tác. Nội dung của bảng nối này gồm 3 trường: Order_Number, Part_Number và Part_Quantity. Tiêu chuẩn hóa (Normalization) - Quá trình giảm bớt sự phức tạp, trùng lắp dữ liệu giữa các bảng gọi là tiêu chuẩn hóa. Những thông tin được thiết kế 1 cách hợp lý và bình thường sẽ dễ dàng để duy trì với tỷ lệ trùng lắp thông tin bé nhất. Tính toàn vẹn (Referential Integrity) - Hệ thống quan hệ dữ liệu phải có tính liên quan, toàn vẹn để đảm bảo rằng mối quan hệ giữa 2 bảng phải thống nhất với nhau. - Trong những doanh nghiệp nhỏ, bạn sẽ có nhiều bảng với nhiều thực thể khác nhau như khách hàng, nhà vận chuyển, nhân viên và mỗi tập đoàn lớn sẽ có hàng ngàn thực thể để duy trì. Điều quan trọng đối với bất cứ công ty nào dù lớn hay nhỏ là phải có mô hình dữ liệu tốt bao gồm tất cả các chủ thể và mối quan hệ giữa chúng, tối thiểu hóa sự trùng lắp dư thừa, tối đa sự chính xác, để dễ dàng cho việc đánh giá và phân tích. Nếu công ty không có mô hình dữ liệu đúng thì hệ thống dữ liệu sẽ không thể đáp ứng cho việc kinh doanh tốt được. Việc kinh doanh của công ty sẽ không có Trang 9 hiệu quả vì đang phải làm việc với dữ liệu không chính xác, không hợp lý. Hiểu được cách tổ chức dữ liệu và cách trình bày dữ liệu là những phần quan trọng mà các doanh nghiệp cần phải chú ý. Ví dụ, Famous Footwear, có hơn 800 cửa hàng ở 49 nước, có thể không đạt được mục tiêu “ đúng style ở đúng cửa hàng với đúng giá” vì hệ thống dữ liệu thiết kế không hợp lý để điều chỉnh nhanh hàng tồn kho. Công ty có một hệ dữ liệu Oracle chạy trên máy tính trung bình IBM AS/400, nhưng hệ dữ liệu dc thiết kế chủ yếu để cung cấp báo cáo cho người quản lý hơn là để phản ứng với những thay đổi thị trường. Nhà quản lý không thể có được dữ liệu rõ ràng về hàng tồn kho ở mỗi cửa hàng. Công ty phải giải quyết vấn đề này bằng việc xây dựng hệ dữ liệu mới để bán hàng và dữ liệu tồn kho được tổ chức tốt hơn cho việc phân tích và quản lý hàng tồn kho. 2. Hệ thống quản trị cơ sở dữ liệu (DBMS) 2.1 Định nghĩa - Là 1 phầm mềm đặc trưng cho việc: tạo lập , lưu trữ, tổ chức, truy cập dữ liệu từ cơ sở dữ liệu - Giải phóng người dùng khỏi phải suy nghĩ về việc: trình bày dữ liệu sao cho hợp lý (logical views) và cấu trúc , lưu trữ dữ liệu sao cho hiệu quả (physical views) - Ví dụ: • Microsoft Access là DBMS cho máy tính cá nhân • Trong khi DB2, Orecle database, Microsoft SQL server là DBMS cho máy tính cỡ lớn (Midrange computer), siêu máy tính (large mainframes). • Các dạng DBMS trên đều là Relational DBMS hỗ trợ cho relational database - Minh họa DBMS bằng Cơ sở dữ liệu của phòng Nhân sự • Cơ sở dữ liệu của phòng HR cung cấp nhiều loại dữ liệu, tùy thuộc vào yêu cầu thông tin của người sử dụng. Ví dụ như, Giám đốc quan tâm đến việc trả lương cho nhân viên. Trang 10 [...]... kho cơ sở dữ liệu và khai thác dữ liệu để tăng lượng khách hàng trung thành và tung ra những dịch vụ mới Công ty đã tạo ra một kho cơ sở dữ liệu củng cố dữ liệu từ hệ thống dữ liêu doanh nghiệp, hệ thống quản lý dữ liệu liên hệ khách hàng, dữ liệu thanh toán của khách hàng trong một dữ liệu lớn Khai thác dữ liệu cho phép quản lý xác định hồ sơ nhân khẩu học của những khách hàng mới và liên hệ nó tới... gồm có: phát triển chính sách thông tin, sắp xếp dữ liệu, theo dõi thiết kế logic của dữ liệu, sự phát triển của danh mục dữ liệu và giám sát việc sử dụng dữ liệu của các chuyên gia hệ thống thông tin và nhóm người dùng cuối 4.1.3 Quản lý cơ sở dữ liệu (Database Administration) - Một tổ chức lớn cần có khung thiết kế dữ liệu và từng nhóm quản lý trong một hệ thống thông tin chung, bộ phận mà sẽ chịu... 150 từ bảng PART và SUPPLIER dưới một bảng khác Chức năng của DBMS Hệ quản trị cơ sở dữ liệu (DBMS) có những chức năng và công cụ để tổ chức, quản lý và truy cập dữ liệu Những nhiệm vụ quan trọng nhất của nó là, khả năng định nghĩa dữ liệu, từ điển dữ liệu và ngôn ngữ sửa đổi dữ liệu - Data Definition (Định nghĩa dữ liệu) : Chỉ ra cấu trúc của cơ sở dữ liệu Cụ thể - là, tạo bảng cơ sở dữ liệu rồi xác định... đổi đối với cơ sở dữ liệu nội - bộ Thứ ba, truy cập cơ sở dữ liệu của công ty thông qua Web tạo ra những cơ hội và hiệu quả mới, trong một vài trường hợp, nó thậm chí đang thay đổi cách thức kinh doanh Quản lý nguồn tài nguyên dữ liệu 4 Xây dựng một hệ thống cơ sở dữ liệu chỉ mới là bước đầu Để đảm bảo rằng nguồn dữ liệu cho doanh nghiệp luôn được đảm bảo về độ chính xác, tính tin cậy và sẵn sàng cho... động dò tìm và sửa đổi các dữ liệu không đúng, không hoàn chỉnh, không đúng định dạng hay thừa thải + Làm sạch dữ liệu không chỉ chỉnh sửa lại dữ liệu mà còn đòi hỏi sự thống nhất giữa những nhóm dữ liệu khác nhau bắt nguồn từ nhiều hệ thống thông tin tách rời + Phần mềm chuyên về làm sạch dữ liệu có thể dùng để điều tra dữ liệu tự động, sửa lỗi dữ liệu, và tích hợp dữ liệu trong một dạng thống nhất... kê và thông tin Quản lý dữ liệu là để giúp các tổ chức quản lý các thông tin sẵn có, khả năng sử dụng, tính toàn vẹn và bảo mật của dữ liệu Nó sẽ giúp tăng tính riêng tư, bảo mật, chất lượng của dữ liệu, và tuân thủ các quy định của - chính phủ Kiểm tra chất lượng của dữ liệu và lọc dữ liệu là rất cần thiết để số lượng hồ sơ không phù hợp Chúng được phân loại thành bản sao hồ sơ, hồ sơ mà thiếu dữ liệu, ... lưu trữ dữ liệu cho phép họ quản lý, khai thác dữ liệu dễ dàng hơn Cách lưu trữ dữ liệu này là kho dữ liệu (Data Warehouses) 3.1 Kho dữ liệu (Data warehouses) 3.1.1 Khái niệm - Là một cơ sở dữ liệu được thiết kế để trả lời các câu hỏi của doanh nghiệp Nó là nơi chứa nhiều loại dữ liệu doanh nghiệp từ các nguồn khác nhau - (các hệ thống xử lý tác vụ) Dữ liệu từ những nguồn này được chuyển dịch vào trong... doanh và ra quyết định 3 Doanh nghiệp sử dụng cơ sở dữ liệu của họ nhằm: - Theo dõi các giao dịch cơ bản - Cung cấp thông tin sẽ giúp các công ty điều hành kinh doanh hiệu quả hơn - Giúp các nhà quản lý và nhân viên đưa ra quyết định tốt hơn Hiện nay, đã có rất nhiều phần mềm cung cấp cho người sử dụng những khả năng truy vấn và lập các báo cáo thông tin, đặc biệt là các hệ quản trị cơ sở dữ liệu quan hệ. .. việc - thiết lập cấu trúc, nội dung và lưu giữ dữ liệu Các chức năng gồm có sự phối hợp sâu sát với người dùng, nhóm thiết kế thiết lập nguồn dữ liệu, những mối quan hệ logic giữa các phần tử, cách thức truy cập và chính sách bảo mật 4.2 Đảm bảo chất lượng nguồn dữ liệu Một cơ sở dữ liệu và cơ sở thông tin được thiết kế tốt sẽ hoạt động lâu dài, đảm bảo cho doanh nghiệp có được đủ những thông tin cần Tuy... huống này? - Cơ sở dữ liệu được minh họa trong tình huống này Đề cập đến vấn đề củng cố nhiều cơ sở dữ liệu vào những danh sách riêng lẻ Hơn nữa, các cơ quan đang sử dụng kho dữ liệu thông tin truy vấn tập hợp của tất cả các cơ quan chính phủ Cơ quan có thể nhận được một trung tâm dữ liệu, một tập hợp các dữ liệu, mà gắn liền với nhiệm vụ cụ thể của nó Ví dụ, các hãng hàng không sử dụng dữ liệu được cung . 5 FOUNDATIONS OF BUSINESS INTELLIGENCE: DATABASES AND INFORMATION MANAGEMENT SỰ THÀNH LẬP B. I: CƠ SỞ DỮ LIỆU VÀ QUẢN LÝ THÔNG TIN A. LÝ THUYẾT 1. Phương pháp tiếp cận cơ sở dữ liệu để quản lý dữ liệu 1.1. hay chia sẻ dữ liệu kịp th i - Thiếu tính b o mật 1.3 Cơ sở dữ liệu quan hệ (Relational Database) Đ i v i cơ sở dữ liệu số, việc tìm kiếm thông tin rất dễ dàng, nhanh chóng b ng việc tạo liên. định nghĩa dữ liệu, từ i n dữ liệu và ngôn ngữ sửa đ i dữ liệu. - Data Definition (Định nghĩa dữ liệu) : Chỉ ra cấu trúc của cơ sở dữ liệu. Cụ thể là, tạo b ng cơ sở dữ liệu r i xác định các

Ngày đăng: 09/05/2015, 22:30

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan