BÀI TẬP LỚN MẬT MÃ VÀ AN TOÀN DỮ LIỆU Nén dữ liệu Huffman

20 1.1K 1
BÀI TẬP LỚN MẬT MÃ VÀ AN TOÀN DỮ LIỆU Nén dữ liệu Huffman

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BÀI TẬP LỚN MẬT MÃ VÀ AN TOÀN DỮ LIỆU Nén dữ liệu Huffman Giới thiệu chung: Hầu hết các tập tin trong máy tính có nhiều thông tin dư thừa Nén tập tin thực chất là mã hóa lại thông tin dư thừa Tầm quan trọng: Giảm kích thước dữ liệu: Để lưu trữ. Truyền dữ liệu. Tăng tính bảo mật.

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ BÀI TẬP LỚN MÔN HỌC: MẬT MÃ VÀ AN TOÀN DỮ LIỆU ĐỀ TÀI: Nén dữ liệu Huffman Họ tên: Nguyễn Thị Thu Hà Lớp: Cao học K20 - HTTT Mã học viên: 13025079 Giảng viên hướng dẫn: PGS.TS. Trịnh Nhật Tiến Hà Nội - 2014 MỤC LỤC MỤC LỤC 2 1. Giới thiệu chung về nén và giải nén 3 2. Ý tưởng Nén dữ liệu Hu!man 3 3. Xây dựng cây hu!man 6 4. Nén và giải nén Hu!man 10 4.1. Nén tập -n 10 4.2. Giải nén tập -n: 10 5. Cài đặt chương trình 16 1. Giới thiệu chung về nén và giải nén  Giới thiệu chung: − Hầu hết các tập tin trong máy tính có nhiều thông tin dư thừa − Nén tập tin thực chất là mã hóa lại thông tin dư thừa  Tầm quan trọng: * Giảm kích thước dữ liệu: − Để lưu trữ. − Truyền dữ liệu. * Tăng tính bảo mật. 2. Ý tưởng Nén dữ liệu Huffman  Tác giả: − Được đề xuất bởi David A. Huffman khi còn là sinh viên. − Công bố năm 1952 trong bài báo "A Method for the Construction of Minimum - Redundancy Codes“ − Sau này Huffman trở thành giảng viên của Đại học California  Mã hóa dữ liệu: Để lưu trữ dữ liệu trong máy tính, ta phải mã hóa chúng. Ví dụ, trong bộ mã ASCII nổi tiếng ra đời năm 1967, người ta dùng 8 bit để mã hóa 1 ký tự, cụ thể như: “A” = 1000001 “B” = 1000010 “C” = 1000011 Vậy, với bộ mã ASCII, chúng ta có thể mã hóa 2 8 = 256 ký tự, với mỗi từ mã dài 8 bit.  Ví dụ: Giả sử có dữ liệu sau: “ma hoa huffman” Xét thấy: Chuỗi có 8 ký tự = 2 3 , nên ta chỉ cần dùng 3 bit cho mỗi ký tự là đủ để mã hóa. Ngoài ra: Ký tự o xuất hiện 1 lần và ký tự a xuất hiện 3 lần đều dùng 3 bit như nhau. Huffman nghĩ ra phương án ký tự nào xuất hiện nhiều lần thì nên dùng số bit ít. Ký tự nào xuất hiện ít thì có thể mã hóa bằng từ mã dài hơn. Tuy nhiên, nếu mã hóa với độ dài thay đổi, thì khi giải mã ta làm thế nào phân biệt được xâu bít nào là mã hóa của ký hiệu nào? Một trong các giải pháp là dùng các dấu phẩy (“,”) để tách từ mã của các kí tự đứng cạnh nhau. Nhưng như thế số các dấu phẩy sẽ chiếm một không gian đáng kể trong bảng mã. Và mã tiền tố là giải pháp phù hợp trong trường hợp này.  Mã tiền tố là gì? − Nếu mã hóa “A”=0, “B”=01, “C”=11 thì bộ từ mã này không là mã tiền tố. Vì từ mã của “A” là tiền tố của từ mã của “B”. − Nếu mã hóa “A”=0, “B”=10, “C”=11 thì bộ mã này là mã tiền tố. Khi đó, để mã hóa xâu “ACB” ta có 01110.  Xây dựng và biểu diễn mã tiền tố − Được xây dựng và biểu diễn bằng cây nhị phân gọi là cây Huffman 3. Xây dựng cây huffman  Ví dụ: Giả sử ta có dữ liệu như sau: “ma huffman” − Tạo 1 cây mới với cây con trái và cây con phải là hai cây từ mảng cây có tần suất nhỏ nhất, tức là 2 cây ở vị trí 0 và 1 − Khóa của cây cha là chuỗi gồm chuỗi cây con trái và cây con phải − Tần suất của cây cha là của 2 cây con trái và phải cộng lại − Sắp xếp lại mảng cây theo tần suất tăng dần, nếu bằng nhau ưu tiên theo kí tự đầu của khóa - Tiếp tục chọn 2 phần tử đầu của mảng cây để tạo cây cha mới − Sắp xếp lại mảng cây − Tiếp tục tạo cây mới từ 2 cây 0 và 1 của mảng cây − Tiếp tục sắp xếp lại − Tiếp tục xây dựng cây mới − Tiếp tục sắp xếp − Tiếp tục xây dựng cây mới − Tiếp tục xây dựng cây mới − Tiếp tục đến khi mảng cây chỉ còn 1 phần tử, ta được cây Huffman hoàn chỉnh. 4. Nén và giải nén Huffman 4.1. Nén tập tin 4.2. Giải nén tập tin: [...]... lọc bỏ và cấm các truy xuất vào các nguồn thông tin hoặc tài liệu không thích hợp cho công việc • Xây dựng các hệ thống phòng chống và phát hiện xâm nhập Các hệ thống quét Virus, antispyware, antispam • Thực hiện các cơ chế mã hoá thông tin, xây dựng hạ tầng PKI • Thường xuyên dò tìm, phát hiện lỗ hổng hệ thống • Thiết lập hệ thống cung cấp bản vá lỗ hổng bảo mật • Xây dựng cơ chế dự phòng và phục... thống (Nguồn VNBA) Dịch vụ: Đánh giá hạ tầng bảo mật Đánh giá hạ tầng bảo mật thông qua: 1 2 DDI Internet Core Switch Phát hiện threat thông minh 3 Phân Tich, Báo cáo Giám sát lưu lượng mạng Phân tích và báo cáo thời gian thực Dịch vụ: Đánh giá hạ tầng bảo mật 1 Phát hiện và phòng chống virus máy tính 2 Đánh giá điểm yếu an ninh mạng 3 Tư vấn hệ thống an toàn thông tin Giải Pháp: Web Gateway Mail Gateway... Gateway giúp doanh nghiệp dễ dàng thiết đặt các chính sách kiểm soát việc tuân thủ CNTT của người dùng và ngăn chặn rò rỉ dữ liệu Viruses Users Mail Gateway Anti-virus Spam mail Anti-spyware Contents filtering Spyware Data loss Giải Pháp: Mã hóa Mail Gateway • Email Encryption Gateway cung cấp giải pháp mã hóa tích hợp với hạ tầng mail sẵn có, giải pháp cung cấp khả năng triển khai và quản trị đơn... Protocols, Applications, Web… Some Common: Network Attacks Attacks over allow Protocols Các rủi ro về bảo mật, An toàn thông tin (Nguồn VNCERT) Khuyến cáo mô hình cần bảo vệ Internet Mạng WAN Đối tác Lớp bảo vệ ngoại vi Trung tâm Dữ liệu Vùng DMZ Ngăn cách với mạng nội bộ Mạng Core Ngăn cách với mạng LAN Mạng LAN Ngăn cách với người dùng cuối End User Giải pháp nào cần thiết cho bạn? (Nguồn VNCERT) Giải pháp... thách thức với CPĐT Số liệu thống kê 2011: • Chỉ có 35% cơ quan, tổ chức đã xây dựng và áp dụng chính sách ATTT • Các Cổng/Trang thông tin điện tử của cơ quan Nhà nước còn tồn tại nhiều lỗ hổng, chưa áp dụng những giải pháp đảm bảo ATTT phù hợp • Những vụ việc mất ATTT, vấn nạn thư rác, mất dữ liệu, tấn công xâm nhập gia tăng ở mức báo động về số lượng, đa dạng về hình thức và ngày càng tinh vi hơn... quả cao nhất cho Chính phủ và người dân Cụ thể, trong quá trình hoạt động của CPĐT và tương tác với người dân, nguy cơ bị rò rỉ dữ liệu rất cao bởi những người không có thẩm quyền, vì văn bản phải đi qua rất nhiều server khác nhau Các hệ thống thông tin, website ngừng hoạt động vì bị tin tặc tấn công, chiếm quyền điều khiển hay dữ liệu bị thay đổi là những nguy cơ mất an toàn thông tin đối với CPĐT... Sunmedia Vai trò bảo mật thông tin trong chính phủ điện tử Giải Pháp bảo mật hạ tầng- Sunmedia Tóm lược Các rủi ro về bảo mật, An toàn thông tin Virus, Worm, Trojan, and other Malwares… HTTP, HTTPS, FTP, Mail Services Normal Mobile Security Viruses HTTP Attacks URL filtering Normal traffice over allow Protocols Spam mails Unnecessary Protocols Data loss Phishing Web threats Spyware DoS and DDoS Attacks... ghi dữ liệu lên thiết bị ngoại vi, ngăn chặn mất dữ liệu quan trọng) Deploy settings Inspects data content and monitors/blocks its being taken out Log collection Copying forbidden USB memory End Point Solution End Point Solution Management server Client Device control function Allowed Unauthorized removable memory Authorized removable memory Log USB memory Giới thiệu sơ lược về Sunmedia Vai trò bảo mật. .. thâm nhập vào hệ thống, ngăn chặn nguy cơ mất dữ liệu Web Gateway tự động bảo vệ chống lại các mối đe dọa web khi người dùng truy cập internet Bằng cách kết hợp với điều khiển ứng dụng, quét phần mềm độc hại, kiểm tra web reputation theo thời gian thực, lọc URL, và phát hiện chống botnet, Web Gateway bảo vệ mạng của doanh nghiệp khỏi các mối đe dọa từ Internet Viruses Web Gateway Spam mail Anti-virus... Spam mail Anti-virus Users Data loss Anti-spyware Anti-phishing Phishing URL filtering Web reputation Spyware URL filtering Giải Pháp: Mail Gataway Mail Gateway lọc chặn Virus, Spam mail, Spyware trước khi chúng có thể thâm nhập vào hệ thống của bạn Mail Gateway được tích hợp khả năng phòng chống thư rác nhiều lớp và chống lừa đảo (anti-phishing) sử dụng bộ lọc mã độc và phần mềm gián điệp Khả năng lọc . class="bi x 11 y60 w4 h15" alt=""

Ngày đăng: 19/10/2014, 21:29

Từ khóa liên quan

Mục lục

  • MỤC LỤC

  • 1. Giới thiệu chung về nén và giải nén

  • 2. Ý tưởng Nén dữ liệu Huffman

  • 3. Xây dựng cây huffman

  • 4. Nén và giải nén Huffman

    • 4.1. Nén tập tin

    • 4.2. Giải nén tập tin:

    • 5. Cài đặt chương trình

Tài liệu cùng người dùng

Tài liệu liên quan