Mã hóa tối ưu nguồn rời rạc không nhớ

28 1K 4
Mã hóa tối ưu nguồn rời rạc không nhớ

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Trang 100 Bài 7 hóa tối ưu nguồn rời rạc không nhớ 7.1 Các định lý về giới hạn trên và dưới của chiều dài trung bình 7.2 hoá theo Shannon và Fano 7.3 Phương pháp hoá tối ưu theo Huffman Trang 101 Các định lý về giới hạn trên và dưới của chiều dài trung bình  Định lý 7.1  Cho nguồn tin X = { a 1 , ., a K } với các xác suất tương ứng p 1 , ., p K . Một bộ phân tách được bất kỳ cho nguồn này với cơ số m , chiều dài trung bình từ sẽ thoả (trong đó H (X) là entropy của nguồn với cơ số của logarit là m ).  Chứng minh ( ) m H l log X ≥ ∑∑∑ = − == =−−=− K i i l i K i ii K i ii p m pmlpppmlXH i 111 lnlnlnln)( 01111 11 =−≤− ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ −≤ ∑∑ = − = − K i l K i i l i i i m p m p Trang 102 Các định lý về giới hạn trên và dưới của chiều dài trung bình (tt)  Chú ý dấu “=” xảy ra khi và chỉ khi , tức là  Định lý 7.2  Cho nguồn tin X = {a 1 , ., a K } với các xác suất tương ứng p 1 , ., p K , có thể xây dựng một prefix với cơ số m sao cho  Chứng minh  Chọn chiều dài l i của từ cho tin a i theo qui tắc  Chúng ta có ( ) 1 log X +< m H l 1= − i l p m i i l i mp − = ⎡⎤ i p mi l log−= 1 11 =≤⇒ ∑∑ == − K i i K i l pm i ⎡⎤ i lp mi p mi pmll iii ≤⇒−≥⇒−= − loglog Trang 103 Chứng minh định lý (tt)  Vì các chiều dài được chọn này thoã bất đẳng thức Kraft nên tồn tại một prefix tương ứng có các chiều dài này.  Tiếp tục chúng ta có  Điều này hoàn tất chứng minh của chúng ta. ⎡⎤ 1loglog +−<⇒−= ii p mi p mi ll ∑∑∑ === +−< K i i K i p mi K i ii pplp i 111 log ( ) 1 log X 1 log log 1 +=+ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ −= ∑ = m H m pp K i ii Trang 104 Hệ quả  Có thể hoá một nguồn có chiều dài trung bình tiếp cận đến với sai số nhỏ tuỳ ý.  Chúng ta thực hiện điều này bằng cách hoá các dãy N tin của nguồn X = {a 1 , ., a K } theo Định lý 7.2.  Lúc này chúng ta có nguồn mới với kích thước là K N , mỗi phần tử là một dãy của N tin được lấy độc lập từ nguồn X.  Entropy của nguồn mới này là NH(X) và chiều dài trung bình các từ của nó theo định nghĩa sẽ là N lần chiều dài trung bình các từ của nguồn ban đầu, .  Áp dụng Định lý 7.1 và Định lý 7.2 đối với nguồn mới chúng ta có ( ) m H log X l Trang 105 Hệ quả (tt)  Áp dụng Định lý 7.1 và Định lý 7.2 đối với nguồn mới ta có  Vì N có thể lớn tuỳ ý, nên tiếp cận đến H(X) / log m với tốc độ tương đương với 1/N tiến đến 0 khi N tiến ra vô cùng.  Để đánh giá một phương pháp hoá nào đólàtốt hay không người ta đưa ra khái niệm hiệu suất lập mã.  Hiệu suất lập  Hiệu suất lập h được định nghĩa bằng tỉ số của entropy của nguồn với chiều dài trung bình của bộ được lập () ( ) 1 log X log X +<≤ m NH lN m NH ( ) ( ) Nm H l m H 1 log X log X +<≤ ⇒ l ( ) l H h X = Trang 106 hóa tối ưu  Là phép hóa kết quả là một bộ có chiều dài trung bình là nhỏ nhất trong tất cả các phép hóa có thể có cho nguồn.  Bộ của phép hóa tối ưu cho nguồn được gọi là bộ tối ưu.  Ba phép hóa: Shannon, Fano, Huffman.  Trong mỗi phép hóa chúng ta sẽ hóa với cơ số m = 2 trước (mã hóa nhị phân), sau đósẽ mở rộng cho trường hợp m > 2. Trang 107 Phương pháp hoá Shannon B1.Sắp xếp các xác suất theo thứ tự giảm dần. Không mất tổng quát giả sử p 1 ≥ . ≥ p K . B2. Định nghĩa q 1 = 0, q i = , ∀ i = 1, 2, ., K. B3. Đổi q i sang cơ số 2, (biểu diễn q i trong cơ số 2) sẽ được một chuỗi nhị phân B4.Từ được gán cho a i là l i kí hiệu lấy từ vị trí sau dấu phẩy của chuỗi nhị phân tương ứng với q i , trong đó l i = ∑ − = 1 1 i j j p ⎥ ⎥ ⎤ ⎢ ⎢ ⎡ − i p 2 log Trang 108 Ví dụ  Hãy hoá nguồn S = {a 1 , a 2 , a 3 , a 4 , a 5 , a 6 } với các xác suất lần lượt là 0,3; 0,25; 0,2; 0,12; 0,08; 0,05.  H = 2.36, = 2,75, h = 2,36/2,75 = 85,82% ∑ − = = 1 1 i j ji qq ⎡ ⎤ ii pl 2 log−= Tin a i Xác suất p i Biểu diễn nhị phân Từ w i a 1 0,3 0 0,00 2 00 a 2 0,25 0,3 0,01001 . 2 01 a 3 0,2 0,55 0,10001 . 3 100 a 4 0,12 0,75 0,11000 . 4 1100 a 5 0,08 0,87 0,11011 . 4 1101 a 6 0,05 0,95 0,111100 . 5 11110 l Trang 109 Nhận xét - Bài tập  Phương pháp Shannon cho kết quả là một prefix.  Phương pháp Shannon có thể mở rộng cho trường hợp m > 2  Bài tập  Hãy hoá các nguồn sau bằng phương pháp Shannon. Tính entropy của nguồn, chiều dài trung bình và hiệu suất của phép hóa.  S 1 = {a 1 , a 2 , a 3 , a 4 , a 5 , a 6 } với các xác suất lần lượt là 0,25; 0,21; 0,19; 0,16; 0,14; 0,05.  S 2 = {a 1 , a 2 , a 3 , a 4 , a 5 , a 6 , a 7 , a 8 } với các xác suất lần lượt là 0,21; 0,18; 0,15; 0,14; 0,12; 0,01; 0,06 ; 0,04.  S 3 = {a 1 , a 2 , a 3 , a 4 , a 5 , a 6 , a 7 , a 8 , a 9 } với các xác suất lần lượt là 0,25; 0,19; 0,15; 0,11; 0,09; 0,07; 0,06; 0,04; 0,04. [...]... nếu tối ưu cho nguồn S là tốt hơn theo qui tắc đã phát biểu thì được dẫn xuất từ tối ưu này bằng cách bỏ đi hai từ wK và wK–1 và thay vào từ bỏ đi bit cuối của wK thì sẽ được một tối ưu tốt hơn cho nguồn S’, điều này mâu thuẫn Vậy nhận được cho S theo qui tắc trên là tối ưu Định lý Định lý 7.3 và 7.4 cho phép qui bài toán tìm tối ưu cho nguồn có K tin về bài toán tìm tối. .. bộ mới so với bộ cũ Δl = pilj + pjli – pili – pjlj = (pj – pi)(li – lj) < 0 Điều này mâu thuẫn với định nghĩa của bộ tối ưu Trang 115 Hai định lý của Huffman Bổ đề này thật sự phát biểu một điều rằng, để hoá tối ưu cho một nguồn tin thì tin có xác suấ càng lớn phải được hoá thành từ có chiều dài càng nhỏ Định lý 7.3 (Định lý số 1 của Huffman) Trong bộ tối ưu (m = 2) cho một nguồn. .. Phương pháp hoá tối ưu Huffman Trước hết xét cơ số m = 2 Trường hợp m > 2, chúng ta sẽ có một sự chú ý về sự khác biệt so với trường hợp m = 2 Bổ đề Cho nguồn S = {a1, , aK} có các xác suất lần lượt là p1, , pK Gọi l1, , lK là chiều dài các từ tương ứng với bộ tối ưu cho S Nếu pi > pj thì li ≤ lj Chứng minh Với pi > pj, giả sử li > lj Xét bộ mới bằng cách hoán đổi hai từ có chiều... tổng quát phương pháp Fano không phải là phương pháp hóa tối ưu Chú ý Trong trường hợp nếu xác suất pK–1 + pK bằng với một xác suất pi nào đó thì chúng ta có thể đặt pK–1 + pK nằm dưới hoặc nằm trên xác suất pi thì kết quả chiều dài từ trung bình vẫn không thay đổi cho dù các từ kết quả có thể khác nhau Trang 122 Mở rộng cho cơ số m > 2 Nếu K ≤ m thì việc hoá tối ưu là quá tầm thường Giả... bit cuối Nếu có một từ wi khác có chiều dài bằng lK đồng thời khác từ wK chỉ ở bit cuối thì chúng ta có thể hoán đổi wK–1 và wi cho nhau, vì vậy định lý cũng được chứng minh Nếu không tồn tại một từ wi như vậy thì chúng ta có thể tạo ra một bộ mới bằng cách bỏ đi bit cuối của từ wK Bộ mới này không vi phạm điều kiện prefix và có chiều dài trung bình nhỏ hơn bộ cũ Vì vậy định lý được... chứng minh Trang 117 Hai định lý của Huffman (tt) Định lý 7.4 (Định lý số 2 của Huffman) Xét một nguồn mới S’ = {a’1, , a’K–1} với sự phân bố xác suất là p’1, , p’K–1 trong đó p’i = pi với 1 ≤ i ≤ K – 2 còn p’K–1 = pK–1 + pK Nếu {w’1, , w’K–1} làm một tối ưu cho S’ thì nhận được theo qui tắc sau là tối ưu cho S 1≤i≤K–2 wi = w’i, wK–1 = w’K–10 wK = w’K–11 Chứng minh Vì lK = lK–1 = 1 + l’K–1, nên... qui tắc trên là tối ưu Định lý Định lý 7.3 và 7.4 cho phép qui bài toán tìm tối ưu cho nguồn có K tin về bài toán tìm tối ưu cho nguồn có K–1 tin Và quá trình này có thể được lặp lại cho đến khi chỉ còn hai tin Lúc đó thì tối ưu là dễ thấy Trang 119 Giải thuật hóa Huffman B1 Sắp xếp các xác suất theo thứ tự giảm dần chẳng hạn p1 ≥ ≥ pK B2 Gán 0 tới bit cuối của wK–1 và 1 đến bit cuối của... 125 Nhận xét Xét nguồn S = {a1, a2, a3, a4} có sự phân bố xác suất là {0,4; 0,25; 0,2; 0,15} Xét nguồn mới S2 = {aiaj, 1 ≤ i, j ≤ 4} có tập phân bố xác suất là {0,16; 0,1; 0,08; 0,06; 0,1; 0,0625; 0,05; 0,0375; 0,08; 0,05; 0,04; 0,03; 0,06; 0,0375; 0,03; 0,0225} H(S) = 1,9 và H(S2) = 2H(S) = 3,8 Hai bảng sau đây trình bày kết quả việc hoá tối ưu cho S và S2 theo Huffman Nhận xét Việc hoá cho một... thì hai từ tương ứng với hai tin có xác suất nhỏ nhất phải có chiều dài bằng nhau (lK–1 = lK) và có thể làm cho chúng chỉ khác nhau duy nhất ở bit cuối (bit tận cùng bên phải) Chứng minh Nếu lK–1 < lK thì loại bỏ bit cuối cùng của từ wK chúng ta được một bộ mới vẫn có tính prefix nhưng có chiều dài trung bình nhỏ hơn bộ cũ Trang 116 Hai định lý của Huffman (tt) Giả sử wK–1 và wK không thoả... 1 1 3 4 wi 00 0 010 1 011 0 100 1 101 0 110 1 0 1110 1 1 1111 Nhận xét - Bài tập Nhận xét Phương pháp Fano thường cho kết quả tốt hơn phương pháp Shannon Bài tập Hãy hoá các nguồn sau bằng phương pháp Fano Tính hiệu suất của phép hóa S1 = {a1, a2, a3, a4, a5, a6} với các xác suất lần lượt là 0,25; 0,21; 0,19; 0,16; 0,14; 0,05 S2 = {a1, a2, a3, a4, a5, a6 , a7, a8} với các xác suất lần lượt là . phép mã hóa tối ưu cho nguồn được gọi là bộ mã tối ưu.  Ba phép mã hóa: Shannon, Fano, Huffman.  Trong mỗi phép mã hóa chúng ta sẽ mã hóa với cơ số mã. 106 Mã hóa tối ưu  Là phép mã hóa mà kết quả là một bộ mã có chiều dài trung bình là nhỏ nhất trong tất cả các phép mã hóa có thể có cho nguồn.  Bộ mã

Ngày đăng: 29/09/2013, 22:20

Hình ảnh liên quan

„ Hai bảng sau đây trình bày kết quả việc mã hoá tối ưu cho S và - Mã hóa tối ưu nguồn rời rạc không nhớ

ai.

bảng sau đây trình bày kết quả việc mã hoá tối ưu cho S và Xem tại trang 27 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan