tài liệu tham khảo đa truyền thông phần 5 pptx

9 308 0
tài liệu tham khảo đa truyền thông phần 5 pptx

Đang tải... (xem toàn văn)

Thông tin tài liệu

MPEG MPEG - - 1 1 – Kiến trúc Băng lọc phân tích ña pha 32 kênh Lượng tử hoá Mã hoá M U X FFT LI: 512 LII: 1024 Phân tích tâm sinh lý âm học Phân phối bit ñộng 32 Dữ liệu Thông tin thêm SMR Lượng tử 32 s(n) kênh Dữ liệu SMR: Tỷ số tín hiệu/ngưỡng che Băng lọc phân tích ña pha 32 kênh MDCT M U X FFT Phân tích tâm sinh lý âm học SMR 32 s(n) kênh Vòng lặp chỉ ñịnh bit Lượng tử hoá Mã hoá Huffman Mã thông tin thêm ↓32 MPEG1 lớp 1,2 MPEG1 lớp 3 Thông tin thêm MPEG MPEG - - 1 1 • Thuật toán cơ bản – Tiến hành chia ngõ vào thành 32 băng con bởi các băng lọc. • Lấy 32 mẫu PCM trong cùng một thời ñiểm, kết quả là 32 hệ số tần số ở ngõ ra. – Trong MPEG-1 lớp I thì tập 32 giá trị PCM ñược kết hợp vào trong khối gồm 12 nhóm 32 mẫu này. – MPEG-1 lớp II và lớp III thì gồm 3 khối 12 nhóm này. – Phân bố bit ñảm bảo rằng mọi nhiễu lượng tử nằm ở dưới các ngưỡng che. – Với mỗi băng con, xác ñịnh mức biên ñộ và mức nhiễu bằng mô hình tâm sinh lý nghe. SMR (signal-mask rate) ñược sử dụng ñể xác ñịnh số bit cho quá trình lượng tử hoá ñối với mỗi băng con với mục ñích giảm thiểu dung lượng. MPEG MPEG - - 1 1 Ví dụ: Sau khi phân tích, mức của 16 băng con ñầu là: Band 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Level (db) 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1 Nếu mức của băng con thứ 8 là 60 thì nó che 12 dB ở băng con thứ 7 và 15 dB ở băng con thứ 9. Băng con 7 có mức 10dB<12dB: loại. Băng con 9 có mức 35dB>15dB: gởi ñi.  Chỉ có các mức lớn hơn mức che là ñược gởi ñi thay vì dùng 6 bits ñể mã hoá, ta chỉ dùng 4 bits. MPEG-Layer I: Bộ lọc DCT 1 khung và tần số bằng phẳng trong mỗi băng con. Mô hình tâm sinh lý nghe sử dụng che tần số. MPEG-Layer II: Có 3 khung trong bộ lọc (trước, hiện tại và kế), tổng là 1125 mẫu. Sử dụng vài bits ñể che thời gian. MPEG-Layer III: Sử dụng bộ lọc tới hạn ñể ñáp ứng tốt hơn. Mô hình tâm sinh lý nghe sử dụng che thời gian, che tần số, tính toán ñộ dư thừa stereo và mã hoá Hufman. MPEG MPEG - - 1 1 • Cấu trúc khung – Header Info: Gồm 12 bits ñồng bộ; 20 bis thông tin hệ thống chỉ thị tốc ñộ bit, tần số lấy mẫu, dạng nhấn…; 16 bits CRC với ña thức sinh x 16 +x 15 +x 2 +1. – Side Info: Gồm phân bố bit: lớp 1 với 4 bits tuyến tính cho các băng con, lớp II 4 bits cho các băng con tần thấp, 3 bit tần trung và 2 bits tần cao; hệ số tỷ lệ là 6 bits/băng con kết hợp với phân bố bits và các bits mã hóa cho băng con ñó ñể xác ñịnh giá trị, lớp III mã hóa âm thanh nổi. – Subband Samples: 32x12 mẫu ñối với lớp I và 32x36 mẫu ñối với lớp II và lớp III. – Aux Data: Dữ liệu bổ sung Header Info Side Info Subband Samples Aux Data MPEG MPEG - - 2 2 • Mở rộng MPEG-1 cho các ứng dụng mới. • Có khả năng áp dụng nhiều tốc ñộ khác nhau, từ 32 ñến 1066kbps. Tần số lấy mẫu có thể giảm 1 nửa so với MPEG-1 (16; 22,05; 24kHz). • Khả năng ña kênh, tốc ñộ bits mở rộng có thể lên ñến 1 Mbps cho các ứng dụng tốc ñộ cao. Cho phép nén ñồng thời nhiều kênh. • Chất lượng âm thanh tuỳ thuộc ứng dụng. • Hỗ trợ khả năng lồng tiếng, bình luận nhiều ngôn ngữ trong phần bits mở rộng. • MPEG-2 sử dụng mã hoá cường ñộ cao, giảm xuyên âm, mã hoá dự ñoán liên kênh và mã hoá ảo ảnh kênh trung tâm ñể nhận ñược tốc ñộ bit kết hợp 384 kbps. • Khung MPEG-2 ñược chia thành 2 phần, phần ñầu là MPEG-1stereo, phần mở rộng MPEG-2 chứa tất cả những dữ liệu surround khác. MPEG MPEG - - 2 2 Mono-stereo MPEG-1 32;44.1;48kHz MPEG-2 Layer I Layer II Layer III Mono-stereo MPEG-2 16;22,05;24kHz Layer I Layer II Layer III 5 channels MPEG-2 multi channel 32;44.1;48kHz Layer I Layer II Layer III MPEG MPEG - - 2 2 • Mã hoá và giải mã MPEG-2 Matrix MPEG-1 encoder MPEG-2 Extension encoder L C R LS RS L0 R0 T3 T4 T5 + MPEG-1 decoder MPEG-2 Extension decoder L0 ’ R0 ’ T3 ’ T4 ’ T5 ’ Inverse Matrix L ’ C ’ R ’ LS ’ RS ’ channel MPEG MPEG - - 2 2 Trong ñó: Với R: phải, L: trái, C: trung tâm, LS:trái vòm và RS: phải vòm. Từ ñó dễ dàng trong mã hóa thuận nghịch Cấu trúc khung    ===== + = ++= ++= 0;1 2 1 ; 21 1 , )(0 )(0 δβαδβα δβα δβα or RSCRR LSCLL MPEG1 header MPEG-1 Data MPEG-1 Auxillary Data MPEG2 header MPEG2 Data Khung MPEG-1/2 AC AC - - 3 (DOLBY DIGITAL) 3 (DOLBY DIGITAL) • Chuyển tải âm thanh ña kênh trong các ứng dụng như DVD-Video, DTV và DBS. • Phát triển từ AC-1 và AC-2. • Mã hoá âm thanh từ 1 ñến 6 kênh, thông thường cung cấp âm thanh 5.1 kênh: trái, phải, trung tâm, trái vòm, phải vòm và 1 kênh hiệu ứng tần số thấp. • 6 kênh yêu cầu 6x48kHzx18bits=5.184Mbps chưa nén có thể ñược mã hoá tối thiểu với tốc ñộ 384kbps (tỷ lệ 13:1). • Tuy nhiên, AC-3 hỗ trợ tốc ñộ từ 32 ñến 640kbps. • Cung cấp khả năng tự chọn mức âm thanh cho thính giả. • Cho phép giảm dữ liệu bằng quá trình lượng tử biểu diễn trong miền tần số của tín hiệu âm thanh. • Bộ mã hoá sử dụng băng lọc phân tích chuyển các mẫu PCM thành các hệ số trong miền tần số. Mỗi hệ số biểu diễn ký hiệu mũ nhị phân gồm phần số mũ và phần ñịnh trị. Các tập số mũ ñược mã hoá thô qua phổ tín hiệu và xem như là ñường bao phổ. Sử dụng phân phối bít xác ñịnh số bits cần mã hoá mỗi ñịnh trị dựa vào ñường bao phổ. ðường bao phổ và các ñịnh trị ñược lượng tử cho 6 khối âm thanh (1536 mẫu âm thanh) ñược ñịnh dạng thành khung rồi chuyển ñi. AC AC - - 3 (DOLBY DIGITAL) 3 (DOLBY DIGITAL) Quá trình giải mã hoàn toàn ngược lại, ở ñây chỉ xét quá trình mã hoá Băng lọc phân tích Mã hoá ñường bao Chỉ ñịnh bit Lượng tử hoá phần ñịnh trị ðịnh dạng khung AC-3 Thông tin chỉ ñịnh bit Phần ñịnh trị Số mũ ðường bao phổ ñược mã hoá Phần ñịnh trị ñược lượng tử hoá Các mẫu PCM Dòng bit AC-3 APT APT - - X100 X100 • APT-X100 cho tỷ lệ nén 4:1. • Sử dụng ñể truyền dẫn, lưu trữ các tín hiệu audio mono, stereo hay ña kênh chất lượng cao. • Không hẳn dựa vào mô hình tâm sinh lý nghe, cũng không trực tiếp loại các thành phần không thích hợp trong tín hiệu audio, mà nó ngầm hiểu một mô hình ñáp ứng nghe bằng việc phân phối ít bit ở tần số cao. • Thuật toán hoàn toàn trong miền thời gian sử dụng mã hoá dự ñoán tuyến tính trong các băng con. • Hoạt ñộng với bất kỳ tần số lấy mẫu với ngõ ra 16 bits/từ mẫu. • Tín hiệu audio ñược chia thành 4 băng con với băng thông ñều nhau sử dụng các bộ lọc QMF. • Tín hiệu ñược phân tích trong miền thời gian: sử dụng mã hoá dự ñoán tuyến tính ADPCM ñể lượng tử mỗi băng theo nội dung và loại bỏ ñộ dư thừa trong các băng con. • Mã hoá sự khác biệt của mẫu hiện thời và mẫu trước. • Giải mã ñược tiến hành một cách ngược lại. MÃ H MÃ H Ó Ó A ÂM THANH N A ÂM THANH N Ổ Ổ I I • Âm thanh ña kênh L R C C L R L R S S C L R LS RS C L R LS RS LFE S: Surround. LFE : Low Frequency Enhancement (Woofer) 15 – 120Hz Có thể ñặt bất kỳ. 2/0 Stereo 3/0 3/1 3/2 3/2 với siêu trầm (5.1) MÃ HO MÃ HO Á Á ÂM THANH N ÂM THANH N Ổ Ổ I I • Mã hóa Trái phải (LR) Không loại bỏ ñộ dư thừa. Các kênh riêng biệt ñược mã hoá ñộc lập. Ngưỡng che không liên quan. Hiệu quả với âm thanh rất khác biệt giữa kênh trái và kênh phải . N 1 N2 L≈R R≈L + + L’ R’ Nguồn MÃ HO MÃ HO Á Á ÂM THANH N ÂM THANH N Ổ Ổ I I • Joint Stereo Midle-Side Khuynh hướng của Joint Stereo không chỉ là kết hợp các ñịnh dạng của chuẩn nén mp3 (MPEG1 lớp III) mà còn kết hợp các dạng khác: MPEG và AAC. Middle-Side Stereo xét hai kênh dữ liệu theo hai phương diện khác nhau. Thay vì lưu trữ một dữ liệu âm thanh theo hai kênh Left và Right, ta có thể chỉ cần lưu trữ một chuỗi tương tự số trung bình Average (của Left và Right) và sự sai biệt Difference (giữa Left và Right). Ở dạng Middle-Side, ta có thể lưu trữ các giá trị Middle và Side như sau: Middle=(L+R)/2, Side=(L-R)/2. Dấu của Side là rất quan trọng, nếu Side >0 nghĩa là tín hiệu L lớn hơn tín hiệu R. Ta hoàn toàn có thể tái tạo hai kênh L, R như sau: L=Middle+Side, R=Middle-Side. Ưu ñiểm là sự khác biệt tương ñối của các tín hiệu audio của các kênh L và R. Kết quả là kênh Middle lớn hơn nhiều so với kênh Side. Việc mã hoá kênh Side sử dụng ít bít hơn ñể giải phóng tài nguyên mà có thể ñược sử dụng ñể triển khai hữu hiệu hơn trên kênh Middle. Khi tái ñịnh dạng lại L, R thì kết quả sẽ thể hiện tín hiệu gốc ngõ vào thực hơn. MÃ HO MÃ HO Á Á ÂM THANH N ÂM THANH N Ổ Ổ I I – Tính chất Kênh side sử dụng số bit rất ít. Loại bỏ ñộ dư thừa cho tín hiệu mono trong thực tế. Có thể ñược áp dụng trong miền thời gian lẫn tần số. ðộ lợi mã hoá cao phụ thuộc tín hiệu. – Biến ñổi ngược: tổng/hiệu chuẩn hoá. MÃ HO MÃ HO Á Á ÂM THANH N ÂM THANH N Ổ Ổ I I • Stereo ghép cường ñộ cao (Intensity Stereo): Mục ñích: Tối thiểu hoá thông tin stereo ñể nhận ñược tốc ñộ bit thấp nhất nếu có thể. • Mã hoá tín hiệu tổng các kênh + các hướng của các kênh. Truyền ñường bao, sau ñó tỷ lệ theo các kênh. • Kiểm chứng dựa trên việc cảm nhận của con người kém ñối với tần số trên 3kHz. • Không liên quan ñến kỹ thuật suy giảm. • Biên ñộ và pha là không quan trọng. • Giảm gần 50% dữ liệu. • Không ñảm bảo thông tin về pha của tín hiệu. • Một vài sự méo có thể nhận biết ñược. • Sử dụng trong các ứng dụng tốc ñộ bit thấp. MÃ HO MÃ HO Á Á ÂM THANH N ÂM THANH N Ổ Ổ I I Chỉnh pha Chỉnh pha Σ ðo biên ñộ ðo biên ñộ ÷ ÷ ðo biên ñộ ðo biên ñộ Hướng kênh L Hướng kênh R L+R L R X X L+R Hướng kênh L Hướng kênh R L R . là: Band 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Level (db) 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1 Nếu mức của băng con thứ 8 là 60 thì nó che 12 dB ở băng con thứ 7 và 15 dB ở băng con thứ. kênh Lượng tử hoá Mã hoá M U X FFT LI: 51 2 LII: 1024 Phân tích tâm sinh lý âm học Phân phối bit ñộng 32 Dữ liệu Thông tin thêm SMR Lượng tử 32 s(n) kênh Dữ liệu SMR: Tỷ số tín hiệu/ngưỡng che Băng. tốc ñộ bit kết hợp 384 kbps. • Khung MPEG-2 ñược chia thành 2 phần, phần ñầu là MPEG-1stereo, phần mở rộng MPEG-2 chứa tất cả những dữ liệu surround khác. MPEG MPEG - - 2 2 Mono-stereo MPEG-1 32;44.1;48kHz MPEG-2 Layer

Ngày đăng: 22/07/2014, 17:20

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan