Nén âm thanh tiếng nói dải rộng (audio hifi)

28 933 2
Nén âm thanh tiếng nói dải rộng (audio hifi)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG BÁO CÁO XỬ LÝ DỮ LIỆU ĐA PHƯƠNG TIỆN Đề tài 16: Nén âm tiếng nói dải rộng (audio HiFi) Giảng viên hướng dẫn: PGS.TS Nguyễn Thị Hoàng Lan Sinh viên thực hiện: Nguyễn Thành Trung MSSV: 20112384 Trần Anh Tuấn MSSV: 20112451 Trần Xuân Sơn MSSV: 20112090 Hà Nội 05/2015 MỤC LỤC Nhóm 16 Page LỜI NÓI ĐẦU Trong học phần Xử Lí Dữ Liệu Đa Phương Tiện chúng em học liệu đa phương tiện phương pháp xử lí liệu dùng nén, giải nén liệu đa phương tiện Dữ liệu đa phương tiện bao gồm văn bản, hình ảnh, đối tượng đồ họa (bao gồm vẽ, phác thảo hình minh họa) chuỗi hình ảnh động, âm video Trong nén âm audio công nghệ vô quan trọng Tại ta phải nén audio? Những file audio gốc với dung lượng lớn khó truyền tải, lưu trữ nén Tùy theo nhu cầu kĩ thuật thực hiện, phát minh nhiều chuẩn nén audio khác nhau, phù hợp với nhiều mục đích sử dụng Trong báo cáo chúng em trình bày nén âm dải rộng (audio Hifi) Chúng em xin cảm ơn cô Nguyễn Thị Hoàng Lan giúp chúng em hoàn thành báo cáo Nhóm 16 Page Đặc điểm âm tiếng nói dải rộng  Âm có chất tín hiệu, dựa dải tần tín tín hiệu người ta chia thành loại sau: • Âm dải tần sở (âm tiếng nói thoại) với dải tần số từ 300Hz đến 4KHz • Âm tiếng nói dải rộng (tiếng nói trình diễn, hát, âm nhạc …) với dải tần số từ 100Hz đến 20KHz  Âm tiếng nói dải rộng công nghệ âm sử dụng phổ biến điện thoại Nó mở rộng phạm vi tần số tín hiệu âm truyền qua đường dây điện thoại cho chất lượng cao Phạm vi tiếng nói người kéo dài từ 80Hz đến 14 kHz, gọi điện thoại truyền thống, voiceband hẹp giới hạn tần só âm khoảng 300Hz đến 3,4 kHz Âm tiếng nói dải rộng giới hạn bang thông truyền thông phạm vi tần số âm từ 50 Hz đến kHz cao  Một số lợi ích âm tiếng nói dải rộng so với truyền thống (hẹp): • Chất lượng âm tổng thể rõ ràng • Dễ dàng để nhận tiếng nói, phân biệt âm khó hiểu hiểu từ có dấu • Dễ dàng giải mã từ có âm gần “s” “f” từ khác, thường phân biệt qua đường dây điện thoại • Sự nhận diện tốt tạp âm, chẳng hạn người ta nói sử dụng loa  Âm tiếng nói dải rộng đưa giải pháp nhằm cải thiện chất lượng độ tự nhiên âm cách mở rộng dải phổ so với tiếng nói thoại bình thường Việc mở rộng tần số âm áp dụng nhiều mạng điện thoại âm nhạc, mạng điện thoại từ dải tần để cải thiện chất lượng người ta mở rộng lên dải tần 200-700Hz, âm nhạc nên tới 20kHz  Cụ thể với phát triển công nghệ âm tiếng nói dải rộng giúp cải tạo chất lượng tiếng nói, độ tự nhiên âm Nhóm 16 Page có tần số 3400Hz Mở nhiều công nghệ âm tiếng tnói dải rộng  Ta so sánh số đặc điểm âm tiếng nói dải rộng âm tiếng nói thoại sau: Tiếng nói thoại Giới hạn dải phổ tín hiệu Tần số lấy mẫu trị Tốc độ cần thiết Nhóm 16 chuẩn xấp xỉ 4KHz 20KHz fs=8KHz, Ts= 125µs Lượng tử hóa giá Các GSM Tiếng nói dải rộng nén fs=44.1KHz, fs chuyên dụng = 48KHz mã hóa bit mã hóa 16 bits, 20 bits 8bits x 8KHz= 64Kbit/s 176Kbyte/s 15,2Kbit/s, 32Kbit/s ADPCM: MPEG-1, MPEG-2, MPEG3… Page Mô hình cảm nhận âm Trong truyền thông đa phương tiện,một tảng việc xử lí âm hiểu biết trình cảm thụ âm người Tất phương pháp nén âm với tỉ lệ cao phát triển nguyên tắc tín hiệu âm mà nhà thẩm âm chuyên nghiệp nhận loại bỏ Nhiều yếu tố cảm âm học ngưỡng nghe che tích hợp vào trình thiết kế phương pháp nén.Sau ta phân tích vài yếu tố cảm âm học thường sử dụng mã hóa âm 2.1 Ngưỡng nghe tối thiểu Đơn vị thể độ lớn âm theo người cảm nhận thấy gọi độ ồn Giá trị phụ thuộc nhiều vào cảm giác người cường độ âm việc đo lường không dễ dàng Ví dụ thường gặp sống hàng ngày nghe nhạc, tùy thuộc vào cách thay đổi giá trị equalization mà cân tính hiệu tần số cao thấp thay đổi theo, khiến ta cảm thấy độ ồn âm tăng lên hay giảm Có nhiều yếu tố độ ồn mà ta cần ý đến khi xây dựng mã hóa âm thanh.Một yếu tố ngưỡng nghe tối thiểu cách mà ngưỡng nghe biến đổi tần số thay đổi.Một yếu tố khác cách mà chế cảm nhận âm người phát thay đổi độ ồn mà thông số khác phổ chu kì không đổi Mức độ sức ép âm (SPL): L = 20log db (SPL) (2.1) p: sức ép mà nguồn âm tạo p0: số = 20microPa, tương đương ngưỡng sức ép tối thiểu mà tín hiệu có tần số kHz cần đạt để người nghe thấy Ta định nghĩa SPL thông qua cường độ âm Ta viết cường độ tức thời âm sau: I(t) = p(t)u(t) (2.2) p(t): sức ép tức thời âm u(t): tốc độ truyền Nhóm 16 Page Đối với song bình thường, tốc độ truyền sức ép có liên hệ với qua công thức: (2.3) ρ khối lượng riêng môi trường truyền (không khí có ρ = 1,29kg/m3) c: tốc độ âm không khí Từ công thức (2.2) (2.3), ta viết hàm phụ thuộc vào cường độ tần số sau: (2.4) Từ công thức (2.4) ta tính cường độ tương ứng với áp suất 20 microPa: (2.5) Giá trị thường làm tròn 10 -12 W/m2 Và lúc mức độ sức ép âm nguồn âm với cường độ I tính sau: (2.6) Độ lớn âm mà người cảm nhận H cường độ âm I liên hệ với theo công thức: (2.7) Nhóm 16 Page Công thức áp dụng SPL biến thiên khoảng 40dB 120dB, mức âm thấp có vài sai khác nhỏ Tính chất quan trọng độ ồn phụ thuộc độ ồn vào tần số.Để trì độ ồn tần số âm thay đổi ta phải sử dụng cường độ âm khác nhau.Để trì độ ồn tín hieuejt ần số thấp với tín hiệu khác có tần số cao tín hiệu tần số thấp cần có cường độ lớn nhiều Mức cường độ tương ứng mà tần số cần có để độ ồn giá trị cho trước gọi mức độ ồn cân Tất mức độ ồn cân cường độ tuyệt đối khác nhauhợp thành đường độ ồn cân (hình 2.1) Mỗi đường cong tương ứng với SPL tần số tương ứng cần đạt để độ ồn với độ ồn tín hiệucó tần số 1kHz Ví dụ, mức 20 phon (1 phon đơn vị cường độ 1dB tần số 1kHz) ta thấy tín hiệu với tần số 50Hz cần phải có cường độ lớn 30dB so với tín hiệu 1kHz để tạo độ ồn Đường cong thấp hình gọi trường nghe tối thiểu tương ứng với ngưỡng nghe trung bình người Hình 2.1 Đường cong cho thấy mức sức ép âm cần thiết tần số để tạo độ ồn tương đương với tín hiệu 1kHz Từ hình ta thấy âm có cường độ cao  ảnh hưởng tần số lên độ ồn giảm, thể lên cao đường cong gần với đường thằng Nhóm 16 Page 2.2 Hiện tượng che Một tính chất khác hệ thính giác người mà phương pháp mã hóa âm hay lợi dụng che Đây tượng số âm tồn không gian (vẫn nằm dải tần mà người cảm nhận được) ta nghe thấy số lý định (biên độ nhỏ bị âm khác lấn át mất) Hình 2.2:Che khiến ngưỡng nghe bị nâng lên cao so với bình thường Vì tất tín hiệu ngưỡng che loại bỏ trình mã hóa Những thử nghiệm có hệ thống nhằm nghiên cứu ảnh hưởng tượng che vai trò thông số phổ, mức độ chu kì tín hiệu che thực Fletcher Trong thí nghiệm tín hiệu che phát sinh giữ mức cố định tín hiệu âm khác đượng tằng dần cường độ từ ngưỡng nghe bình thường cảm nhận quan thính giác người bị che phủ che Sự chênh lệch cường độ ban đầu cường độ cần thiết để vượt qua ảnh hưởng che gọi mức thay đổi ngưỡng (threshold shift) Thử nghiệm Fletcher chứng minh nhận xét Mayer âm với tần số cao dễ bị che âm với tần số thấp Điều nghĩa ta mã hóa tín hiệu âm thanhlà hợp nhiều nguồn với tần số khác tượng che khiến ta có cảm giác tín hiệu tần số thấp tăng mức cường độ (do tín hiệu tần số cao dễ bị che phủ gây cho người nghe cảm giác có cường độ thấp hơn) Một điều thú vị tín hiệu che tiếp nhận tai tín hiệu bị che tiếp nhận độc Nhóm 16 Page lập tai lại ta không cảm thấy cường độ âm tần số thấp tăng lên 2.2.1 Hiện tượng che theo tần số (Frequency masking) Hiện tượng che âm phức tạp hợp nhiều âm đơn lẻ không hợp kết âm đơn lẻ mà kết tổng chênh lệch âm Phổ tín hiệu che đóng vai trò quan trọng trình che, tín hiệu đơn (tức phổ bao gồm đường) đóng vai trò tín hiệu che.Các tín hiệu tần số thấp che phủ tín hiệu tần số cao tín hiệu tần số cao không thích hợp để đóng vai trò tín hiệu che cho tín hiệu tần số thấp Những nghiên cứu sau xác nhận kết luận đồng thời thêm cường độ tín hiệu che tăng lên, tác dụng che phủ tăng phía tín hiệu có tần số cao mà không tăng phía tín hiệu có tần số thấp, tín hiệu che tần số thấp có khoảng che phủ cao nhiều so với tín hiệu có tần số cao Điều cho thấy tín hiệu che tần số thấp ảnh hưởng lên vùng tần số rộng nhiều so với khả tín hiệu che có tần số cao Hình 2.3 Với tín hiệu che băng thông rộng, có phần lượng vùng găng có tác dụng làm xuất hiện tượng che Cơ quan thính giác người có khả hoạt động thiết bị phân tích phổ phân tách tần số tin hiệu âm sử dụng ngưỡng lọc gọi lọc nghe Độ rộng lọc thay đổi tùy thuộc vào tần số âm đến Trong công trình mình, Fletcher ngưỡng che phủ giai điệu tỉ lệ thuận với băng thông nhiếu che, nhiên tín hiệu che đạt đến độ rộng định tác dụng che phủ không tăng thêm Điều cho phép đặt giả thuyết lọc nghe có vùng găng xác định.Fletcher định nghĩa vùng găng tỉ lệ cường độ tín hiệu cường độ nhiễu, thể độ chênh lệch tính dB tín hiệu âm tín hiệu che (hình 2.3) 2.2.2 Nhóm 16 Hiện tượng che miền thời gian Page 10 để đảm bảo trình nhận dạng liệu thực cách dễ dàng, thông tin bổ sung tần số lấy mẫu hay tần số bit… Ở bước cần thiết ta bổ sung thêm thông tin phát sửa lỗi Ví dụ: Giả sử ta có tín hiệu mà 16 dải tần số có cường độ bảng dưosi đây: Với cường độ 60dB, tín hiệu dải tần thứ gây tượng che làm ngưỡng nghe dải chở thành 12dB ngưỡng nghe dải trở thành 15dB Vì cường độ tín hiệu dải 10dB nên ta không cần mã hóa dải mà bỏ qua Vì cường độ dải 35dB nên ta cần phải mã hóa dải  Khối Time/Frequency Mapping: Khối có đầu vào tín hiệu gốc.Được sử dụng để chia tín hiệu đầu vào thành subband Khối thường băng lọc với nhiều lọc với đáp ứng tần số khác  Khối Psychoacoustic Model: Khối có đầu vào tín hiệu gốc tín hiệu sau chia thành subbands Khối sử dụng để tính toán hiệu ứng che tín hiệu đưa vào dựa vào mô hình cảm thụ âm người Từ tính masking level cho bang tần đưa tới khối lượng tử hóa để tiến hành lượng tử hóa  Khối lượng tử hóa mã hóa (Quantizer and Coding): Khối có đầu vào subband chia sau tín hiệu gốc qua băng lọc hiệu ứng che tính toán từ khối Psychoacoustic Model Nhiệm vụ khối tiến hành lượng tử hóa tín hiệu subbands cách phù hợp cho số bit sử dụng cho subband (tất nhiên cần đảm bảo chất lượng tín hiệu) sau mã hóa tín hiệu subband với phương pháp mã hóa huffman, mã hóa đại số … Ta có sai số lượng tử với trường hợp lượng tử bước lượng tử Q gần xấp xỉ với phân bố khoảng ( với phương sai (Đây nhiễu gây lượng tử) Nhóm 16 Page 14 Giả sử tín hiệu gốc có phân phối khoảng B Với R bits/mẫu ta có mức lượng tử sử dụng Mối liên hệ bước lượng tử Q R : Nhiễu lượng tử hóa giảm dB với việc ta sử dụng thêm bit cho việc lượng tử : Như ta biết subband có ngưỡng che riêng (masking threshold – masking level) Khối lượng tử hóa làm nhiệm vụ lượng tử tín hiệu subband với đủ số bit để trì khoảng cách nhiễu lượng tử ngưỡng che subband (Giữ cho nhiễu lượng tử nhỏ ngưỡng che subband để thành phần nhiễu nghe thấy tai người) Như ta giảm số bit cần để lượng tử hóa mẫu tín hiệu subband tùy thuộc vào ngưỡng che subband tương ứng nhờ ta tăng hiệu nén liệu (Việc giảm bit làm tăng nhiễu lượng tử lên dB ta cần giữ cho giá trị nhiễu nhỏ ngưỡng che) Bên cạnh đó, ta thấy giới hạn mã hóa tín hiệu âm nhiễu lượng tử hóa vượt ngưỡng che trở thành phần tín hiệu âm mà tai nghe Ta phải cố gắng giảm số bit sử dụng để lượng tử hóa giá trị mẫu cho giá trị nhiễu lượng tử xấp xỉ với giá trị ngưỡng che phải nhỏ giá trị ngưỡng che Sau tiến hành lượng tử hóa với số bit tương ứng cho subband ta tiến hành encode cho subband phương pháp mã hóa nêu  Khối Frame Packing Dữ liệu sau ta lượng tử mã hóa đưa vào khối để đóng gói thành frame chuyển hệ thống mạng Nhóm 16 Page 15 Nhóm 16 Page 16 Phân tích kỹ thuật SBC phương pháp nén audio theo chuẩn MP3 Kỹ thuật SBC 4.1 Nguyên lý phương pháp mã hóa dải tần con: - Tín hiệu nguồn phân tách thành tín hiệu dải tần kỹ thuật lọc số - Tín hiệu dải tần mã hóa riêng • Mã hóa dải tần sử dụng lọc số để phân tách tín hiệu nguồn thành tín hiệu dải băng tần khác Mã hóa riêng dải tần cho phép đạt hiệu nén tốt • 4.2 Phân tích kỹ thuật SBC phương pháp nén audio theo chuẩn MP3 Phân tích khối Analysis Filterbank, Scaler and Quantizer, Huffman Coding sơ đồ nén audio theo chuẩn MP3 Hình 4.2: Sơ đồ nén audio theo chuẩn MP3 Nhóm 16 Page 17 4.2.1 Chia tín hiệu nguồn thành tín hiệu dải tần ⇒ Hình 4.2.1: Sơ đồ mô phỏngbăng lọc sử dụng khối Analysis Filterbanks Phương pháp nén audio theo chuẩn MP3 thực việc chia tín hiệu nguồn thành tín hiệu dải tần khác cách sử dụng băng lọc song song cách chứa 32 lọc phân tích (Khối Analysis Filterbanks) Tín hiệu nguồn là: tín hiệu audio PCM, chuỗi 1152 mẫu PCM lọc băng lọc song song cách chứa 32subband, subband lại chứa 36 mẫu subband Trong nén MP3 sau tín hiệu nguồn chia thành tín hiệu dải tần khác băng lọc ánh xạ vào MDCT, trước trình biến đổitrong MDCT xảy subband áp dụng loại cửa sổ, cửa sổ dài hay ngắn áp dụng tùy thuộc vào subband định chọn cửa sổ đc áp dụng phụ thuộc vào khối Masking Thresholds Với subband đc áp dụng cửa sổ dài sau qua MDCT sản sinh 18 dòng tần số Và subband đc áp dụng cửa sổ ngắn sinh thêm nhóm tần số Do có chồng cửa sổ lên 50% nên kích thước cửa sổ 36 mẫu cho khối dài 12 mẫu cho khối ngắn Như tạo 576 dòng tần số sau qua khối MDCT Cửa sổ dài đc áp dụng nhằm tăng cường độ phân giải phổ đưa MDCT Cửa sổ ngắn: chứa cửa sổ ngắn gối lên có tác dụng tăng cường độ phân giải thời gian đưa MDCT Nhóm 16 Page 18 4.2.2 Mã hóa tín hiệu dải tần Lượng tử hóa: Lượng tử hóa thực khối Scaler and Quantizer Khối lượng tử hóa áp dụng cho 576 giá trị phổ lúc, thực vòng lặp: • Vòng lặp kiểm soát tốc độ (vòng trong) • Vòng lặp kiểm soát nhiễu lượng tử (vòng ngoài) Số bit dùng để lượng tử hóa định khối Masking Thresholds Vòng lặp kiểm soát tốc độ Vòng lặp tốc độ thực lấy mẫu miền tần số định độ lớn bước lượng tử hóa Ngoài việc chia giá trị lớn thành vùng, định chọn bảng Huffman cho vùng việc tính toán biên vùng diễn • Ta bắt đầu với mẫu lượng tử hóa với bước lượng tử hóa tăng dần giá trị lượng tử hóa mã hóa sử dụng giá trị bảng mã Huffman Một bước lượng tử hóa lớn dẫn theo giá trị lượng tử hóa nhỏ Sau bit tổng mã Huffman tính toán so sánh với bit có Nếu bit tổng vượt số bit có, bước lượng tử hóa tăng lên thủ tục lại lặp lại đủ bit có • Sự phi tuyến đạt cách lũy thừa mẫu lên ¾ • Vòng lặp kiểm soát sai khác Vòng lặp kiểm soát nhiễu lượng tử tạo trình lượng tử hóa dòng miền tần số vòng lặp kiểm soát tốc độ Mục đích để giữ nhiễu lượng tử ngưỡng che (cho phép tiếng ồn mô hình âm tri giác tạo ra) • Để định hình nhiễu lượng tử, nhân tố tỉ lệ (mặc định 1.0) dùng vào dòng tần số băng Các nhân tố tỉ lệ băng bước lượng tử hóa sau lưu lại trước vòng lặp kiểm soát tốc độ gọi Sau vòng lặp kiểm soát tốc độ (bên trong), nhiễu lượng tử hóa tính toán Điều lặp lại băng có tiếng ồn lớn ngưỡng cho phép Các giá trị nhân tố tỉ lệ băng ồn tăng cho vòng lặp lặp lại Cuối tai người không nghe tiếng ồn trình lượng tử hóa tạo vòng lặp kết thúc • Nhóm 16 Page 19 • Vẫn có trường hợp hai vòng lặp tính toán vô hạn Để tránh trường hợp này, kiểm tra vài điều kiện vòng lặp kiểm soát sai khác để dừng trình lặp lại sớm Đầu vào vòng lặp: • Vector độ lớn 576 giá trị phổ • Sự sai khác cho phép băng • Số lượng băng • Các bit có mã Huffman mã nhân tố tỉ lệ • Số bit trung bình Đầu vòng lặp: • Vector 576 giá trị lượng tử hóa • Nhân tố tỉ lệ • Độ lớn thông tin bước lượng tử hóa • Số bit không sử dụng • Cờ nhấn mạnh trước vòng lặp • Mã Huffman liên quan tới thông tin bên lề o big_values (số cặp mã giá trị Huffman, trừ “count1”) o count1table_select (bảng mã Huffman giá trị 24,60 > 21,34) Qua ta thấy Cùng tần số lấy mẫu, tốc độ bit cao cho chất lượng tốt tỉ lệ nén thấp • Cùng tốc độ bit, tần số lấy mẫu cao cho chất lượng tốt • Nhóm 16 Page 26 KẾT LUẬN Qua tập lớn giúp chúng em hiều thêm nén âm dải rộng Do thời gian thực tập lớn nhiều nên chắn báo cáo có số thiếu sót, chúng em bổ sung tiếp tục nghiên cứu tiếp có hội Một lần chúng em chân thành cảm ơn cô Nguyễn Thị Hoàng Lan góp ý giúp đỡ cô trình làm báo cáo Nhóm 16 Page 27 TÀI LIỆU THAM KHẢO Audio coding – Yao Wang, Polytechnic University, Brooklyn, NY11201 Subband Coding – 2005 http://wiki.hydrogenaud.io/ - MPEG-1 Audio Layer Xử lý âm thanh, hình ảnh – PTIT Tập giảng Xử Lí Dữ Liệu Đa Phương Tiện cô Nguyễn Thị Hoàng Lan Nhóm 16 Page 28 [...]... lớn hơn rất nhiều so với các tín hiệu ở tần số thấp 3 Nén âm thanh kết hợp mô hình cảm thụ âm thanh Nén âm thanh tiếng nói kết hợp với mô hình cảm nhận âm thanh là phương pháp giảm lượng dữ liệu cần thiết khi số hóa các tín hiệu âm thanh Điểm khác biệt giữa phương pháp này và các phương pháp nén thông thường khác đó là mặc Nhóm 16 Page 12 dù những âm thanh bị cắt bỏ có thể dễ dàng bị nhận ra nếu ta phát... phương pháp nén khác ví dụ như ADPCM là ở chỗ nó có thể lợi dụng được những Skhiếm khuyết trong cơ chế cảm nhận âm thanh của con người nhằm làm tăng tí số nén Cơ sở chính của phương pháp nén này đó là một số tín hiệu âm thanh có khả năng gây kích thích mạnh lên não bộ và khiến não bộ bỏ qua không xử lí những tín hiệu âm thanh nhất định khác .Nói cách khác, một âm thanh có thể che lấp những âm thanh khác,... 128kbps • Nén cùng tốc độ bit 128kbps, tần số lấy mẫu khác nhau là 32kHz và 44,1kHz • Dữ liệu âm thanh trong tập tin WAV là dạng dữ liệu âm thanh không nén Định dạng WAV có ưu điểm là cấu trúc đơn giản , chất lượng âm thanh được bảo toàn, nhưng nhược điểm là dung lượng file khá lớn Nếu được lấy mẫu với tần số 44.1 kHz (44100 lần/giây), độ phân giải 16 bit (tương đương với chất lượng CD) thì 1 phút âm thanh. .. Phương pháp nén MP3 sử dụng mã hóa Huffman để mã hóa các subband • Phương pháp mã hóa Huffman là phương pháp mã hóa không mất dữ liệu làm nâng cao chất lượng của phương pháp nén MP3 • Nhóm 16 Page 21 5 Ứng dụng thử nghiệm nén âm thanh dải rộng theo chuẩn MPEG (MP3) Phần mềm sử dụng: Free make Audio Converter Kịch bản: Nén 1 file nhạc WAV sang MP3 sau đó đánh giá chất lượng trong 2 trường hợp: Nén cùng... bỏ qua không mã hóa những âm thanh đó Hình 2.5 Sơ đồ quá trình nén mã hóa Trong hình 2.5 ở trên ta có thể thấy các bước chính của quá trình nén. Tín hiệu đầu vào được chia ra thành nhiều dải tần số khác nhau, trải rộng trên khắp phổ tần số Sau khi thực hiện xong việc phân chia, ta có thể xử lí từng dải tần số đó một cách riêng rẽ, dựa vào các đặc điểm của quá trình cảm nhận âm thanh của cơ quan thính... pháp nén audio theo chuẩn MP3 Kỹ thuật SBC 4.1 Nguyên lý phương pháp mã hóa các dải tần con: - Tín hiệu nguồn được phân tách thành các tín hiệu trên các dải tần con bằng kỹ thuật lọc số - Tín hiệu trên mỗi dải tần được mã hóa riêng • Mã hóa các dải tần sử dụng bộ lọc số để phân tách tín hiệu nguồn thành các tín hiệu trên các dải băng tần khác nhau Mã hóa riêng các dải tần cho phép đạt hiệu quả nén tốt... che xuất hiện sau tín hiệu bị che Đây là hiện tượng âm thanh che sẽ che mất phần cuối của âm thanh trước đó được phát ra Hiện tượng này ít xảy ra hơn và ngược chỉ có thể xảy ra khi mức độ của tín hiệu che cao hơn tương đối nhiều so với mức độ của tín hiệu âm thanh bị che phủ và khoảng cách thời gian giữa 2 tín hiệu này nhỏ hơn 25ms Mặc dù tín hiệu âm thanh tới tai trước nhưng do não bộ lại xủa lý tín... Giả sử ta có một tín hiệu mà 16 dải tần số đầu tiên có cường độ như ở bảng dưosi đây: Với cường độ là 60dB, tín hiệu dải tần thứ 8 sẽ gây ra hiện tượng che làm ngưỡng nghe ở dải 7 chở thành 12dB và ngưỡng nghe ở dải 9 trở thành 15dB Vì cường độ tín hiệu ở dải 7 chỉ là 10dB nên ta không cần mã hóa dải này mà bỏ qua nó luôn Vì cường độ dải 9 là 35dB nên ta cần phải mã hóa dải này  Khối Time/Frequency... nén âm thanh không bảo toàn nội dung (Lossy) như MP3, WMA,AC-3 … mặc dù âm thanh không còn nguyên vẹn, nhưng chất lượng cũng tương đối tốt, và đặc biệt chỉ chiếm khoảng 5MB cho một bài hát khoảng 5 phút (bằng 10% so với chuẩn WAV) Giao diện phần mềm Nhóm 16 Page 22 File WAV ban đầu Nén với tần số lấy mẫu 44,1kHz, tốc độ bit 128kbps Nhóm 16 Page 23 Nén với tần số lấy mẫu 44,1kHz, tốc độ bit 64kbps Nén. .. nhận âm thanh của cơ quan thính giác của con người và từ ảnh hưởng che của các dải tần số xung quanh, từng dải sẽ có 1 ngưỡng nghe mới nhất định Nếu như dải nào có cường độ thấp hơn ngưỡng nghe đó thì ta có thể loại bỏ nó đi (vì dải này đã bị che bởi các dải lân cận và tai người không thể cảm nhận được nó nữa) Đối với những dải có cường độ cao hơn ngưỡng nghe mới thì quá trình mã hóa sẽ được thực hiện ... điểm âm tiếng nói dải rộng  Âm có chất tín hiệu, dựa dải tần tín tín hiệu người ta chia thành loại sau: • Âm dải tần sở (âm tiếng nói thoại) với dải tần số từ 300Hz đến 4KHz • Âm tiếng nói dải rộng. .. làm tăng độ rõ với âm có tần số >3400Hz Mở nhiều công nghệ âm tiếng tnói dải rộng  Ta so sánh số đặc điểm âm tiếng nói dải rộng âm tiếng nói thoại sau: Tiếng nói thoại Giới hạn dải phổ tín hiệu... dải rộng (tiếng nói trình diễn, hát, âm nhạc …) với dải tần số từ 100Hz đến 20KHz  Âm tiếng nói dải rộng công nghệ âm sử dụng phổ biến điện thoại Nó mở rộng phạm vi tần số tín hiệu âm truyền

Ngày đăng: 07/04/2016, 22:52

Từ khóa liên quan

Mục lục

  • MỤC LỤC

  • LỜI NÓI ĐẦU

  • 1. Đặc điểm của âm thanh tiếng nói dải rộng

  • 2. Mô hình cảm nhận âm thanh.

    • 2.1. Ngưỡng nghe tối thiểu

    • 2.2. Hiện tượng che

      • 2.2.1. Hiện tượng che theo tần số (Frequency masking)

      • 2.2.2. Hiện tượng che trên miền thời gian

      • 2.2.3. Hiện tượng che chênh lệch

      • 3. Nén âm thanh kết hợp mô hình cảm thụ âm thanh

      • 4. Phân tích kỹ thuật SBC trong phương pháp nén audio theo chuẩn MP3

        • 4.1. Kỹ thuật SBC

        • 4.2. Phân tích kỹ thuật SBC trong phương pháp nén audio theo chuẩn MP3

          • 4.2.1. Chia tín hiệu nguồn thành các tín hiệu trên các dải tần con

          • 4.2.2. Mã hóa các tín hiệu trên các dải tần con

          • 5. Ứng dụng thử nghiệm nén âm thanh dải rộng theo chuẩn MPEG (MP3)

          • KẾT LUẬN

          • TÀI LIỆU THAM KHẢO

Tài liệu cùng người dùng

Tài liệu liên quan