Nén âm thanh tiếng thoại theo chuẩn ITU

33 1.6K 2
Nén âm thanh tiếng thoại theo chuẩn ITU

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1 TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG - - BÁO CÁO BÀI TẬP LỚN XỬ LÝ DỮ LIỆU ĐA PHƯƠNG TIỆN Đề tài: Nén âm tiếng thoại theo chuẩn ITU Giáo viên hướng dẫn: PGS.TS NGUYỄN THỊ HOÀNG LAN Nhóm sinh viên: Trịnh Công Nam 20101926 Cao Thanh Hoàng 20101569 Nguyễn Đức Mạnh 20101862 Mục lục CHƯƠNG 1: TÌM HIỂU KHÁI NIỆM, ĐẶC ĐIỂM CỦA HAI LOẠI TÍN HIỆU 1.1 Khái niệm âm Âm sóng học tạo nên dao động phần tử không khí Sóng không khí truyền tới tai, va đập vào màng nhĩ, làm cho màng nhĩ dao động với tần số tần số dao động phân tử khí, có khả tạo cảm giác âm tai ta tần số sóng đạt tới độ lớn định( tần số khoảng từ 16Hz đến 20KHz) - Những sóng có tần số < 16Hz : sóng hạ âm - Những sóng có tần số >20kHz: sóng siêu âm Tai người không cảm nhận sóng hạ âm sóng siêu âm Âm lan truyền môi trường khí, lỏng, rắn không truyền chân không 1.2 Khái niệm audio Là tái tạo âm dạng tín hiệu điện tử Dựa dải tần tín hiệu người ta chia thành loại sau: • Âm dải tần sở (âm tiếng nói thoại) với dải tần số từ 300Hz đến 4KHz • Âm tiếng nói dải rộng (Audio Hifi) (tiếng nói trình diễn, hát, âm nhạc…) với dải tần số từ 100Hz đến 20KHz Ở ta không xét đến chất lượng khác chất lượng thiết bị nghe để giải thích cho khác chất lượng âm mà quan tâm tới điểm khác phân loại âm dựa dải tần Giữa dải tần sở dải tần rộng bên cho chất lượng tốt 1.3 Đặc điểm tín hiệu tiếng nói thoại 1.3.1 Tần số phổ tần - Thông lượng: thể tích không khí vận chuyển qua môn đơn vị thời gian (khoảng 1cm3/s) - Chu kỳ T 0: Khi dây rung với chu kỳ T thông lượng biến đổi tuần hoàn theo chu kỳ ta gọi T0 chu kỳ - Giá trị nghịch đảo T F0=1/ T0 gọi tần số tiếng nói F phụ thuộc vào giới tính độ tuổi người phát âm; F thay đổi theo điệu F0 ảnh hưởng đến ngữ điệu người nói 1.3.2 Biểu diễn tín hiệu tiếng nói Có phương pháp biểu diễn tín hiệu tiếng nói : - Biểu diễn dạng sóng theo thời gian - Biểu diễn miền tần số: Phổ tín hiệu tiếng nói - Biểu diễn không gian chiều (Sonagram) a Dạng sóng thời gian Phần tín hiệu ứng với âm vô không tuần hoàn, ngẫu nhiên có biên độ nhỏ nguyên âm (cỡ khoảng 1/3) Ranh giới từ khoảng lặng (Silent), cần phân biệt khoảng lặng với âm vô Hình 1.1: Dạng sóng theo thời gian Âm theo dạng sóng lưu trữ theo định dạng thông dụng máy tính * WAV với tần số lấy mẫu thường gặp: 8000Hz, 10000Hz, 11025Hz, 16000Hz, 22050Hz, 32000Hz, 44100Hz,…; Độ phân giải (số bit/ mẫu ) 16 số kênh (mono) (stereo) b Phổ tín hiệu tiếng nói Dải tần số tín hiệu tiếng nói thoại nằm từ khoảng 0Hz đến 20KHz, nhiên phần lớn công suất nằm dải tần số từ 0,3 KHz đến 3,4 KHz Dưới số hình ảnh biểu diễn tín hiệu tiếng nói miền tần số Hình 1.2: Phổ tín hiệu tiếng nói đường bao phổ c Biểu diễn tín hiệu tiếng nói không gian chiều Để biểu diễn không gian chiều, người ta chia tín hiệu thành khung (frame) ứng với ô quan sát hình vẽ 3: Hình 1.3: Chia tín hiệu thành khung cửa sổ (frame) Độ dài cửa sổ tương ứng 10ms Các cửa sổ có đoạn chồng lên (khoảng 1/2 cửa sổ) Tiếp theo ta vẽ phổ khung tín hiệu trục thẳng đứng , biên độ phổ biểu diễn độ đậm/nhạt (đối với đồ thị đơn sắc) "nóng"/"lạnh" (đối với đồ thị màu) màu sắc Ta vẽ theo trục thời gian cách chuyển sang cửa sổ Hình 1.4: Phổ khung cửa sổ Dựa vào phương pháp ta phân biệt âm vô âm hữu theo đặc điểm: - Âm vô thanh: Năng lượng tập trung miền tần số cao Các mức tần số phân bổ đồng miền tần số cao tần sốthấp - Âm hữu thanh: Năng lượng tập trung không đồng * Formant Antiformant Tuyến âm coi hốc cộng hưởng có tác dụng tăng cường tần số Những tần số đươc tăng cường lên gọi Formant Khoang mũi coi hốc cộng hưởng , khoang mũi khoang miệng “mắc” song song nên làm suy giảm số tần số tần số bị suy giảm gọi AntiFormant Hình 1.5: Đường bao phổ formant Cùng người phát âm Formant khác Giá trị đặc trưng cho âm hữu không vào giá trị formant mà phải dựa vào phân bố tương đối Formant Ngoài xác định formant trực tiếp từ phổ không xác mà phải dựa vào đường bao phổ, đáp ứng tần số tuyến âm 1.4 Đặc điểm tín hiệu tiếng nói dải rộng (audio HiFi) Âm tiếng nói dải rộng công nghệ âm sử dụng phổ biến điện thoại Nó mở rộng phạm vi tần số tín hiệu âm truyền qua đường dây điện thoại cho chất lượng cao Phạm vi tiếng nói người kéo dài từ 80 Hz đến kHz, gọi điện thoại truyền thống, voiceband hẹp giới hạn tần số âm khoảng 300 Hz đến 3,4 kHz Âm tiếng nói dải rộng giới hạn băng thông truyền phạm vi tần số âm từ 50 Hz đến kHz cao AMR-WB phát triển Nokia VoiceAge lần quy định 3GPP Hình 1.6: Dải tần kênh thoại Một số lợi ích âm tiếng nói dải rộng so với truyền thống (hẹp): • Chất lượng âm tổng thể rõ ràng • Dễ dàng để nhận tiếng nói, phân biệt âm khó hiểu hiểu từ có dấu • Dễ dàng giải mã từ có âm gần “s” “f” người khác, thường phân biệt qua đường dây điện thoại • Sự nhận diện tốt tạp âm, chẳng hạn người nói sử dụng loa Âm tiếng nói dải rộng đưa giải pháp nhằm cải thiện chất lượng độ tự nhiên âm cách mở rộng dải phổ so với tiếng nói thoại bình thường Việc mở rộng tần số âm áp dụng nhiều mạng điện thoại âm nhạc, mạng điện thoại từ dải tần để cải thiện chất lượng người ta mở rộng lên dải tần 200-7000Hz, âm nhạc nên tới 20kHz Cụ thể với phát triển công nghệ âm tiếng nói dải rộng giúp cải tạo chất lượng tiếng nói, độ tự nhiên âm có tần số 3400Hz Mở nhiều công nghệ âm tiếng nói dải rộng 10 1.5 So sánh đặc điểm âm tiếng nói dải rộng tiếng nói thoại Tiếng nói thoại Giới hạn dải phổ tín hiệu Tiếng nói dải rộng xấp xỉ 4KHz 20KHz fs=44.1KHz, Tần số lấy mẫu fs=8KHz, Ts= 125µs fs chuyên dụng = 48KHz Lượng tử hóa giá trị Tốc độ cần thiết Các chuẩn nén GSM 10 mã hóa bit 8bits x 8KHz= 64Kbit/s 15,2Kbit/s, ADPCM: 32Kbit/s mã hóa 16 bits, 20 bits 176Kbyte/s MPEG-1, MPEG-3… MPEG-2, 19 trạng thái hữu vô thanh(voiced / unvoiced) Để tìm đầu vào cần thiết cho lọc , tín hiệu kích thích chọn cho tín hiệu khôi phục gần giống với tín hiệu ban đầu Hình 2.5: Sơ đồ mã hoá lai 19 20 CHƯƠNG 3: TÌM HIỂU CÁC CHUẨN NÉN ITU 3.1 Tìm hiểu chuẩn nén ITU Nén tín hiệu thoại: mạng điện thoại thông thường tín hiệu thoại mã hóa PCM theo luật A Muy với tốc độ 64Kbps Với cách mã hoác cho phép khôi phục cách tương đối trung thực âm giải tần tiếng nói Tuy nhiên số ứng dụng đặc biệt yêu cầu truyền âm với tốc độ thấp ví dụ truyền tín hiệu thoại mạng internet Từ xuất số kỹ thuật mã hóa nén tín hiệu tiếng nói xuống tốc độ thấp cụ thể chuẩn G723 1, G729, G729A Hiệp hội viễn thông quốc tế ITU-T (International Telecommunication Union - Telecommunication) đưa chuẩn nén âm G728, G729, G723.1 … dành cho băng thông thoại thấp với tần số 300Hz đến 3.4 kHz Tất chuẩn dựa chuẩn mã hóa CELP (Code – Excited Linear Prediction) Chuẩn nén âm tiêu chuẩn hóa mã ANSI-C với lý chính: - Độ tin cậy tương tác thiết bị Giá thành thấp tiện ích thực thi dựa 16 bit fixpoint DSP Một vài chuẩn nén âm thoại ITU như:  G.711 - Điều biến mã Pulse tần số thoại (PCM) tín hiệu audio 3.1 kHz analogue mã thành luồng 48, 56 64 kbps stream Chỉ dùng không dùng chuẩn khác Một giá trị đề nghị củ tần số lấy mẫu 8000 sample/giây Độ sai sót thường +/- 50 phần triệu 20 21  G.722 - Mã hóa audio kHz thành luồng 48, 56 64 kbps Chất lượng cao chiếm nhiều băng thông  G.722.1 - Mã hóa audio kHz 24 32 kbps với tỉ lệ khung thấp  G.722.1 Annex C - Chuẩn ITU có nguồn gốc từ Siren 14 Polycom mã hóa audio 14 kHz  G.722.2 - Mã hóa lời nói khoảng 16 kbps sử dụng Adaptive MultiRate Wideband, AMR-WB Bao gồm chế độ: 6.60, 8.85, 12.65, 15.85 23.85 kbps  G.723.1 - Mã hóa 3.4 kHz cho viễn thông 5.3 kbps 6.4 kbps Đây nén dùng để nén tín hiệu thoại tín hiệu âm khác dịch vụ đa phương tiện tốc độ bits thấp Hai tốc độ chuyển đổi qua lại khung truyền thoại 30 ms Tốc độ 6.3 kbit/s cho chất lượng âm tốt Thời gian trễ tổng cộng lầ 37.5 ms  G.728 - Mã hóa 3.4 kHz Low Delay Code Excited Linear Prediction (LD-CELP) âm 3.4 kHz analogue mã thành luồng 16 kbps Chuẩn cung cấp chất lượng tốt tốc độ thấp  G.729 A/B - Mã hóa 3.4 kHz với âm gần chất lượng điện thoại cố ddịnh, âm mã thành luồng kbps sử dụng phương pháp AS-CELP Phụ lục A mã giảm hóa bớt độ phức tạp, phụ lục B hỗ trợ triệt lặng cung cấp âm dễ chịu Ngoài nhà sản xuất có chuẩn mã hoá riêng cho chất lượng âm cao sử dụng thiết bị đồng hãng Ví dụ: chuẩn PT716plus, PT724, Siren14, Siren22 Polycom 21 22 Hình 3.1: So sánh chuẩn nén âm thoại 3.2 Giải thích chuẩn thường dùng ứng dụng VOIP? - Các ứng dụng VOIP cần truyền âm với tốc độ thấp Cải thiện độ tin cậy chất lượng âm tốt Nén tín hiệu thoại: mạng điện thoại thông thường tín hiệu thoại mã hóa PCM theo luật A Muy với tốc độ 64Kbps Với cách mã hoác cho phép khôi phục cách tương đối trung thực âm giải tần tiếng nói Tuy nhiên số ứng dụng đặc biệt yêu cầu truyền âm với tốc độ thấp ví dụ truyền tín hiệu thoại mạng internet Từ xuất số kỹ thuật mã hóa nén tín hiệu tiếng nói xuống tốc độ thấp cụ thể chuẩn G723 G729 G729A 22 23 CHƯƠNG 4: XÂY DỰNG THỬ NGHIỆM MỘT BỘ CODEC THEO CHUẨN ITU 4.1 Phần mềm sử dụng : Sử dung phần mềm mã nguồn mở Matlab Matlab phần mềm cung cấp môi trường tính toán số lập trình, công ty MathWorks thiết kế MATLAB cho phép tính toán số với ma trận, vẽ đồ thị hàm số hay biểu đồ thông tin, thực thuật toán, tạo giao diện người dùng liên kết với chương trình máy tính viết nhiều ngôn ngữ lập trình khác Với thư viện Toolbox, MATLAB cho phép mô tính toán, thực nghiệm nhiều mô hình thực tế kỹ thuật 4.2 Kịch bản thử nghiệm : Xây dựng CODEC theo chuẩn G723 Thực mã hoá giải mã Sau đánh giá hiệu cách đo số MSE tỉ số nén 4.3 Thử nghiệm với matlab : ENCODE function adpcm_y = adpcm_encoder(raw_y) [raw_y, Fs, nbits] = wavread('\file_demo.wav); IndexTable = [-1, -1, -1, -1, 2, 4, 6, 8, -1, -1, -1, -1, 2, 4, 6, 8]; StepSizeTable = [7, 8, 9, 10, 11, 12, 13, 14, 16, 17, 19, 21, 23, 25, 28, 31, 34, 37, 41, 45, 50, 55, 60, 66, 23 24 73, 80, 88, 97, 107, 118, 130, 143, 157, 173, 190, 209, 230, 253, 279, 307, 337, 371, 408, 449, 494, 544, 598, 658, 724, 796, 876, 963, 1060, 1166, 1282, 1411, 1552, 1707, 1878, 2066, 2272, 2499, 2749, 3024, 3327, 3660, 4026, 4428, 4871, 5358, 5894, 6484, 7132, 7845, 8630, 9493, 10442, 11487, 12635, 13899, 15289, 16818, 18500, 20350, 22385, 24623, 27086, 29794, 32767]; prevsample = 0; previndex = 1; Ns = length(raw_y); n = 1; raw_y = 32767 * raw_y; % 16-bit operation while (n = 0) code = 0; else code = 8; 24 25 diff = -diff; end tempstep = step; if (diff >= tempstep) code = bitor(code, 4); diff = diff - tempstep; end tempstep = bitshift(tempstep, -1); if (diff >= tempstep) code = bitor(code, 2); diff = diff - tempstep; end tempstep = bitshift(tempstep, -1); if (diff >= tempstep) code = bitor(code, 1); end diffq = bitshift(step, -3); if (bitand(code, 4)) diffq = diffq + step; 25 26 end if (bitand(code, 2)) diffq = diffq + bitshift(step, -1); end if (bitand(code, 1)) diffq = diffq + bitshift(step, -2); end if (bitand(code, 8)) predsample = predsample - diffq; else predsample = predsample + diffq; end if (predsample > 32767) predsample = 32767; elseif (predsample < -32768) predsample = -32768; end index = index + IndexTable(code+1); if (index < 1) 26 27 index = 1; end if (index > 89) index = 89; end prevsample = predsample; previndex = index; adpcm_y(n) = bitand(code, 15); %adpcm_y(n) = code; n = n + 1; end HUFFMAN histogram = hist(y, max(y)-min(y)+1); p = histogram/length(y); symbols = [0:15]; [dict, avglen] = huffmandict(symbols,p); compressed = huffmanenco(y, dict); HUFFMAN-1 X=adpcm_decoder(x); 27 28 DECODE function raw_y = adpcm_decoder(adpcm_y) IndexTable = [-1, -1, -1, -1, 2, 4, 6, 8, -1, -1, -1, -1, 2, 4, 6, 8]; StepSizeTable = [7, 8, 9, 10, 11, 12, 13, 14, 16, 17, 19, 21, 23, 25, 28, 31, 34, 37, 41, 45, 50, 55, 60, 66, 73, 80, 88, 97, 107, 118, 130, 143, 157, 173, 190, 209, 230, 253, 279, 307, 337, 371, 408, 449, 494, 544, 598, 658, 724, 796, 876, 963, 1060, 1166, 1282, 1411, 1552, 1707, 1878, 2066, 2272, 2499, 2749, 3024, 3327, 3660, 4026, 4428, 4871, 5358, 5894, 6484, 7132, 7845, 8630, 9493, 10442, 11487, 12635, 13899, 15289, 16818, 18500, 20350, 22385, 24623, 27086, 29794, 32767]; prevsample = 0; previndex = 1; Ns = length(adpcm_y); n = 1; while (n 32767) predsample = 32767; elseif (predsample < -32768) predsample = -32768; 29 30 end index = index + IndexTable(code+1); if (index < 1) index = 1; end if (index > 89) index = 89; end prevsample = predsample; previndex = index; raw_y(n) = predsample / 32767; n = n + 1; end Cách tính tỉ số nén : Tỉ số nén dung lượng lưu trữ - 30 Cr = Kích thước liệu ban đầu / Kích thước liệu sau nén Kích thước liệu ban đầu = 64kbps * thời gian âm Kích thước liệu sau nén ~ với kích thước file 31 - 31 32 - 32 Trong trường hợp ta có tỉ số nén ( 64000 * 17 ) / 732000 = 1.48 33 Tài liệu tham khảo EE3414 Multimedia Communication Systems -1 , Source Coding Basics and Speech Coding, Yao Wang Polytechnic University, Brooklyn, NY11201 Linear Predictive Coding, Jeremy Bradbury, December 5, 2000 “A HiFi Audio Coding Technique for Wireless Communication based on Wavelet Packet Transformation” Sansanee Netirojjanakul, Watcharee Veerakachen, and Mongkol Raksapatcharawong Scorpion Group, Electrical Engineering Department Kasetsart University, Jatujak, Bangkok 10900 Thailand 33 [...]... cung cấp âm thanh nền dễ chịu Ngoài ra mỗi nhà sản xuất còn có các chuẩn mã hoá riêng cho chất lượng âm thanh rất cao nếu sử dụng thiết bị đồng nhất của một hãng Ví dụ: các chuẩn PT716plus, PT724, Siren14, Siren22 của Polycom 21 22 Hình 3.1: So sánh các chuẩn nén âm thanh thoại 3.2 Giải thích tại sao các chuẩn này thường được dùng trong các ứng dụng VOIP? - Các ứng dụng VOIP cần truyền âm thanh với... trạng thái là hữu thanh và vô thanh( voiced / unvoiced) Để tìm đầu vào cần thiết cho bộ lọc , thì tín hiệu kích thích được chọn sao cho tín hiệu được khôi phục gần giống nhất với tín hiệu ban đầu Hình 2.5: Sơ đồ mã hoá lai 19 20 CHƯƠNG 3: TÌM HIỂU CÁC CHUẨN NÉN ITU 3.1 Tìm hiểu các chuẩn nén ITU Nén tín hiệu thoại: trong mạng điện thoại thông thường tín hiệu thoại được mã hóa PCM theo luật A hoặc Muy... tin cậy và chất lượng âm thanh tốt hơn Nén tín hiệu thoại: trong mạng điện thoại thông thường tín hiệu thoại được mã hóa PCM theo luật A hoặc Muy với tốc độ 64Kbps Với cách mã hoác này cho phép khôi phục một cách tương đối trung thực các âm thanh trong giải tần tiếng nói Tuy nhiên trong một số ứng dụng đặc biệt yêu cầu truyền âm thanh với tốc độ thấp hơn ví dụ như truyền tín hiệu thoại trên mạng internet... quốc tế ITU- T (International Telecommunication Union - Telecommunication) đã đưa ra các chuẩn nén âm thanh mới nhất như G728, G729, G723.1 … dành cho băng thông thoại thấp với tần số 300Hz đến 3.4 kHz Tất cả các chuẩn này đều dựa trên chuẩn mã hóa CELP (Code – Excited Linear Prediction) Chuẩn nén âm thanh đã được tiêu chuẩn hóa trong mã ANSI-C với 2 lý do chính: - Độ tin cậy khi tương tác giữa các thiết... khung truyền thoại 30 ms nào Tốc độ 6.3 kbit/s cho chất lượng âm thanh tốt hơn Thời gian trễ tổng cộng lầ 37.5 ms  G.728 - Mã hóa 3.4 kHz Low Delay Code Excited Linear Prediction (LD-CELP) trong đó âm thanh 3.4 kHz analogue được mã thành luồng 16 kbps Chuẩn này cung cấp chất lượng tốt ở tốc độ thấp  G.729 A/B - Mã hóa 3.4 kHz với âm thanh gần bằng chất lượng điện thoại cố ddịnh, âm thanh được mã... phục một cách tương đối trung thực các âm thanh trong giải tần tiếng nói Tuy nhiên trong một số ứng dụng đặc biệt yêu cầu truyền âm thanh với tốc độ thấp hơn ví dụ như truyền tín hiệu thoại trên mạng internet Từ đã xuất hiện một số kỹ thuật mã hóa và nén tín hiệu tiếng nói xuống tốc độ thấp cụ thể là các chuẩn G723 1, G729, G729A Hiệp hội viễn thông quốc tế ITU- T (International Telecommunication Union... các thiết bị Giá thành thấp và những tiện ích thực thi dựa trên 16 bit fixpoint DSP Một vài chuẩn nén âm thanh thoại ITU như:  G.711 - Điều biến mã Pulse các tần số thoại (PCM) trong đó tín hiệu audio 3.1 kHz analogue được mã thành các luồng 48, 56 hoặc 64 kbps stream Chỉ được dùng khi không có thể dùng được chuẩn nào khác Một giá trị được đề nghị củ tần số lấy mẫu là 8000 sample/giây Độ sai sót thường... kích thích – V/UV quyết định hữu thanh hay vô thanh – T là chu kì pitch(Chỉ áp dụng với âm hưu thanh) Xác định tham số G : Theo chuẩn LPC 10 tham số kích thích G được xác định bởi năng lượng RMSE( Root mean Square Energy ) theo công thức : En =( )1/2) Xác định tham số T và V/UV : 15 16 Trước tiên ta xác định tập tham số giá trị bình sai khác mẫu AMDF(Average Magnitude Difference Function ) • AMDT(i)... thấp  G.722.1 Annex C - Chuẩn ITU có nguồn gốc từ Siren 14 của Polycom mã hóa audio 14 kHz  G.722.2 - Mã hóa lời nói ở khoảng 16 kbps sử dụng Adaptive MultiRate Wideband, AMR-WB Bao gồm 5 chế độ: 6.60, 8.85, 12.65, 15.85 và 23.85 kbps  G.723.1 - Mã hóa 3.4 kHz cho viễn thông ở 5.3 kbps và 6.4 kbps Đây là một bộ nén có thể dùng để nén tín hiệu thoại hoặc những tín hiệu âm thanh khác của dịch vụ đa... index; raw_y(n) = predsample / 32767; n = n + 1; end Cách tính tỉ số nén : Tỉ số nén dung lượng lưu trữ - 30 Cr = Kích thước dữ liệu ban đầu / Kích thước dữ liệu sau nén Kích thước dữ liệu ban đầu là = 64kbps * thời gian âm thanh Kích thước dữ liệu sau khi nén ~ với kích thước file 31 - 31 32 - 32 Trong trường hợp này ta có tỉ số nén là ( 64000 * 17 ) / 732000 = 1.48 33 Tài liệu tham khảo 1 EE3414 ... hoá lai 19 20 CHƯƠNG 3: TÌM HIỂU CÁC CHUẨN NÉN ITU 3.1 Tìm hiểu chuẩn nén ITU Nén tín hiệu thoại: mạng điện thoại thông thường tín hiệu thoại mã hóa PCM theo luật A Muy với tốc độ 64Kbps Với... tự nhiên âm có tần số 3400Hz Mở nhiều công nghệ âm tiếng nói dải rộng 10 1.5 So sánh đặc điểm âm tiếng nói dải rộng tiếng nói thoại Tiếng nói thoại Giới... loa Âm tiếng nói dải rộng đưa giải pháp nhằm cải thiện chất lượng độ tự nhiên âm cách mở rộng dải phổ so với tiếng nói thoại bình thường Việc mở rộng tần số âm áp dụng nhiều mạng điện thoại âm

Ngày đăng: 07/04/2016, 22:52

Từ khóa liên quan

Mục lục

  • Mục lục

  • CHƯƠNG 1: TÌM HIỂU KHÁI NIỆM, ĐẶC ĐIỂM CỦA HAI LOẠI TÍN HIỆU

  • 1.1 Khái niệm âm thanh

  • 1.2 Khái niệm audio

  • 1.3 Đặc điểm của tín hiệu tiếng nói thoại

    • 1.3.1 Tần số cơ bản và phổ tần

    • 1.3.2 Biểu diễn tín hiệu tiếng nói

    • 1.4 Đặc điểm của tín hiệu tiếng nói dải rộng (audio HiFi)

    • 1.5 So sánh đặc điểm chính đối với âm thanh tiếng nói dải rộng và tiếng nói thoại

    • CHƯƠNG 2: CÁC PHƯƠNG PHÁP MÃ HÓA

    • 2.1 Phương pháp mã hoá DPCM :

    • 2.2 Phương pháp mã hoá ADPCM :

    • 2.3 Phương pháp mã hoá LPC :

    • 2.4 Phương pháp mã hoá Hỗn Hợp (Lai) :

    • CHƯƠNG 3: TÌM HIỂU CÁC CHUẨN NÉN ITU

    • 3.1 Tìm hiểu các chuẩn nén ITU.

    • 3.2 Giải thích tại sao các chuẩn này thường được dùng trong các ứng dụng VOIP?

    • CHƯƠNG 4: XÂY DỰNG THỬ NGHIỆM MỘT BỘ CODEC THEO CHUẨN ITU

    • 4.1 Phần mềm sử dụng :

    • 4.2 Kịch bản thử nghiệm :

    • 4.3 Thử nghiệm với matlab :

Tài liệu cùng người dùng

Tài liệu liên quan