Nghiên cứu đặc trưng tín hiệu và ràng buộc ngôn điệu để nâng cao chất lượng tổng hợp và nhận dạng tiếng Việt

253 405 0
Nghiên cứu đặc trưng tín hiệu và ràng buộc ngôn điệu để nâng cao chất lượng tổng hợp và nhận dạng tiếng Việt

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

MỞ ĐẦU 1. Tính cấp thiết của đề tài Ngày nay, với sự bùng nổ của xã hội thông tin, con người không còn chỉ có nhu cầu giao tiếp với nhau nữa mà còn cần giao tiếp với những thiết bị điện tử. Hình thức giao tiếp người – máy thông qua ngôn ngữ tự nhiên sẽ đem lại nhiều ứng dụng, góp phần giải phóng sức lao động của con người. Chính vì vậy, vai trò của nhận dạng, tổng hợp tiếng nói có tầm quan trọng đặc biệt liên quan đến quá trình phát triển của văn minh nhân loại. Các ứng dụng nhận dạng và tổng hợp tiếng nói như Dragon của LH, Viavoice, Google voice search, Siri của Apple v.v…ngày càng trở nên thông dụng và hữu ích trong cuộc sống. Về các hệ thống tổng hợp tiếng nói, hiện nay đã có nhiều phương pháp tổng hợp được nghiên cứu và ứng dụng trong thực tế như: tổng hợp theo cấu âm, tổng hợp bằng ghép nối, cách điệu hóa đường F0 và hiện tượng ngôn điệu [23][25][27], tổng hợp theo phương pháp thống kê dựa trên HMM [18][71][72] … Tuy nhiên, vấn đề tổng hợp giọng tự nhiên cho tới nay vẫn là một vấn đề mở, ngay cả trong các ngôn ngữ châu Âu thông dụng như tiếng Anh. Bởi vì để tổng hợp được giọng tự nhiên đòi hỏi rất nhiều yếu tố từ việc xử lý các đặc trưng tín hiệu, hiện tượng ngôn điệu và ngữ cảnh ứng dụng (như trạng thái cảm xúc…) v.v… Các hệ thống nhận dạng tiếng nói thường sử dụng các kỹ thuật học máy truyền thống như mạng nơ ron, mô hình Markov ẩn (HMM), chiến thuật tìm kiếm dựa trên quy hoạch động, các mô hình này có tính khái quát cao được ứng dụng ở nhiều lĩnh vực ngoài nhận dạng và tổng hợp tiếng nói. Để tăng được chất lượng nhận dạng tiếng nói các hệ thống nhận dạng cần phải bổ sung các phép tiền xử lý tín hiệu tiếng nói, các phép trích chọn đặc trưng tiếng nói như xử lý giảm thiểu sự sai lệch về phổ giữa đặc trưng tiếng nói của tập giọng nói người được huấn luyện và giọng nói của người sử dụng hệ thống [26][50] (ứng dụng trong các hệ thống nhận dạng độc lập người nói). Lọc nhiễu tiếng nói [28][58], trích chọn đặc trưng [35][36][46], tích hợp đặc trưng ngôn điệu [16]… Hai môi trường nền phổ biến cho các hệ thống nhận dạng và tổng hợp tiếng nói là server hoặc nhúng (các ứng dụng tiếng nói cho điều khiển thiết bị, nhúng v.v…), các môi trường này có tài nguyên lưu trữ và tính toán khác nhau, điều đó dẫn đến các tiếp cận khác nhau trong việc cân bằng giữa chất lượng nhận dạng tổng hợp tiếng nói và sử dụng tài nguyên (lưu trữ, tính toán và điện năng tiêu thụ), thời gian thu thập mẫu huấn luyện v.v…Môi trường nhúng có tầm quan trọng đặc biệt, được tập trung nghiên cứu phát triển nhiều trong thời gian gần đây do các thiết bị nhúng hầu hết không trang bị thiết bị nhập liệu như bàn phím và màn hình cảm ứng, giao tiếp bằng tiếng nói thể hiện hình thức tương tác tự nhiên, tuy vậy các hệ thống này đòi hỏi phải tối ưu rất nhiều so với quy trình nhận dạng tổng hợp tiếng nói nói chung [13][47][52] Nhận dạng và xử lý tiếng Việt (ngôn ngữ và tiếng nói) là một trong những mục tiêu cơ bản của phát triển và ứng dụng công nghệ thông tin ở Việt Nam do sự khác biệt về bản chất của hệ thống âm tiết, ngữ pháp và hiện tượng thanh điệu nên không thể sử dụng nguyên các hệ thống ứng dụng cho tiếng nước ngoài. Hiện nay những nghiên cứu về đặc trưng tín hiệu, hiện tượng ngôn điệu tiếng Việt mới chỉ đề cập ở mức độ ban đầu. Trong nước đã hình thành nhiều trung tâm nghiên cứu của các Viện nghiên cứu và các khoa Công nghệ Thông tin của các trường Đại học về xử lý tiếng nói (tiếng Việt) và ngôn ngữ tự nhiên như : Viện Công nghệ Thông tin, Trung tâm Pháp –Việt MICA của Đại học Gronobe và Đại học Bách khoa Hà Nội, Trung tâm SLP của Đại học khoa học tự nhiên Đại học Quốc Gia TP. HCM, Viện Công nghệ Bộ Khoa học và Công nghệ v.v... Các kết quả nghiên cứu tập trung vào việc sử dụng, cải tiến các công nghệ nguồn về Nhận dạng và Tổng hợp tiếng nói của tiếng Anh. 3 Phòng thí nghiệm Trí tuệ nhân tạo AILab (Đại học Khoa học tự nhiên TP HCM) đã thiết kế và xây dựng các hệ thống Nhận dạng và tổng hợp tiếng Việt với nhiều cách tiếp cận khác nhau như tổng hợp ghép nối, tổng hợp dựa trên mô hình HMM. Về ứng dụng cho điều khiển, Viện Hàn lâm Khoa học và Công nghệ Việt Nam, với đề tài “Nghiên cứu thiết kế và chế tạo hệ thống điều khiển bằng tiếng nói tích hợp vào robot hút bụi tự động thông minh”, thực hiện năm 2011-2013[77] đã nghiên cứu phát triển mẫu robot dịch vụ - robot hút bụi điều khiển bằng khẩu lệnh tiếng Việt. Viện nghiên cứu Quốc tế MICA (Đại học Bách khoa Hà Nội) đã nghiên cứu một robot hướng dẫn bảo tàng từ giữa năm 2009 và thử nghiệm tại Bảo tàng Dân tộc học Việt Nam. Robot có khả năng hiểu một số câu hỏi của khách thăm quan, đồng thời sẽ giới thiệu cho khách thăm quan bằng tiếng nói nhiều thông tin liên quan đến các hiện vật trưng bày v.v… Chính vì vậy việc đi sâu nghiên cứu các đặc trưng của ngôn ngữ tiếng Việt, khai thác, áp dụng các đặc trưng đó vào các hệ thống nhận dạng, tổng hợp tiếng nói để nâng cao chất lượng tổng hợp và nhận dạng tiếng Việt đang là vấn đề cần thiết nhằm tiến tới xây dựng các ứng dụng phù hợp với đặc thù của ngôn ngữ tiếng Việt, đáp ứng các nhu cầu ứng dụng ngày càng cao của xã hội. Xuất phát từ thực tế và những lý do trên, việc lựa chọn đề tài “Nghiên cứu các đặc trưng tín hiệu và ràng buộc ngôn điệu để nâng cao chất lượng Tổng hợp và Nhận dạng tiếng Việt”, nghiên cứu các đặc trưng tiếng nói phù hợp với đặc thù ngôn ngữ tiếng Việt, các đặc trưng ngữ âm như thanh điệu, trường độ và formant để nâng cao chất lượng Tổng hợp và nhận dạng tiếng Việt trong các ứng dụng giao tiếp người máy. Đề tài này cũng nghiên cứu hướng tới các ứng dụng tương tác điều khiển thiết bị, robot dịch vụ, ứng dụng hỗ trợ người khuyết tật, những ứng dụng mà công nghệ nhận dạng và tổng hợp tiếng Việt có vai trò quan trọng. 2. Mục tiêu, phạm vi nghiên cứu của luận án. Mục tiêu chính của đề tài là tập trung chủ yếu ở vấn đề về xử lý ngôn điệu và đặc trưng tín hiệu để nâng cao chất lượng tổng hợp và nhận dạng tiếng Việt. Các hiện tượng ngôn điệu có thể là đường F0, trường độ và âm lượng của âm tiết hoặc từ đa âm tiết trong ngữ cảnh câu. Nghiên cứu về các ràng buộc ngôn điệu cho tổng hợp tiếng Việt còn ít được đề cập tới, trong khi để đạt được độ tự nhiên cao của tiếng nói tổng hợp cũng như để tăng độ chính xác của các hệ thống nhận dạng tiếng nói (nhận dạng khẩu lệnh, nhận dạng tên, nhận dạng đối thoại v.v…) đều đòi hỏi phải tích hợp các đặc trưng ngôn điệu của tiếng nói trong ngữ lưu và trong môi trường sử dụng thực tế của tiếng nói. Ngoài phương pháp học ngôn điệu dựa trên các mô hình thống kê, các tác giả của Viện Ứng dụng Công nghệ, Đại học Quốc gia TP HCM cũng đã giới thiệu một hệ thống tổng hợp tiếng Việt VOS với giọng đọc gần tiếng nói tự nhiên dựa trên tiếp cận kiểu kho ngữ liệu (corpus-based), mô hình này đòi hỏi rất nhiều dữ liệu được gán nhãn (dựa trên công nghệ phân đoạn tự động câu tiếng nói thành các đơn vị tiếng nói kết hợp với điều chỉnh tay) và chỉ phù hợp với ứng dụng cho môi trường server, bên cạnh đó tiếp cận này cũng có điểm hạn chế là đọc không chuẩn các ngữ đoạn ít thông dụng. Nghiên cứu các ảnh hưởng của hiện tượng ngôn điệu tiếng Việt như thanh điệu, các tần số formant và trường độ âm tiết trong các hệ thống nhận dạng tiếng Việt là một vấn đề quan trọng nhưng hiện tại ít được đề cập tới trong các công trình nghiên cứu về xử lý âm thanh tiếng Việt. Các hệ thống nhận dạng tiếng Việt dựa trên HMM thường dựa trên đặc trưng chuẩn MFCC. Khi ứng dụng thuật toán nhận dạng HMM với các đặc trưng MFCC cơ sở cho việc nhận dạng tiếng nói liên tục không phụ thuộc người nói, hệ thống thường suy giảm độ chính xác với những người nói có có đặc trưng giọng nói không phù hợp với những mẫu giọng được sử dụng để huấn luyện mô hình HMM. Xuất phát từ mục tiêu trên, phạm vi nghiên cứu của đề tài tập trung vào các vấn đề sau:  Nghiên cứu các mô hình dự báo các hiện tượng ngôn điệu như trường độ, âm lượng, thanh điệu của các âm tiết tiếng Việt trong ngữ lưu, tích hợp trong các hệ thống tổng hợp tiếng Việt, tối ưu hiệu quả sử dụng tài nguyên lưu trữ và tính toán ứng dụng cho hệ thống nhúng.  Nghiên cứu các phương pháp giảm thiểu sự sai lệch về cấu âm, phổ của tập giọng nói huấn luyện và giọng của người sử dụng dựa trên đặc trưng ngữ âm tiếng Việt để tăng độ chính xác nhận dạng tiếng nói cho các hệ thống nhận dạng tiếng Việt độc lập người nói. Đối tượng nghiên cứu của đề tài là:  Các mô hình học máy như HMM, CART.  Các đặc trưng tiếng nói (MFCC, F0, formant, VTL v.v …)  Mô hình biểu diễn, cách điệu đường F0, mô hình xử lý nhiễu, cân bằng tần số v.v…  Phương pháp tổng hợp ghép nối.  Phép chuẩn hóa VTLN cho các hệ thống nhận dạng tiếng nói độc lập người nói.

1 BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CƠNG NGHỆ NGƠ HỒNG HUY NGHIÊN CỨU CÁC ĐẶC TRƯNG TÍN HIỆU VÀ RÀNG BUỘC NGƠN ĐIỆU ĐỂ NÂNG CAO CHẤT LƯỢNG TỔNG HỢP VÀ NHẬN DẠNG TIẾNG VIỆT LUẬN ÁN TIẾN SĨ TOÁN HỌC Hà Nội – 2016 BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CƠNG NGHỆ NGƠ HỒNG HUY NGHIÊN CỨU CÁC ĐẶC TRƯNG TÍN HIỆU VÀ RÀNG BUỘC NGƠN ĐIỆU ĐỂ NÂNG CAO CHẤT LƯỢNG TỔNG HỢP VÀ NHẬN DẠNG TIẾNG VIỆT Chuyên ngành: Cơ sở Toán học cho Tin học Mã số: 62 46 01 10 LUẬN ÁN TIẾN SĨ TOÁN HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS LƯƠNG CHI MAI PGS.TS NGÔ QUỐC TẠO Hà Nội – 2016 LỜI CAM ĐOAN Tác giả xin cam đoan cơng trình nghiên cứu thân tác giả Các kết nghiên cứu kết luận luận án trung thực, không chép từ nguồn hình thức Việc tham khảo nguồn tài liệu thực trích dẫn ghi nguồn tài liệu tham khảo quy định Tác giả luận án Ngơ Hồng Huy LỜI CẢM ƠN Luận án báo cáo phần kết nghiên cứu làm việc hai chục năm qua Trong suốt thời gian nỗ lực làm việc thân tơi, phịng Nhận dạng Cơng nghệ Tri thức, Viện Công nghệ Thông tin tạo cho môi trường làm việc, điều kiện để thực nghiên cứu chuyên nghành rộng nhận dạng chuyên nghành hẹp nhận dạng tổng hợp tiếng Việt Tôi xin chân thành cảm ơn PGS.TS Lương Chi Mai PGS.TS Ngô Quốc Tạo dẫn làm việc bước đường khoa học tơi, tận tình dẫn tơi để hồn thành luận án Xin cảm ơn đồng nghiệp Phịng Nhận dạng Cơng nghệ tri thức, Viện Cơng nghệ Thơng tin đóng góp ý kiến thiết thực để hiệu chỉnh lại tiếp cận nghiên cứu mình, cảm ơn kỹ sư cơng ty Cổ phần Phần mềm Công nghệ ứng dụng hỗ trợ thử nghiệm kết tổng hợp nhận dạng lệnh tiếng Việt tảng chip PSoC Đặc biệt xin bày tỏ lịng biết ơn sâu sắc tới vợ tơi Mai Thị Bạch Tuyết mà thiếu điều chắn khơng đủ nghị lực để hồn thành luận án MỤC LỤC Danh mục thuật ngữ từ viết tắt i Danh sách bảng ii Danh sách hình vẽ iii MỞ ĐẦU 1 Tính cấp thiết đề tài Mục tiêu, phạm vi nghiên cứu luận án Phương pháp nội dung nghiên cứu Kết đạt luận án CHƯƠNG TỔNG QUAN VỀ TỔNG HỢP VÀ NHẬN DẠNG TIẾNG NĨI 10 1.1 Tổng hợp tiếng nói 10 1.1.1 Chuẩn hóa văn phân tích câu – xử lý ngôn ngữ tự nhiên 11 1.1.2 Chuyển văn sang đơn vị tiếng nói 11 1.1.3 Dự báo ngôn điệu 11 1.1.4 Các phương pháp tổng hợp tiếng nói 12 1.1.5 Các hệ thống tổng hợp tiếng nói tiếng Việt 21 1.1.6 Các tham số ngôn điệu 23 1.1.7 Tổng quan âm học tượng ngôn điệu tiếng Việt ngữ lưu 25 1.1.8 Hiệu chỉnh đường tần số 33 1.2 Nhận dạng tiếng nói 38 1.2.1 Liệt kê lớp toán nhận dạng tiếng nói 38 1.2.2 Mơi trường thu nhận tín hiệu 39 1.2.3 Biểu diễn tiếng nói - đặc trưng tiếng nói 40 1.2.4 Phương pháp nhận dạng tiếng nói 42 1.2.5 Các hệ thống nhận dạng tiếng nói tiếng Việt 43 1.3 Kết luận chương 44 CHƯƠNG XỬ LÝ TIẾNG NĨI VÀ CÁC MƠ HÌNH HỌC MÁY 46 2.1 Xử lý tiếng nói 46 2.1.1 Xử lý nhiễu 46 2.1.2 Một số loại nhiễu môi trường thực 47 2.1.3 Trích chọn đặc trưng tiếng nói 50 2.1.4 Thuật toán PSOLA 56 2.2 Mơ hình dự báo CART 59 2.3 Mô hình Markov ẩn (HMM, Hidden Markov Model) 63 2.3.1 Tham số mơ hình HMM 64 2.3.2 Nhận dạng tiếng nói với mơ hình Markov ẩn 66 2.4 Kết luận chương 67 CHƯƠNG DỰ BÁO TRƯỜNG ĐỘ, ÂM LƯỢNG VÀ TỔNG HỢP THANH ĐIỆU TIẾNG VIỆT 68 3.1 Khảo sát số đặc tính âm học tiếng Việt 69 3.1.1 Đặc tính trường độ âm tiết ảnh hưởng phụ âm nguyên âm ngữ cảnh 70 3.1.2 Quy luật biến đổi điệu ngữ cảnh 71 3.1.3 Quy luật biến đổi formant nguyên âm ngữ cảnh 73 3.1.4 Cách điệu hóa đường F0 âm tiết tiếng Việt 78 3.2 Dự báo thông tin trường độ, âm lượng âm tiết tiếng Việt ngữ cảnh câu 86 3.2.1 Cơ sở liệu tiếng nói huấn luyện mơ hình dự báo 87 3.2.2 Dự báo ngôn điệu 92 3.2.3 Thiết kế phân tích ngơn điệu xác định tham số huấn luyện dự báo trường độ âm lượng 93 3.2.4 Tổng hợp tiếng Việt hệ thống tài nguyên hạn chế 101 3.3 Kết luận chương 103 CHƯƠNG KẾT HỢP THAM SỐ CẤU ÂM, FORMANT VÀ THANH ĐIỆU ĐỂ NÂNG CAO CHẤT LƯỢNG NHẬN DẠNG TIẾNG VIỆT 105 4.1 Nhận dạng điệu tiếng Việt 105 4.2 Đặc trưng MFCC với phép chuẩn hóa độ dài cấu âm VTLN kết hợp với F0108 4.2.1 Phép chuẩn hóa VTLN 110 4.2.2 Tổ hợp giá trị F0 chuẩn hóa VTLN 112 4.2.3 Ước lượng tham số chuẩn hóa VTLN phương pháp formant 117 4.3 Hệ thống nhận dạng tiếng Việt nhúng 124 4.3.1 Điều khiển thiết bị tự hành tiếng nói 126 4.3.2 Biểu diễn HMM nhớ SRAM chip với tính tốn chấm tĩnh (fixed point) 130 4.4 Kết luận chương 131 KẾT LUẬN 133 Kết tổng hợp tiếng Việt 133 1.1 Kết 133 1.2.Kết khác 134 1.3.Một kết ứng dụng 134 Kết nhận dạng tiếng Việt 134 2.1 Kết 134 2.2.Kết khác 135 2.3.Một kết ứng dụng 136 Hướng phát triển 136 DANH MỤC CƠNG TRÌNH ĐÃ CƠNG BỐ 138 TÀI LIỆU THAM KHẢO 140 PHỤ LỤC 149 Cách tổ chức dự báo CART Wagon/Festival 153 1.1 Sự hỗn tạp liệu (tạp âm) 153 1.2 Định dạng liệu 156 1.3 Xây dựng 161 Phân loại âm vị tiếng Việt 163 Cơ sở liệu ngữ âm 171 Các câu trích từ tập truyện “Dế mèn phiêu lưu ký” 213 i Danh mục thuật ngữ từ viết tắt Tên đầy đủ Từ viết tắt ADC Analog-Digital-Converter ADPCM Adaptive differential pulse-code modulation ANN Artificial neural network CART Class And Regression Tree CD-HMM Continuous-Density Hidden Markov Model CMS Cepstral-mean-subtraction CSDL Cơ sở liệu C-V Consonant-Vow C-V-C Consonant-Vow-Consonant dB Decibel DFT Discrete Fourier Transform EM Expectation Maximization FFT Fast Fourier Transform F0 Fundamental Frequency GMM Gaussian Mixture Models GPIO General-purpose Input/Output HMM Hidden Markov Model HTK Hidden Markov Model Toolkit IDFT Inverse Discrete Fourier Transform IFFT Inverse Fast Fourier Transform LPC Linear Predictive Coding LPCC Linear Predictive Cepstral Coefficient LPF Low Pass filter LSF Line Spectral Frequency LSP Line Spectrum Pair ii MAP Maximum A posteriori MFCC Mel Frequency Cepstral Coefficient ML Maximum Likelihood PDF Probility Density Function POS Part-Of-speech PSOC Programmable System On Chip PSOLA Pitch Synchronous Overlap Add RMSE Root Mean Square Error SD Speaker Dependent SI Speaker Independent SS Spectral Subtraction SRAM Static Random Access Memory STC Shared decision Tree Cluster ToBI Tones and Break Indices TTS Text To Speech VTLN Vocal Tract Length Normalization VAD Voice Activity Detection ZCR Zero Crossing Rate WF Wiener Filter VTL Vocal Tract Length 225 250 tơi mím miệng nghiến rắng gắng sức bình sinh cõng chũi bay qua sơng 251 khơng cất cao lên tơi đủ sức bay là mặt nước 252 đàn chục cá đuổi theo chen đánh sóng quẫy ngốp miệng bắn nước lên đầy mặt tơi ướt cánh ướt bụng 253 lưng nặng có hịn núi đá đè 254 cuối tơi lướt khỏi mặt nước sang tới bên bãi cỏ 255 lăn kềnh bãi chũi bị hất tung ngã tít đằng 256 trở dậy trơng lại bờ bên thấy xóm ếch nhái kéo 257 không thấy đại vương ếch cốm đâu 258 thêm viện binh bốn bác cua núi đen bốn xe bọc sắt to kềnh múa lên lớn 259 tưởng bị cắp bụng tơi có thiết giáp phải phì ruột 260 chúng tơi qua sông 261 thách chẳng mống cá dám lên bờ đuổi 262 nghĩ cứng lại nghĩ thêm học chữ ngờ 263 vội bảo chũi chạy chốn 264 chũi thông cảm 265 biến nhanh 266 trước chạy làm oai ta 267 dơ lên di di hát 268 trời chuồn chuồn bay sát cánh rợp nắng 269 cậu kỉm kìm kim gày còm lượn thấp tung tăng dáng 270 hỏi thêm anh em muốn xem hội thi võ có khơng 271 chúng tơi theo chuồn chuồn chảy hội 272 họ bay không 273 chúng tơi 226 274 đơi lúc khối chí cất cánh bay chơi quãng 275 đường cịn gặp vơ khối khách nơ nức chảy hội 276 ông liềng nghiễng đen nháy quanh năm không khỏi mép sen mặt nước lịch kịch cất bước 277 tích hội thi võ 278 nguyên vùng cỏ may hàng năm đến mùa hoa may chín trắng bạc khắp miền có hội lễ 279 năm ngối cụ bọ ngựa già ốm khuất núi 280 năm dân vùng nhân hội hoa lau mở hội thi vơ lấy tài giỏi để đứng coi sóc việc chung vùng 281 Đó phong tục lâu năm vùng cỏ may 282 vùng cỏ may chân cỏ đỏ tía đầu hoa rám trắng lóng lánh dựng lên võ đài đồ sộ cao toàn bỗ lau ngà vàng đứng cuối bãi trông lên rõ mồn 283 đài rõ chắn đẹp có ghế ơng cầm trịch ngồi lợp cỏ mật treo chùm hoa ké vàng mọng bng xuống lắc lư gió 284 hơm đầu đấu loại 285 nhiều anh chấu chấu vừa nứt mắt bắng nhắng lên đài 286 ngựa non háu đá 287 gã ngơng nghênh thật chưa có ba hột sức 288 tự chân đá run rẩy người đứng thở hồng hộc 289 có anh tưởng có võ tuyệt thơi cịn khách xem thấy đấu loạc choạc ngấy 290 họ chơi hội xem thi võ 291 ngày sau võ đài bắt đầu rầm rộ tay võ xồng bị lọc hết 292 cậu ti toe bạt xuống chân đài 293 cịn lại có hai tay cứng vào đấu vòng cuối bọ muỗm bọ ngựa 294 hai tráng sĩ vùng 227 295 sáng hôm trước xem thi đấu tơi dạo chơi quanh bãi nhìn thiên hạ nô nức kéo tới xem hội động nêm cối 296 chị cào cào làng mĩ miều áo đỏ áo xanh mớ ba mớ bẩy chân bước chầm chậm khoan thai e thẹn làm dáng ngượng ngùng 297 anh châu chấu ma mặt mũi xấu xí chúa hay lơn tơn đón đường co kéo nàng cào cào xinh đẹp vào trò chuyện vẩn vơ vườn cỏ non hàng quán dọc đường 298 thấy bụng đói đói tơi tản vào qn làm vài nhánh cỏ lót 299 chấu chấu cào cào bọ muỗm bọ ngựa rậm rịch vào chè chén 300 thấy chấu chấu ma nhảy nhót khoe tài quanh nàng cào cào vội né dạt bên 301 cửa hàng im tiếng ồn 302 thấy trịnh trọng tiến vào anh bọ ngựa 303 người ngợm anh bọ ngựa bình thường chưa hiểu anh làm lối quan rạng 304 anh chân nhấc bước cao ngang đầu gối kiểu bước chân ngỗng 305 kiểu cách ta kẻ dờ hách dịch phát xít 306 khớp cổ vươn 307 mặt ngắn cằm vuông bạnh lên 308 mắt đu đưa tưởng xung quanh có việc nhìn 309 hai sợi râu óng ả mấp máy phát lên phất xuống 310 hai lưỡi gươm bên mạng sườn lưỡi có cưa ln ln co vào trước ngực lối ta nhà võ đứng kiểu võ lúc giữ giữ miếng 311 trông tịch không để tâm 312 tơi biết thường anh tính hay khoe miệng hết có miệng bụng nhiều chẳng có cóc khơ 313 anh có miếng võ xồng trổ tay chân mặt mũi 228 chẳng cịn để phải ý 314 vả chẳng đâu cần để mắt đến oai rơm rác lố bịch 315 có nghĩa lúc tơi đủng đỉnh cửa quán hàng không trông thấy võ sĩ bọ ngựa vào 316 thấy thằng bọ ngựa phũ tính bổ ln cho tơi nhát gươm vào đầu 317 nhảy trái đá hậu cú song phi 318 né co hai gươm định quạng tơi 319 thấy có xung đột khách hàng bỏ chạy hết 320 chị cào cào hốt hoảng nhảy tung rách vạt áo màu 321 gã bọ ngựa không xông vào mà dơ gươm trỏ mặt bảo 322 có giỏi chốc lên đài 323 tơi cười khềnh nói lịch mỉa mai 324 sau bọ ngựa thật tức cười lại trịnh trọng kiểu cách khệnh khạng bước kiểu chân ngỗng lúc 325 đám đông dần trở lại 326 quán cỏ lại chen chân đông nghịt 327 họ xúm quanh 328 bác cành cạch ngã lúc dậy nhơ mũi nhọn đến thở hổn hển nói 329 dại xa đến chưa biết 330 vùng không dám động đến lông chân ông đâu 331 ông phen hẳn tranh chân trạng võ nối chức cụ võ sư bọ ngựa 332 mày biết điều mau mau tránh nơi khác 333 cảm ơn chư vị 334 bình sinh đời sợ lời đe dọa 335 gở chết hay 336 quán bán cỏ 337 lời lẽ nhát sợ bác cành cạch tơi khó chịu 229 338 phải bước vào rừng cỏ ngắm hoa may đương gió tràn ngập phơi phới cho tĩnh tâm lại 339 trở vào đám hội võ đài đương vào thi tài 340 ngạc nhiên thấy chũi đứng sừng sững đài đấu với anh bọ muỗm 341 chũi nhà tơi lâu cịn căm nhà bọ muỗm 342 trận đòn ác mụ bọ muỗm nanh ác ngày chưa thể quên 343 căm nặng đến độ gặp gã bọ muỗm xa lạ khiến chũi máu đòn thù 344 chũi lên đài 345 gã bọ muỗm đánh ngã địch thủ nhép hôm qua 346 đằng đuôi mắc thêm lưỡi gươm cong hoắt 347 đầu gã lớn mút nhọn lại húc khỏe 348 hai vành râu trắng phau 349 đôi mắt to hó mắt cá 350 hai tảng đen nhọn khoằm khoặm 351 khơng có chũi lên võ đài bọ muỗm đấu thẳng với bọ ngựa để tranh chức trạng võ 352 hai võ sĩ đài 353 cụ châu chấu già lụ khụ bạc lưng có gân đen gồ chán ngồi cầm trịch 354 chũi bọ muỗm sau anh võ mắt tay đô vật múa lên đâì đứng lại ngó giây từ từ đưa chân lên vuốt râu đàng hoàng ập vào đấu đá liền 355 chũi xử đôi khéo 356 từ ngày chũi học thêm nhiều miếng võ đường quyền coi ngoạn mục kín 357 bọ muỗm khơng cần võ cậy sức lăn xả vào thọc gươm cắn lia 230 358 loanh qoanh lát bọ muỗm mệt phờ 359 chũi mở sức 360 chũi nhẩy lên đưa hai trùy ép bẹp vỡ cặp kính bảo vệ mắt bọ muỗm kết thúc thêm đá làm gã ngã ngửa rướn lưng lần mà không dậy 361 cụ châu chấu cầm trịch thong thả bước tới dắt chàng trận bên tuyên bố kẻ thắng trận 362 bãi xôn xao 363 vừa hoan hơ vừa chưa biết võ sĩ chũi tài giỏi quê đâu ta 364 võ sĩ dế chũi thắng võ sĩ bọ muỗm 365 lên đấu với võ sĩ dế chũi 366 tiếng ông cụ gọi loa vang đài 367 lặng yên nghe lặng yên nghe 368 tiếng đáp vang động 369 anh chàng bọ ngựa ban vừa lôi với nhảy vót lên 370 nguy cho chũi xem chàng chũi mệt 371 bọ ngựa ngơng ngáo nhớ chuyện ban quán hàng bực tơi trở lại 372 tơi lên đài quát 373 khoan khoan trước nhớ hẹn 374 bọ ngựa lùi lại tiếng rõ to nghênh hai gươm lên điệu khinh bạc tự cao tự đại ngô nghê 375 lại lệ trường đấu ngày trước vào bên biểu diễn vài đường quyền theo sở trường 376 bọ ngựa đứng vươn xong kiếm 377 bóng kiếm loang loáng mù mịt hoa may điệu đẹp mắt 231 378 chẳng cần hết 379 tơi đứng nghiêng người đằng trước hếch hai lên 380 hai đạp phóng tách liên liến hồi 381 gió tuôn thành luồng xuống bay áo xanh áo đỏ cô cào cào đứng gần 382 oai sức khỏe 383 lúc vào đấu bọ ngựa cao nên lợi địn 384 hai gươm bổ xuống đầu tơi chan chát 385 đầu đầu gỗ lim 386 tơi lựa cách đỡ khơng vần hết 387 cịn đoản người nhè bụng mà đá khiến có lúc phải hạ gươm xuống đỡ đà đâm loạng choạng 388 định lách gươm nghiêng vào khe họng tơi chỗ hiểm 389 cuống họng tơi có khe thịt dễ đứt chơi 390 thấy nguy tơi gỡ địn cúi xuống thúc nhanh sâu vào bụng 391 choáng người bọ ngựa nhảy lộn qua lưng tơi 392 tơi đợi 393 vừa đà lừa vào miếng võ gia truyền nhà dế 394 lấy đá hậu đánh phách 395 đá trời giáng vào mặt anh chàng 396 chàng bọ ngựa kiêu ngạo rú lên tiếng bắn tung lên trời rơi ngồi võ đài ngã vào đám đơng xơn xao 397 hạ địch thủ cách vẻ vang 398 đám hội đương ồn nhốn nháo khơng ngờ võ sĩ bọ ngựa giỏi võ vùng lại thua nhanh thua đau thua chàng dế mèn lạ mặt đâu đến 399 chưa hết cụ châu chấu cầm trịch lại trịnh trọng dơ loa lên ba lần đặn hô vang vang xuống 232 400 xin hỏi đông đủ võ sĩ thiên hạ tề tịu quanh võ đài 401 có cịn lên 402 đám hội im lặng 403 cụ châu chấu cầm trịch lại hô tiếp 404 trận tranh hùng kết thúc 405 đấu võ với chũi 406 nhìn sang chũi 407 vừa lúc chũi nhìn lại tơi 408 đến đất để đấu võ tranh quyền với ý 409 tơi tiến lại chũi đứng thẳng hai chân trước khốc vai chũi 410 hai hướng xuống võ đài 411 khắp bãi rờn bóng hoa may tụ tập hàng nghìn vạn lồi vùng xem hội võ 412 tơi nói to lên 413 thưa chư vị anh em vừa từ phương xa tới 414 chủ đích chúng tơi thật khơng định tranh lèo giật giải đất 415 đất lành chim đậu thấy phong tục vui chúng tơi đến góp mặt vui chung mà thơi 416 điều không chờ đợi anh hùng bốn phương lui mà nhường quyền đọ sức cao thấp sau cho anh em 417 với tranh đua anh em xin lỗi khơng thể 418 vị rõ 419 cịn ngơi thứ trách nhiệm anh em xin lỗi không dám 420 anh em hai kẻ giang hồ vốn trọng nghĩa khinh tài thấy đất que đẹp đẽ ghé tời đường mà khơng ý định đâu 421 dám xin chư vị xét cho 422 tơi vừa nói xong vang lên tiếng the thé tiếng ầm ầm 233 423 kẻ bảo phải mời thi đấu lệ vùng nghìn xưa 424 kẻ 425 cụ châu chấu cụ bọ ngựa cụ cành cạch cụ cào cào cụ niềng nghiễng 426 cụ nói với chúng tơi 427 thưa hai võ sĩ đất lành chim đậu 428 hai võ sĩ qua lại có lịng lên thi thố tài nghệ siêu quần 429 thiên hạ không đối địch 430 thật phúc cho chúng tơi 431 vả lệ đấu bỏ 432 nguyện vọng phong tục đất hàng bao đời chọn tài khơng thể khác 433 tơi hết lời từ chối 434 cịn chũi đứng lặng khơng nói 435 sau biết im lặng chũi có ý nghĩa riêng 436 tơi đành phải nhận 437 đám hội ầm vang lời hoan hơ tơn chúng tơi lên chánh phó thủ lĩnh đứng đầu làng vùng cỏ may 438 đám hội xô vào làm kiệu rước hai lên chen đám đông hoa cỏ may 439 chị cào cào áo xanh áo đỏ làm dun đứng nghiêng khn mặt dài ngoẵng nhìn theo đỗi lâu mến phục 440 tất tung cỏ tung hoa may dấu hiệu hoan hô 441 lồng dân cử hát rầm rộ 442 tất mừng rỡ cầm tay khiêu vũ 443 cành cạch với châu chấu cào cào với bọ muỗm nhảy múa linh đình 234 444 từ hang đến bãi đồng hoa may trắng ngát chân trời 445 bước lên đài uốn éo múa rung cánh trổ hát du dương 446 chũi hớn hở hết 447 lúc im khơng nói sợ tơi từ chối địa vị thủ lĩnh 448 đến thấy nhận lời chũi ta hét inh lên múa rối rít hai khiến bác cành cạch nhút nhát đầu sợ 449 tơi tơi buồn băn khoăn 450 nể q mà phải nhận lời thơi 451 tơi muốn thỏa chí nguyện đi đủ sung sướng 452 trái với chũi thú vị 453 bảo chũi 454 đừng tưởng thấy an nhàn mà vui 455 đời ta trẻ mà sống thấy an nhàn buồn tẻ khác hang quê nhà 456 chũi đừng quên đương dong duổi đường tìm ý nghĩa thật đời 457 mà đừng an nhàn giữ chân ta 458 việc đời khó khơng đâu 459 nhiên mùa đơng năm xảy việc biến lớn 460 cỏ may bờ đường tàn 461 bò gầy tọp giũi toét mũi chĩa rễ cỏ khô 462 người làng đồng gặt lúa 463 cánh đồng vàng rượi người ta lấy liềm gặt bó lượm địn sóc đâm ngang thành gánh quảy sân 464 mênh mơng cịn trơ lại gốc rạ khô 465 mùa rét tới 235 466 cánh đồng vắng ngắt màu xám trời màu xám đất liền vào có gió gào suốt đêm ngày 467 trẻ ngồi đồng lạnh tai đỏ hắt mũi 468 rét rúm chân 469 chẳng rốn cánh đồng không 470 phải tìm nơi tránh rét 471 phong phanh trời suốt mùa đơng đến chết 472 thành thói quen từ xưa mùa rét đến lồi sống vùng lại bỏ cánh đồng lạnh ngắt lạnh ngơ mà kiếm nơi tránh rét 473 có phải tranh cướp đánh tìm chỗ 474 mùa rét nhiều lồi khác tìm kiếm chỗ ấm thói quen châu chấu 475 tơi bảo chũi 476 có phải khơng chũi thấy đời chưa thể ngồi yên để cười 477 lo cho sống gay gắt lám 478 lồi phải xơ đẩy tìm chỗ ẩn cho mùa đơng tháng giá 479 chim nhỏ xấu số lạnh nằm chết tuyết 480 mùa đông đem rét khủng khiếp đến 481 tơi bảo bà 482 rét đến đồng 483 kíp tìm nơi ấm áp mà trú ẩn 484 chẳng lúc khơng cịn thấy bóng trời 485 bọn chuồn chuồn cánh mỏng cậu kỉm kìm kim ốm o biết khơng chịu nửa gió giật mị mẫm trước 486 cánh anh em nhà niềng nghiễng lặn xuống bùn với anh cọng vó bên cạnh cua ếch lo rét đương vội vã đắp mà lô nhô quanh bờ đầm ao 236 487 châu chấu cào cào bọ ngựa bọ muỗm tìm khe dứa dại 488 mùa đơng có bụi dứa dại xanh nguyên 489 dứa dỏng tai cứng lên trời xám 490 kẽ dứa sâu hoắm chui vào nằm chổng đuôi bất chấp gió mưa bên ngồi 491 chui vào nằm yên ngày xuân trở lại thấy ấm đậu xuống hai vai nghe thấy tiếng chim chích kêu vui tranh trách ngồi khe biết mùa tới lúc bước 492 chúng tơi đương tìm chỗ mùa đơng 493 tìm chỗ mùa đơng việc năm phải làm gian nan 494 khơng khơng đâu chỗ đến sắn chỗ 495 cảnh tranh dành đổ máu lại thường diễn 496 đồng mây đen cuồn cuộn gió tan tác mặt đất gió thổi lùa giá buốt vào tận ruột gan 497 không muốn cất bước 498 mà phải đi mãi chưa tìm thấy đâu chỗ ẩn náu 499 khe gốc đầy rẫy loài áo mỏng vào tránh rét chốn rét 500 sáng lại bỏ lại bỏ lại ven đường xác bạn đau thương mà chưa bới nơi trú ngụ 501 lại phải đánh 502 sống hai chết 503 có đánh giành chỗ 504 tiếng bàn tán than thở đám đông lúc xôn xao 505 anh bọ muỗm cao cẳng rón chân thám thính xem đến chưa 506 quân thám thính báo 507 đồn sau lưng chúng tơi la ó kêu ràm rĩ 508 họ khơng muốn 237 509 họ không 510 chù chừ lát 511 sau thấy đám đông ùn lên nhốn nháo 512 hùa theo 513 kêu lên xông vào đánh đánh chết thơi 514 kéo đến gốc dứa leo lên lách vào khe đầy gai cụ ngồi cắn châu chấu voi mà lôi giật lùi 515 khó chịu bọn châu chấu voi phải nhảy 516 phần tranh nhảy vào khe dứa hở 517 phần xúm lại đánh cho châu chấu voi không quay vào 518 bọn châu chấu voi khỏe 519 anh hùng dũng hiên ngang 520 chẳng trách họ mang tên châu chấu voi 521 châu chấu voi đương xông tới 522 sắc xanh biếc lưng cao nhọn ngang ngạnh lên 523 hai râu trổ hai đinh 524 chẳng cần biết yếu châu chấu voi to gấp lần châu chấu lăn xả vào vây đánh 525 đương hăng đương liều 526 choảng rối rít đến tận chiều chưa ngã ngũ bên bên thua 527 đám chui vào chiếm khe dứa sợ lại phải nhảo 528 chúng tơi long đong bên ngồi trời rét buốt đến tận óc 529 có điều đau đơn cho chũi bị châu chấu voi bắt làm tù binh 530 chũi bị châu chấu voi bắt làm tù binh 531 đêm trằn trọc lo không chợp mắt 532 mờ mờ hôm sau đơng hàng nghìn kéo vao vây rặng dứa 533 phải cứu chũi kì trước 238 534 xơ lên nhịm vào khe lạ thay rỗng tuếch khơng cịn bóng châu chấu voi 535 họ rút từ lúc 536 có lẽ sợ đông tránh hăng choảng thí mạng chúng tơi 537 họ từ ban đêm 538 dù xong nỗi lo mùa đông 539 chỗ ấm mà ngao ngán người 540 lúc rút chạy châu chấu voi mang tù bình 541 chũi tích 542 chúng tơi vào kín bụi dứa 543 ngày đêm khe gió hú gió gào bên ấm áp êm đềm thường 544 nơi ăn chốn đầy đủ tơi nói 545 trận xung đột vừa chẳng may em bị cầm tù 546 phải châu chấu voi đầy đến tận xứ xở không rõ 547 ngày trước anh em thề sinh tử 548 phải tìm trời cuối đất tơi gặp anh em tơi lại trở 549 xúm lại can ngăn không muốn để 550 tù chân chỗ lâu tơi nóng ruột 551 biết khơng thể lưu lại ngao ngán 552 họ dặn dặn lại tìm chũi phải trở 553 chư vị yên tâm 554 mặt đất rộng mà hẹp 555 gặp 556 chia tay lưu luyến bịn rịn không khóc lịng nao nao bùi 239 ngùi 557 cảnh biệt ly chẳng 558 khăn gói gió đưa tơi lại bước chân 559 tàn mùa hoa may từ lâu 560 đồng bãi bờ ruộng xám mờ đám gốc rạ gốc cỏ trẻ chăn trâu nhổ lên chất đống để đốt sưởi 561 đám khói cỏ may xanh ngắt vịm trời gió buốt rợn thê lương 562 trời đông rét run cánh run râu mà làng châu chấu nhảy ngồi khe đội gió tiễn tơi qua dặm đường chịu trở lại 563 đuổi theo châu chấu voi lần mị tìm kiếm thăm hỏi 564 ngược lên phía bắc ngắm bụi mùa đơng trơ trụi xa xa mà tới 565 bước cao bước thấp hết mùa đông sang mùa xuân 566 có tơi ngửa mặt lên vịm khơng gọi to 567 em em đâu ... tin liên quan đến vật trưng bày v.v… Chính việc sâu nghiên cứu đặc trưng ngôn ngữ tiếng Việt, khai thác, áp dụng đặc trưng vào hệ thống nhận dạng, tổng hợp tiếng nói để nâng cao chất lượng tổng... với đặc thù ngôn ngữ tiếng Việt, đáp ứng nhu cầu ứng dụng ngày cao xã hội Xuất phát từ thực tế lý trên, việc lựa chọn đề tài ? ?Nghiên cứu đặc trưng tín hiệu ràng buộc ngôn điệu để nâng cao chất lượng... formant điệu để nâng cao chất lượng nhận dạng tiếng Việt  Nghiên cứu nhận dạng điệu tiếng Việt  Nghiên cứu đưa đặc trưng điệu, tham số formant tham số cấu âm người nói để nâng cao chất lượng

Ngày đăng: 22/02/2016, 10:24

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan