báo cáo tìm hiểu về môn xử lý tiếng nói

11 630 0
báo cáo tìm hiểu về môn xử lý tiếng nói

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

XÂY DỰNG BỘ TỔNG HỢP TIẾNG VIỆT Tạo sở liệu tiếng nói Ghép nối âm vị kép Tổng hợp điệu • • • • I.Tạo sở liệu tiếng nói: Tiến hành ghi âm âm vị kép đảm bảo yêu cầu chiều dài, biên độ, tần số để phục vụ cho ghép nối Tần số chênh lệch điểm ghép nối âm vị kép nhỏ Biên độ điểm ghép nối phải đảm bảo chuyển tiếp trơn hai âm vị kép ghép nối Chiều dài âm vị kép phải đảm bảo thích hợp để tiếng nói tổng hợp tự nhiên PP Hạn chế chênh lệch tần số điểm ghép nối hai âm vị kép • • Đường biểu diễn tần số âm vị kép phẳng tốt tần số âm vị kép chọn 165Hz, dải tần số âm vị kép khoảng 160-170 Hz phù hợp cho tổng hợp PP Hạn chế chênh lệch lượng (biên độ) • Các âm vị kép ghi âm sau chuẩn hóa biên độ cực đại giá trị định • Không ghép nối trực tiếp điểm với điểm cách cộng chồng khung cuối âm vị kép thứ với khung đầu đầu âm vị kép thứ hai => làm giảm tối thiểu chênh lệch điểm ghép nối Chiều dài âm vị kép • • Chiều dài âm vị kép phải ghi âm với chiều dài phù hợp Chiều dài trung bình ngữ cảnh không dài không ngắn II.Ghép nối âm vị kép Thực thuật toán TD-PSOLA cần xác định: • • • • Sự chênh lệch lượng điểm ghép nối Sự chênh lệch tần số điểm ghép nối Sự lệch pha chu kỳ điểm ghép nối Sự chênh lệch miền tần số Sự chênh lệch lượng điểm ghép nối • Chuẩn hóa âm vị kép sở liệu tiến hành cho lượng cực đại toàn âm vị kép, cho điểm ghép nối Sự chênh lệch tần số điểm ghép nối • Nếu ghép âm vị kép sau lấy từ sở liệu dẫn đến chênh lệch tần số điểm ghép nối =>dẫn đến không tự nhiên tiếng nói tổng hợp tai người nhạy cảm không trơn tần số Sự lệch pha chu kỳ điểm ghép nối • Do vị trí điểm đánh dấu pitch hai chu kỳ không xác định vị trí tương ứng với nhau (tức giá trị tương quan chéo hai chu kỳ với gốc điểm đánh dấu pitch tương ứng chưa phải giá trị cực đại) III.Tổng hợp âm điệu có dấu • • Việc tổng hợp âm điệu có dấu thường tiến hành cách biến đổi tần số âm điệu không dấu theo đường biểu diễn tần số mô hình hóa Tất âm có biến đổi tần số theo mô hình tần số chung Khó khăn thực thực tế • • Xác định đường biểu diễn tần số chung cho tất âm điệu khó chưa có chuẩn đường biểu diễn tần số công bố cho việc sử dụng rộng rãi Ngoài tần số ra, có yếu tố khác chiều dài phát âm, phân bố lượng theo chiều dài âm (đường bao biên độ),… ảnh hưởng đến điệu

Ngày đăng: 17/10/2016, 22:31

Từ khóa liên quan

Mục lục

  • Slide 1

  • I.Tạo cơ sở dữ liệu tiếng nói:

  • Slide 3

  • PP Hạn chế sự chênh lệch năng lượng (biên độ)

  • Chiều dài của các âm vị kép

  • II.Ghép nối các âm vị kép

  • Sự chênh lệch về năng lượng tại điểm ghép nối.

  • Sự chênh lệch tần số cơ bản tại điểm ghép nối.

  • Sự lệch pha giữa 2 chu kỳ tại điểm ghép nối

  • III.Tổng hợp âm thanh điệu có dấu

  • Khó khăn khi thực hiện trong thực tế

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan