Nghiên cứu cải tiến một số phương pháp phân loại văn bản tự động và áp dụng trong xử lý văn bản tiếng Việt

119 922 1
Nghiên cứu cải tiến một số phương pháp phân loại văn bản tự động và áp dụng trong xử lý văn bản tiếng Việt

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

. trong tiếng Việt 35 4.1.2. So sánh tiếng Việt và tiếng Anh 37 4.2. Bài toán phân loại văn bản tiếng Việt 38 4.3. Vấn đề tách từ trong văn bản tiếng Việt 39 4.3.1. Tách từ trong văn bản tiếng Việt. NGHIÊN CỨU CẢI TIẾN MỘT SỐ PHƯƠNG PHÁP PHÂN LOẠI VĂN BẢN TỰ ĐỘNG VÀ ÁP DỤNG TRONG XỬ LÝ VĂN BẢN TIẾNG VIỆT Ngành: Công nghệ thông tin Chuyên ngành: Công nghệ phần mềm Mã số: . nghiệm phân loại văn bản tiếng Việt sử dụng một số thuật toán tiêu biểu. - Nghiên cứu một số hƣớng cải tiến của phân loại văn bản phù hợp với bối cảnh Việt Nam và tiếng Việt. + Sử dụng phân

Ngày đăng: 25/03/2015, 09:55

Từ khóa liên quan

Mục lục

  • MỤC LỤC

  • Danh sách các hình

  • Danh sách bảng

  • Danh sách từ viết tắt

  • Bảng thuật ngữ Anh-Việt

  • MỞ ĐẦU

  • 1. Cơ sở khoa học và tính thực tiễn của đề tài.

  • 2. Phạm vi và mục đính nghiên cứu của để tài

  • 3. Bố cục và cấu trúc của luận văn

  • 1.1. Tổng quan

  • 1.2. Các bƣớc chính trong bài toán phân loại văn bản

  • 2.1. Các vector thuộc tính

  • 2.2. Việc lựa chọn thuộc tính

  • 2.2.1. Loại bỏ các từ dừng

  • 2.2.2. Xác định gốc của từ

  • 2.2.3. Lựa chọn thuộc tính

  • 2.3.1. Ngƣỡng tần xuất văn bản (DF)

  • 2.3.2. Lợi ích thông tin (IG)

  • 2.3.3. Thông tin tƣơng hỗ (MI)

  • 2.3.5. Cƣờng độ của từ (TS)

Tài liệu cùng người dùng

Tài liệu liên quan