Xây dựng hệ thống trợ giúp người cơ tu học tin học văn phòng

25 385 0
Xây dựng hệ thống trợ giúp người cơ tu học tin học văn phòng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

B GIÁO DO ĐẠI HỌC ĐÀ NẴNG BÙI THANH PHÚ XÂY DỰNG HỆ THỐNG TRỢ GIÚP NGƯỜI TU HỌC TIN HỌC VĂN PHÒNG Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2013 Công trình c hoàn thành ti ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: PGS.TS. PHAN HUY KHÁNH Phản biện 1: TS. HUỲNH CÔNG PHÁP Phản biện 2: TS. NGUYỄN MẬU HÂN Lun vn c bo v trc Hi ng chm Lun vn tt nghip th thut hp ti i hc à Nng vào ngày 18 tháng 5 nm 2013. thể tìm hiểu luận văn tại: - Trung tâm Thông tin - Hc liu, i Hc à Nng 1 MỞ ĐẦU 1. Lý do chọn đề tài  ng c     vit c      t trong nhng b phn cu thành to nên mt Nam m n sc dân t Ti mai mt và mc bit, th h tr ngày nay nhip cn ni t nh nên không bit ting m  t truyn ch vit ca    rt cp thit, rt cn mt gii pháp nhm bo tn ch vit cng bào. n Trung t chc dy hc ni trú cho con ng bào nhiu kinh nghim v phát trin kinh tc kho, bo tn và phát huy các giá tr c sc ca các dân tc, gi vng an ninh biên gii . Quá trình dy ci vi hp nhiu p hng s m th các em hng thi vì tr ngi v mt ngôn ng nên các em hg vic tip thu kin thc, t bit là các môn t c.                                T các thc t    xu  tài: “Xây dựng hệ thống trợ giúp học sinh người Cơtu học tin học văn phòng”. 2 2. Mục tiêu của đề tài u các v v x lý ngôn ting Vi  thut tách t ting Vit, kho ng vng song ng, xây dng h thng hi- ng. Xây dng kho ng vu trúc m và d k th phc v  lý ngôn ng t nhiên (Vit- khác. Khai thác kho ng v xây dng h hi- ng Vit-  cnh hn ch  h tr cho hc tin h 3. Đối tượng và phạm vi nghiên cứu   Tìm hiểu lý thuyết Tìm hi pháp ca ting Vit, ti him khác nhau gia ting Vit và ti Tìm hiu lý thuyt v h thng hi- ng, k thut tách t ting Vi d li, cách t chc kho ng vng song ng bng XML. Phân tích cu trúc các câu hng g cu trúc câu Vit-ng cho các câu. Cập nhật kho ngữ vựng Cơtu Thu thp d liu t các mu câu, trích rút t vng t các mu  xây dng kho ng vng Vit-c v cho h thng hi-  ng. Xây dựng ứng dụng Xây dng h thng hi- ng Vit- h tr hc c tin hc v 3 4. Giả thiết nghiên cứu H thng s phát huy ht tác dng n vt cht và ngun nhân lc v công ngh thông tin t hoàn thin. Vic ng dng ca tin hc vào cuc sc chính quyo u ki phát tring bào nhing ng và s dng các h th tìm hiu v nc sng. 5. Phương pháp nghiên cứu Thu thp d liu t các hc sinh trong quá trình hc. Phân tích t vng và mu câu Vit-ng. Xây dng kho ng vng ci d ta th miêu t d dàng ni dung ca tài li  t, m rng, chuynh dng d liu. Tìm hiu các công c phù h phc v cho công vic lp trình, Khai thác kho ng v  xây dng ng dng hi-  ng. Kim th t qu. 6. Ý nghĩa khoa học và thực tiễn của đề tài: Ý nghĩa khoa học: Nm bc các v n trong x lý ting Vit, ti cho các bài toán x lý ngôn ng t nhiên cho ngôn ng ca các dân tc thiu s i- ng, t  Ý nghĩa thực tiễn: Phc v cho công tác dy và hc ca thy ng THPT Phm Phú Th nhm to thun li cho hc sinh trong vic tip thu kin thc khoa hc, góp phn nâng cao dân trí cho  7. Cấu trúc luận văn  4 Chương 1. Nghiên cứu tổng quan:  tng quan v h thng hi-áp t h câu hi và tìm kim câu tr li trong h thng hi- ng. Các quy tc son thn. Chương 2. Tìm hiểu ngôn ngữ : u v các  m ca hai ngôn ng ting Vit và ti     ging và khác nhau ca hai ngôn ng. Chương 3. Xây dựng hệ thống hỏi-đáp tự động Việt-Cơtu nhằm hỗ trợ học sinh người Cơtu học tin học văn phòng:  xut gii pháp rút trích t khóa, gom cm và tìm kim câu tr li. 5 CHƯƠNG 1 NGHIÊN CỨU TỔNG QUAN 1.1 HỆ THỐNG HỎI-ĐÁP TỰ ĐỘNG Nhng th m ca ngi dùng di d truy vn s c tìm ki và t v mt cách ngn g là nhng gì mà hmong mun. ó chính là mc tiêu ca h tng i- áp  ng.  này s trình bày   1.1.1 Giới thiệu hệ thống hỏi-đáp tự động và lịch sử phát triển a) Giới thiệu hệ thống hỏi-đáp tự động hng i-áp  ng liên quan  3 nh c ln là  lý ngôn ng  Language Processing), tìm ki thông tin (Information Retrieval) và rút trích thông tin (Information Extraction). hai lo h thng i-áp:   tng hi-p nh c h   tng hi-áp nh vc rng b) Sơ lược lịch sử phát triển 1.1.2. Kiến trúc hệ thống hỏi-đáp tự động Mô hình c bn ca h thng IR k trúc nh sau: Hình 1.2 - Hệ thống tìm kiếm thông tin 6 Các h thng IR thng không giúp c ngi s dng tìm ra chính xác thông tin mà ngi dùng  nó ch t tng hp các thông tin n  trong hng và tìm các v b liên quan n yêu  ca ngi s dng. Tính nng này là mt bc  g hn dng mt h thng hi-áp.  trúc chung ca các  thng i-áp th dng nh sau: Hình 1.3- Kiến trúc hệ thống hỏi-đáp a) Giao diện người dùng (User Interface) b) Phân tích câu hỏi (Question Analyzer) c) Tìm kiếm dữ liệu (Data Retrieval) d) Rút trích câu trả lời (Answer Extraction) e) Chiến lược xếp hạng (Ranking) f) Xác minh câu trả lời (Answer Verification) 1.1.3 Một số vấn đề quan tâm khi xây dựng hệ thống hỏi- đáp tự động  Loi câu hi  X lý câu hi  Ng cnh và h thng h  Ngun d liu cho h thng h 7  Trích xut câu tr li 1.2 CÁC PHƯƠNG PHÁP PHÂN TÍCH CÂU HỎI VÀ TÌM KIẾM CÂU TRẢ LỜI Ba bc quan trng  trong  thng hi-áp là: phân tích câu hi, tìm k tài liu cha câu tr li và rút trích câu  li  tài  Do mc tiêu ca lu vn là hng n mt h tng hi-áp cho mt m c th là  v các  thù trình bày trong  m  không nhu u rút trích thông tin câu tr li  tài l nên chúng tôi trình bày trong cng này hai i dung chính là các ph phân tích câu hi và các ph tìm ki. 1.2.1 Phương pháp phân tích câu hỏi             -   hai ph pháp phân tích câu hi, cng c xem nh hai phng pháp ca h thng i-áp . ó là ph pháp nông và ph pháp sâu. a) Phương pháp nông (Shallow Method) b) Phương pháp sâu (Deep Method) 1.2.2 Tìm kiếm thông tin  tìm km thông tin  qu các tài liu thc chuyn i thành các cách bi di tài li thích hp. nhiu ph pháp khác nhau c u c tng hp nh sau:  Các mô hình lý thuyt tp hp  i s  Các mô hình xác sut  Mô hình không gian vector 8 1.2.3 Phương pháp gom cụm dữ liệu a) Thuật toán K-Means Input: K, và d  v n m ca m s   Output:  K cm sao cho cc tiu v tng bình ph sai. Thuật toán:  c 1: Chn ngu nhiên K mu vào K cm. Coi tâm ca cm chính là mu trong cm.  c 2: Tìm tâm mi ca cm.  c 3: Gán (gán li) các mu vào tng cm sao cho khong cách t m n tâm ca c nht.  c 4: Nu các cm không s i nào sau khi thc hic 3 thì chuyc li chuyn c 2.  Bc 5: Dng thut toán. b) Thuật toán HAC HAC (Hierarchical Agglomerative Clustering) là   phân cm không giám sát (không c bi c s c  vào) nhng ph c dng. Thu toán HAC th tóm n nh sau:  s N ph  và ma ng cách N*N  c 1: Bu cho mi phn t vào mt phân vùng ca nó. Nu N phn t thì N phân vùng khi to  c 2: Tìm cp phân vùng khong cách nh nht và hp li thành mt phân vùng. Lúc này s t  c 3: Tính khong cách gia phân vùng mi vi các phân vùng còn li  c 4: Lp lc 2, n khi ch còn li mt phân vùng hoc tha mu kin d

Ngày đăng: 31/12/2013, 10:31

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan