... đặt đề bài " khỏc ca bi vit trờn:ã phuongthucbieudatbai tieng noi cua van ngheã soanbai khi con tu hu ngu van 8ã xem phuongthucbieudat cua bai tho khi con tu hu, ... đầu đìnhEm xinh em đứng một mình cũng xinh. (Ca dao)đ) Nếu ta đẩy quả địa cầu quay quanh trục theo hướng từ tay trái sang tay phải mà chúng ta gọi là hướng từ tây sang đông thì hầu hết các ... điểm trên bề mặt quả địa cầu đều chuyển động, đều thay đổi vị trívà vẽ thành những đường tròn. (Theo Địa lí 6)Gợi ý: Mục đích giao tiếp của các văn bản:a) Kể lại chuyện Tấm bị Cám lừa lấy hết...
... chiều là làm tăng sự khó khăn trong bài toán đánh giá với số chiều d của không gian, theo nguyên tắc, sẽ tăng theo hàm mũ với số mẫu của các đặc tính của không gian. Việc này bao gồm một bài toán ... tắt Từ Tiếng Anh Tiếng Việt CSDL Database Cơ sở dữ liệu DF Document Frequency Tần xuất tài liệu ERM Empirical Risk Minimization Tối thiểu hoá rủi ro theo kinh nghiệm IG Information Gain ... nhận thông tin KDD Knowledge Discovery in Database Khai phá tri thức trong CSDL KNN K Neighbourhood Nearest K láng giêng gần nhất ODM Oracle Data Mining Khai phá dữ liệu Oracle SVM Support...
... Language and Culture, College of Foreign Languages, Vietnam National University, Hanoi, Pham Van Dong Street, Cau Giay, Hanoi, Vietnam Frequency uses of negative words and negative sentences ... thân. Cứ ở nhà này. - Không. - Thế thì tôi đi với mợ. (Nó sợ hãi) - Không. (sđd: Diệp Quang Ban, 2004) [7] 2.2.2. Sử dụng phươngthức suy luận để tri nhận A. Phủ định bằng phươngthức không ... hy vọng thực hiện được công việc. Ngữ nghĩa trong các cấu trúc hình thức trên được giải thích theo nội dung nhà nghiên cứu ngữ pháp tiếng Hán Chu Đức Hi (Trung Quốc) đã tổng kết như sau: 1....
... khổ thân. Cứ ở nhà này. -Không. -Thế thì tôi đi với mợ. Nó sợ hÃi -Không. (sđd: Diệp Quang Ban, 2004)[7] 2.3.2. Sử dụng phơng thức suy luận để tri nhận 58 và khác nhau trong ... lại hy vọng thực hiện đợc công việc. Ngữ nghĩa trong các cấu trúc hình thức trên đợc giải thích theo nội dung nhà nghiên cứu ngữ pháp tiếng Hán Chu Đức Hi (Trung Quốc) đà tổng kết nh sau: 1.Hễ ... xảy ra, bèn nói giọng buồn bÃ: quả đó suýt nữa không vào lới: đà vào lới, không thể hiểu theo nghĩa là: không vào lới đợc). Điều này đòi hỏi chúng ta cần xem xét kỹ càng hơn đặc trng...
... đó làm cho việc tính toán NB hiệu quả và nhanh chóng hơn các phương pháp khác với độ phức tạp theo số mũ vì nó không sử dụng việc kếp hợp các từ để đưa ra phán đoán chủ đề. 2.2.4.2. Công thức ... đích chính là tính được xác suất Pr( , )Cj d′, xác suất để vănbản d′ nằm trong lớp Cj. Theo luật Bayes, vănbản d′ sẽ được gán vào lớp Cj nào có xác suất Pr( , )Cj d′cao nhất. ... chớnh xỏc trờn 97% [inh in et al, 2001] ắ Mụ hỡnh cho kt qu phõn on t vi tin cy (xỏc sut) kốm theo. ắ Nhờ có tầng mạng neural nên mô hình có thể khử nhập nhằng các trường hợp tầng WFST cho...
... sinh khi biểu diễn vănbảntheo hướng vector đặc trưng chính là việc chọn đặc trưng và số chiều cho không gian. Cần phải chọn bao nhiêu từ và chọn những từ nào ? theo những cách nào ? Có nhiều ... tin tức điện tử Do đó mà số lượng vănbản xuất hiện trên mạng Internet cũng tăng theo với một tốc độ chóng mặt. Theo số lượng thống kê từ Broder et al (2003), lượng thông tin đó lại tăng gấp ... dictionary) chỉ chứa các thành phần của từ và ngữ như hình vị và các từ đơn giản trong tiếng Hoa. Tùy theo cách chọn để khớp từ (match), hướng tiếp cận “full word/ phrase” có thể được chia ra thành...
... cứu về Phát hiện tri thức trong cơ sở dữ liệu (Knowledge Discovery in Database) ra đời với bài toán Khai phá dữ liệu (DataMining) làm trung tâm nghiên cứu. Các tư tưởng nghiên cứu và các thuật ... quyết định, mạng nơ-ron Hầu hết các thuật toán nghiên cứu cho DataMining là tập trung trên các nguồn số liệu có cấu trúc (structured data). Nhưng phần lớn thông tin mà chúng ta lưu trữ và trao ... ngày lại được lưu trữ dưới các dạng dữ liệu bán cấu trúc (semi-structured data) hoặc phi cấu trúc (non-structured data). Ví dụ như trong các nhà xuất bản, hệ thống các trang web trên một website,...
... liệu.Tuỳ theo yêu cầu ràng buộc cụ thể của bài toán mà tasử dụng các mô hình biểu diễn vănbản cho phù hợp.2.6 Áp dụng phương pháp véc-tơ thưa trong lưu trữ văn bảnKhi biểu diễn vănbảntheo mô ... đề jC2. Tính tổng số từ của mỗi lớp jC3. Tính xác xuất của chủ đề jC đối với vănbản d theo công thức4.( )iP C d=1 2( ( | )* ( | )* * ( | ))j j m jP word C P word C P word C*(Tổng ... thử nhất. Lớp của vănbản thửchính là lớp mà véc-tơ trọng tâm đại diện. Khoảng cách được tính theo độ đo cosine. (): 1. Tính trọng tâm iC của lớp thứ i 2. Tính độ tương đồng *cos(...
... (Joachims, 1998). Dữ liệu huấn luyện và kiểm thử Kt qu thc nghimãD liu hun luyn (data train) và kiểm thử (data test) được sử dụng gồm 4936 tài liệu được lấy từ trang http://vnexpress.net. ... vi SVM (tip)ãB phõn loi SVM c nh ngha:ãTrong ú ãNu f(x)=+1 thỡ x thuc v lp dng (lnh vc c quan tõm)ãNu f(x)=-1 thỡ x thuc về lớp âm (các lĩnh vực khác) ( ) (w )Tf x sign x b= +( )...
... Thoi gian tim tap pho bien02000400060003000 4000 5000So van ban So giay 70%80%90% Hình 3.Biểu đồ phân tích thời gian xử lý theo số vănbản và ngưỡng minsupp Độ chính xác của kết quả ... binary and fuzzy association rules from database, In Proc of AFSS2000 intl. Conf on Fuzzy Set and Application, Tsukuba, Japan, pp 981-986 [4]. Diệp Quang Ban, Hoàng Văn Thung (2000), Ngữ pháp ... lập với ngôn ngữ. Phương pháp xử lý của QTAG có thể mô tả tổng quát như sau. Nó được xây dựng theo tiếp cận máy học từ khối ngữ liệu học đã được gán nhãn bằng tay. Dựa vào những dữ liệu đã...