0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Tài liệu Báo cáo khoa học: "Mining Wiki Resources for Multilingual Named Entity Recognition" pdf

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Mining Wiki Resources for Multilingual Named Entity Recognition" pdf

... pages 1–9,Columbus, Ohio, USA, June 2008.c2008 Association for Computational LinguisticsMining Wiki Resources for Multilingual Named Entity Recognition Alexander E. Richman Patrick Schone ... is available for download (download.wikimedia.org) in a text format suitable for inclusion in a database. For the remainder of this paper, we refer to this format. 1 Within Wikipedia, we ... annotated contains no Wikipedia specific information or formatting. In the second pass, we look for strings of 2 to 4 words which were not wikilinked but which have Wikipedia entries of their...
  • 9
  • 429
  • 1
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: " Mining the Web for Language Learning" pdf

... therefore cannot cover fresh words ornew usages of existing words. Secondly, their search1http://www.engkoo.com.functions are often limited, making it hard for usersto effectively find information ... built for Chinese users who arelearning English; however the technology it-self is language independent and can be ex-tended in the future. At a system level, En-gkoo is an application platform ... Specifically, web pages that containboth Chinese and English are discovered andanalyzed for parallelism, extracted and for- mulated into clear term definitions and sam-ple sentences. This approach allows...
  • 6
  • 658
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Using Structural Information for Identifying Similar Chinese Characters" pdf

... Volume), pages 93–96,Columbus, Ohio, USA, June 2008.c2008 Association for Computational LinguisticsUsing Structural Information for Identifying Similar Chinese Characters Chao-Lin Liu Jen-Hsiang ... pronunciations or in their internal structures are useful for computer-assisted language learning and for psycholinguistic studies. Al-though it is possible for us to employ image-based methods to identify ... more Chinese characters form a Chinese word to carry a meaning, although there are Chinese words that contain only one Chinese character. For in-stance, a translation for “conference” is “研討會”...
  • 4
  • 415
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Kinds of Features for Chinese Opinionated Information Retrieval" pdf

... set of features for text classification (index-ing) for an OIR query of the first level (finds opin-ionated information) and for an OIR query of thesecond level (finds opinionated information withsentiment ... politics.We therefore believe that a system capable of pro-viding access to opinionated information in otherlanguages (especially in Chinese) might be of greatuse for individuals as well as for institutions ... 37–42,Prague, June 2007.c2007 Association for Computational LinguisticsKinds of Features for Chinese Opinionated Information RetrievalTaras ZagibalovDepartment of InformaticsUniversity of SussexUnited...
  • 6
  • 434
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Incorporating Context Information for the Extraction of Terms" pdf

... 1996), incorporating information gained from the textual context of the candidate term. 2 Context information for terms The idea of incorporating context information for term extraction came ... product. Since context carries information about terms it should be involved in the procedure for their ex- traction. We incorporate context information in the form of weights constructed in ... terms, domain-dependent linguistic information (i.e. mor- phology) is used (Ananiadou, 1994). Multi-word ATR usually uses linguistic information in the form of a grammar that mainly allows...
  • 3
  • 369
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Clique-Based Clustering for improving Named Entity Recognition systems" pot

... processing. For instance the NE Oxford illus-trates the different ambiguity types that are inter-esting to address:• intra-annotation ambiguity: Wikipedia listsmore than 25 cities named Oxford in ... IntroductionIn Information Extraction domain, named entities(NEs) are one of the most important textual unitsas they express an important part of the meaningof a document. Named entity recognition ... 51–59,Athens, Greece, 30 March – 3 April 2009.c2009 Association for Computational LinguisticsClique-Based Clustering for improving Named Entity Recognition systemsJulien Ah-PineXerox Research Centre...
  • 9
  • 297
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Statistical Model for Unsupervised and Semi-supervised Transliteration Mining" pptx

... labelled information for training. Our sys-tem extracts transliteration pairs in an unsupervisedfashion. It is also able to utilize labelled informationif available, obtaining improved performance.We ... of the Association for Computational Linguistics, pages 469–477,Jeju, Republic of Korea, 8-14 July 2012.c2012 Association for Computational LinguisticsA Statistical Model for Unsupervised ... alignment-basedstring similarity for transliteration mining. Thesemethods model the conditional probability distribu-tion and require supervised/semi-supervised infor-mation for learning. We propose...
  • 9
  • 521
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Mining Wikipedia Revision Histories for Improving Sentence Compression" docx

... bountiful resource for such training data,which we obtain by mining the revision his-tory of Wikipedia for sentence compressionsand expansions. Using only a fraction of theavailable Wikipedia data, ... pages 137–140,Columbus, Ohio, USA, June 2008.c2008 Association for Computational LinguisticsMining Wikipedia Revision Histories for Improving Sentence CompressionElif Yamangil Rani NelkenSchool ... importance.2 Data: Wikipedia revision histories as asource of sentence compressionsMany researchers are increasingly turning toWikipedia as a large-scale data source for trainingNLP systems....
  • 4
  • 328
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Mining User Reviews: from Specification to Summarization Xinfan Meng Key Laboratory of Computational Linguistics " doc

... struc-ture information and unit of measurementinformation are mined from the specifi-cation to improve the accuracy of featureextraction. At summary generation stage,hierarchy information in ... to users. For example, for feature “size”, descriptions like “small” and “thin”are more readable than “positive”.Usually, the words used to describe a productfeature are short. For each product ... which de-scribes the entity of interest. M. Gamon et al.(2005) clusters sentences in reviews, then labeleach cluster with a keyword and finally providea tree map visualization for each product...
  • 4
  • 428
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Mining metalinguistic activity in corpora to create lexical resources using Information Extraction techniques: the MOP system" doc

... information about sublanguage usage is being put forward. But the usefulness of robust NLP applications for special-domain text goes beyond glossary updates. The kind of categoriza-tion information ... informational segments are not meant to be read by laymen, but used by do-main lexicographers reviewing existing glossaries for neological change, or, for example, in machi-ne-readable form ... components described be-low (autonym, informative segment and mar-kers/operators) was the criteria for classification. Reliability of human subjects for this task has not been reported in...
  • 8
  • 459
  • 0

Xem thêm

Từ khóa: tài liệu báo cáo khoa học bản chất của khủng hoảng kinh tế thế giới pdftài liệu báo cáo nghiên cứu khoa họctài liệu về báo cáo khoa họcbáo cáo khoa học tài chính côngbáo cáo khoa học số loài quý hiếm tại vườn quốc gia ba bểtai lieu bao cao thuc tap khoa co khiBáo cáo quy trình mua hàng CT CP Công Nghệ NPVNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhPhát triển mạng lưới kinh doanh nước sạch tại công ty TNHH một thành viên kinh doanh nước sạch quảng ninhNghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chếNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Sở hữu ruộng đất và kinh tế nông nghiệp châu ôn (lạng sơn) nửa đầu thế kỷ XIXChuong 2 nhận dạng rui roTăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtNguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtMÔN TRUYỀN THÔNG MARKETING TÍCH HỢPQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ