0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "A Stacked Sub-Word Model for Joint Chinese Word Segmentation and Part-of-Speech Tagging" potx

Báo cáo khoa học:

Báo cáo khoa học: "A Cascaded Linear Model for Joint Chinese Word Segmentation and Part-of-Speech Tagging" pdf

... seg-mentation only and joint segmentation and part-of-speech tagging. On the Penn Chinese Treebank 5.0, we obtain an error reduction of18.5% on segmentation and 12% on joint seg-mentation and part-of-speech ... 897–904,Columbus, Ohio, USA, June 2008.c2008 Association for Computational LinguisticsA Cascaded Linear Model for Joint Chinese Word Segmentation and Part-of-Speech TaggingWenbin Jiang†Liang Huang‡Qun ... tagging (Collins, 2002), Chinese word seg-mentation (Ng and Low, 2004; Zhang and Clark,2007) and so on. We trained a character-based per-ceptron for Chinese Joint S&T, and found that theperceptron...
  • 8
  • 445
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "An Error-Driven Word-Character Hybrid Model for Joint Chinese Word Segmentation and POS Tagging" docx

... discriminative word- character hybrid model for joint Chi-nese word segmentation and POS tagging.Our word- character hybrid model offershigh performance since it can handle bothknown and unknown words. ... ACL and the 4th IJCNLP of the AFNLP, pages 513–521,Suntec, Singapore, 2-7 August 2009.c2009 ACL and AFNLPAn Error-Driven Word- Character Hybrid Model for Joint Chinese Word Segmentation and ... litera-ture.1 IntroductionIn Chinese, word segmentation and part-of-speech (POS) tagging are indispensable steps for higher-level NLP tasks. Word segmentation and POS tag-ging results are...
  • 9
  • 338
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Stacked Sub-Word Model for Joint Chinese Word Segmentation and Part-of-Speech Tagging" potx

... Association for Computational LinguisticsA Stacked Sub -Word Model for Joint Chinese Word Segmentation and Part-of-Speech TaggingWeiwei SunDepartment of Computational Linguistics, Saarland UniversityGerman ... inter-mediate sub -word structure for joint segmentation and tagging. Since the sub-words are large enoughin practice, the decoding for POS tagging over sub-words is efficient. Finally, the Chinese ... In this work, stacked learning isused to acquire extended training data for sub -word tagging.3 Method3.1 ArchitectureIn our stacked sub -word model, joint word segmen-tation and POS tagging...
  • 10
  • 412
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Hybrid Hierarchical Model for Multi-Document Summarization" ppt

... paper, we formulate ex-tractive summarization as a two step learn-ing problem building a generative model for pattern discovery and a regression model for inference. We calculate scores for sentences ... hierarchical model and re-gression model to score sentences in new docu-ments, eliminating the need for building a genera-tive model for new document clusters.3 Summary-Focused Hierarchical Model Our ... model. Then, using thesescores, we train a regression model basedon the lexical and structural characteris-tics of the sentences, and use the model toscore sentences of new documents to forma...
  • 10
  • 559
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Unified Graph Model for Sentence-based Opinion Retrieval" pdf

... The Lexicon of Chinese Positive Words, which consists of 5,054 positive words and the Lexicon of Chinese Negative Words, which consists of 3,493 negative words; (2) The opinion word lexicon ... notion of topic-sentiment word pair, which consists of a topic term and a sentiment word. A word pair maintains the asso-ciative information between the two words, and enables systems to draw ... consists of 2,812 positive words and 8,276 negative words; (3) Sentiment word lexicon and comment word lexicon from Hownet. It contains 1836 posi-tive sentiment words, 3,730 positive com-ments,...
  • 9
  • 585
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A probabilistic generative model for an intermediate constituency-dependency representation" pptx

... re-ranking model performs rather well for a limited number of candidate structures, and out-performs Charniak’s model when k = 5. In thiscase we observe a small boost in performance for the detection ... structure. It models the eventof filling B with a content word (cw), given thecontent word of the governing block, the cate-gories (cats) and functional words (f w) of B, and further information ... consistently outper-forms the PCFG model on this metric, as for UAS, and BAS. Concerning the other metrics, as thenumber of k-best candidates increases, the PCFG model outperforms the TDS-reranker...
  • 6
  • 555
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Phonotactic Language Model for Spoken Language Identification" pptx

... another. Therefore, one can easily draw the analogy between an acoustic token in bag-of-sounds and a word in bag-of-words. Unlike words in a text document, the phonotactic information that ... n-character slice for text categorization by lan-guage (Cavnar and Trenkle, 1994) and Phone Rec-ognition followed by n-gram Language Modeling, or PRLM (Zissman, 1996) . Orthographic forms of language, ... information from acous-tic model and n-gram LM for language l. We have and {,AM}LLMlllλλλ= ( 1, , )llλ∈Λ =. A maxi-mum-likelihood classifier can be formulated as follows: ()(ˆargmax...
  • 8
  • 436
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Localized Prediction Model for Statistical Machine Translation" ppt

... length.Single source and target words are denoted by and respectively, where and .We will also use a special single -word block setwhich contains only blocks for which . For the experiments in ... phrase-based model for SMTsimilar to the models presented in (Koehn et al., 2003;Och et al., 1999; Tillmann and Xia, 2003). In our pa-per, phrase pairs are named blocks and our model is de-signed ... itself. and are single -word blocks, where source and target phrases are of length . is the num-ber of blocks for for which.5604 Online Training of Maximum-entropy Model The local model described...
  • 8
  • 578
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A SPEECH-FIRST MODEL FOR REPAIR DETECTION AND CORRECTION" docx

... statistical analysis does not sup- 6We performed the same analysis for the last and first syllables in the reparandum and repair, respectively, and for normalized f0 and energy; results did not substantially ... Length of Reparandum Offset Word Frag- ments (N=288) bution of initial phonemes for all words in the corpus of 6,414 ATIS sentences, and for all fragments, single syllable fragments, and single ... Offset (N=288) a clear tendency for fragmentation at the reparandum offset to occur in content words rather than function words. 3In our pilot study of the SRI and TI utterances only, we found...
  • 8
  • 502
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Unified Statistical Model for the Identification of English BaseNP" pptx

... describe the two-passstatistical model, parameters training and Viterbialgorithm for the search of the best sequences ofPOS tagging and baseNP identification. Beforedescribing our algorithm, ... iiinnnP and (4) ),|(iiibmtwP . Thefirst and the third parameters are trigrams of T and B respectively. The second and the fourthare lexical generation probabilities. Probabilities(1) and (2) ... calculation formulas are similarwith equations (13) and (14) respectively.Before training trigram model (3), all possiblebaseNP rules should be extracted from thetraining corpus. For instance,...
  • 8
  • 482
  • 0

Xem thêm

Từ khóa: tuyên tập cac bao cao khoa học hội nghị khoa học địa i apos abáo cáo khoa họcbáo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnbáo cáo khoa học về cá trabáo cáo khoa học nghiên cứu chôm chômtrạng thái hiện sinh báo cáo khoa họcbiểu tượng văn học báo cáo khoa họctài liệu báo cáo khoa họccách trình bày báo cáo khoa họcbáo cáo khoa học toán họcBáo cáo quy trình mua hàng CT CP Công Nghệ NPVNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhPhối hợp giữa phòng văn hóa và thông tin với phòng giáo dục và đào tạo trong việc tuyên truyền, giáo dục, vận động xây dựng nông thôn mới huyện thanh thủy, tỉnh phú thọTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longNghiên cứu tổng hợp các oxit hỗn hợp kích thƣớc nanomet ce 0 75 zr0 25o2 , ce 0 5 zr0 5o2 và khảo sát hoạt tính quang xúc tác của chúngNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Thơ nôm tứ tuyệt trào phúng hồ xuân hươngBT Tieng anh 6 UNIT 2Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtTrách nhiệm của người sử dụng lao động đối với lao động nữ theo pháp luật lao động Việt Nam từ thực tiễn các khu công nghiệp tại thành phố Hồ Chí Minh (Luận văn thạc sĩ)HIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ