0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Tài liệu Báo cáo khoa học: "Improving Statistical Machine Translation with Monolingual Collocation" pdf

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improving Statistical Machine Translation with Monolingual Collocation" pdf

... 11-16 July 2010.c2010 Association for Computational LinguisticsImproving Statistical Machine Translation with Monolingual Collocation Zhanyi Liu1, Haifeng Wang2, Hua Wu2, Sheng Li1 ... paper proposes to use monolingual collocations to improve Statistical Ma-chine Translation (SMT). We make use of the collocation probabilities, which are estimated from monolingual corpora, ... Speech Translation Evalua-tion. In Processings of the International Workshop on Spoken Language Translation 2005. Philipp Koehn, Franz J. Och, and Daniel Marcu. 2003. Statistical Phrase-based Translation. ...
  • 9
  • 474
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Resolution for Machine Translation of Telegraphic Messages" docx

... leads to a mistranslation in a machine translation system. Therefore, the issue becomes how to parse tele.graphic messages accurately and efficiently to produce high quahty translation output. ... Misparsing re- duced by omissions has a far-reaching consequence in machine translation. Namely, a misparse of the input often leads to a translation into the target language which has incoherent meaning ... efficiently becomes a critical issue in machine translation. In this paper we describe a technical solution for the issue, and reSent the performance evaluation of a machine trans- tion system on telegraphic...
  • 8
  • 365
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "SUBLANGUAGES IN MACHINE TRANSLATION" pdf

... system within the computer-aided Saarbriicken Translation System (STS), i.e. in human-aided MT and in machine- aided human translation. Titles of scientific papers from German databases were machine- translated ... sublanguage notion for disambi- guation and the selection of target language equivalents in machine translation. In this paper a theoretical concept and its imple- mentation in a real MT application ... Luckhardt 1984) to use the sublanguage notion for solving some of the notorious problems in machine translation (MT) such as disambiguation and selection of target language equivalents. In...
  • 3
  • 476
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Statistical Model for Unsupervised and Semi-supervised Transliteration Mining" pptx

... thetransliteration pairs. We propose a second modelp2(e, f ) to deal with non-transliteration pairs (the“non-transliteration model”). Interpolation with thenon-transliteration model allows the transliterationmodel ... initialized with a uniform distribu-tion and λ is set to 0.5.The expected count of a multigram q (E-step) iscomputed by multiplying the posterior probabilityof each alignment a with the frequency ... standard way (Deligne and Bimbot,1995). Consider a node r which is connected with a node s via an arc labelled with the multigram q.The expected count of a transition between r and sis calculated...
  • 9
  • 521
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improving Word Representations via Global Context and Multiple Word Prototypes" pdf

... learningalgorithms and as extra word features in NLPsystems. However, most of these models arebuilt with only local context and one represen-tation per word. This is problematic becausewords are ... accountsfor homonymy and polysemy by learning mul-tiple embeddings per word. We introduce anew dataset with human judgments on pairs ofwords in sentential context, and evaluate ourmodel on it, showing ... other neurallanguage models.11 IntroductionVector-space models (VSM) represent word mean-ings with vectors that capture semantic and syntac-tic information of words. These representations canbe...
  • 10
  • 494
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improving Chinese Semantic Role Labeling with Rich Syntactic Features" ppt

... information of sub-trees in a givenparse. With help of these new features, our sys-tem achieves 93.49 F-measure with hand-craftedparses. Comparison with the best reported results,92.0 (Xue, ... arguments of a predicate are la-beled with a contiguous sequence of integers, inthe form of AN (N is a natural number); the ad-juncts are annotated as such with the label AMfollowed by a secondary ... denotea candidate constituent ck with a fixed contextwi−1[ckwi wh wj]wj+1, where whis the headword of ck, and denote predicate in focus with a context wv−2wv−1wvwv+1wv+2,...
  • 5
  • 364
  • 0
Tài liệu Báo cáo khoa học: Improving Classification of Medical Assertions in Clinical Notes

Tài liệu Báo cáo khoa học: Improving Classification of Medical Assertions in Clinical Notes" pdf

... instances with that label as positive instances and instances with any other label as negative instanc-es. The final class label is assigned by choosing the class that was assigned with the ... its performance with our original system. 4.1 Data The training set includes 349 clinical notes, with 11,967 assertions of medical problems. The test set includes 477 texts with 18,550 assertions. ... assertion categories: absent, hypothet-ical, historical, and not associated with the patient. Uzuner et al. (2009) developed the Statistical As-sertion Classifier (StAC) and showed that a ma-chine...
  • 6
  • 496
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improving Automatic Speech Recognition for Lectures through Transformation-based Rules Learned from Minimal Data" ppt

... Li, 2007).1Even with all of these,however, there remains a significant gap betweenthis WER and the threshold of 25%, at which lec-ture transcripts have been shown with statistical significance ... you⇓Output all rules for replacing the incorrect ASRsequence with the correct text, using the entiresequence (a) or splices (b), with or withoutsurrounding anchors:(a) the okay one and / ok why ... how the transcripts improve, words with lower information content (e.g., a lower tf.idfscore) are corrected more often and with moreimprovement than words with higher informationcontent. The...
  • 9
  • 427
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improving the Scalability of Semi-Markov Conditional Random Fields for Named Entity Recognition" pdf

... Onthe other hand, the system with preceding infor-mation is not significantly better than the systemwithout it5. Other non-local information may im-prove performance with our framework and this ... of the classifier on development data is 74.64(without preceding information) and 75.14 (with precedinginformation).470Table 5: Performance with filtering on the development data. (< 1.0 ... data without filtering required muchlarger memory resources (estimated to be about80G Byte) than was possible for our experimentalsetup. We thus compared the result of the recog-nizers with...
  • 8
  • 527
  • 0

Xem thêm

Từ khóa: tài liệu báo cáo khoa họctài liệu báo cáo nghiên cứu khoa họctài liệu về báo cáo khoa họcbáo cáo khoa học tài chính côngbáo cáo khoa học số loài quý hiếm tại vườn quốc gia ba bểNghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngBáo cáo quy trình mua hàng CT CP Công Nghệ NPVNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzNghiên cứu tổ chức chạy tàu hàng cố định theo thời gian trên đường sắt việt namGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longPhát hiện xâm nhập dựa trên thuật toán k meansThơ nôm tứ tuyệt trào phúng hồ xuân hươngThiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíBT Tieng anh 6 UNIT 2Tăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015QUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ