0

large scale discriminative n gram language models for statistical machine translation

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Refined Lexicon Models for Statistical Machine Translation using a Maximum Entropy Approach" pptx

Báo cáo khoa học

... additional information could be:Simple context information: information ofthe words surrounding the word pair;Syntactic information: part-of-speech in-formation, syntactic constituent, sentencemood;Semantic ... entropy approach is outlined inSection 3.2 Statistical Machine Translation The goal of the translation process in statisti-cal machine translation can be formulated as fol-lows: A source language ... Tillmann, S. Vogel, H. Ney, and A. Zubiaga. 1997.A DP-based search using monotone alignments in statistical translation. In Proc. 35th Annual Conf.of the Association for Computational Linguistics,pages...
  • 8
  • 427
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improved Smoothing for N-gram Language Models Based on Ordinary Counts" doc

Báo cáo khoa học

... new method eliminatingmost of the gap between Kneser-Ney andthose methods.1 Introduction Statistical language models are potentially useful for any language technology task that producesnatural -language ... is a single unknown probability distribution for the amount of quantization error in every N- gram count. If so, the total quantization error for a given context will tend to be proportional to ... 4- gram language models using English data fromthe WMT-06 Europarl corpus (Koehn and Monz,2006). We took 1,003,349 sentences (27,493,499words) for training, and 2000 sentences each for testing...
  • 4
  • 365
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Bucking the Trend: Large-Scale Cost-Focused Active Learning for Statistical Machine Translation" docx

Báo cáo khoa học

... Kaufmann, San Fran-cisco, CA.Rion Snow, Brendan O’Connor, Daniel Jurafsky, andAndrew Ng. 2008. Cheap and fast – but is itgood? evaluating non-expert annotations for natu-ral language tasks. In ... solicits translations only for trigger n- gramsand not for entire sentences. We provide senten-tial context, highlight the trigger n- gram that wewant translated, and ask for a translation of just ... WrenThornton, Jonathan Weese, and Omar Zaidan. 2009.Joshua: An open source toolkit for parsing-based machine translation. In Proceedings of the FourthWorkshop on Statistical Machine Translation, ...
  • 11
  • 580
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Incremental Syntactic Language Models for Phrase-based Translation" pptx

Báo cáo khoa học

... 2009.Quadratic-time dependency parsing for machine trans-lation. In Proceedings of the Joint Conference of the47th Annual Meeting of the ACL and the 4th Interna-tional Joint Conference on Natural Language ... speechrecognition, research in statistical machine trans-lation has effectively used n- gram word sequence models as language models. Modern phrase-based translation using large scale n- gram language models ... Proceedings of the Ninth Ma-chine Translation Summit of the International Associ-ation for Machine Translation. Ciprian Chelba and Frederick Jelinek. 1998. Exploit-ing syntactic structure for language...
  • 12
  • 510
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Translation Model Adaptation for Statistical Machine Translation with Monolingual Topic Information" doc

Báo cáo khoa học

... 2006Evaluation. In Proc. of International Workshop onSpoken Language Translation, pages 103-110.Arne Mauser, Saˇsa Hasan and Hermann Ney 2009. Ex-tending Statistical Machine Translation with Discrimi-native ... Statistical Machine Translation. In Proc. of ACL 2006, pages 609-616.Yajuan Lv, Jin Huang and Qun Liu. 2007. Improv-ing Statistical Machine Translation Performance byTraining Data Selection and Optimization. ... obtain synthetic parallel sen-tences, and Wu et al. (2008) used an in-domain translation dictionary and monolingual corpora toadapt an out-of-domain translation model for the in-domain text.Differing...
  • 10
  • 533
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Ranking-based Approach to Word Reordering for Statistical Machine Translation" doc

Báo cáo khoa học

... Chunking. In Proc.CoNLL, pages 63-69.Young-Suk Lee, Bing Zhao and Xiaoqiang Luo. 2010.Constituent reordering and syntax models for English-to-Japanese statistical machine translation. In Proc.Coling.Chi-Ho ... canhelp English-Hindi Statistical Machine Translation. In Proc. IJCNLP.Roy Tromble. 2009. Search and Learning for the Lin-ear Ordering Problem with an Application to Machine Translation. Ph.D. ... Subject-Object-Verb Languages. In Proc. HLT-NAACL, pages 376-384.Richard Zens and Hermann Ney. 2006. Discriminative Reordering Models for Statistical Machine Transla-tion. In Proc. Workshop on Statistical Machine...
  • 9
  • 615
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Mixing Multiple Translation Models in Statistical Machine Translation" docx

Báo cáo khoa học

... Ciprian Chelba, and FranzOch. 2010. Model combination for machine transla-tion. In Human Language Technologies: The 2010 An-nual Conference of the North American Chapter of theAssociation for ... E. Hinton. 1999. Products of experts. In Artifi-cial Neural Networks, 1999. ICANN 99. Ninth Interna-tional Conference on (Conf. Publ. No. 470), volume 1,pages 1–6.Jing Jiang and ChengXiang Zhai. ... JohnBenjamins, Amsterdam/Philadelphia.Nicola Ueffing, Gholamreza Haffari, and Anoop Sarkar.2007. Transductive learning for statistical machine translation. In Proceedings of the 45th Annual...
  • 10
  • 456
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Bilingual Sense Similarity for Statistical Machine Translation" ppt

Báo cáo khoa học

... Association for Computational LinguisticsBilingual Sense Similarity for Statistical Machine Translation Boxing Chen, George Foster and Roland Kuhn National Research Council Canada 283 ... string con-sisting of terminal and non-terminal symbols. ~ defines a one-to-one correspondence between non-terminals in α and γ. 1 There has been a lot of work (more details in Section ... performance of Alg2 on Chinese-to-English NIST large data condition and German-to-English WMT task. We can see that IBM model 1 and cosine distance similarity function both obtained significant...
  • 10
  • 594
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervised Search for The Optimal Segmentation for Statistical Machine Translation" doc

Báo cáo khoa học

... models for morpheme segmentation and morphology learn-ing. ACM Transactions on Speech and Language Processing, 4(1):1–34.Sajib Dasgupta and Vincent Ng. 2007. High-performance, language- independent ... SRILM-an extensible language modeling toolkit. In Seventh International Confer-ence on Spoken Language Processing, volume 3.David Talbot and Miles Osborne. 2006. Modellinglexical redundancy for machine ... Pre-Processing for Turkish to English Statistical Machine Translation. In Proc. of the In-ternational Workshop on Spoken Language Transla-tion, pages 129–135, Tokyo, Japan.M.R. Brent. 1999. An efficient,...
  • 6
  • 445
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Corpus Expansion for Statistical Machine Translation with Semantic Role Label Substitution Rules" doc

Báo cáo khoa học

... Koehn, and Miles Os-borne. 2006. Improved statistical machine translation using paraphrases. In Proceedings of the main con-ference on Human Language Technology Conferenceof the North American ... phrase-based translation models, which can be used directlyin translation tasks or combined with base-line models. Experimental results on Chinese-English machine translation tasks show an av-erage ... and William Dolan. 2004.Monolingual machine translation for paraphrase gen-eration. In Proceedings of EMNLP 2004, pages 142–149, Barcelona, Spain, July. Association for Computa-tional Linguistics.298...
  • 5
  • 416
  • 0

Xem thêm

Tìm thêm: xác định các nguyên tắc biên soạn khảo sát các chuẩn giảng dạy tiếng nhật từ góc độ lí thuyết và thực tiễn khảo sát chương trình đào tạo của các đơn vị đào tạo tại nhật bản khảo sát chương trình đào tạo gắn với các giáo trình cụ thể tiến hành xây dựng chương trình đào tạo dành cho đối tượng không chuyên ngữ tại việt nam điều tra đối với đối tượng giảng viên và đối tượng quản lí điều tra với đối tượng sinh viên học tiếng nhật không chuyên ngữ1 khảo sát thực tế giảng dạy tiếng nhật không chuyên ngữ tại việt nam khảo sát các chương trình đào tạo theo những bộ giáo trình tiêu biểu nội dung cụ thể cho từng kĩ năng ở từng cấp độ xác định mức độ đáp ứng về văn hoá và chuyên môn trong ct các đặc tính của động cơ điện không đồng bộ đặc tuyến hiệu suất h fi p2 đặc tuyến mômen quay m fi p2 đặc tuyến tốc độ rôto n fi p2 đặc tuyến dòng điện stato i1 fi p2 động cơ điện không đồng bộ một pha sự cần thiết phải đầu tư xây dựng nhà máy từ bảng 3 1 ta thấy ngoài hai thành phần chủ yếu và chiếm tỷ lệ cao nhất là tinh bột và cacbonhydrat trong hạt gạo tẻ còn chứa đường cellulose hemicellulose chỉ tiêu chất lượng 9 tr 25