0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Learning Tense Translation from Bilingual Corpora" docx

Báo cáo khoa học:

Báo cáo khoa học: "Learning Tense Translation from Bilingual Corpora" docx

... Learning Tense Translation from Bilingual Corpora Michael Schiehlen* Institute for Computational Linguistics, University ... future in the past (3) In some cases, tense was ambiguous when con- sidered in isolation, and had to be resolved in tandem with tense translation. Ambiguous tenses on the target side were disambiguated ... Formally, we define source tense and target tense as two random variables S and T. Disam- biguation strategies are modeled as functions tr from source to target tense. Precision figures...
  • 5
  • 279
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Event Durations from Event Descriptions" docx

... instances), from the TimeBank corpus annotated in TimeML (Pustejovky et al., 2003). The non-WSJ articles (mainly political and disaster news) include both print and broadcast news that are from ... two peaks in this distribution. One is from 5 to 7 in the natural logarithmic scale, which corresponds to about 1.5 minutes to 30 minutes. The other is from 14 to 17 in the natural logarithmic ... potentially very important in applications in which the time course of events is to be extracted from news. For example, whether two events overlap or are in sequence often de-pends very much...
  • 8
  • 381
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Constructing Transliteration Lexicons from Web Corpora" docx

... role in machine translation. The importance of term transliteration can be realized from our analysis of the terms used in 200 qualifying sentences that were randomly selected from English-Chinese ... organized, much invaluable information can be obtained from this large text corpus. Many researchers dealing with natural language processing, machine translation, and information retrieval have focused ... 15,822,984 pages, which was collected from the Internet using a web spider and was converted to plain text, was used as a training set. This corpus is called SET1. From SET1, 80,094 qualifying sentences...
  • 4
  • 218
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Hierarchical Translation Structure with Linguistic Annotations" ppt

... integrating lin-guistic information in translation systems. Syntax-based MT often suffers from inadequate constraintsin the translation rules extracted, or from striving tocombine these rules ... advancing from structures which mimic lin-guistic syntax, to learning linguistically aware latentrecursive structures targeting translation, we achievesignificant improvements in translation ... separately from phrase-pair emission, allows us to concentrate ourinference efforts towards the hidden, higher-level translation mechanism.4 Experiments4.1 Decoding ModelThe induced joint translation...
  • 11
  • 478
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Computing Consensus Translation from Multiple Machine Translation Systems Using Enhanced Hypotheses Alignment" pot

... (EPPS). In ourexperiments, we used the translations from Span-Table 2: Improved translation results for the con-sensus translation computed from 5 translation outputs on the Chinese-English ... trans-lations. These translations can be improved if wecompute a consensus translation from the outputof at least two different speech translation systems. From each system, we take the translation ... consensus translation from some of the submissions to the TC-STAR2005 evaluation campaign (TC-STAR, 2005). TheTC-STAR participants had submitted translationsof manually transcribed speeches from...
  • 8
  • 358
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Common Grammar from Multilingual Corpus" potx

... languages from non-parallelmultilingual corpora in an unsupervisedfashion. For this purpose, we assume agenerative model for multilingual corpora,where each sentence is generated from alanguage ... borrowing from nearby languages, and 3) theinnate abilities of humans (Chomsky, 1965).We assume hidden commonalities in syntaxacross languages, and try to extract a commongrammar from non-parallel ... that a PCFG for eachlanguage is generated from a general model thatare common across languages, and each sentencein multilingual corpora is generated from the lan-guage dependent PCFG. The inference...
  • 5
  • 326
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Semantic Links from a Corpus of Parallel Temporal and Causal Relations" doc

... null label is NO-REL.train/test split from Table 1 and the feature sets:Syntactic The syntactic features from Section 4.Semantic The semantic features from Section 4.All Both syntactic and ... 2ndwords.POS Pair As 1stEvent, but using part of speech tagpairs. POS tags encode tense, so this suggests theperformance of a tense- based classifier.The results on our test data are shown in Table 3. ... (Boguraev and Ando, 2005; Verha-gen et al., 2007). Still, TempEval showed that on aconstrained tense identification task, systems couldachieve accuracies in the 80s, and Bethard and col-leagues...
  • 4
  • 363
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Semantic Categories from Clickthrough Logs" pdf

... both precision and recall.We cast semantic category acquisition from search logs as the task of learning labeled in-stances from few labeled seeds. To our knowledgethis is the first study that ... different from ours. An-other line of new research is to combine various re-sources such as web documents with search querylogs (Pas¸ca and Durme, 2008; Talukdar et al.,2008). We differ from this ... pages 189–192,Suntec, Singapore, 4 August 2009.c2009 ACL and AFNLPLearning Semantic Categories from Clickthrough LogsMamoru KomachiNara Institute of Science and Technology (NAIST)8916-5 Takayama,...
  • 4
  • 316
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Transliteration Lexicons from the Web" pptx

... from corpora. The EX approach aims to construct a large and up-to-date transliteration lexicon from live corpora. Towards this objective, some have proposed extracting translation pairs from ... transliteration pairs (EX) from corpora. The TM approach models phoneme-based or grapheme-based mapping rules using a generative model that is trained from a large bilingual lexicon, with the ... learn PSM and harvest E-C pairs from the Web at the same time. Conceptually, the adaptive learning is carried out as follows. We obtain bilingual snippets from the Web by iteratively submitting...
  • 8
  • 341
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Building Emotion Lexicon from Weblog Corpora" potx

... Blog from January to July, 2006, spanning a period of 212 days. In total, 336,161 bloggers’ articles were col-lected. Each blogger posts 16 articles on average. We used the articles from ... and emotions using weblog corpora. A collocation model is proposed to learn emotion lexicons from weblog articles. Emotion classification at sentence level is experimented by using the mined ... of our day-to-day experiences, anytime and anywhere. Blogs are web sites that timestamp posts from an individual or a group of people, called bloggers. Bloggers may not follow formal writing...
  • 4
  • 302
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnchuyên đề điện xoay chiều theo dạngMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitNGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWAN SLIDEPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngĐịnh tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Thơ nôm tứ tuyệt trào phúng hồ xuân hươngSở hữu ruộng đất và kinh tế nông nghiệp châu ôn (lạng sơn) nửa đầu thế kỷ XIXTăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtNguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtBÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015