0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Tài liệu Báo cáo khoa học: " Word Translation Disambiguation Using Bilingual Bootstrapping" doc

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: " Word Translation Disambiguation Using Bilingual Bootstrapping" doc

... correct Chinese translation of the ambiguous English word, given an English sentence which contains the word. Word translation disambiguation is actually a special case of word sense disambiguation ... 1999). 3 Bilingual Bootstrapping 3.1 Overview Instead of using Monolingual Bootstrapping, we propose a new method for word translation disambiguation using Bilingual Bootstrapping. In translation ... improving. 5 Word Translation Disambiguation 5.1 Using Bilingual Bootstrapping While it is possible to straightforwardly apply the algorithm of BB described in Section 3 to word translation disambiguation, ...
  • 9
  • 480
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "WORD AND OBJECT IN DISEASE DESCRIPTIONS" doc

... between common English words and medical terms. We measured word frequency by "disease occur- rence", (the number of disease definitions in which a given word occurs one or more ... tion measure, A. Word pairs which are found to be highly associated, appear to do so for two reasons. The test, which is trivial, is that some word pairs are semantically one word despite their ... by not taking adjacent words in forming the term- pairs, without any significant overall effect. The second reasons for high frequency word co-occurrence is that both words are causally related...
  • 4
  • 527
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervised Relation Disambiguation Using Spectral Clustering" ppt

... windows. The “0”tag means that the word is outside of anychunk. The “I-XP” tag means that this word is inside an XP chunk. The “B-XP”by default means that the word is at thebeginning of an XP ... The clustering result using K-means; (c) Threeelongated clusters in the 2D clustering space using Spectral clustering: two dominant eigenvectors; (d)The clustering result using Spectral-based ... 89–96,Sydney, July 2006.c2006 Association for Computational LinguisticsUnsupervised Relation Disambiguation Using Spectral ClusteringJinxiu Chen1Donghong Ji1Chew Lim Tan2Zhengyu Niu11Institute...
  • 8
  • 350
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Word representations: A simple and general method for semi-supervised learning" doc

... contains204K words (14K sentences, 946 documents), thetest set contains 46K words (3.5K sentences, 231documents), and the development set contains51K words (3.3K sentences, 216 documents).We ... induce word features—or to download word features that havealready been induced—plug these word featuresinto an existing system, and observe a significantincrease in accuracy. But which word ... (TKE).Sahlgren, M. (2006). The word- space model: Using distributional analysis to represent syn-tagmatic and paradigmatic relations betweenwords in high-dimensional vector spaces.Doctoral dissertation,...
  • 11
  • 687
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Word Alignment with Synonym Regularization" doc

... amethod for using synonym information effectivelyto improve word alignment quality.In general, synonym relations are defined interms of word sense, not in terms of word form. Inother words, synonym ... models into low-frequency word pairs in bilingual sentences, and then improved the word alignment performance. The SRH regardsall of the different words coupled with the same word in the synonym pairs ... pro-posed method to an English-French word align-ment task and successfully improved the word 137Figure 1: Graphical model of HM-BiTAMalignment quality.2 Bilingual Word Alignment ModelIn this section,...
  • 5
  • 470
  • 2
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Sentiment Translation through Lexicon Induction" doc

... of a word w, the hits near positive(P words) and negative (Nwords) seed words isused. The SO-PMI equation is given asSO-PMI (word) =log2pword∈P wordshits (word NEAR pword)nword∈Nwordshits (word ... =log2pword∈P wordshits (word NEAR pword)nword∈Nwordshits (word NEAR nword)×nword∈Nwordshits(nword)pword∈P wordshits(pword)5.2 Data AcquisitionWe used the English and German Wikipediabranches ... graphs need to be known. When operating on word graphs, these can be taken from a bilingual lexicon. This provides us with a framework forthe induction of a bilingual lexicon which can beconstructed...
  • 6
  • 395
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Crowdsourcing Translation: Professional Quality from Non-Professionals" pptx

... this translation. • Is-Best percentage: how often the translation was top-ranked among the four translations.• Is-Better percentage: how often the translation was judged as the better translation, ... IntroductionIn natural language processing research, translationsare most often used in statistical machine translation (SMT), where systems are trained using bilingual sentence-aligned parallel corpora. ... source Professional LDC Translation Non-Professional Mechanical Turk Translation Figure 1: A comparison of professional translations provided by the LDC to non-professional translations created...
  • 10
  • 633
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Name Translation in Statistical Machine Translation Learning When to Transliterate" pptx

... cap-italized words (with a few exceptions).We use a list of about 200 Arabic and Englishstopwords and stopword pairs.We use lists of countries and their adjectiveforms to bridge cross-POS translations ... the NEWA metric (section 2) to bothour SMT translations as well as the four human ref-erence translations, using both the original named-entity translation annotation and the re-annotation:Gold ... scratch, but rather find a translation in verylarge listsof Englishwords (3.4 million) and phrases(47 million).We develop a similarity metric for Arabic and En-glish words. Since matching against...
  • 9
  • 545
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervised Translation Induction for Chinese Abbreviations using Monolingual Corpora" ppt

... Gigaword have billions of words,but the parallel data has only about 30 million words.Step-4 and -5 are natural ways to integrate the ab-breviation translation component with the baseline translation ... 0.133phrase translation 0.066 0.023lexical translation 0.061 0.078reverse phrase translation 0.059 0.103reverse lexical translation 0.112 0.090phrase penalty -0.150 -0.162 word penalty -0.327 ... continuous span of English words must satisfythe following conditions:• all words must start from a capital letter exceptfor function words “of”, “the”, and “and”;• each function word can appear only...
  • 9
  • 444
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Word to Sentence Level Emotion Tagging for Bengali Blogs" doc

... emotion (Roth et.al., 2005).  SentiWordNet emotion word: A word appearing in the SentiWordNet (Bengali) contains an emotion.  Reduplication: The reduplicated words (e.g., bhallo bhallo [good ... likely emotion words.  Question words: It has been observed that the question words generally contrib-ute to the emotion in a sentence.  Colloquial / Foreign words: The collo-quial words (e.g., ... to the words or sentences that precede or follow it. Features Training Testing Parts of Speech First Sentence Word in SentiWordNet Reduplication Question Words Coll. / Foreign Words Special...
  • 4
  • 429
  • 0

Xem thêm

Từ khóa: Báo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngBáo cáo quy trình mua hàng CT CP Công Nghệ NPVchuyên đề điện xoay chiều theo dạngNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longNghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Tìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinQuản lý nợ xấu tại Agribank chi nhánh huyện Phù Yên, tỉnh Sơn La (Luận văn thạc sĩ)Nguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015MÔN TRUYỀN THÔNG MARKETING TÍCH HỢPTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲ