0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Identifying Word Translations from Comparable Corpora Using Latent Topic Models" potx

Báo cáo khoa học:

Báo cáo khoa học: "Identifying Word Translations from Comparable Corpora Using Latent Topic Models" potx

... language-independentframework for mining translations of words from latent topic models. We have proven that topicalknowledge is useful and improves the quality of word translations. The quality of translations de-pends ... 2011.c2011 Association for Computational LinguisticsIdentifying Word Translations from Comparable Corpora Using Latent Topic ModelsIvan Vuli´c, Wim De Smet and Marie-Francine MoensDepartment ... same cross-lingual topics and not ob-served in other cross-lingual topics. In other words,a word w2 from a target language is a potential trans-lation candidate for a word w1 from a source lan-guage,...
  • 6
  • 449
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Identifying Word Translations in Non-Parallel Texts" potx

... algorithms for sentence and word- alignment allow the automatic iden- tification of word translations from paxalhl texts. This study suggests that the identi- fication of word translations should also ... determine the translations of words from comparable or even unrelated texts. 2 Approach It is assumed that there is a correlation between the co-occurrences of words which are translations ... patterns of word co- occurrences in texts of different languages. 1 Introduction In a number of recent studies it has been shown that word translations can be automatically derived from the...
  • 3
  • 219
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Bilingual Terminology Acquisition from Comparable Corpora and Phrasal Translation to Cross-Language Information Retrieval" pptx

... the comparable corpora. Re-scoring through the Comparable Corpora Comparable corpora could be considered for thedisambiguation of translation alternatives and thusselection of best phrasal translations ... Acquisition (Two-stages Comparable Corpora- based Model)Linguistic-based PruningPhrasal Translation / SelectionJapaneseDoc.Content words (nouns, verbs, adjectives, adverbs, foreign words)Bilingual ... JapaneseJapaneseMorphologicalAnalyzerEnglishMorphologicalAnalyzerFiltered Translation Candidates Comparable Corpora (Japanese-English)EnglishDoc.Linguistic PreprocessingWWWNTCIRTest Collection Comparable Corpora MorphologicalAnalysisInteractive...
  • 4
  • 377
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Mining Parenthetical Translations from the Web by Word Alignment" potx

... correspondences between the words using a word alignment algorithm. At first glance, word alignment appears to be a more difficult problem than the extraction of par-enthetical translations. Extraction ... translations. Extraction of parenthetical translations need only determine the first pre-parenthesis word aligned with an in-parenthesis word, whereas word alignment requires the respec-tive ... the alignments are restricted word- to -word align-ments, which implies that multi -word expressions can only be partially linked at best. 4.1 Dealing with multi -word alignment We made a small...
  • 9
  • 612
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Joint Word Segmentation and POS Tagging using a Single Perceptron" docx

... are different to those from Collins (2002)and are specific to Chinese, are shown in Table 2.The word segmentation features are extracted from word bigrams, capturing word, word lengthand character ... last word can be a complete word ora partial word. A problem arises in whether to givePOS tags to incomplete words. If partial words aregiven POS tags, it is likely that some partial wordsare ... pattern “number word + “number word can help to prevent seg-menting a long number word into two words.In order to avoid error propagation and make useof POS information for word segmentation,...
  • 9
  • 576
  • 0
Báo cáo khoa học: A novel trehalase from Mycobacterium smegmatis ) purification, properties, requirements potx

Báo cáo khoa học: A novel trehalase from Mycobacterium smegmatis ) purification, properties, requirements potx

... fraction or in thepurified fraction from the column.Partial characterization of the trehalase from M. tuberculosisThe M. tuberculosis trehalase was isolated from cytoso-lic extracts and partially ... to the hypothetical protein from M. avium. However, the aggregated form of thetuberculosis trehalase emerges from a Sephacryl S-300column later than the enzyme from M. smegmatis, sug-gesting ... was obtained from BectonDickinson (Franklin Lakes, NJ), and LB broth wasobtained from Fisher Scientific Co. (Pittsburgh, PA) Seph-acryl S-300 and Sephacryl S-200 were obtained from Amersham...
  • 14
  • 271
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Building Emotion Lexicon from Weblog Corpora" potx

... between words and emotions using weblog corpora. A collocation model is proposed to learn emotion lexicons from weblog articles. Emotion classification at sentence level is experimented by using ... the total word occurrences. A word entry of a lexicon may contain several emotion senses. They are ordered by the colloca-tion strength co. Figure 2 shows two Chinese ex-ample words, “ 哈 ... Suppose a sentence S to be classified consists of n emotion words. The emotion of S is derived by a mapping from a set of n emotion words to m emo-tion categories as follows: }, ,{ˆ}, ,{11...
  • 4
  • 302
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Constructing Transliteration Lexicons from Web Corpora" docx

... sentence contained at least one English word. Analysis showed that 17.43% of the English terms were transliterated, and that most of them were content words (words that carry essential meaning, ... existing dictionaries. Regularly exploring Web corpora is a good way to update dictionaries. Transliterated-term extraction using non-parallel corpora has also been conducted (Kuo, 2003). Automated ... may belong to two completely different language families, are selected using local context analysis from non-parallel corpora (Kuo, 2003). In order to determine the degree of similarity between...
  • 4
  • 218
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Bilingual Lexicons from Monolingual Corpora" pot

... input two monolingual corpora and per-haps some seed translations, and we produce as out-put a bilingual lexicon, defined as a list of word pairs deemed to be word- level translations. Preci-sion ... the word type features from a base-line normal distribution with variance σ2IdS, withhyperparameter σ2 0; unmatched target wordsare similarly generated.If two word types are truly translations, ... performanceof the system, in English-Spanish induction with ourbest feature set, using corpora derived from topicallysimilar but non-parallel sources, the system obtains89.0% precision at...
  • 9
  • 300
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Tense Translation from Bilingual Corpora" docx

... mor- phosyntactically (analytic tenses). 2 Words Are Not Enough Often, sentence meaning is not compositional but arises from combinations of words (1). (1) a. Ich habe ihn gestern gesehen. ... context depen- dence. For every ambiguous word, the part of the context relevant for disambiguation must be identified (disambiguation strategy), and every word potentially occurring in this context ... chore. Fortunately, the task can be (partly) automated if the tables associating words with biases are learned from a corpus. Statistical approaches also support empirical evaluation of different...
  • 5
  • 279
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnNghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngchuyên đề điện xoay chiều theo dạngNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhPhối hợp giữa phòng văn hóa và thông tin với phòng giáo dục và đào tạo trong việc tuyên truyền, giáo dục, vận động xây dựng nông thôn mới huyện thanh thủy, tỉnh phú thọNghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)BT Tieng anh 6 UNIT 2Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)chuong 1 tong quan quan tri rui roGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015HIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMMÔN TRUYỀN THÔNG MARKETING TÍCH HỢPTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ