0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Tài liệu Báo cáo khoa học: "Word Alignment for Languages with Scarce Resources Using Bilingual Corpora of Other Language Pairs" pptx

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Word Alignment for Languages with Scarce Resources Using Bilingual Corpora of Other Language Pairs" pptx

... im-prove word alignment for languages with scarce resources using bilingual corpora of other language pairs. To perform word alignment between languages L1 and L2, we introduce a third language ... improve word alignment for languages with scarce re-sources using bilingual corpora of other language pairs. To perform word alignment between lan-guages L1 and L2, we introduce a third language ... only be used for very similar language pairs. In this paper, besides the limited resources for the given language pair, we make use of large amounts of resources available for other lan-guage...
  • 8
  • 359
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Word Alignment with Synonym Regularization" doc

... framework for word alignment that incorporates synonymknowledge collected from monolinguallinguistic resources in a bilingual proba-bilistic model. Synonym information ishelpful for word alignment ... occurrences of ‘chief’ and ‘forefront’ with ‘head’ do sometimes harm with word alignment accuracy, and we have to model either the contextor senses of words.We propose a novel method that incorporatessynonyms ... monolingual resources in a bilin-gual word alignment model. We formulate a syn-onym pair generative model with a topic variableand use this model as a regularization term with a bilingual word alignment...
  • 5
  • 470
  • 2
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Inducing Gazetteers for Named Entity Recognition by Large-scale Clustering of Dependency Relations" ppt

... than 48GB of memory is not widely available even today.Therefore, we parallelized the clustering algo-rithm, to make it suitable for running on a cluster of PCs with a moderate amount of memory ... Torisawa (2007),which encodes the matching with a gazetteer entity using IOB tags, with the modification for Japanese.They describe using two types of gazetteer features.The first is a matching-only ... one of the strengths of machine learning methods such as CRFs. We canalso see that our current matching method is not anoptimal one. For example, 16% of the matches werelost as a result of using...
  • 9
  • 428
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Discriminative Pruning for Discriminative ITG Alignment" pdf

... alignment system of GIZA++. 1 Introduction Inversion transduction grammar (ITG) (Wu, 1997) is an adaptation of SCFG to bilingual parsing. It does synchronous parsing of two languages with phrasal ... expanding the list of alignment hypotheses of minimal number of span pairs. The first type of pruning is equivalent to mi-nimizing the number of hypernodes in a hyper-graph. The task of ITG pruning ... found to be highly harmful to alignment performance and therefore not adopted in this paper. The third type of pruning is equivalent to mi-nimizing the beam size of alignment hypotheses in each...
  • 9
  • 429
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Word representations: A simple and general method for semi-supervised learning" doc

... corpus of 160 million word tokens with a vocabulary size W of 70K word types. There are 2·W types of context(columns): The first or second W are counted if theword c occurs within a window of 10 ... EACL.Honkela, T. (1997). Self-organizing maps of words for natural language processing applica-tions. Proceedings of the International ICSCSymposium on Soft Computing.Honkela, T., Pulkki, V., & ... Induction, Repre-sentation of Language and Language Learning.Turney, P. D., & Pantel, P. (2010). From frequencyto meaning: Vector space models of semantics.Journal of Artificial Intelligence...
  • 11
  • 687
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Word to Sentence Level Emotion Tagging for Bengali Blogs" doc

... This tag weight for each emotion tag has been calculated based on the frequency of occurrence of an emotion tag with respect to the total number of occurrences of all six types of emotion tags ... Bengali part of speech tagger (Ekbal et al. 2008) based on Support Vector Machine (SVM) tech-nique. The POS tagger was developed with a tagset of 26 POS tags2, defined for the Indian languages. ... results of the development set have demonstrated an accuracy of 56.45%. Error analysis has been conducted with the help of confusion matrix as shown in Table 2. A close investigation of the...
  • 4
  • 429
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Word Vectors and Two Kinds of Similarity" pptx

... semantic process-ing. Other methods use a variety of other informa-tion: cooccurrence of two words (Burgess, 1998;Sch¨utze, 1998), occurrence of a word in the sensedefinitions of a dictionary (Kasahara ... kind of semantic similarity betweenwords in the same level of categories or clusters of the thesaurus, in particular synonyms, antonyms,and other coordinates. Associative similarity, onthe other ... between words thatare associated with each other by virtue of seman-tic relations other than taxonomic one such as acollocational relation and a proximity relation. For example, the word writer...
  • 8
  • 473
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Word Order in German: A Formal Dependency Grammar Using a Topological Hierarchy" pptx

... domain, with positions for all of its dependents, or arestricted phrase, which forms the verb cluster, with no positions for dependents other thanpredicative elements. These two kinds of phrases ... infini-tives (with zu) and bare infinitives (without zu):Bare infinitives cannot form an embeddeddomain outside of the Vorfeld. Consequently,there are two different prosodies for (3a) (with or without ... right bracket. The other rules areidentical to those for other domains, with thegroup containing the pronominal part of therelative pronoun having to join the other part of the pronoun in the...
  • 8
  • 575
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: " Word Translation Disambiguation Using Bilingual Bootstrapping" doc

... and repeatedly boosts the performances of the classifiers by further classifying data in each of the two languages and by exchanging between the two languages information regarding the classified ... data in both languages, (2) using the constructed classifiers in each of the languages to classify some unclassified data and adding them to the classified training data set of the language. ... use of in learning a small number of classified data and a large number of unclassified data in the source and the target languages in translation. It constructs classifiers in the two languages...
  • 9
  • 480
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "WORD, PHRASE AND SENTENCE" pptx

... primarily concerned with analysis of language at the sentence level. The most glamourous areas of natural language research are at levels above the sentence, concerned with dialogues and ... level. Yet, with regard to most of the topics in this and other sessions, there is a stronK sense of de~a vu; the earliest natural language studies featured automatic extracting and information ... associational properties of keywords. Mechanical translation of sentences without regard for larger contexts marked the late sixties high point of MT research amid contemporaneous studies of the English...
  • 2
  • 381
  • 0

Xem thêm

Từ khóa: tài liệu báo cáo khoa họctài liệu báo cáo khoa học bản chất của khủng hoảng kinh tế thế giới pdftài liệu báo cáo nghiên cứu khoa họctài liệu về báo cáo khoa họcbáo cáo khoa học tài chính côngbáo cáo khoa học số loài quý hiếm tại vườn quốc gia ba bểtai lieu bao cao thuc tap khoa co khitai lieu bao cao thuc tap tai khoa duoc benh vientai lieu bao cao thuc tap y si da khoabáo cáo khoa học ảnh hưởng của tuổi thu hoạch đến năng suất và chất lượng thức ăn của cỏ voi pennisetum purpureum cỏ ghi nê panicum maximum trồng tại đan phượng hà tây pptxtai lieu bao cao thuc tap tim hieu nhan cach mot hoc sinhbáo cáo khoa học về nghệ thuật trong lieu trai chi ditai lieu bao cao thuc tap tai khoa duoc benh vien hop lucđề tài báo cáo khoa họcđề tài báo cáo khoa học sinh họcBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzNghiên cứu tổ chức chạy tàu hàng cố định theo thời gian trên đường sắt việt namđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitPhối hợp giữa phòng văn hóa và thông tin với phòng giáo dục và đào tạo trong việc tuyên truyền, giáo dục, vận động xây dựng nông thôn mới huyện thanh thủy, tỉnh phú thọPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chếThơ nôm tứ tuyệt trào phúng hồ xuân hươngChuong 2 nhận dạng rui roKiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Tăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtHIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ