0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Generating Usable Formats for Metadata and Annotations in a Large Meeting Corpus" pptx

Báo cáo khoa học:

Báo cáo khoa học: "Generating Usable Formats for Metadata and Annotations in a Large Meeting Corpus" pptx

... the AMI Corpus metadata and annota-tions as part of the larger objective of automatingthe generation of annotation and metadata databasesto enhance search and browsing of meeting record-ings. ... Proceedings of the ACL 2007 Demo and Poster Sessions, pages 93–96,Prague, June 2007.c2007 Association for Computational LinguisticsGenerating Usable Formats for Metadata and Annotations in a Large ... metadata and annotations. The annotation files areconverted to a tabular format using an eas-ily adaptable XSLT-based mechanism, and their consistency is verified in the process. Metadata files are...
  • 4
  • 373
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Re-Usable Tools for Precision Machine Translation∗" pdf

... available for system development and also serve as trainingdata for machine learning approaches. Using thediscriminant-based Redwoods approach to tree-banking (Oepen, Flickinger, Toutanova, ... distribution, and we combine theMaxEnt model with a traditional language modeltrained on a much larger corpus (the BNC). Thelatter, more standard approach to realization rank-ing, when used in isolation ... Using a trial LFG treebank for Norwegian (of less than 100 annotated sen-tences), we have adapted the tools for the currentLOGON version and are now working to train onlarger data sets and...
  • 4
  • 448
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Generating Complex Morphology for Machine Translation" pdf

... gain in both monolingual and bilingual settings in both language pairs. Weobtain a particularly large gain in the Russian bilin-gual case, in which the absolute gain is more than4%, translating ... which also includes bilingual lex-ical features;7Monolingual-All, which has accessto all the information available in the target lan-guage, including morphological and syntactic fea-tures; and ... corresponding num-bers for Arabic were 27 feature templates (0.7 mil-lion binary instantiations) and 39 feature templates(2.3 million binary instantiations) for Monolingual-All and Bilingual-All,...
  • 8
  • 333
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Know When to Hold''''Em: Shuffling Deterministically in a Parser for Non concatenative Grammars*" pdf

... most appropriate parsing algorithm to take advantage of the information that a semantic head provides. For example, a head usually provides information about the remaining daughters that the ... descriptions includes Bach's (1979) wrapping oper- ations, Pollard's (1984) head-wrapping operations, and Moortgat's (1996) extraction and infixation op- erations in (categorial) type-logical ... type-logical grammar. What is common to the proposals of Dowty, Reape, and Kathol, and to the particular analysis implemented here, is the characterization of nat- ural language syntax in terms...
  • 7
  • 397
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Generating statistical language models from interpretation grammars in dialogue systems" potx

... important thanthe quantity. This makes extraction of domaindata from larger corpora an important issue and increases the interest of generating artificial cor-pora.As the approach of using SLMs ... recognition performance. We areconsidering basing our re-ranking on the informa-tion held in the dialogue information state, knowl-edge of what is going on in the graphical interface and on dialogue ... captured a quite different language for the same domain and functionality. This shows the risk of a hand-tailored domain grammar and the difficulty of pre-dicting what users may say. In addition, a...
  • 8
  • 381
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "An annotation scheme for discourse-level argumentation in research articles" doc

... Purposes, for tasks as varied as teaching English as a foreign language, human translation and citation analysis (Myers, 1992; Thompson and Ye, 1991; Duszak, 1994), but al- ways for manual analysis ... show that the annotation scheme can be learned by trained annotators and subsequently applied in a consistent way. Because the scheme is reliable, hand-annotated data can be used to train a system ... Proceedings of EACL '99 An annotation scheme for discourse-level argumentation in research articles Simone Teufel t and Jean Carletta f and Marc Moens ~ tHCRC Language Technology Group and...
  • 8
  • 396
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Phrase Table Training For Precision and Recall: What Makes a Good Phrase and a Good Phrase Pair?" doc

... phrases appear only a few times in training data, a phrase pair translationis also evaluated by lexical weights (Koehn et al.,2003) or term weighting (Zhao et al., 2004) as addi-tional features ... training data sizeis small.3.2 Bilingual Information MetricTrying to find phrase translations for any possible n-gram is not a good idea for two reasons. First, dueto data sparsity and/ or alignment ... can put as many features aspossible together under the log-linear model to eval-uate the quality of a phrase and a phase pair. Thephrase table extracting procedure is trainable and can be optimized...
  • 8
  • 472
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "An Integrated Architecture for Shallow and Deep Processing" doc

... trend in application-oriented natural language processing (e.g., in thearea of term, information, and answer extraction)has been to argue that for many purposes, shallownatural language processing ... construction, and for providing se-mantically based selectional restrictions to help con-straining the search space during deep parsing. Ger-maNet (Hamp and Feldweg, 1997) is a large lexicaldatabase, ... are associated with POS in- formation and semantic sorts, which are organized in a fine-grained hierarchy. The HPSG lexicon, on theother hand, is comparatively small and has a morecoarse-grained...
  • 8
  • 414
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Weakly Supervised Learning for Hedge Classification in Scientific Literature" pot

... iswell within the range usually accepted as represent-ing ‘good’ agreement, and thus we are confident in accepting human labeling as a gold-standard for thehedge classification task. For our experiments, ... training samples, the basic paradigm for both co-training and self-training. However wegeneralise by framing the task in terms of the acqui-sition of labelled training data, from which a super-vised ... classifier can subsequently be learned.7 A Probabilistic Model for Training DataAcquisition In this section, we derive a simple probabilisticmodel for acquiring training data for a given learn-ing...
  • 8
  • 470
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "An Unsupervised System for Identifying English Inclusions in German Text" doc

... training on the space travel and test-ing on the internet data. We chose these two do-main pairs to ensure that both the training and testdata contain a relatively large number of English in- clusions. ... described above. Althoughboth domains contain a large number of English in- clusions, their type-token ratio amounts to 0.29 in the internet data and 0.15 in the space travel data(Table 1), signalling ... the tagger’s performance on a new do-main containing more unknown inclusions, we rantwo cross-domain (CD) experiments: CD1, train-ing on the internet and testing on the space traveldata, and...
  • 6
  • 333
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnchuyên đề điện xoay chiều theo dạngNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longChuong 2 nhận dạng rui roKiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Quản lý nợ xấu tại Agribank chi nhánh huyện Phù Yên, tỉnh Sơn La (Luận văn thạc sĩ)BT Tieng anh 6 UNIT 2Tăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtTrách nhiệm của người sử dụng lao động đối với lao động nữ theo pháp luật lao động Việt Nam từ thực tiễn các khu công nghiệp tại thành phố Hồ Chí Minh (Luận văn thạc sĩ)BÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIHIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ