0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "ALIGNING A PARALLEL ENGLISH-CHINESE CORPUS STATISTICALLY WITH LEXICAL CRITERIA" doc

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "WebCAGe – A Web-Harvested Corpus Annotated with GermaNet Senses" docx

... perfor-mance of WSD algorithms for languages such asEnglish for which hand-crafted sense-annotatedcorpora have been available (Agirre et al., 2007;Erk and Strapparava, 2012; Mihalcea et al., ... amount of data that canreasonably be annotated by hand.Leacock et al. (1998), Agirre and Lopez de La-calle (2004), and Mihalcea and Moldovan (1999)propose a set of methods for automatic harvestingof ... be language inde-pendent and should be applicable to as manylanguages as possible for which the neces-sary input resources are available.(2) The quality of the automatically generateddata...
  • 10
  • 419
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "ALIGNING A PARALLEL ENGLISH-CHINESE CORPUS STATISTICALLY WITH LEXICAL CRITERIA" doc

... available in machine-readable form. We have obtained and converted these materials by special arrangement. The materials contain high-quality literal translation. Statements in LegCo may ... be made using either English or Cantonese, and are tran- scribed in the original language. A translation to the other language is made later to yield com- plete parallel texts, with annotations ... ments, given a pair of parallel texts. Formally, 2Cantonese is one of the four major Han Chinese languages. Formal written Cantonese employs the same characters as Mandarin, with some additions....
  • 8
  • 339
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Collecting a Why-question corpus for development and evaluation of an automatic QA-system" pdf

... each paid reward.• Qualifications To improve the data quality, a HIT can also be attached to certain tests,“qualifications” that are either system-providedor created by the requester. An example ... both answers. We calculated the overall averageagreement ratio (Total Avg) and the average of thebest matches between two assignments within oneHIT (Best Match). We ran the test for two data ... the assign-ments have been completed.• Rewards At upload time, each HIT has to beassigned a fixed reward, that cannot be changedlater. Minimum reward is $0.01. Amazon.comcollects a 10% (or a...
  • 9
  • 610
  • 1
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "GEMINI: A NATURAL LANGUAGE SYSTEM FOR SPOKEN-LANGUAGE UNDERSTANDING*" doc

... interpretation is available for each syntactic node. This is guaranteed by the seman- tic rule formalism and by the fact that every lexical item has a semantics associated with it. Table 2 contains ... example, the various categorial unification ap- proaches, such as Unification Categorial Gram- mar (Zeevat, Klein, and Calder, 1987)). Even when a syntactic skeleton is assumed, some approaches ... syntac- tic, semantic, and lexical rules are applied by a bottom-up all-paths constituent parser to populate a chart with edges containing syntactic, seman- tic, and logical form information....
  • 8
  • 376
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Creating a Multilingual Collocation Dictionary from Large Text Corpora" docx

... the collocation occurs (both col-location's keys occur on the same sentence, as theyare in a syntactical relation).When parallel corpora are available, also thetranslation equivalents of ... length-based and integrates a shal-low content analysis. It begins by individuating a paragraph in the target text which is a first candi-date as target paragraph, and which we call"pivot". ... two kinds of tests on the paragraphsin this span: a test of paragraph content, and a testof paragraphs relative size matching. The first testcompares the paragraphs' numbering (if present).The...
  • 4
  • 479
  • 0
Báo cáo khoa học: KCTD5, a putative substrate adaptor for cullin3 ubiquitin ligases docx

Báo cáo khoa học: KCTD5, a putative substrate adaptor for cullin3 ubiquitin ligases docx

... 12CA5 mAb against HA was from Roche(Indianapolis, IN, USA), anti-HA clone HA.11 was fromCovance (Berkely, CA, USA), anti-glutathione S-transferase(GST) and mAb against myc (9E10) were from Santa ... 403–410.29 Altschul SF, Madden TL, Schaffer AA, Zhang J,Zhang Z, Miller W & Lipman DJ (1997) GappedBLAST and PSI-BLAST: a new generation of proteindatabase search programs. Nucleic Acids Res ... Gene´tica Molecular, CSIC-Universidad de Valladolid, Spain2 Program of Inflammation, Inflammatory and Infectious Disease Center, and Program of Signal Transduction, Burnham Institute for MedicalResearch,...
  • 11
  • 402
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Creating a Gold Standard for Sentence Clustering in Multi-Document Summarization" potx

... DUC taskswhich range from single-/multi-document summa-rization to update summaries, where it is assumedthat the reader has already read earlier articlesabout an event and requires only an ... Hatzivas-siloglou et al. (2001) created a set of 10.535 man-ually marked pairs of paragraphs. Two human an-notator were asked to judge if the paragraphs con-tained ’common information’. They were ... same paragraph are clustered together whereasour approach is to find similar information be-tween documents. A gold standard for event identification wasbuilt by Naughton (2007). Ten annotators...
  • 9
  • 398
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Inducing a Semantically Annotated Lexicon via EM-Based Clustering" doc

... consisting of a class label, a selecting head, a grammatical relation, and a filler head. The class label is treated as hidden data in the EM- framework for statistical estimation. 2 EM-Based Clustering ... clustering approach, classes are derived directly from distributional data a sample of pairs of verbs and nouns, gathered by pars- ing an unannotated corpus and extracting the fillers of grammatical ... increase.as:s increase.aso:o fall.as:s pay.aso:o reduce.aso:o rise.as:s exceed.aso:o exceed.aso:s affect.aso:o grow.as:s include.aso:s reach.aso:s decline.as:s lose.aso:o act.aso:s...
  • 8
  • 245
  • 0
Báo cáo khoa học: FH8 – a small EF-hand protein from Fasciola hepatica docx

Báo cáo khoa học: FH8 – a small EF-hand protein from Fasciola hepatica docx

... andpurification of recombinant FH8, with the use ofconventional affinity tags, was not appropriate. As analternative, a construct was prepared with theH. Fraga et al. FH8 from Fasciola hepaticaFEBS ... Silva E, Castro A, Lopes A, Rodrigues A, Dias C,Conceic¸ a ˜o A, Alonso J, Costa JMC, Bastos M, Parra Fet al. (2004) A recombinant antigen recognized byFasciola hepatica-infected hosts. J Parasitol ... 4309–4316.24 Gopal B, Swaminathan CP, Bhattacharya A, Murthy MRN & Surolia A (1997) Thermodynamics ofmetal ion binding and denaturation of a calciumbinding protein from Entamoeba histolytica.Biochemistry...
  • 14
  • 356
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Synchronous Grammars for Semantic Parsing with Lambda Calculus" docx

... statistical machine translation ( SMT)community as a way of formalizing syntax-basedtranslation models between natural languages (NL).In generating multiple parse trees in a single deriva-tion, ... parsing is cast as a machine translation task,where an SCFG is used to model the translationof an NL into a formal meaning-representation lan-guage (MRL). Our algorithm, WASP, uses statisticalmodels ... multilingual GEOQUERYdata set. The 250-example data set is a subset of thelarger GEOQUERY corpus. All English questions inthis data set were manually translated into Spanish,Japanese and Turkish,...
  • 8
  • 336
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhPhối hợp giữa phòng văn hóa và thông tin với phòng giáo dục và đào tạo trong việc tuyên truyền, giáo dục, vận động xây dựng nông thôn mới huyện thanh thủy, tỉnh phú thọTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Nghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngNghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chếNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Sở hữu ruộng đất và kinh tế nông nghiệp châu ôn (lạng sơn) nửa đầu thế kỷ XIXChuong 2 nhận dạng rui roGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtĐổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt nam