0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Tài liệu Báo cáo khoa học: "Learning with Unlabeled Data for Text Categorization Using Bootstrapping and Feature Projection Techniques" doc

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning with Unlabeled Data for Text Categorization Using Bootstrapping and Feature Projection Techniques" doc

... two approaches using unlabeled data in text categorization; one approach combines unlabeled data and labeled data, and the other approach uses the clustering technique for text categorization. ... labeled data. While labeled data are difficult to obtain, unlabeled data are readily available and plentiful. Therefore, this paper advocates using a bootstrapping framework and a feature projection ... projection technique with just unlabeled data for text categorization. The input to the bootstrapping process is a large amount of unlabeled data and a small amount of seed information to tell...
  • 8
  • 443
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Word-Class Lattices for Definition and Hypernym Extraction" doc

... learning,definitions are used to create and enrich concepts with textual information (Gangemi et al., 2003), and extract taxonomic and non-taxonomic rela-tions (Snow et al., 2004; Navigli and Velardi,2006; Navigli, ... |sk|} and b ∈ {1, . . . , |sj|},Sa,bis a score of the matching between the a-thtoken of sk and the b-th token of sj, and M0,0,M0,b and Ma,0are initially set to 0 for all a and b.The ... Westerhout and Paola Monachesi. 2007. Extrac-tion of dutch definitory contexts for eLearning pur-poses. In Proceedings of CLIN.Eline Westerhout. 2009. Definition extraction using linguistic and structural...
  • 10
  • 567
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Sub-Word Units for Open Vocabulary Speech Recognition" doc

... words;the collection of σs form the lexicon. Each unitσ is present in a segmentation with some contextc = (φl, φr) of the form φlσφr. Features based onthe context and the unit itself parameterize ... corpus with segmentations and corresponding features. The notation m ih/1:1represents unit/label :feature- value. Overlapping contextfeatures capture rich segmentation regularities associated with ... language model training text is converted intophones using the dictionary (or a letter-to-soundmodel for OOVs), and a N-gram phone LM is es-timated on this data and pruned using a relative en-tropy...
  • 10
  • 441
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Trimming CFG Parse Trees for Sentence Compression Using Machine Learning Approaches" pptx

... proposed for sentence compression (Witbrock and Mittal, 1999;Jing and McKeown, 1999; Vandeghinste and Pan,2004), this paper focuses on Knight and Marcu’snoisy-channel model (Knight and Marcu, ... Y), is produced, and 851contextual information, x (∈ X ), is observed. Torepresent whether the event (x, y) satisfies a cer-tain feature, we introduce a feature function. A feature function ... changes. Turner and Charniak (Turner and Charniak, 2005) revised and improved Knight and Marcu’s algorithm; however, their algorithm alsouses only mother and daughter relations and hasthe same...
  • 8
  • 370
  • 0
Tài liệu Báo cáo khoa học: Is ATP binding responsible for initiating drug translocation by the multidrug transporter ABCG2? docx

Tài liệu Báo cáo khoa học: Is ATP binding responsible for initiating drug translocation by the multidrug transporter ABCG2? docx

... post-hydrolysis. Therefore, the dissoci-ation of phosphate and ⁄ or ADP is likely to be responsible for resettingof the transporter. The data indicate that, like ABCB1 and ABCC1,the ‘power stroke’ for translocation ... provided the most information. For two of theproteins, ABCB1 and ABCC1, it has been demon-strated that the binding of nucleotide imparts marked and essential conformational changes within TMDs.The ... concentration, and the data were fitted with the Langmuir binding isotherm using nonlinear least-squaresregression. (B) Photoaffinity labelling of purified ABCG2R482G(0.25 lg) was undertaken using a...
  • 9
  • 564
  • 0
Tài liệu Báo cáo khoa học: a-Conotoxins as tools for the elucidation of structure and function of neuronal nicotinic acetylcholine receptor subtypes doc

Tài liệu Báo cáo khoa học: a-Conotoxins as tools for the elucidation of structure and function of neuronal nicotinic acetylcholine receptor subtypes doc

... nullmutants [72]. Immunoprecipitation and ligand bindingstudies [21] confirmed that a4b2* (with possible inclusionof a5 subunits) and a6b2* (with possible inclusion of a4 and b3 subunits) are the main ... obtained with EpI. Thisa-conotoxin was originally characterized on rat intracardiacganglia neurons and bovine chromaffin cells and assumed tobe selective for a3b2anda3b4 interfaces and unable ... target for prey capture. However, the geneticinformation for ÔunderdevelopedÕ a-conotoxins targetingother nAChR subtypes might still be present in the snails and could supply novel ligands for...
  • 15
  • 757
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Collecting Highly Parallel Data for Paraphrase Evaluation" doc

... paraphrasers”, with the result that there areno readily available large corpora and no consistentstandards for what constitutes a high-quality para-phrase. In addition to the lack of standard datasets for ... our data collection framework for use on crowdsourcing platforms such as Amazon’sMechanical Turk. Crowdsourcing can allow inex-pensive and rapid data collection for various NLPtasks (Ambati and ... 4, with 4being the best. A paraphrase identical to the sourcesentence would receive a score of 4 for meaning and 1 for dissimilarity and overall. We randomly se-lected 200 source sentences and...
  • 11
  • 418
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Mobile Touchable Application for Online Topic Graph Extraction and Exploration of Web Content" ppt

... the infor-mation space, the current search engine paradigmdoes not provide enough assistance for these kindof searches. The user has to read through the docu-ments and then eventually reformulate ... actuallylabeled with the specific relation that exists betweenthe nodes.In this way the user can explore in an uniform wayboth new information nuggets and validated back-ground information nuggets ... perform text exploration from the Web (via button labeled “i–GNSSMM”) or via Wikipedia (touching button “i–MILREX”). The Figures 2, 3, 4, 5 show results for the “i–GNSSMM” mode, and Fig. 6 for...
  • 6
  • 458
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Outilex, a Linguistic Platform for Text Processing" pdf

... Outilex, a generalist linguis-tic platform for text processing. The plat-form includes several modules implement-ing the main operations for text processing and is designed to use large-coverage ... cov-erage for French and English, originating from theformer LADL1, will be distributed with the plat-form under LGPL-LR2license.The platform aims to be a generalist base for di-verse ... work on severalprojects with specific texts, dictionaries and gram-mars.1French Laboratory for Linguistics and Information Re-trieval2Lesser General Public License for Language Resources,http://infolingu.univ-mlv.fr/lgpllr.html.3http://www.dcs.shef.ac.uk/...
  • 4
  • 428
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning to Translate with Multiple Objectives" doc

... #of features, and metrics used. Our MT models are trained with standard phrase-based Moses software (Koehn and others, 2007), with IBM M4 alignments, 4gram SRILM,lexical ordering for PubMed and ... combining metrics using machine learning for better correlation with human judgments (Liu and Gildea, 2007; Albrecht and Hwa, 2007; Gimnez and M`arquez, 2008) and may give insights for setting {pk}. ... outperform a single-objective opti-mizer in its own metric. In Figure 2, single-objective PRO focusing on optimizing RIBESonly achieves 0.68, but PMO-PRO using bothBLEU and RIBES outperforms with...
  • 10
  • 624
  • 0

Xem thêm

Từ khóa: tài liệu báo cáo nghiên cứu khoa họctài liệu về báo cáo khoa họcbáo cáo khoa học tài chính côngbáo cáo khoa học số loài quý hiếm tại vườn quốc gia ba bểtai lieu bao cao thuc tap khoa co khitai lieu bao cao thuc tap tai khoa duoc benh vienBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Báo cáo quy trình mua hàng CT CP Công Nghệ NPVchuyên đề điện xoay chiều theo dạngNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitNGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWAN SLIDEQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longThơ nôm tứ tuyệt trào phúng hồ xuân hươngSở hữu ruộng đất và kinh tế nông nghiệp châu ôn (lạng sơn) nửa đầu thế kỷ XIXQuản lý nợ xấu tại Agribank chi nhánh huyện Phù Yên, tỉnh Sơn La (Luận văn thạc sĩ)Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Nguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtBÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015HIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMMÔN TRUYỀN THÔNG MARKETING TÍCH HỢPTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲ