Nghiên cứu công nghệ số hóa và tạo lập chỉ số trong hệ quản trị nội dung

74 400 0
Nghiên cứu công nghệ số hóa và tạo lập chỉ số trong hệ quản trị nội dung

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ HÕA NGHIÊN CỨU CÔNG NGHỆ SỐ HÓA VÀ TẠO LẬP CHỈ SỐ TRONG HỆ QUẢN TRỊ NỘI DUNG LUẬN VĂN THẠC SĨ Hà Nội - 2013 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ HÕA NGHIÊN CỨU CÔNG NGHỆ SỐ HÓA VÀ TẠO LẬP CHỈ SỐ TRONG HỆ QUẢN TRỊ NỘI DUNG Ngành: Công nghệ thông tin Chuyên ngành: Công nghệ phần mềm Mã số: 60 48 10 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: TS Trần Minh Hà Nội - 2013 LỜI CẢM ƠN Trước tiên xin bày tỏ lòng biết ơn sâu sắc tới TS Trần Minh, Phó viện trưởng Viện công nghiệp phần mềm nội dung số Việt Nam Trong thời gian làm luận văn tốt nghiệp, thầy dành nhiều thời gian quí báu tận tình bảo, hướng dẫn việc nghiên cứu, thực luận văn Tôi xin cảm ơn thầy giáo, cô giáo giảng dạy trình học tập làm luận văn Các thầy cô giúp hiểu thấu đáo lĩnh vực mà nghiên cứu để vận dụng kiến thức vào công tác Xin cảm ơn bạn bè, đồng nghiệp tạo điều kiện tốt nhất, động viên, cổ vũ suốt trình học tập nghiên cứu để hoàn thành luận văn tốt nghiệp Hà Nội, tháng 12 năm 2013 Học viên thực Nguyễn Thị Hòa LỜI CAM ĐOAN Tôi xin cam đoan rằng, kết nghiên cứu có giúp đỡ lớn thầy hướng dẫn đồng nghiệp trường Đại học Hải Dương Các số liệu kết nêu luận văn trung thực chưa công bố công trình nghiên cứu khác Trong luận văn, có tham khảo đến số tài liệu số tác giả liệt kê phần tài liệu tham khảo cuối luận văn Hà Nội, tháng 12 năm 2013 Học viên thực Nguyễn Thị Hòa MỤC LỤC DANH MỤC CÁC CHỮ VIẾT TẮT DANH SÁCH BẢNG DANH SÁCH HÌNH VẼ MỞ ĐẦU Chương PHÂN TÍCH QUÁ TRÌNH SỐ HÓA 11 1.1 Công nghệ số hóa 11 1.1.1 Khái niệm 11 1.1.2 Tại phải số hóa liệu 11 1.1.3 Ưu điểm Hạn chế 11 1.1.4 Quá trình số hóa 12 1.2 Công nghệ mã nguồn mở chụp tài liệu 13 1.2.1 Giới thiệu TWAIN thư viện Dynamic Net TWAIN 13 1.2.2 Giới thiệu thư viện SANE 17 Chương LẬP METADATA VÀ CHỈ MỤC NGƯỢC ĐỂ LƯU TRỮ VÀ TÌM KIẾM 35 2.1 Cơ sở tạo lập 35 2.2 Metadata tạo lập (xác thực) 36 2.3 Metadata tìm kiếm (Dublin Core) 36 2.3.1 Tạo lập metadata 37 2.3.2 Lựa chọn chuẩn liệu đặc tả 37 2.4 Phương pháp lập mục ngược để tìm kiếm tài liệu 43 2.4.1 Đánh mục 44 2.4.2 Truy vấn theo nhóm từ 48 2.5 GreenStone tạo lập mục 49 2.5.1 Tổng quan GreenStone 49 2.5.2 Quá trình xây dựng sưu tập 55 Chương ỨNG DỤNG THỬ NGHIỆM 56 3.1 Bài toán ứng dụng 56 3.1.1 Yêu cầu thực tế 56 3.1.2 Bài toán ứng dụng 56 3.2 Ứng dụng thử nghiệm 57 3.2.1 Ứng dụng scan văn 57 3.2.2 Tạo văn lưu trữ với GLI (sau gọi chung sưu tập) 59 3.3.3 Một số giao diện trang lưu trữ tìm kiếm văn 64 3.3 Đánh giá 66 KẾT LUẬN 67 TÀI LIỆU THAM KHẢO 68 PHỤ LỤC: Các xử lý chương trình Scan văn 69 DANH MỤC CÁC CHỮ VIẾT TẮT Từ viết tắt Ý nghĩa Giải thích tiếng Việt API Application Programming Interface CCVC Công chức viên chức CNTT Công nghệ thông tin GLI GreenStone Librarian Interface GNU GNU's Not Unix SANE Scanner Access Now Easy Truy cập máy quét dễ dàng XML eXtensible Markup Language Ngôn ngữ đánh dấu mở rộng Giao diện lập trình ứng dụng Giao diện GreenStone thư viện DANH SÁCH BẢNG Bảng 1.1: Mã trạng thái (Status Codes) 21 Bảng 1.6: Giá trị ý nghĩa SANE_ACTION 27 Bảng 2.1: Các thành tố đặc tả liệu Dublin Core 39 Bảng 2.2: Bảng danh sách Plugin 51 Bảng 2.3: Bảng tên thành phần hiển thị trang web 55 DANH SÁCH HÌNH VẼ Hình 1.1: Mô hình tổng quan hệ thống số hóa tài liệu 12 Hình 1.2: Các yếu tố TWAIN 13 Hình 1.4: Quá trình thu thập liệu 14 Hình 1.6: Dynamic Net TWAIN Microsoft Visual Studio Net 17 Hình 1.7: Khung chương trình 32 Hình 1.8: Thuộc tính vùng quét (Scan area options) 34 Hình 2.1: Mô hình thực nghiệp vụ hành 35 Hình 2.2: Sơ đồ chuyển đổi văn gốc vào hệ thống tin học 36 Hình 2.3: Danh sách posting cho từ Brutus, Caesar, Calpurnia 44 Hình 2.4: Quá trình xây dựng token 45 Hình 2.5: Tạo token từ Tài liệu 1, Tài liệu 45 Hình 2.6: Sắp xếp theo từ mục 46 Hình 2.7: Dictionary Postings 47 Hình 2.8: Kết truy vấn hai từ Brutus, Caesar 48 Hình 2.10: Tài liệu liệt kê theo vùng alphabet 54 Hình 3.1: Chế độ quét 1-bit BW 58 Hình 3.2: Chế độ quét 8-bit Gray 58 Hình 3.3: Chế độ quét 24-bit RGB 59 Hình 3.4: Tạo sưu tập 60 Hình 3.5: Chọn tài liệu cho sưu tập 60 Hình 3.6: Biên mục tài liệu theo chuẩn Dublin Core 61 Hình 3.7: Lựa chọn Plugin cho tài liệu 61 Hình 3.8: Chỉ mục tìm kiếm 62 Hình 3.9: Thêm mục tìm kiếm 62 Hình 3.10: Tạo nút tìm kiếm 63 Hình 3.11: Xây dựng sưu tập 63 Hình 3.12: Định dạng Email, ảnh hiển thị 63 Hình 3.13: Các thư mục chứa file tài liệu file đặc tả tương ứng (XML) 64 Hình 3.14: Giao diện giới thiệu 64 Hình 3.15: Tìm kiếm theo tùy chọn 65 Hình 3.16: Tìm kiếm theo tên tệp tin 65 Hình 3.17: Tìm kiếm theo thể loại 65 Hình 3.18: Tìm kiếm theo thời gian 66 58 Hình 3.1: Chế độ quét 1-bit BW Hình 3.2: Chế độ quét 8-bit Gray 59 Hình 3.3: Chế độ quét 24-bit RGB Scan: Select: Cho phép người dùng chọn máy scan PixelType & Bit Depth: Thiết lập PixelType (BW, Gray, RGB), Bit Depth (1 bit, bit, 24 bit) cho ảnh quét Resolution: Thiết lập độ phân giải cho ảnh quét Error: Hiển thị thông báo lỗi xảy trình quét tài liệu Save: Các định dạng lưu ảnh quét ( BMP, JPEG, PNG, TIFF, PDF) Riêng định dạng TIFF, PDF có thêm lựa chọn Multi-Page TIFF, Multi-Page PDF tương ứng Create Index: Tạo mục cho ảnh quét để phục vụ công tác lưu trữ, tìm kiếm Chọn chức chạy ứng dụng Librarian Interface (GLI) để lưu trữ, tìm kiếm tài liệu quét, ứng dụng nêu phần 3.3.2 3.2.2 Tạo văn lưu trữ với GLI (sau gọi chung sưu tập) Cài đặt công cụ GreenStone, sử dụng chức GLI (GreenStone Librarian 60 Interface) để tạo sưu tập lưu trữ văn GLI cung cấp giao diện thực bước tạo sưu tập Quá trình thực mô tả qua bước sau:  Bước 1: Tạo sưu tập (cụ thể thư mục để lưu trữ tất xử lý sưu tập) Gõ tên, mô tả tóm tắt cho sưu tập: Hình 3.4: Tạo sưu tập  Bước 2: Chọn tài liệu cần tạo sưu tập Chọn tập tin tài liệu “Vùng làm việc” kéo thả vào cửa sổ “Sưu tập”: Hình 3.5: Chọn tài liệu cho sưu tập 61  Bước 3: Biên mục cho tài liệu đưa vào theo chuẩn Dublin Core Chọn flie tương ứng biên mục theo 15 trường Dublin Core: Hình 3.6: Biên mục tài liệu theo chuẩn Dublin Core  Bước 4: Lựa chọn Plugin Mỗi định dạng file ta có Plugin tương ứng, ta bổ xung xóa bớt plugin cần: Hình 3.7: Lựa chọn Plugin cho tài liệu  Bước 5: Chỉ mục tìm kiếm (mặc định gồm tiêu chí) 62 Hình 3.8: Chỉ mục tìm kiếm Để thêm tiêu chí tìm kiếm chuyển sang bước 6, không chuyển sang bước  Bước 6: Chọn bổ xung tìm kiếm mục Hình 3.9: Thêm mục tìm kiếm  Bước 7: Bộ phân lớp duyệt xem Tạo thêm nút hiển thị trình duyệt: 63 Hình 3.10: Tạo nút tìm kiếm  Bước 8: Xây dựng sưu tập Hình 3.11: Xây dựng sưu tập  Bước 9: Một số định dạng Hình 3.12: Định dạng Email, ảnh hiển thị Kết việc tạo sưu tập bao gồm tập hợp thư mục, thư mục chứa file tài liệu, file XML đặc tả cho file tài liệu 64 Hình 3.13: Các thư mục chứa file tài liệu file đặc tả tương ứng (XML) 3.3.3 Một số giao diện trang lưu trữ tìm kiếm văn Hình 3.14: Giao diện giới thiệu 65 Hình 3.15: Tìm kiếm theo tùy chọn Hình 3.16: Tìm kiếm theo tên tệp tin Hình 3.17: Tìm kiếm theo thể loại 66 Hình 3.18: Tìm kiếm theo thời gian 3.3 Đánh giá Sau sử dụng công cụ thực nghiệm có số nhận xét sau: Với toán đặt làm quản lý tất loại văn phát sinh nghiệp vụ hành trường Đại học Hải Dương mà đảm bảo tính pháp lý phục vụ tìm kiếm trao đổi thông tin Phương pháp số hóa văn tạo lập mục giải pháp tốt; Ứng dụng bước đầu cung cấp yếu tố giúp nhà quản lý văn quét, lưu trữ, tìm kiếm theo số yếu tố đặc trưng Tuy nhiên chức đơn giản cần hoàn thiện nữa; Ứng dụng với giao diện Tiếng Việt dễ sử dụng; Với công cụ mã nguồn mở khả phát triển ứng dụng cao, người sử dụng dễ dàng nâng cao ứng dụng thông qua định dạng đặc tả phát sinh trình thực hiện; Ngoài hệ thống văn thư lưu trữ, công cụ GreenStone sử dụng lĩnh vực khác như: thông tin thư viện, quản lý đề tài, đồ án, luận văn,…vv Bài toán quản lý văn thư lưu trữ trường Đại học Hải Dương giải thực trạng tồn Nhà trường, giải vấn đề lưu trữ mà ngày người quản lý phải lưu lại với cặp giấy tờ, giải vấn đề mở rộng phạm vi sử dụng văn văn số hóa khả trao đổi tìm kiếm dễ dàng, đặc biệt đảm bảo tính pháp lý văn ban hành Bài toán mang ý nghĩa thực tế cao, đáp ứng nhu cầu người sử dụng, giúp công việc người làm việc hành nhanh chóng gọn nhẹ so với việc xử lý kho liệu khổng lồ ngày tăng lên nhiều 67 KẾT LUẬN Ngày với phát triển mạnh mẽ internet lĩnh vực sống tin học hóa Việc ứng dụng công nghệ thông tin vào hoạt động sản xuất, kinh doanh, giải trí mang lại lợi ích đáng kể Ngành giáo dục có phát triển vượt bậc, phủ nhận đóng góp không nhỏ việc nhanh chóng áp dụng công nghệ thông tin để đổi phương pháp giáo dục quản lý Trong phạm vi nghiên cứu luận văn tốt nghiệp này, tìm hiểu ngôn ngữ số hóa văn bản, cách thức tạo lập mục để lưu trữ, tìm kiếm đảm bảo tính pháp lý, tính đắn văn ban hành theo quy định văn hành nhà nước ứng dụng Cụ thể ứng dụng thực quét, quản lý, tìm kiếm văn trường Đại học Hải Dương Sau thời gian nghiên cứu xây dựng đề tài tốt nghiệp, yêu cầu giải quyết, nhiên không tránh khỏi nhứng hạn chế định Dưới kết đạt hướng phát triển đề tài:  Kết đạt được: Tìm hiểu trình số hóa liệu: khái niệm số hóa liệu, đưa lý cần số hóa liệu trình số hóa liệu thể nghiệp vụ hành quan, tổ chức; Tìm hiểu công nghệ số hóa tài liệu TWAIN, SANE: thuộc tính, phương thức thông dụng, hàm ngôn ngữ SANE, khung chương trình để áp dụng vào việc xây dựng ứng dụng quét văn bản; Tìm hiểu thư viện DynamicDotNetTwain: phương thức, thuộc tính thư viện đặc biệt tích hợp thư viện DynamicDotNetTwain.dll vào Visual Studio để xây dựng mã nguồn cho ứng dụng quét văn bản; Tìm hiểu công cụ hữu ích GreenStone liên quan tới việc tạo lập số theo chuẩn Dublin Core để lưu trữ tím kiếm văn bản; Xây dựng ứng dụng nhỏ để scan, tạo lập, lưu trữ tìm kiếm văn áp dụng công tác văn thư lưu trữ trường Đại học Hải Dương công cụ GreenStone  Hướng phát triển đề tài: Mở rộng ứng dụng scan văn với thuật toán xử lý ảnh quét như: làm trắng nền, nâng cao độ tương phản chữ nền, tự động xoay ảnh, tự động cắt bỏ đường viền; Nhận dạng chữ viết, thực tìm kiếm nội dung văn để có kết tìm kiếm tối ưu nhất; Nghiên cứu công cụ GreenStone để xây dựng ứng dụng văn thư lưu trữ hoàn thiện hơn, nhiều tính đưa vào sử dụng trường Đại học Hải Dương 68 TÀI LIỆU THAM KHẢO Tiếng Việt Bộ Thông tin Truyền thông (2011), Thông tư Quy định việc tạo lập, sử dụng lưu trữ liệu đặc tả trang thông tin điện tử cổng thông tin điện tử quan nhà nước, Hà Nội Lã Thị Duyên, Vai trò công tác lưu trữ hành nhà nước, Cục Văn thư – Lưu trữ Nhà nước, tr.1-4 Chính Phủ (2007), Nghị định 79 cấp từ sổ gốc, chứng thực từ chính, chứng thực chữ ký, Hà Nội, tr.4-7 Phạm Minh Quân (2003), Hiểu sử dụng Dublin Core, Bản tin, Phòng tài nguyên thông tin, Thư viện ĐH Khoa học Tự nhiên, ĐHQG TPHCM, tr.28-30, 32-36 Viện Công nghiệp Phần mềm Nội dung số Việt Nam – Bộ Thông tin Truyền thông (2012), Phần mềm nội dung số, Tạp chí số 3, Hà Nội, tr.32-44 Vũ Thị Thu Trang (2009), Tìm hiểu phần mềm mã nguồn mở GreenStone, Đồ án tốt nghiệp, ĐH Dân lập Hải Phòng, tr.22-47 Tiếng Anh TWAIN Working Group on July (2009), TWAIN Specification Version 2.1 Website http://www.dynamsoft.com/help/TWAIN/.Net-TWAIN-Scanner/index.htm http://www.greenstone.org 10 http://tailieutonghop.com/free/cac-phuong-phap-lap-chi-muc-tai-lieu-trong-hetim-kiem-thong-tin_f240-28255.html 11 http://vanthuluutru.dongnai.gov.vn/View.aspx?Id=37 12 http://www.twain.org/ 13 http://www.sane-project.org 69 PHỤ LỤC: Các xử lý chương trình Scan văn Mở Data Source Manager dynamicDotNetTwain.OpenSourceManager(); Lấy tất thiết bị máy quét kết nối với máy tính int lngNum; dynamicDotNetTwain.OpenSourceManager(); for (lngNum = 0; lngNum < dynamicDotNetTwain.SourceCount; lngNum++) { cmbSource.Items.Add(dynamicDotNetTwain.SourceNameItems(Convert.ToInt 16(lngNum))); } if (lngNum > 0) cmbSource.SelectedIndex = 0; Lựa chọn máy scan thực scan với tùy chọn quét private void AcquireImage() { dynamicDotNetTwain.SelectSourceByIndex(Convert.ToInt16(cm bSource.SelectedIndex)); dynamicDotNetTwain.OpenSource(); dynamicDotNetTwain.IfDisableSourceAfterAcquire = true; if (optBW.Checked == true) { dynamicDotNetTwain.PixelType = Dynamsoft.DotNet.TWAIN.Enums.TWICapPixelType.TWPT_BW; dynamicDotNetTwain.BitDepth = 1; } else if (optGray.Checked == true) { dynamicDotNetTwain.PixelType = Dynamsoft.DotNet.TWAIN.Enums.TWICapPixelType.TWPT_GRAY; dynamicDotNetTwain.BitDepth = 8; } 70 else { dynamicDotNetTwain.PixelType = Dynamsoft.DotNet.TWAIN.Enums.TWICapPixelType.TWPT_RGB; dynamicDotNetTwain.BitDepth = 24; } if (cmbResolution.SelectedIndex == 0) { dynamicDotNetTwain.Resolution = 100; } else if (cmbResolution.SelectedIndex == 1) { dynamicDotNetTwain.Resolution = 150; } else if (cmbResolution.SelectedIndex == 2) { dynamicDotNetTwain.Resolution = 200; } else { dynamicDotNetTwain.Resolution = 300; } if (dynamicDotNetTwain.Resolution != int.Parse(cmbResolution.Text)) { string errorstr = "Loi thiet lap phan giai."; errorstr += "\r\n"; errorstr += "Do phan giai ban thiet lap nguon khong cung cap."; errorstr += "\r\n"; txtErrorString.Text = txtErrorString.Text + errorstr; } dynamicDotNetTwain.AcquireImage(); } 71 Lưu hình ảnh quét private void cmdSave_Click(object sender, EventArgs e) { string strFile; if (BMPradio.Checked == true) { dlgFileSave.Filter = "BMP File (*.bmp)|*.bmp"; } else if (JPEGradio.Checked == true) { dlgFileSave.Filter = "JPEG File (*.jpg)|*.jpg"; } else if (PNGradio.Checked == true) { dlgFileSave.Filter = "PNG File (*.png)|*.png"; } else if (TIFFradio.Checked == true) { dlgFileSave.Filter = "TIFF File (*.tif)|*.tif"; } else if (PDFradio.Checked == true) { dlgFileSave.Filter = "PDF File (*.pdf)|*.pdf"; } dlgFileSave.InitialDirectory = System.IO.Directory.GetCurrentDirectory(); dlgFileSave.ShowDialog(); strFile = dlgFileSave.FileName; if (BMPradio.Checked == true) { dynamicDotNetTwain.SaveAsBMP(strFile, dynamicDotNetTwain.CurrentImageIndexInBuffer); } else if (JPEGradio.Checked == true) { 72 dynamicDotNetTwain.SaveAsJPEG(strFile, dynamicDotNetTwain.CurrentImageIndexInBuffer); } else if (PNGradio.Checked == true) { dynamicDotNetTwain.SaveAsPNG(strFile, dynamicDotNetTwain.CurrentImageIndexInBuffer); } else if (TIFFradio.Checked == true) { if (MultiTIFF.Checked == true) { dynamicDotNetTwain.SaveAllAsMultiPageTIFF(strFile); } else { dynamicDotNetTwain.SaveAsTIFF(strFile, dynamicDotNetTwain.CurrentImageIndexInBuffer); } } else if (PDFradio.Checked == true) { if (MultiPDF.Checked == true) { dynamicDotNetTwain.SaveAllAsPDF(strFile); } else { dynamicDotNetTwain.SaveAsPDF(strFile, dynamicDotNetTwain.CurrentImageIndexInBuffer); } } } [...]... được Đối tƣợng và phạm vi nghiên cứu Đối tượng nghiên cứu: Công nghệ số hóa văn bản TWAIN, SANE (Scanner Access Now Easy), ứng dụng Greenstone trong việc lưu trữ và tạo lập chỉ mục Phạm vi nghiên cứu: Luận văn tập trung nghiên cứu cơ sở xử lý, lưu trữ và chuyển giao văn bản tại trường Đại học Hải Dương bằng công nghệ số hóa văn bản TWAIN, SANE và tạo lập chỉ mục sử dụng ứng dụng Greenstone Kết cấu của... trình số hóa Chương này trình bày về khái niệm số hóa và tạo lập chỉ số, lý do tại sao cần số hóa, các ưu điểm, nhược điểm của việc số hóa dữ liệu, và đặc biệt là trình bày về công nghệ mã nguồn mở trong sao chụp tài liệu (thư viện Dynamic Net TWAIN, thư viện mã nguồn mở SANE) Chƣơng 2: Lập metadata và chỉ mục ngƣợc để lƣu trữ và tìm kiếm Chương này trình bày hai giai đoạn tạo lập metadata, metadata tạo. .. giả đã nghiên cứu và nhận thấy rằng công 10 nghệ số hóa và tạo lập chỉ mục sẽ giúp cho các cơ quan tổ chức quản lý và trao đổi văn bản điện tử một cách dễ dàng hơn và đặc biệt tuân thủ các quy phạm pháp luật về hành chính Qua thực tế tại trường Đại học Hải Dương tác giả sẽ đưa ra mô hình quản lý, lưu trữ và trao đổi văn bản của Nhà trường với kết quả đã nghiên cứu được Đối tƣợng và phạm vi nghiên cứu. .. metadata tạo lập (mang tính xác thực văn bản), metadata mô tả nội dung (Dublin Core - phục vụ trong quá trình tìm kiếm văn bản), nghiên cứu phương pháp tạo lập chỉ mục ngược để lưu trữ và tìm kiếm Chƣơng 3: Ứng dụng thử nghiệm Chương này sẽ đưa ra ứng dụng scan văn bản, ứng dụng Greenstone trong việc lưu trữ, tạo lập chỉ mục văn bản đã được số hóa tại trường Đại học Hải Dương minh họa cho các nghiên cứu ở... giữa hệ thống máy quét, hệ thống lập chỉ mục, tách bộ (điển hình là phần mềm Kodak Capture Pro) và hệ thống quản lý khai thác tài liệu (mà hiện nay thông dụng là giải pháp quản lý tài liệu Docuflo) 1.2 Công nghệ mã nguồn mở trong sao chụp tài liệu 1.2.1 Giới thiệu TWAIN và thư viện Dynamic Net TWAIN 1.2.1.1 TWAIN  Tổng quan về TWAIN TWAIN [7, 12] định nghĩa một phần mềm giao thức chuẩn và giao diện lập. .. mà chỉ chỉnh sửa chất lượng mang tin, như tài liệu bị mờ, bị hư hỏng nặng cần chỉnh sửa b Hạn chế [11]: Khi bắt đầu xây dựng một đề án số hóa tài liệu lưu trữ, cần phải đầu tư ban đầu 12 về công nghệ, cơ sở hạ tầng công nghệ thông tin và các thiết bị khác, ví dụ, cần phải đầu tư mua sắm, hoặc thuê từng phần các thiết bị phần cứng như máy tính, máy in, máy quét ảnh và các chương trình phần mềm để quản. .. Thiết lập giá trị thuộc tính Giá trị thuộc tính được truyền qua đối số v có thể được thay đổi bởi backend nếu giá trị không thể thiết lập một cách chính xác Bật chế độ tự động Backend hoặc thiết bị sẽ tự động lựa chọn một giá trị phù hợp Sau khi thiết lập giá trị với giá trị action value là SANE_ACTION_SET_VALUE, các thông tin thêm về mức độ thành công của yêu cầu thiết lập được trả về trong đối số *i... với những người chuyên làm công tác quản trị mạng, nhưng không giản đơn đối với toàn bộ công chức, viên chức của cả một cơ quan, tổ chức có sử dụng cơ sở dữ liệu số hóa Việc triển khai sử dụng gặp nhiều khó khăn do phải thực hiện training đồng bộ và có hệ thống Ngoài ra việc bảo mật dữ liệu cũng là một thách thức lớn 1.1.4 Quá trình số hóa Mô hình tổng quan của hệ thống số hóa tài liệu được mô tả ở... nhiêu dòng quét Nếu giá trị này là -1 thì nghĩa là không lấy được số dòng quét, frontend nên gọi hàm sane_read() tới khi nó trả về giá trị SANE_STATUS_EOF Trường bytes_per_line: chỉ rõ số byte cho một dòng quét Trường depth: chỉ rõ số bit của một mẫu Trường pixels_per_line: chỉ rõ số điểm ảnh cho một dòng quét Giả sử B là số kênh trong một khung, khi đó số byte trên dòng (được cho trong trường bytes_per_line)... quản lý và tra tìm tài liệu Khi đã có đầy đủ các thiết bị phần cứng, phần mềm, việc thực hiện số hóa tài liệu có thể thuê các cơ quan chuyên môn thực hiện Ngoài ra, điều rất quan trọng là phải đầu tư cho yêu cầu đào tạo con người theo các mức độ khác nhau như đào tạo công chức làm quản lý, công chức, viên chức tác nghiệp và những cán bộ kỹ thuật, cán bộ chuyên tin Dữ liệu số hóa dễ bị sao chép và sửa ... GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ HÕA NGHIÊN CỨU CÔNG NGHỆ SỐ HÓA VÀ TẠO LẬP CHỈ SỐ TRONG HỆ QUẢN TRỊ NỘI DUNG Ngành: Công nghệ thông tin Chuyên ngành: Công nghệ phần mềm Mã số: 60... sau: Chƣơng 1: Phân tích trình số hóa Chương trình bày khái niệm số hóa tạo lập số, lý cần số hóa, ưu điểm, nhược điểm việc số hóa liệu, đặc biệt trình bày công nghệ mã nguồn mở chụp tài liệu (thư... Greenstone việc lưu trữ tạo lập mục Phạm vi nghiên cứu: Luận văn tập trung nghiên cứu sở xử lý, lưu trữ chuyển giao văn trường Đại học Hải Dương công nghệ số hóa văn TWAIN, SANE tạo lập mục sử dụng ứng

Ngày đăng: 30/11/2015, 13:17

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan