Đang tải... (xem toàn văn)
Cách convert trên 123doc.vn
Convert tài liệu trên 123doc.vnNhững vấn đề gặp phải và giải pháp Giới thiệu 123doc.vnTrang chia sẻ tài liệu và sách hàng đầu Việt Nam. 200k tài liệu đã có trên hệ thống. Dự kiến đến tháng 4 – 2013 sẽ có 40k đầu sách.App Android & IOS đọc sách riêng. Yêu cầu kết quảĐầu vào: File tài liệu định dạng phổ biến: doc, docx, ppt, pptxĐầu ra:Định dạng htmlGiữ nguyên được form so với tài liệu gốcCỡ chữ, màu chữ, font chữCăn lềHình ảnh, bảng biểu, … Bước đầuGiải phápDoc, docx, ppt, pptx -> html qua OpenOffice PDF -> html dùng thư viện XPDF (Nguồn mở viết bằng C) Vấn đềMất hết cấu trúc html vì OpenOffice convert ra html dạng rất đơn giản. Tiếp theoGiải phápDoc, docx, … -> PDF Tất cả từ PDF -> HTML. Vấn đềFont chữ hầu như là sai hết. Bắt đầu nghiên cứu về font chữ. Font chữ trong PDF đều là font nhúng (embeded subset)-> Phải tách được riêng font chữ từ file pdf và hiển thị được trên trình duyệt. Lấy font trong file pdfDùng các chương trình sẵn có. Vấn đề: Không hiển thị được font đó trên HTML. Font Forge. Quản lý bộ nhớ, thời gian timeout và convert nhiều tài liệu tại một thời điểmVấn đề: Convert bị đứng dẫn đến nghẽn hệ thống không convert được. Trong quá trình convert -> Memory leak -> Server dieConvert được nhiều tài liệu cùng một lúc để giảm thời gian đợi của user. Giải pháp Dùng service. Service có khả năng Đón nhận id của các tài liệu gửi đếnPhân chia công việc, gọi đồng thời convertQuản lý thời gian timeout Quản lý memory Quản lý bộ nhớ, thời gian timeout và convert nhiều tài liệu tại một thời điểmQuản lý thời gian timeout & bộ nhớ sử dụng chức năng sẵn có của nhân Linux. ps -ao pid,etime,cmd | grep convert_to_html.php14062 00:10 convert_to_html.phpps -ao pid,rss | grep convert_to_html.php 14062 160000 Convert đồng thời. 3s service sẽ kiểm tra số lượng convert đang chạy: Nếu thiếu -> bù. Mô hìnhPDF•Doc, docx•Ppt, pptxHTML . Convert tài liệu trên 123doc.vnNhững vấn đề gặp phải và giải pháp Giới thiệu 123doc.vnTrang chia sẻ tài liệu và sách hàng đầu Việt Nam. 200k tài liệu. gian timeout và convert nhiều tài liệu tại một thời điểmVấn đề: Convert bị đứng dẫn đến nghẽn hệ thống không convert được. Trong quá trình convert ->