Hỗ trợ các nhà nghiên cứu và các tổ chức trong việc khai thác cơ sở dữ liệu hành chính cho mục đích thống kê: Chiến lược của cơ quan thống kê quốc gia Ý

11 72 0
Hỗ trợ các nhà nghiên cứu và các tổ chức trong việc khai thác cơ sở dữ liệu hành chính cho mục đích thống kê: Chiến lược của cơ quan thống kê quốc gia Ý

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài viết trình bày về chiến lược của Cơ quan Thống kê quốc gia Ý (Istat) nhằm hỗ trợ cả những người sử dụng truyền thống cũng như những người mới sử dụng nguồn dữ liệu hành chính cho mục đích thống kê. Một chiến lược như vậy bao gồm một số hoạt động nhằm mục đích liệt kê những nguồn dữ liệu hành chính sẵn có, ghi rõ nội dung thông tin và chất lượng của nguồn dữ liệu hành chính, tạo điều kiện thuận lợi để điều chỉnh nội dung của những nguồn dữ liệu hành chính này cho phù hợp với các tiêu chuẩn thống kê. Những thông tin thu thập được về các nguồn dữ liệu hành chính sẵn có được phổ biến cho người sử dụng thống kê tiềm năng thông qua một hệ thống quản lý siêu dữ liệu dựa trên web chuyên dụng được gọi là DARCAP. Ngoài ra, để hỗ trợ các phân tích chuyên sâu về chất lượng của các nguồn dữ liệu hành chính quan trọng nhất, chúng tôi đang nghiên cứu Khung đánh giá chất lượng mới đối với các nguồn dữ liệu hành chính.

IAOS 2014 Hỗ trợ nhà nghiên cứu … Hỗ trợ nhà nghiên cứu tổ chức việc khai thác sở liệu hành cho mục đích thống kê: CHIẾN LƯỢC CỦA CƠ QUAN THỐNG KÊ QUỐC GIA Ý Giovanna D’Angiolini, Pierina De Salvo Andrea Passacantilli, Cơ quan Thống kê quốc gia Ý Tóm tắt Bài viết trình bày chiến lược Cơ quan Thống kê quốc gia Ý (Istat) nhằm hỗ trợ người sử dụng truyền thống người sử dụng nguồn liệu hành cho mục đích thống kê Một chiến lược bao gồm số hoạt động nhằm mục đích liệt kê nguồn liệu hành sẵn có, ghi rõ nội dung thông tin chất lượng nguồn liệu hành chính, tạo điều kiện thuận lợi để điều chỉnh nội dung nguồn liệu hành cho phù hợp với tiêu chuẩn thống kê Những thông tin thu thập nguồn liệu hành sẵn có phổ biến cho người sử dụng thống kê tiềm thông qua hệ thống quản lý siêu liệu dựa web chuyên dụng gọi DARCAP Ngoài ra, để hỗ trợ phân tích chuyên sâu chất lượng nguồn liệu hành quan trọng nhất, chúng tơi nghiên cứu Khung đánh giá chất lượng nguồn liệu hành Từ khóa: Nguồn liệu hành chính, tài liệu liệu hành chính, chất lượng liệu hành chính, mơ hình nguồn liệu, sản xuất số liệu thống kê Chiến lược quan thống kê quốc gia trình sản xuất liệu quan Ý hỗ trợ sử dụng nguồn liệu hành cho thống kê quốc gia cụ thể mà liệu hành mục đích thống kê: Sự hình thành hoạt động có liên quan, liệu đầu vào liệu Ngày nay, có nhiều quan thống kê quốc phụ [3] [9] gia khai thác liệu hành cho mục đích thống Viễn cảnh truyền thống phát triển kê, nhằm nâng cao chất lượng sản phẩm cách nhanh chóng Ngày nay, việc sử dụng đầu thống kê, giảm bớt gánh nặng cho người trả nguồn liệu hành quy trình sản xuất lời để giảm thiểu tối đa chi phí [2] [8] Vì việc liệu quan thống kê không việc sử xác định nội dung nguồn liệu hành dụng thống kê liệu hành Nhờ sẵn có đánh giá chất lượng liệu hành có lan rộng phương pháp tiếp cận kho thu thập mối quan tâm tất yếu đối liệu năm gần mà ngày nhiều với quan thống kê quốc gia Tuy nhiên tổ chức phi thống kê triển khai hệ viễn cảnh này, tài liệu nguồn liệu hành thống hỗ trợ việc định riêng - tạo cần thiết, chất lượng liệu hệ thống khai thác liệu hành hành nói chung đánh giá từ quan điểm nhằm theo dõi bối cảnh tác động hoạt CHUYÊN SAN HỘI NGHỊ QUỐC TẾ VỀ THỐNG KÊ CHÍNH THỨC 107 107 Hỗ trợ nhà nghiên cứu … IAOS 2014 động tổ chức Những hệ thống thực Để xử lý hạn chế vậy, Istat cam tế sử dụng kỹ thuật thống kê cho dù mục đích kết thực chiến lược chung nhằm làm cho chúng sản xuất số liệu thống kê nguồn liệu hành sẵn có trở nên dễ Việc sử dụng liệu hành hỗ trợ định địi hỏi liệu khai thác phải có chất lượng tốt xem công cụ đo lường tượng giới thực, nghĩa địi hỏi liệu phải có chất lượng tốt xét từ quan điểm thống kê Như kết tất yếu, việc quan tâm tới vấn đề chất lượng liệu hành lan rộng số cộng đồng nghiên cứu cộng đồng nghiên cứu sở liệu [1] Gần đây, tầm nhìn liệu mở làm củng cố xu hướng Trong viễn cảnh đòi hỏi quan thống kê quốc gia phải đóng vai trị quan trọng Các quan thống kê quốc gia phải suy nghĩ đưa hướng dẫn, phương pháp công cụ nhằm hỗ trợ cho người sử dụng cần để khai thác liệu hành để có hiểu biết tượng giới thực Điều đặc biệt Ý nhiều quan thuộc Hệ thống thống kê quốc gia Ý (chẳng hạn quan phủ cần theo dõi tác động sách mà họ ban hành), xây dựng kho liệu lớn mà bao gồm sở liệu hành họ sở hữu với liệu điều tra sở liệu hành bên ngồi Tuy nhiên, thường khả nguồn liệu hành trở thành nguồn thông tin thống kê bị hạn chế, thiếu thông tin phù hợp nội dung chất lượng nguồn liệu hành chúng sử dụng định nghĩa, phân loại quy tắc quản lý liệu có tính định hướng hành 108 hiểu dễ sử dụng [5] Nói chung, chiến lược Istat nhằm mục đích: • Thu thập thơng tin nguồn liệu hành sẵn có tạo tài liệu chuẩn nội dung thông tin chất lượng nguồn liệu hành • Điều chỉnh (khi có thể) nội dung nguồn liệu hành sẵn có thơng qua việc sử dụng định nghĩa, phân loại thống kê quy tắc quản lý liệu chuẩn Cung cấp cho người sử dụng kiến thức phù hợp nội dung chất lượng nguồn liệu hành bước nhằm đẩy mạnh việc khai thác thống kê họ Để thực nhiệm vụ vậy, Istat triển khai số hoạt động có tính hệ thống tài liệu có liên quan đến loại nguồn liệu hành khác Các quan phủ trung ương quản lý hệ thống thông tin lớn cấu thành từ nhiều nguồn liệu hành trì khai thác thơng qua thủ tục hành Trong bối cảnh đó, chuyên gia Istat với chuyên gia nguồn liệu thực điều tra riêng cách có hệ thống nguồn liệu hành biểu mẫu hành có liên quan nguồn liệu Một điều tra nguồn liệu hành hoạt động thu thập phân tích tài liệu tuân theo mẫu tiêu chuẩn để thu thập thơng tin so sánh nội dung chất lượng nguồn liệu, trình bày phần Các thông tin đ, tên quan quản lý Đối với nguồn liệu hành mẫu biểu hành thuộc sở hữu quan quyền địa phương tiêu chuẩn tìm kiếm là: thời hạn hiệu lực, tên loại quan quản lý, vùng, loại thủ tục hành có liên quan, lĩnh vực chủ đề chung lĩnh vực chủ đề cụ thể Tiêu chuẩn sau tương ứng với phân loại thức nội dung chủ đề nguồn liệu hành Danh sách lựa chọn phù hợp hiển thị cho tiêu chuẩn Hệ thống hiển thị danh sách nguồn liệu hành mẫu biểu hành thỏa mãn điều kiện cụ thể, người sử dụng cuối lựa chọn Chức tìm kiếm thứ hai tìm kiếm nguồn liệu hành mẫu biểu hành theo nội dung thông tin: cho chuỗi đặc điểm kỹ thuật, hệ thống hiển thị tất tập hợp, đặc điểm phân loại mà tên chúng có chứa chuỗi ký tự cụ thể, với loại có chứa đựng nguồn liệu hành mẫu biểu hành vậy, người dùng cuối có Điều hướng thơng qua tài liệu nguồn liệu hành mẫu biểu có: mơi trường cung cấp cho người dùng cuối hai chức tìm kiếm khác thể lựa chọn loại Một lần người sử dụng cuối lựa chọn mẫu biểu hành nguồn liệu cụ thể mà họ duyệt thơng Chức tìm kiếm tìm kiếm nguồn liệu hành mẫu biểu hành CHUYÊN SAN HỘI NGHỊ QUỐC TẾ VỀ THỐNG KÊ CHÍNH THỨC qua tài liệu có liên quan Chính xác hơn, họ truy cập: 113 113 Hỗ trợ nhà nghiên cứu … IAOS 2014 • Tên, mơ tả hiệu lực thời hạn, danh sách đơn giản tập hợp quan sát được, đặc điểm phân loại; Istat để đánh giá chất lượng nguồn liệu hành sẵn có [7] Như thấy xu hướng phát • Một trình bày đồ thị mơ hình triển rộng khắp kho liệu gia tăng sử nguồn liệu, cụ thể mạng lưới tập hợp dụng nguồn liệu hành cho mục mối quan hệ chúng, với tập hợp, khả đích phi hành bắt buộc quan thống kê xem danh sách đặc điểm với quốc gia phải chịu trách nhiệm thực nhiệm vụ phân loại có liên quan mạng lưới tập hợp phương pháp luận kết hợp mới, cụ thể để xác định tập hợp tập hợp đầy đủ linh hoạt tiêu chuẩn • Các tính chung khác như: quan sở hữu quan quản lý khác, thủ tục hành có liên quan luật quy định, quy trình đánh giá chất lượng lặp lại nguồn liệu hành chính, giống họ làm với điều tra [5] nguồn liệu hành mẫu biểu hành Do vậy, khung đánh giá chất lượng đầu vào, liệu nguồn liệu hành nguồn liệu hành xác định khung khác, thơng tin khác bao gồm tài tiêu chất lượng hợp lý để điều chỉnh liệu kèm theo địa trang web bên hay bên quan thống kê quốc Đối với nguồn liệu hành chính, tải tài liệu dạng pdf bao gồm bảng hỏi để điền hiệu lực chất lượng nguồn gia, đặc biệt thân chủ sở hữu nguồn liệu hành chính, nhằm đánh giá chất lượng nguồn liệu hành sẵn có liệu hành chính, bảng hỏi thu thập thơng Để đáp ứng nhu cầu vậy, tin số khía cạnh như: việc sử dụng thực tế dựa khung phân tích kỹ lưỡng với tiềm nguồn liệu hành chính, mục tiêu đặc điểm riêng biệt q trình thu thủ tục thu thập thơng tin mức độ bao phủ ước thập liệu hành tác động chúng tính tập hợp quan sát chất lượng liệu thu thập Trong phiên DARCAP, Một phân tích thực đối mẫu biểu hành chính, xem nội dung thông tin với loại khác đối tượng quan liên quan đến phần khác tạo thành cấu trúc sát hình thành nên mơ hình nguồn liệu chúng Nó làm bật phần [6] Cách tiếp cận sáng tạo giao diện mở cửa sổ với phân loại mô tả nội dung nguồn liệu dựa nội dung thông tin chi tiết mơ hình liệu khơng phải thực hành thường Đánh giá sâu chất lượng nguồn liệu hành chính: Khung đánh giá chất lượng liệu hành Khung đánh giá chất lượng nguồn liệu hành công cụ phương pháp luận 114 thấy nhà thống kê thực tế tài liệu liệu dựa mơ hình liệu thực hành phổ biến Bằng cách giữ tiêu đề xuất cho mơ hình nguồn liệu, đảm bảo hệ thống đặc điểm kỹ thuật tiêu cung cấp chuyên gia đánh giá chất CHUYÊN SAN HỘI NGHỊ QUỐC TẾ VỀ THỐNG KÊ CHÍNH THỨC 114 IAOS 2014 Hỗ trợ nhà nghiên cứu … lượng với định hướng cho việc lựa chọn hành Nó bao gồm tiêu định tính biến tính tốn cho việc giải định lượng thích tiêu tính tốn Các tiêu định tính đa chiều liệu Khung xếp theo cấu trúc quan xác định cách khai thác hoạt động điều thống kê Hà Lan đề xuất, phân biệt ba quan tra, thu thập đánh giá chất lượng ban đầu điểm khác chất lượng, cụ thể quan điểm riêng biệt cho tập hợp (các tổng thể dân cư nguồn liệu, quan điểm siêu liệu, quan tập hợp kiện) nguồn liệu hành điểm liệu Mỗi quan điểm gọi “đa chiều” bao gồm số khía cạnh, phương pháp tiêu chất lượng Với tiêu định lượng, cụ thể tiêu tính tốn từ liệu địi hỏi tính sẵn có liệu, chung phải tính tốn Trong đa chiều nguồn liệu, khía chủ sở hữu liệu hành quan cạnh chất lượng liên quan đến nguồn liệu hành thống kê quốc gia mà thu liệu nói chung, chủ sở hữu nguồn liệu, Viễn cảnh tốt thủ tục tính tốn có tính điều kiện cung cấp Đa chiều siêu liệu đặc chất cộng tác áp dụng biệt tập trung vào siêu liệu liên quan tới khía cạnh nguồn liệu hành Nó liên quan tới tồn tính đầy của tài liệu liên quan tới loại cấu trúc mã định danh Đa chiều liệu tập hợp tất tiêu định lượng tính toán từ liệu nhằm mục tiêu đo lường phương diện chất lượng truyền thống cho liệu thu thập được, chẳng hạn mức độ bao phủ tập hợp quan sát độ xác giá trị thu thập cho đặc điểm quan sát Đối với đa chiều nguồn liệu siêu liệu, Khung đề xuất tiêu định tính tương tự tiêu đề xuất dự án BLUE-ETS Lưu ý yêu cầu chủ sở hữu liệu hành phải xác nhận tính sẵn có tài liệu nguồn liệu hành chính, chúng tơi cũng cung cấp cho họ công cụ chuẩn phù hợp để quản lý tài liệu vậy, cụ thể hệ thống DARCAP Đối với đa chiều liệu, xác định tiêu cấu trúc phong phú hơn, hồn tồn dựa mơ hình nguồn liệu CHUN SAN HỘI NGHỊ QUỐC TẾ VỀ THỐNG KÊ CHÍNH THỨC Để xác định tiêu định lượng đó, trước tiên mặt phải phân biệt sai sót mặt khác cách kiểm tra chúng Các sai sót xác định liên quan đến đối tượng xuất mơ hình nguồn liệu hành theo cách sau Đối với đối tượng mơ hình liệu, cụ thể tập hợp, đặc điểm hay mối quan hệ, chúng tơi xây dựng bảng kê liên quan tới thành tố quan sát Các nguồn liệu hành tiếp tục thu thập lưu trữ liệu mà thực tế kết hợp cách phù hợp bảng kê Ví dụ, giả sử học sinh đăng ký danh sách đăng ký học sinh, thành tố nhập vào tổng thể học sinh, thành tố nhập vào tập hợp kiện đăng ký nhập học Nếu học sinh cấp mã định danh n việc đăng ký nhập học cấp mã định danh i, danh sách đăng ký học sinh chấp nhận hai ghi mới: 1) Một ghi kết nối 115 115 Hỗ trợ nhà nghiên cứu … IAOS 2014 bảng kê học sinh (n) với bảng kê cư trú (n, Milan) với mục sai phân loại giá trị số bảng kê tương tự khác liên quan tới đặc điểm sai tương ứng với sai sót đo lường; đăng ký học sinh mới, 2) Một ghi khác đặc điểm khơng bắt buộc, chúng tơi có kết nối bảng kê đăng ký nhập học (i) với bảng kê sai sót bao gồm Các sai sót nhận dạng đăng ký nhập học_sinh viên (i, n), đăng ký nhập có tác động đến đặc điểm quan sát, học_khóa học (i, thống kê) bảng kê thay đổi đặc điểm đăng ký khác liên quan tới đặc điểm đăng ký cho phần tử có liệu, chẳng hạn thân việc đăng ký nhập học thị trấn nơi cư trú sinh viên Các sai sót Có thể xảy trường hợp số bảng kê bị sai, số bảng kê liệu Do đó, lúc chúng tơi có liên quan tới mối quan hệ xác định cách tương tự Các phương pháp kiểm tra chất lượng sẵn có chủ yếu là: tìm kiếm sai sót hiển nhiên, thể có nguồn liệu hành chính: • Các sai sót bao gồm: bảng kê sai (một cách chắn tạp thời) chấp nhận nguồn liệu • Các sai sót loại trừ: bảng kê (chắc chắn tạm thời) loại trừ từ nguồn liệu Các sai sót khác liên quan tới nhận dạng sai thành tố liên quan, vấn đề hệ thống mã định danh, là: lỗi cú pháp nhận dạng, nhận dạng phần tử không tồn tại, thiếu nhận dạng cho phần tử có, có nhiều định dạng cho phần tử, phần tử chia sẻ định dạng Đối với tập hợp (tổng thể dân cư tập hợp kiện), sai sót bao gồm loại trừ tương ứng với sai sót bao phủ mức sai sót bao phủ mức, cách kết nối chúng với sai sót nhận dạng chúng tơi thu ghi đặc điểm kỹ thuật tất sai sót có liên quan tới tập hợp Đối với đặc điểm bắt buộc, chúng tơi có sai sót loại trừ, sai sót tương ứng với sai sót khơng phản hồi, sai sót loại trừ bao gồm kết hợp phần tử có liên kết 116 mã nhận dạng trùng nhau, kết nối với nguồn liệu khác, sử dụng ràng buộc logic (bắt buộc khơng tương thích bảng kê khác nhau), tính tốn thời gian trễ thời điểm xuất kiện thời điểm đăng ký chúng Cho đến nay, xác định khung tiêu chất lượng liên quan tới mức bao phủ tập hợp định danh thành phần cách kết nối sai sót có cách phù hợp phương pháp kiểm tra chất lượng Hiện tại, chúng tơi phân tích sai sót có đặc điểm mối quan hệ để xác định hai khung tiêu chất lượng khác liên quan tới tất loại không trả lời, sai sót đo lường, sai sót quan hệ Nên nhớ rằng, tiêu mà đề xuất tính tốn riêng biệt cho tập hợp, đặc điểm mối quan hệ mơ hình nguồn liệu hành chính, nhằm hỗ trợ cách có hiệu cho việc sử dụng thống kê thông tin thu thập người sử dụng quan tâm Công việc tương lai CHUYÊN SAN HỘI NGHỊ QUỐC TẾ VỀ THỐNG KÊ CHÍNH THỨC 116 IAOS 2014 Hỗ trợ nhà nghiên cứu … Hiện chúng tơi tiến hành điều tra Ngồi ra, tiến hành công nguồn liệu nguồn liệu hành việc xác định tiêu đa chiều liệu quan trọng quan phủ sở phân tích cẩn thận sai sót có trung ương sở hữu mẫu biểu hành có dựa vào đối tượng xuất mô liên quan chúng Chúng tơi lưu trữ hình nguồn liệu hành Cuối cùng, Khung hệ thống DARCAP kết điều tra đầu đánh giá chất lượng nguồn liệu hành tiên nguồn liệu hành quan bao gồm tiêu định tính để đánh giá quyền địa phương sở hữu Chúng tơi dự định chất lượng sơ đa chiều nguồn liệu mở rộng hoạt động điều tra thông qua việc xử lý siêu liệu với tiêu phong phú gồm ngày nhiều nguồn liệu hành tiêu định tính định lượng để đánh giá chất khởi động hoạt động giám sát thay đổi lượng chuyên sâu tùy chỉnh đa chiều nguồn liệu hành dự án đổi liệu Công việc gợi ý cho hướng nghiên cứu thú vị chất lượng liệu Tài liệu tham khảo: [1] M Benedikt, P Bohannon, G Bruns Data Cleaning for Decision Support First Int'l VLDB Workshop on Clean Databases (2006) [2] G.J Brackstone, Issues in the use of administrative records for statistical purposes, Survey methodology (1987) [3] P Daas, S Ossen, M Tennekes, L Zhang, C Hendriks, K Foldal Haugen, F Cerroni, G Di Bella, T Laitila, A Wallgren, BLUE – ETS Deliverable 4.2 - Report on methods preferred for the quality indicators of administrative data sources (2011) [4] G D‖Angiolini, Manuale per la documentazione di archivi, moduli e dataset nel sistema DARCAP, Istat document (2013) [5] G D‖Angiolini, P , De Salvo, A Passacantilli, Istat‖s new strategy and tools for enhancing statistical utilization of the available administrative databases, European conference on quality in official statistics, Vienna (2014) [6] G D‖Angiolini, P De Salvo, A Passacantilli, E Patruno, T Saccoccio, C De Rosa, E Valente, DARCAP: a tool for documenting the information content and the quality of the available administrative databases, European conference on quality in official statistics, Vienna (2014) [7] G D‖Angiolini, P , De Salvo, A Passacantilli, F Pogelli, Framework per la qualità degli archivi amministrativi, Istat document (2013) [8] United Nations Economic Commission for Europe (UNECE), Using Administrative and Secondary Sources for Official Statistics: A Handbook of Principles and Practices, United Nations Publication (2011) [9] R Vis-Visschers, J Arends-Tóth, Checklist for the Quality evaluation of Administrative Data Sources, Discussion paper by Statistics Netherlands (2009) CHUYÊN SAN HỘI NGHỊ QUỐC TẾ VỀ THỐNG KÊ CHÍNH THỨC 117 117 .. .Hỗ trợ nhà nghiên cứu … IAOS 2014 động tổ chức Những hệ thống thực Để xử lý hạn chế vậy, Istat cam tế sử dụng kỹ thuật thống kê cho dù mục đích kết thực chiến lược chung nhằm làm cho chúng... hướng Trong viễn cảnh đòi hỏi quan thống kê quốc gia phải đóng vai trị quan trọng Các quan thống kê quốc gia phải suy nghĩ đưa hướng dẫn, phương pháp công cụ nhằm hỗ trợ cho người sử dụng cần để khai. ..tốn từ liệu địi hỏi tính sẵn có liệu, chung phải tính tốn Trong đa chiều nguồn liệu, khía chủ sở hữu liệu hành quan cạnh chất lượng liên quan đến nguồn liệu hành thống kê quốc gia mà thu liệu nói

Ngày đăng: 11/02/2020, 19:59

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan