BỘ THÔNG TIN VÀ TRUYỀN THÔNG THUYẾT MINH TIÊU CHUẨN CÔNG NGHỆ THÔNG TIN- QUY TRÌNH TẠO LẬP DỮ LIỆU SỐ 2D (SỐ HÓA, TẠO LẬP METADATA CẤU TRÚC TRONG, METADATA MÔ TẢ DỮ LIỆU) HÀ NỘI - 2017 1 Mục lục 1 GIỚI THIỆU ......................................................................................................................... 2 1.1 TÊN GỌI CỦA TIÊU CHUẨN VIỆT NAM................................................................................ 2 1.2 KÝ HIỆU CỦA TCVN ......................................................................................................... 2 1.3 MỤC ĐÍCH CHUNG ............................................................................................................. 2 1.4 MỤC ĐÍCH CỦA VIỆC XÂY DỰNG TIÊU CHUẨN.................................................................... 2 2 TÌNH HÌ NH TRONG VÀ NGOÀ I NƯỚC ........................................................................ 4 3 CƠ SỞ XÂY DỰNG CÁC YÊU CẦU KỸ THUẬT ........................................................ 23 3.1 PHÂN TÍCH CÁC TÀI LIỆU TIÊU CHUẨN ............................................................................ 23 3.2 LỰA CHỌN TÀI LIỆU TIÊU CHUẨN .................................................................................... 41 3.3 HÌNH THỨC XÂY DỰNG TIÊU CHUẨN ............................................................................... 42 3.4 PHƯƠNG PHÁP XÂY DỰNG TIÊU CHUẨN .......................................................................... 43 4 NỘI DUNG TIÊU CHUẨN .............................................................................................. 43 4.1 TÊN GỌI TIÊU CHUẨN ...................................................................................................... 43 4.2 BỐ CỤC TIÊU CHUẨN ...................................................................................................... 44 4.3 BẢNG ĐỐI CHIẾU NỘI DỤNG DỰ THẢO VÀ CÁC TÀI LIỆU THAM KHẢO ............................... 45 TÀ I LIỆU THAM KHẢO...................................................................................................... 48 1 THUYẾT MINH TIÊU CHUẨN CÔNG NGHỆ THÔNG TIN- QUY TRÌNH TẠO LẬP DỮ LIỆU SỐ 2D (SỐ HÓA, TẠO LẬP METADATA CẤU TRÚC TRONG, METADATA MÔ TẢ DỮ LIỆU) 1 Giới thiệu 1.1 Tên gọi của tiêu chuẩn Việt Nam CÔNG NGHỆ THÔNG TIN- QUY TRÌNH TẠO LẬP DỮ LIỆU SỐ 2D (SỐ HÓA, TẠO LẬP METADATA CẤU TRÚC TRONG, METADATA MÔ TẢ DỮ LIỆU) 1.2 Ký hiệu của TCVN TCVN XXXX:201X 1.3 Mục đích chung Đáp ứng mục tiêu của dự án “Xây dựng chuẩn thông tin số và chuẩn trao đổi thông tin” của Bộ Thông tin và Truyền thông: “Bảo đảm sự phát triển ứng dụng công nghệ thông tin nói chung, công nghiệp phần mềm và công nghiệp nội dung số nói riêng được phát triển thống nhất, đồng bộ theo một kiến trúc quy hoạch tổng thể Công nghệ thông tin và Truyền thông Quốc gia với một hạ tầng thông tin hiện đại, tốc độ cao và môi trường pháp lý phù hợp”; 1.4 Mục đích của việc xây dựng tiêu chuẩn Các năm gần đây, một trong các biện pháp quản lý tài liệu lưu trữ đã được nhắc đến là số hóa tài liệu và trong xã hội đã manh nha thị trường các dịch vụ số hóa tài liệu lưu trữ. Luật lưu trữ do Quốc hội thông qua ngày 11/11/2011 đã quy định về tài liệu lưu trữ điện tử, không quy định chi tiết đến tài liệu lưu trữ số hóa. Chúng ta có thể hiểu tóm tắt tài liệu điện tử là một bản ghi được tạo ra, gửi, chuyển giao, nhận được, hoặc lưu trữ, sử dụng bằng phương tiện điện tử. Tài liệu điện tử được hình thành từ hai nguồn chính: -Một là, bản ghi các thông diệp dữ liệu được khởi tạo từ đầu; -Hai là, bản ghi các dữ liệu số từ tài liệu truyền thống. 2 Vậy, tài liệu số hóa có nguồn gốc từ tài liệu điện tử, nhưng không đồng nhất với tài liệu điện tử. Tài liệu số hóa trở thành tài liệu điện tử qua quá trình số hóa dữ liệu. Đây là quá trình chuyển các dạng dữ liệu truyền thống như các bản viết tay, bản in trên giấy, hình ảnh… sang chuẩn dữ liệu trên các phương tiện điện tử và được các phương tiện đó nhận biết được gọi là số hóa dữ liệu và chúng trở thành dữ liệu số. Từ đó, về mặt lý thuyết, ta hiểu số hóa dữ liệu là quá trình chuyển các dạng dữ liệu truyền thống sang chuẩn dữ liệu trên máy tính và được máy tính nhận biết. Để việc số hóa dữ liệu được hiệu quả và chính xác thì việc áp dụng quy trình số hóa theo chuẩn là điều cần thiết. Quy trình số hóa dữ liệu 2D là quá trình chuyển các dạng dữ liệu truyền thống như các bản viết tay, bản in trên giấy, hình ảnh… sang chuẩn dữ liệu trên các phương tiện điện tử và được các phương tiện đó nhận biết được gọi là số hóa dữ liệu và chúng trở thành dữ liệu số. Từ đó, về mặt lý thuyết, ta hiểu số hóa dữ liệu 2D là quá trình chuyển các dạng dữ liệu truyền thống sang chuẩn dữ liệu trên máy tính và được máy tính nhận biết. Để việc số hóa dữ liệu được hiệu quả và chính xác thì việc áp dụng quy trình số hóa theo chuẩn là điều cần thiết. Số hóa dữ liệu giúp việc lưu trữ, truy xuất, chia sẻ, tìm kiếm thông tin một cách dễ dàng, linh hoạt trong việc chuyển đổi sang các loại dữ liệu số khác nhau, giảm chi phí tối đa cho việc quản lý, không gian lưu trữ và có khả năng chỉnh sửa và tái sử dụng dữ liệu. Do vậy việc xây dựng nên quy trình số hóa theo tiêu chuẩn quốc tế và có sự điều chỉnh để phù hợp với Việt Nam là điều cần thiết và cấp bách. Tránh sau này các dữ liệu số hóa không đồng bộ và không theo quy trình chung. Việc xây dựng tiêu chuẩn quốc gia về “Quy trình tạo lập dữ liệu số 2D” góp phần phát triển công nghiệp nội dung số Việt Nam theo Quyết định số 50/2009/QĐ-TTg về Quản lý Chương trình phát triển công nghiệp phần mềm và Chương trình phát triển công nghiệp nội dung số Việt Nam Tất cả hình ảnh được số hóa nên được chỉ định dữ liệu đặc tả cho quá trình số hóa dữ liệu 2D và hỗ trợ các quy trình nghiệp vụ đang diễn ra. Các tổ chức, cơ quan có thể đưa ra các yêu cầu cụ thể và để tối đa hóa sự kế thừa các giá trị dữ liệu từ các hệ thống và thiết bị hiện có. Trong hoạt động hành chính, dữ liệu 2D chủ yếu tập trung vào ảnh quét hoặc ảnh chụp mà dữ liệu ảnh chủ yếu lấy từ nguồn số hóa. Việc xây dựng tiêu chuẩn về Quy trình 3 tạo lập metadata mô tả dữ liệu 2D giúp đưa ra được quy trình tạo lập dữ liệu đặc tả, các bước cần thiết, các yêu cầu bắt buộc cho mỗi bước trong quy trình để đảm bảo cho dữ liệu đặc tả được tạo ra đúng thời điểm và đúng tiêu chuẩn kỹ thuật. Nhu cầu thực tế và khả năng áp dụng: Cần có bộ tiêu chuẩn kỹ thuật quốc gia về quy trình tạo lập dữ liệu đặc tả trong quy trình số hóa để áp dụng tại Việt Nam. 2 Tin ̀ h hin ̀ h trong và ngoài nước 2.1 Tình hình trong nước Lĩnh vực số hóa đang là điểm nóng, số lượng tài liệu cần số hóa ngày 1 nhiều. Theo sự chỉ đạo của Chính phủ, năm 2013 một số bộ ban ngành, đơn vị đứng đầu đã bắt đầu áp dụng số hóa cho kho tài liệu lưu trữ của mình. Các doanh nghiệp lớn trong lĩnh vực kiểm toán, ngân hàng, bảo hiểm cũng đã quan tâm tới việc số hóa tài liệu khi lượng hồ sơ giấy tờ đó ngày một tăng lên với số lượng lớn. Ngoài ra còn có các đơn vị đặc thù như Bộ công an, quân đội, trường học cũng đã bắt đầu vào việc tư vấn, lập dự toán cho một dự án số hóa tổng thể bao gồm cả phần mềm chuyên dụng cho đơn vị mình… Tại Việt nam hiện tại có khá nhiều đơn vị doanh nghiệp, cơ quan nhà nước đưa ra các giải pháp quy trình số hóa của riêng họ. Do mục tiêu số hóa tài liệu khác nhau, mà có thể đặt ra các bước số hóa tài liệu khác nhau phù hợp đối với từng cơ quan, tổ chức. Cục Văn thư và Lưu trữ Nhà nước đặt ra quy trình số hóa tài liệu lưu trữ gồm 12 bước theo Quyết định số 176/QĐ-VTLTNN ngày 21/10/2011 với yêu cầu phân loại ảnh và sao lưu ảnh. Nhưng nếu với yêu cầu phổ thông, quá trình thực hiện số hóa tài liệu lưu trữ chỉ giản đơn có 5 bước là: Bước 1. Nhận tài liệu lưu trữ đã được lựa chọn để thực hiện số hóa. Việc lựa chọn này là cần thiết, vì không có một cơ quan, tổ chức nào lại có thể số hóa một lần cả kho lưu trữ của mình. Tiêu chuẩn để số hóa tùy thuộc vào mục tiêu của chủ sở hữu tài liệu lưu trữ. Ví dụ, số hóa để bảo hiểm tài liệu lưu trữ, thì tài liệu được chọn phải là tài liệu thuộc diện quý, hiếm theo quy định của pháp luật. Bước 2. Chuẩn bị tài liệu. Công việc bao gồm: - Lấy ra các bìa cứng, ghim kẹp; làm phẳng các trang tài liệu; Phân loại TL, tách riêng những TL rách, hư hỏng, nếu việc số hóa áp dụng cho các hồ sơ lưu trữ và dùng kỹ 4 thuật scan từng tờ tài liệu. Nếu việc số hóa các tư liệu lưu trữ dạng đóng quyển, thì có thể áp dụng công nghệ mới tiến bộ hơn như Bookscan cho việc số hóa tài liệu lưu trữ. Bước 3. Scan và thiết lập hệ thống ảnh; đặt tên file; đặt định dạng; đóng, ghim lại theo tổ chức tài liệu ban đầu; tạo siêu siêu dữ liệu (metadata). Đây là bước quyết định nhất để chuyển đổi tài liệu truyền thống sang tài liệu số hóa. Danh mục tài liệu số hóa được lập và nhúng (gắn) và tài liệu thông qua một phần mềm ứng dụng và tạo ra metadata. Đồng thời, tài liệu được đặt định dạng theo sự lựa chọn được định trước. Bước 4. Kiểm tra chất lượng tài liệu đã được số hóa và làm lại những ảnh không đạt yêu cầu. Bước 5. Nghiệm thu, bàn giao tài liệu lưu trữ. Công việc bao gồm bàn giao tài liệu số hóa và bàn giao tài liệu gốc. Nếu tài liệu số hóa là tài liệu lưu trữ của một Lưu trữ lich sử thì với những văn bản không đóng quyển trong một hồ sơ, việc bàn giao phải được kiểm tra chặt chẽ từng trang tài liệu để bảo đảm đầy đủ như tài liệu ban đầu đã nhận ở bước 1. Tại các đơn vị khác nhau quy trình số hóa thường gắn liền với thiết bị số hóa mà họ cung cấp, ví dụ tại ĐHQGHN và 1 số doanh nghiệp khác quy trình hiện đang được sử dụng cho quy trình số hóa: Hình 1. Quy trình sử dụng trong thư viện ĐHQGHN và 1 số doanh nghiệp tư nhân 5 6 Hoặc bên 1 số trường đại học, thư viện khác Hình 2. Quy trình số hóa tài 1 số thư viện tài Việt nam Hiện nay lĩnh vực số hóa trong các bộ ban ngành cũng đang là điểm nóng, theo sự chỉ đạo của chính phủ Bộ Tài nguyên và Môi trường đã ban hành thông tư số 26/2014/TTBTNMT về Quy trình và định mức kinh tế kỹ thuật xây dựng cơ sở dữ liệu tài nguyên môi trường. Dưới đây là sơ đồ quy trình xây dựng cơ sở dữ liệu tài nguyên môi trường: 7 Hình 3 – Quy trình số hóa tài liệu của Bộ Tài nguyên và Môi trường Việc xây dựng cơ sở dữ liệu tài nguyên môi trường là dựa trên thông tin, dữ liệu từ các kết quả điều tra cơ bản của các lĩnh vực tài nguyên và môi trường đã được kiểm tra, nghiệm thu và được lưu trữ tại cơ quan chuyên môn theo một hay nhiều khuôn dạng khác nhau. Các nội dung khảo sát, thu thập thông tin dữ liệu được thực hiện theo các qui định hiện hành. 1. Quy trình chi tiết xây dựng CSDL tài nguyên môi trường 1.1 Rà soát, phân tích nội dung thông tin dữ liệu 8 1.1.1 Rà soát, phân loại các thông tin dữ liệu - Mục đích Rà soát, phân loại và đánh giá chi tiết các thông tin dữ liệu phục vụ xây dựng cơ sở dữ liệu phù hợp với yêu cầu. - Các bước thực hiện + Rà soát, đánh giá và phân loại chi tiết dữ liệu đã được chuẩn hóa và chưa được chuẩn hóa. + Chuẩn bị dữ liệu mẫu. - Sản phẩm + Báo cáo rà soát, phân loại và đánh giá các thông tin dữ liệu + Bộ dữ liệu mẫu 1.1.2 Phân tích nội dung thông tin dữ liệu - Mục đích Phân tích, xác định chi tiết các thông tin dữ liệu phục vụ thiết kế và lập dự toán xây dựng cơ sở dữ liệu. - Các bước thực hiện + Xác định danh mục CSDL + Xác định chi tiết các thông tin cho từng ĐTQL + Xác định chi tiết các quan hệ giữa các ĐTQL + Xác định chi tiết các tài liệu quét và các tài liệu dạng giấy cần nhập vào CSDL từ bàn phím + Xác định khung danh mục dữ liệu, dữ liệu đặc tả sử dụng trong cơ sở dữ liệu. + Xác định các yếu tố ảnh hưởng đến việc xây dựng CSDL. + Qui đổi đối tượng quản lý - Sản phẩm + Danh mục đối tượng quản lý và các thông tin chi tiết + Danh mục chi tiết các tài liệu quét và giấy cần nhập vào CSDL + Báo cáo qui định khung danh mục dữ liệu, dữ liệu đặc tả + Báo cáo qui đổi đối tượng quản lý. 1.2 Thiết kế mô hình cơ sở dữ liệu 9 Trường hợp nhiệm vụ, dự án có cả hai nội dung xây dựng CSDL và xây dựng ứng dụng phần mềm thì các bước “Thiết kế mô hình cơ sở dữ liệu” và “nhập dữ liệu mẫu để kiểm tra mô hình cơ sở dữ liệu” chỉ thực hiện một lần ở bước này. - Mục đích + Thiết kế mô hình danh mục dữ liệu, dữ liệu đặc tả theo (chuẩn dữ liệu, khung dữ liệu) dựa trên kết quả rà soát, phân tích. + Thiết kế mô hình cơ sở dữ liệu dựa trên kết quả rà soát, phân tích. - Các bước thực hiện + Thiết kế mô hình danh mục dữ liệu, dữ liệu đặc tả. + Thiết kế mô hình cơ sở dữ liệu: - Thiết kế mô hình cơ sở dữ liệu - Nhập dữ liệu mẫu để kiểm tra mô hình cơ sở dữ liệu. - Sản phẩm + Mô hình cơ sở dữ liệu, mô hình danh mục dữ liệu, dữ liệu đặc tả dưới dạng XML + Báo cáo thuyết minh mô hình danh mục dữ liệu, dữ liệu đặc tả + Báo cáo thuyết minh mô hình CSDL + Báo cáo kết quả kiểm tra mô hình CSDL trên dữ liệu mẫu 1.3 Tạo lập dữ liệu cho danh mục dữ liệu, dữ liệu đặc tả - Mục đích Tạo lập nội dung dữ liệu cho danh mục dữ liệu, dữ liệu đặc tả dựa trên kết quả rà soát, phân tích và thiết kế - Các bước thực hiện + Tạo lập nội dung cho danh mục dữ liệu + Tạo lập nội dung cho dữ liệu đặc tả - Sản phẩm + CSDL danh mục dữ liệu, dữ liệu đặc tả đã nhập đủ nội dung + Báo cáo kết quả thực hiện 1.4 Tạo lập dữ liệu cho CSDL 1.4.1 Chuyển đổi dữ liệu - Mục đích 10 Chuyển đổi dữ liệu dạng số (không gian và phi không gian) đã được chuẩn hóa vào CSDL. - Các bước thực hiện + Đối với dữ liệu không gian dạng số chưa được chuẩn hóa thì việc chuẩn hóa dữ liệu được thực hiện theo các qui định của từng chuyên ngành trước khi thực hiện chuyển đổi vào CSDL (biên tập bản đồ, chuyển đổi tọa độ…). - Đối với dữ liệu phi không gian dạng số chưa được chuẩn hóa: + Chuẩn hóa phông chữ theo tiêu chuẩn TCVN 6909 + Chuẩn hóa dữ liệu phi không gian theo thiết kế mô hình cơ sở dữ liệu - Chuyển đổi dữ liệu dạng số đã chuẩn hóa vào cơ sở dữ liệu. - Sản phẩm + Dữ liệu dạng số trước khi chuyển đổi. + Dữ liệu phi không gian trước khi chuyển hóa + Cơ sở dữ liệu đã được chuyển đổi + Báo cáo kết quả thực hiện chuyển đổi dữ liệu 1.4.2 Quét (chụp) tài liệu - Mục đích Quét (chụp) các tài liệu để phục vụ đính kèm vào các trường thông tin cho các lớp, bảng dữ liệu của ĐTQL. - Các bước thực hiện + Quét (chụp) các tài liệu + Xử lý và đính kèm tài liệu quét. - Sản phẩm Danh mục các tài liệu quét và đã được đính kèm vào các lớp, bảng dữ liệu của các ĐTQL 1.4.3 Nhập, đối soát dữ liệu - Mục đích Nhập, đối soát các dữ liệu từ dạng giấy vào cơ sở dữ liệu đã được thiết kế. Dữ liệu sau khi nhập vào cơ sở dữ liệu phải được đối chiếu, kiểm soát để đảm bảo tính chính xác dữ liệu 11 - Các bước thực hiện + Đối với các dữ liệu không gian dạng giấy: Số hóa theo qui định chuyên ngành sau đó thực hiện bước “Chuyển đổi dữ liệu”. + Đối với nhập dữ liệu dạng giấy (phi không gian): - Nhập dữ liệu có cấu trúc cho đối tượng phi không gian - Nhập dữ liệu có cấu trúc cho đối tượng không gian - Nhập dữ liệu phi cấu trúc cho đối tượng phi không gian - Nhập dữ liệu phi cấu trúc cho đối tượng không gian + Đối soát dữ liệu: - Dữ liệu có cấu trúc đã nhập cho đối tượng phi không gian - Dữ liệu có cấu trúc đã nhập cho đối tượng không gian - Dữ liệu phi cấu trúc đã nhập cho đối tượng phi không gian - Dữ liệu phi cấu trúc đã nhập cho đối tượng không gian - Sản phẩm + Dữ liệu dạng giấy dùng để nhập dữ liệu + Báo cáo đối soát dữ liệu và các vấn đề phát sinh trong quá trình nhập dữ liệu + Cơ sở dữ liệu đã được nhập đầy đủ nội dung + Danh mục dữ liệu để cung cấp, khai thác, sử dụng phục vụ yêu cầu quản lý nhà nước. 1.5 Biên tập dữ liệu - Mục đích Biên tập CSDL theo qui định - Các bước thực hiện + Đối với dữ liệu không gian - Tuyên bố đối tượng - Sửa lỗi tương quan của dữ liệu không gian + Đối với dữ liệu phi không gian: Hiệu đính nội dung + Trình bày hiển thị dữ liệu không gian - Sản phẩm + CSDL đã được biên tập 12 + Tệp trình bày hiển thị dữ liệu không gian 1.6 Kiểm tra sản phẩm - Mục đích Kiểm tra CSDL đã được tạo lập đảm bảo tính đầy đủ, chính xác, phù hợp với nội dung đã được phê duyệt. - các bước thực hiện + Kiểm tra mô hình CSDL + Kiểm tra nội dung CSDL - Kiểm tra dữ liệu không gian - Kiểm tra dữ liệu phi không gian + Kiểm tra danh mục dữ liệu, dữ liệu đặc tả - Sản phẩm + Báo cáo kết quả kiểm tra sản phẩm + Báo cáo kết quả sửa chữa + Báo cáo kiểm tra, nghiệm thu chất lượng, khối lượng 1.7 Phục vụ nghiệm thu và giao nộp sản phẩm - Mục đích Phục vụ nghiệm thu và bàn giao các sản phẩm đã kiểm tra. - Các bước thực hiện + Lập báo cáo tổng kết nhiệm vụ và phục vụ nghiệm thu sản phẩm đã kiểm tra. + Đóng gói các sản phẩm dạng giấy và dạng số + Giao nộp sản phẩm về đơn vị sử dụng và đơn vị chuyên trách công nghệ thông tin theo phân cấp/qui định quản lý phục vụ quản lý, lưu trữ và đưa vào hệ thống thông tin ngành tài nguyên và môi trương. - Sản phẩm + Báo cáo tổng kết nhiệm vụ và hồ sơ nghiệm thu kèm theo + Biên bản bàn giao đã được xác nhận + Các sản phẩm dạng giấy và số. Dữ liệu đặc tả được sử dụng để mô tả các đối tượng, các thông tin cần thiết để 13 lưu trữ. Tất cả hình ảnh được số hóa nên được chỉ định dữ liệu đặc tả cho quá trình số hóa tài liệu và hỗ trợ các quy trình nghiệp vụ đang diễn ra. Các tổ chức, cơ quan có thể đưa ra các yêu cầu cụ thể và để tối đa hóa sự kế thừa các giá trị dữ liệu từ các hệ thống và thiết bị hiện có. Quy trình quản lý dữ liệu đặc tả nên tối đa hóa tự động chụp dữ liệu đặc tả, giảm thiểu việc xử lý thủ công. Bất kỳ việc sử dụng, áp dụng dữ liệu đặc tả nên được thực hiện có sự tham khảo tiêu chuẩn ISO 23081-1: 2006. Dữ liệu đặc tả kết hợp với hình ảnh là một thành phần thiết yếu trong việc quản lý và truy vấn các hình ảnh. Dữ liệu đặc tả có thể được nhúng với các nguồn tài nguyên tại thông tin tiêu đề, hoặc có thể được quản lý trong một hệ thống riêng biệt,hoặc cả hai,nhưng trong cả hai trường hợp đó phải có một mối quan hệ trực tiếp hoặc liên hệ giữa chúng; tức là khi dữ liệu đặc tả nằm trong một hệ thống riêng biệt,nó cần phải có liên kết trực tiếp đến các hồ sơ. Dữ liệu đặc tả cũng có thể được đóng gói trong các định dạng hình ảnh. Trong quy trình số hóa bao gồm các giai đoạn mà dữ liệu đặc tả phải được áp dụng. Các giai đoạn này là: - chụp ảnh (quét); - hình ảnh chụp lại (tái quét); - đảm bảo chất lượng; - truyền tải dữ liệu. Hình dưới đây mô tả quy trình số hóa văn bản, trong đó các quá trình bắt buộc áp dụng dữ liệu đặc tả được đánh dấu bằng nét đậm. Tạo lập dữ liệu 2D Dạng số Lên kế hoạch Thiết kế mô hình và thử nghiệm Dạng giấy Khuôn dạng dữ liệu Chuyển đổi dữ liệu Đảm bảo chất lượng Quét (chụp) tài liệu Dữ liệu đặc tả 14 Kiểm tra sản phẩm Lập chỉ mục – Dữ liệu đặc tả Biên tập dữ liệu Hiện nay, Các dự thảo TCVN về GIS đã và đang được các Bộ, ngành liên quan triển khai xây dựng dự thảo QCVN, TCVN và Qui định kỹ thuật, Một số QCVN và TCVN đã được Bộ Tài nguyên và Mội trường xây dựng như sau: TT Tên QCVN/TCVN Số hiệu Ghi chú Ghi nhật ký A Hệ thống QCVN 1. QCVN về xây dựng lưới độ cao QCVN 11:2008/BTNMT 2. QCVN về xây dựng lưới tọa độ QCVN 04:2009/BTNMT 3. QCVN về Phân định địa giới hành QCVN chính và lập hồ sơ địa giới hành 12:2008/BTNMT chính các cấp 4. QCVN về Chuẩn hóa địa danh phục QCVN vụ công tác lập bản đồ 37:2011/BTNMT 5. QCVN về Thông tin địa lý cơ sở 6. Mô hình số độ cao (DEM) 39/2014/TTBTNMT (Lidar), chưa có quy định SP chụp ảnh KT số 7. Dữ liệu đồ họa đường nét 96TCN 42-90 Quy phạm thành lập bản đồ địa hình tỷ lệ 1:500, 1:1 000, 1:2 000, 1:5 000 , 1:10 000 và 1:25 000 QCVN 42:2012/BTNMT 15 (phần trong nhà) 8. Dữ liệu nền địa lý gốc (thành lập trực tiếp ở mức 1:2000, 1:5000, 1:10.000) 21/2014/TTBTNMT, 55/2014/TTBTNMT 9. Dữ liệu địa lý (1:25.000,1:50.000, 1:500.000, 1:1tr) 20/2014/TTBTNMT (1:50.000) 10. Bản đồ địa hình gốc dạng số các loại tỷ lệ cơ bản 70/2000/QĐ-ĐC (Quy định kỹ thuật số hóa bản đồ địa hình tỷ lệ 1:10 000, 1:25 000, 1:50 000 và 1:100 000) 11. Dữ liệu, bản đồ biên giới địa giới Xây dựng mới 12. Dữ liệu, bản đồ địa hình đáy biển 180/1998/QĐĐC, Quy định cơ sở toán học, độ chính xác nội dung và ký hiệu bản đồ địa hình đáy biển tỷ lệ 1:10 000 B Hệ thống QĐKT 13. Quy phạm thành lập bản đồ địa 24/KHKT hình tỷ lệ 1:10 000 - 1:25 000 (phần ngoài trời) 3/26/1977 14. Ký hiệu bản đồ địa hình tỷ lệ 1:500, 1125/ĐĐBĐ 1:1 000, 1:2 000 và 1:5 000 11/19/1994 15. Ký hiệu bản đồ địa hình tỉ lệ 1:10 1126/ĐĐBĐ 000 và 1:25 000 11/19/1994 16. Những yêu cầu cơ bản và qui định 541/QĐ/ĐC kiểm tra, đánh giá chất lượng phim ảnh chụp từ máy bay phục vụ công 9/1/1995 thứ cấp 1:100.000, 16 tác đo vẽ và hiện chỉnh bản đồ 17. Quy định kỹ thuật xây dựng lưới 1284/ĐĐBĐ cấp 0 Nhà nước CHXHCNVN 9/16/1995 18. Quy định cơ sở toán học, độ chính 180/1998/QĐ-ĐC xác nội dung và ký hiệu bản đồ địa hình đáy biển tỷ lệ 1:10 000 3/31/1998 19. Quy định tạm thời về quy trình đo 431/2001/QĐ-TCĐC thủy chuẩn hạng 1, 2 bằng máy thủy chuẩn điện tử và bộ mia có dạng mã vạch 11/13/2001 20. Quy phạm thành lập BĐ ĐH 1:250 09/2006/QĐ-BTNMT 000, 1:500 000 và 1:1 000 000 8/16/2006 21. Ký hiệu BĐĐH 1:250 000, 1:500 11/2006/QĐ-BTNMT 000 và 1:1 000 000 8/22/2006 22. Quy định kỹ thuật thành lập bản đồ 03/2007/QĐ-BTNMT địa hình đáy biển tỷ lệ 1:50 000 2/12/2007 23. Sử dụng hệ thống tham số tính 05/2007/QĐ-BTNMT chuyển giữa Hệ tọa độ quốc tế WGS-84 và Hệ tọa độ quốc gia VN-2000 2/27/2007 24. Quy định kỹ thuật và quy trình công 2097/QĐ-BTNMT nghệ (tạm thời) thành lập mô hình số độ cao bằng công nghệ Lidar 10/22/2008 25. Quy định về quy phạm xây dựng 01/2009/TT-BTNMT lưới trọng lực quốc gia 1/14/2009 26. Quy định kỹ thuật thành lập bản đồ 34/2011/TT-BTNMT địa hình đáy biển tỷ lệ 1: 100.000 bằng phương pháp đo vẽ trực tiếp 8/1/2011 27. Quy định kỹ thuật hiện chỉnh bản 05/2012/TT-BTNMT đồ địa hình quốc gia tỷ lệ 1:25.000 và 1:50.000 bằng ảnh vệ tinh 5/8/2012 28. Quy định kỹ thuật về đo trọng lực 08/2012/TT-BTNMT chi tiết 8/8/2012 17 C Hệ thống TCVN dự kiến xây dựng 29. Thông tin địa lý – Mô hình quy chiếu Đang dự thảo 30. Thông tin địa lý – Thuật ngữ. Đang dự thảo 31. Thông tin địa lý – Phương pháp phân loại đối tượng Đang dự thảo 32. Thông tin địa lý - Các nguyên tắc về chất lượng Đang dự thảo 33. Thông tin địa lý: - Mô hình tham chiếu, phần 2 - Ảnh Đang dự thảo 34. Thông tin địa lý: Thủ tục đánh giá chất lượng Đang dự thảo 35. Thông tin địa lý - Siêu dữ liệu Đang dự thảo Nhận xét : Các tiêu chuẩn và quy chuẩn đều được xây dựng bằng hình thức nghiên cứu các tài liệu và tiêu chuẩn của ISO hoặc tổ chức OGC. Các QCVN này được Bộ Tài nguyên và Môi trường ban hành. 2.2 Tình hình trên thế giới Hiện nay, Tổ chức Tiêu chuẩn hóa Quốc tế đã ban hành các Tiêu chuẩn quốc tế ISO liên quan đến quy trình số hóa: - ISO 19115-1:2014 Geographic information -- Metadata -- Part 1: Fundamentals (Thông tin địa lý – Dữ liệu đặc tả – Phần 1: Nguyên tắc cơ bản) - ISO 19115-2:2009 Geographic information -- Metadata -- Part 2: Extensions for imagery and gridded data (Thông tin địa lý – Dữ liệu đặc tả – Phần 2: Mở rộng đổi với dữ liệu ảnh và dữ liệu lưới) - ISO/TR 13028:2010 Information and documentation - Implementation guidelines for digitization of records (Thông tin và tư liệu – Hướng dẫn thực hiện đối với số hóa bản ghi) Tiêu chuẩn ISO / TR 13028: 2010: thiết lập các hướng dẫn để tạo ra và duy trì các bản ghi trong định dạng kỹ thuật số duy nhất, nơi mà các bài báo gốc, hoặc hồ sơ nguồn không kỹ thuật số khác, đã được sao chép bằng cách số hóa; thiết lập các hướng dẫn 18 thực hành tốt nhất cho việc số hóa để đảm bảo độ tin cậy và độ tin cậy của hồ sơ và cho phép xem xét xử lý các hồ sơ nguồn không kỹ thuật số; thiết lập các hướng dẫn thực hành tốt nhất cho sự tin cậy của các hồ sơ số hóa có thể ảnh hưởng đến việc chấp nhận bằng chứng pháp lý và trọng lượng của các hồ sơ đó; thiết lập các hướng dẫn thực hành tốt nhất cho việc tiếp cận các hồ sơ số hoá cho đến khi họ được yêu cầu; xác định chiến lược để hỗ trợ trong việc tạo ra các bản ghi số hóa phù hợp để duy trì lâu dài; và thiết lập các hướng dẫn thực hành tốt nhất cho việc quản lý các hồ sơ nguồn không kỹ thuật số sau số hóa. ISO / TR 13028: 2010 được áp dụng để sử dụng trong việc thiết kế và tiến hành số hóa trách nhiệm của tất cả các tổ chức thực hiện số hóa, hoặc quá trình kinh doanh số hóa, dự án số hóa chụp lại cho các mục đích quản lý hồ sơ, như được nêu trong ISO 154891: 2001 và ISO / TR 15801: 2009. ISO / TR 13028: 2010 không áp dụng cho: nắm bắt và quản lý hồ sơ kỹ thuật số sinh; thông số kỹ thuật cho chụp kỹ thuật số của hồ sơ; thủ tục để ra quyết định cuối cùng về bố trí hồ sơ; thông số kỹ thuật cho việc bảo tồn lâu dài của hồ sơ kỹ thuật số; số hóa hoặc cổ phần lưu trữ hiện có cho các mục đích bảo quản. AS / NZS ISO 13028: 2012 là một tiêu chuẩn của Úc - New Zealand. Đây là một áp dụng giống hệt nhau của tiêu chuẩn ISO / TR 13028: 2010. UNE-ISO/TR 13028:2011 IN Tiêu chuẩn của Tây Ban Nha cũng dựa trên tiêu chuẩn ISO / TR 13028: 2010. Chính phủ Alberta cũng đưa ra quy trình số hóa “Digitization standard process num A000015 xuất bản ngày 23-04-2013” được áp dụng cho tất cả các cơ quan ban ngành, chỉnh phủ và doanh nghiệp của họ với 10 bước bắt buộc phải sử dụng. Bên cạnh đó đi kèm theo các yêu cầu kỹ thuật cho tiêu chuẩn này “Digitization Technical Requirements Standard A000013 xuất bản 14-07-2012” Hiện nay, các tiêu chuẩn quốc tế thuộc họ tiêu chuẩn ISO 191xx rơi vào một số nhóm tiêu chuẩn sau đây: -Các tiêu chuẩn qui định hạ tầng cho việc tiêu chuẩn hóa về không gian địa lý: ISO 19101 Geographic information — Reference model (Thông tin địa lý – Mô hình tham chiếu); 19 ISO/TS 19103 Geographic information — Conceptual schema language (Thông tin địa lý – Ngôn ngữ lược đồ khái niệm); ISO/TS 19104 Geographic information — Terminology (Thông tin địa lý – Thuật ngữ); ISO 19105 Geographic information — Conformance and testing (Thông tin địa lý – Kiểm thử và sự phù hợp); ISO 19106 Geographic information — Profiles (Thông tin địa lý – Hồ sơ); -Các tiêu chuẩn mô tả các mô hình dữ liệu đối với thông tin địa lý: ISO 19109 Geographic information — Rules for application schema (Thông tin địa lý – Qui tắc cho lược đồ ứng dụng); ISO 19107 Geographic information — Spatial schema (Thông tin địa lý – Lược đồ không gian); ISO 19137 Geographic information — Core profile of the spatial schema (Thông tin địa lý – Hồ sơ lõi của lược đồ không gian); ISO 19123 Geographic information — Schema for coverage geometry and functions (Thông tin địa lý – Lược đồ đối với các chức năng và hình học bao phủ); ISO 19108 Geographic information — Temporal schema (Thông tin địa lý – Lược đồ thời gian); ISO 19141 Geographic information — Schema for moving features (Thông tin địa lý – Lược đồ đối với việc dịch chuyển các đối tượng địa lý); ISO 19111 Geographic information — Spatial referencing by coordinates (Thông tin địa lý – Tham chiếu không gian bằng tọa độ); ISO 19112 Geographic information — Spatial referencing by geographic identifiers (Thông tin địa lý – Tham chiếu không gian bằng các định danh địa lý); -Các tiêu chuẩn cho việc quản lý thông tin địa lý: ISO 19110 Geographic information — Methodology for feature cataloguing (Thông tin địa lý – Phương pháp luận phân loại đối tượng địa lý); 20 ISO 19115 Geographic information — Metadata (Thông tin địa lý – Dữ liệu đặc tả); ISO 19113 Geographic information — Quality principles (Thông tin địa lý – Nguyên tắc chất lượng); ISO 19114 Geographic information — Quality evaluation procedures (Thông tin địa lý – Thủ tục ước lượng chất lượng); ISO 19131 Geographic information — Data product specifications (Thông tin địa lý – Đặc tả sản phẩm dữ liệu); ISO 19135 Geographic information — Procedures for item registration (Thông tin địa lý – Thủ tục đăng ký hạng mục); ISO/TS 19127 Geographic information — Geodetic codes and parameters (Thông tin địa lý – Tham số và mã trắc địa); ISO/TS 19138 Geographic information — Data quality measures (Thông tin địa lý – Đo lường chất lượng dữ liệu); -Các tiêu chuẩn đối với các dịch vụ thông tin địa lý: ISO 19119 Geographic information — Services (Thông tin địa lý – Dịch vụ); ISO 19116 Geographic information — Positioning services (Thông tin địa lý – Dịch vụ định vị); ISO 19117 Geographic information — Portrayal (Thông tin địa lý – Phác họa); ISO 19125-1 Geographic information — Simple feature access — Part 1: Common architecture (Thông tin địa lý – Truy cập đối tượng địa lý đơn giản – Phần 1: Kiến trúc chung); ISO 19125-2 Geographic information — Simple feature access — Part 2: SQL option (Thông tin địa lý – Truy cập đối tượng địa lý đơn giản – Phần 2: Tùy chọn SQL); ISO 19128 Geographic information — Web map server interface (Thông tin địa lý – Giao diện máy chủ bản đồ web); ISO 19132 Geographic information — Location based services — Reference 21 model (Thông tin địa lý – Dịch vụ dựa trên định vị - Mô hình tham chiếu); ISO 19133 Geographic information — Location based services — Tracking and navigation (Thông tin địa lý – Dịch vụ dựa trên định vị - Điều hướng và truy vết); ISO 19134 Geographic information — Location base services — Multimodal routing and navigation (Thông tin địa lý – Dịch vụ dựa trên định vị - Điều hướng và định tuyến đa phương tiện); -Các tiêu chuẩn mã hóa thông tin địa lý: ISO 19118 Geographic information — Encoding (Thông tin địa lý – Mã hóa); ISO 6709 Standard representation of geographic point location by coordinates (Thể hiện chuẩn vị trí điểm địa lý theo các tọa độ); ISO 19136 Geographic information — Geography Markup Language (GML) (Thông tin địa lý – Ngôn ngữ đánh dấu địa lý (GML)); ISO/TS 19139 Geographic information — Metadata — XML schema implementation (Thông tin địa lý – Siêu dữ liệu – Triển khai lược đồ XML); -Các tiêu chuẩn đối với các lĩnh vực chủ đề cụ thể: ISO/TS 19101-2 Geographic information — Reference model — Part 2: Imagery (Thông tin địa lý – Mô hình tham chiếu – Phần 2: Ảnh); ISO 19115-2 Geographic information — Metadata — Part 2: Extensions for imagery and gridded data (Thông tin địa lý – Dữ liệu đặc tả - Mở rộng đối với dữ liệu lưới và Ảnh); 2.3 Kết luận Số hóa đã và đang bùng nổ, thị trường cho lĩnh vực này rất lớn và tiềm năng. Các doanh nghiệp cũng như các cơ quan nhà nước, thư viện, trường đại học… cũng đã có những giải pháp dịch vụ, quy trình cho việc số hóa tài liệu. Tuy nhiên để hiệu quả và chuẩn xác thì việc xây dựng tiêu chuẩn quy trình số hóa là việc làm cần thiết. Quy trình số hóa cần tuân theo các tiêu chuẩn quốc tế đồng thời cũng phải có những điều chỉnh nhất định để phù hợp với yêu cầu cũng như hoàn cảnh tại Việt Nam. 22 3 Cơ sở xây dựng các yêu cầu kỹ thuật 3.1 Phân tích các tài liệu tiêu chuẩn 3.1.1 Tiêu chuẩn ISO 13028 : 2010 ISO / TR 13028 do Ủy ban kỹ thuật ISO / TC 46, Thông tin và tài liệu biên soạn hướng dẫn, Tiểu ban SC 11, Lưu trữ / quản lý hồ sơ. Báo cáo kỹ thuật này được dựa trên tiêu chuẩn S6 Lưu trữ hồ sơ của Lưu trữ New Zealand: Tiêu chuẩn số hóa, được công bố vào tháng 01 năm 2006. Báo cáo kỹ thuật này: Thiết lập các hướng dẫn để tạo ra và duy trì các bản ghi trong định dạng kỹ thuật số duy nhất, nơi mà các bài báo gốc, hoặc hồ sơ nguồn không kỹ thuật số khác, đã được sao chép bằng cách số hóa; - Thiết lập hướng dẫn thực hành tốt nhất cho việc số hóa để đảm bảo độ tin cậy và độ tin cậy của hồ sơ và cho phép xem xét xử lý các hồ sơ nguồn không kỹ thuật số; - Thiết lập hướng dẫn thực hành tốt nhất cho sự tin cậy của các hồ sơ số hóa có thể ảnh hưởng đến việc chấp nhận bằng chứng pháp lý và trọng lượng của các hồ sơ đó; - Thiết lập hướng dẫn thực hành tốt nhất cho việc tiếp cận các hồ sơ số hoá cho đếnkhi họ được yêu cầu; - Xác định các chiến lược để hỗ trợ trong việc tạo ra các bản ghi số hóa phù hợp để duy trì lâu dài; Thiết lập hướng dẫn thực hành tốt nhất cho việc quản lý các hồ sơ nguồn không kỹ thuật số sau số hóa. Báo cáo kỹ thuật này được áp dụng để sử dụng trong việc thiết kế và tiến hành số hóa trách nhiệm của tất cả các tổ chức thực hiện số hóa, hoặc quá trình kinh doanh số hóa, dự án số hóa chụp lại cho các mục đích quản lý hồ sơ, như được nêu trong ISO 154891: 2001 và ISO / TR 15801: 2009. Báo cáo kỹ thuật này là không áp dụng đối với: a)khai thác và quản lý hồ sơ sinh-kỹ thuật số; 23 b)thông số kỹ thuật cho quét hồ sơ kỹ thuật số; c)các thủ tục để ra quyết định cuối cùng về xác định giá trị hồ sơ; d)thông số kỹ thuật cho việc bảo tồn lâu dài của hồ sơ kỹ thuật số; e)số hóa của các tài lưu trữ hiện có cho các mục đích bảo quản. Nội dung của tiêu chuẩn bao gồm các phần chính sau: Tài liệu bắt đầu bằng việc phân tích đánh giá các lợi ích cũng như rủi ro của việc số hóa. Số hóa cung cấp các lợi ích tiềm năng sau đây cho các tổ chức: có thể truy cập hình ảnh đồng thời cho nhiều người; truy cập mạng cho phép truy cập từ nhiều nơi bất cứ lúc nào; hội nhập sâu hơn với các hệ thống thông tin kinh doanh; khả năng truyền tải hình ảnh trong một quy trình làm việc có cấu trúc, do đó hỗ trợ xử lý công việc; loại bỏ tạp chủng (cả giấy và kỹ thuật số) của hệ thống mà có thể gây nhầm lẫn cho người dùng khi yêu cầu truy cập xem toàn bộ lịch sử của một sự việc nào đó; khả năng tái sử dụng nguồn lực hạn chế hiện có của mình bằng cách định dạng của họ, ví dụ: bản đồ rất lớn hoặc các tài liệu được tổ chức trên vi phim hoặc băng từ; áp dụng phân loại phù hợp và lập chỉ mục cho các tài liệu đặc biệt cho các tập tin lai; tích hợp với các tổ chức khắc phục thảm họa và các chế độ sao lưu hiện có; cung cấp một khả năng bảo mật và bảo đảm khả năng làm giảm không gian lưu trữ vật lý bị chiếm đóng bởi các hồ sơ bản giấy; tiềm năng để tăng năng suất của tổ chức. Có một số rủi ro liên quan đến việc thực hiện một quá trình số hóa: tiết kiệm chi phí ngắn hạn có thể đến chi phí dài hạn trong việc duy trì khả năng tiếp cận tới các hình ảnh kỹ thuật số theo thời gian; tiêu chuẩn công nghệ và kỹ thuật được sử dụng để tạo ra hình ảnh kỹ thuật số có thể ảnh hưởng đáng kể tuổi thọ và khả năng tái sử dụng các hình ảnh trong tương lai; 24 Lê kế hoạch là bước đầu tiên và quan trọng nhất trong quy trình số hóa. Tất cả quá trình số hóa phải được lên kế hoạch, xác định phạm vi và ghi lại tài liệu. Các tài liệu dự án bao gồm: a) phạm vi định nghĩa: xác định rõ ràng nghiệp vụ, mục tiêu, quy mô, kích thước và những hạn chế của dự án; b) tuyên bố về mục đích và dự kiến sử dụng của các hồ sơ kỹ thuật số, minh họa nếu cần thiết với các ví dụ; c) tuyên bố về lợi ích, rủi ro: xác định rõ ràng về những lợi ích, rủi ro dự kiến từ việc số hóa; d) báo cáo kết quả nhu cầu và tác động của người dùng: ví dụ, làm thế nào các hồ sơ số hoá sẽ được sử dụng truy cập và ảnh hưởng thế nào người sử dụng; e) tuyên bố về tiêu chuẩn kỹ thuật áp dụng: bao gồm định dạng, nén và dữ liệu đặc tả; f) thiết bị và các nguồn lực để hỗ trợ cho việc số hóa; g) quy trình lập kế hoạch, kiểm soát và thực hiện việc số hóa, bao gồm cả những người thực hiện trước, trong và sau khi số hóa; h) quy trình kiểm soát chất lượng; i) chiến lược cho việc tích hợp các hình ảnh số hóa vào quy trình làm việc để hỗ trợ các hoạt động nghiệp vụ đang diễn ra; chiến lược cho quản lý đối với các hồ sơ được số hóa và hồ sơ nguồn không kỹ thuật số phải luôn sẵn sang khi được yêu cầu. Song song với đó là việc xác định lựa chọn các giải pháp cũng như phần mềm thiết bị cho phù hợp với yêu cầu và mục đích số hóa. 25 Quản lý bản ghi số hóa Suốt quá trình thực hiện các giai đoạn của một dự án số hóa, yêu cầu quản lý hồ sơ phải được đưa vào để đảm bảo rằng nguồn dữ liệu ban đầu và các tài liệu số hóa là toàn vẹn và trong suốt. Quá trình này phải đảm bảo phù hợp với tiêu chuẩn ISO 15489-1: 2001 Trong trường hợp các hình ảnh số hóa được sử dụng như bản ghi hiện tại hoặc sẽ được sử dụng trong quy trình hiện tại thì quy trình này nên được tích hợp với các thông tin nghiệp vụ khác hoặc hệ thống quản lý hồ sơ điện tử. Điều này đảm bảo rằng các hình ảnh số được thừa hưởng việc phân loại quy trình nghiệp vụ và dữ liệu đặc tả lien quan tới quy trình nghiệp vụ sẽ được đưa vào trong quy trình nghiệp vụ và tăng cường tính xác thực bằng cách tích hợp với hệ thống thông tin nghiệp vụ. Dự án số hóa thường được thực hiện như một biện pháp bảo quản để kéo dài tuổi thọ của các hồ sơ không kỹ thuật số dễ mất mát hoặc để tăng truy cập của người dùng đến nội dung thông tin của hồ sơ và thường được đầu tư mạnh. Trong trường hợp kết quả của các dự án này không được liên kết ngay lập tức với một hệ thống thông tin nghiệp vụ đã tồn tại, thì cũng cần phải xem xét luôn việc đảm bảo sự phù hợp với hệ thống đối với các quá trình như định danh, đánh chỉ số, phân loại, kiểm soát an ninh và truy cập, quản lý bản quyền và bảo quản. Tiêu chuẩn mô tả và hướng dẫn các bước liên quan tới việc chuẩn bị hồ sơ gốc, dữ liệu đặc tả và đảm bảo chất lượng. Hệ thống quản lý Dữ liệu số hóa và chưa số hóa để đảm bảo chất lượng luôn phải đi kèm với 1 hệ thống quản lý chuẩn mực và đảm bảo được các yêu cầu bắt buộc. Trong đó việc xác định chiến lược cho việc lưu trữ cũng như kế hoạch và các thủ tục sao lưu được mô tả và hướng dẫn cụ thể. 26 Xác định giá trị bản ghi Trong đó đưa ra một loạt các quá trình lien quan đến việc thực hiện những quyết định về lưu trữ, tiêu hủy hoặc chuyển giao hồ sơ, được quy định bằng văn bản về thẩm quyền xác định giá trị hồ sơ hoặc các công cụ khác. Các tiêu chuẩn tham khảo và tham chiếu: ISO 15489-1:2001, Information and documentation — Records management — Part 1: General ISO/TR 15801:2009, Document management — Information stored electronically — Recommendations for trustworthiness and reliability ISO 23081-1:2006, Information and documentation — Records management processes — Metadata for records — Part 1: Principles ISO 23081-2:2009, Information and documentation — Managing metadata for records — Part 2: Conceptual and implementation issues 3.1.2 ISO 19115-1:2014 ISO 19115-1 do ban kỹ thuật ISO/TC 211 “Thông tin địa lý” biên soạn Sự tiến bộ của phần mềm và phần cứng máy tính đối với việc quản lý và phân tích dữ liệu, cụ thể việc hợp nhất các quan sát tham chiếu địa lý dẫn đến sự tăng nhanh việc sử dụng các giải pháp thông tin số trên phạm vi toàn cầu. Nhận thức được tầm quan trọng địa lý và những thứ liên quan đang tác động đến hầu hết các khía cạnh của xã hội. Tập dữ liệu địa lý số là sự biểu diễn của một số mô hình của thế giới để sử dụng trong phân tích máy tính và hiện thị thông tin tin bằng đồ họa. Các mô hình cơ sở là sự trừu tượng, yêu cầu tính gần đúng, sự đơn giản hóa và sự bỏ qua một vài khía cạnh và luôn luôn là một trong nhiều “cách nhìn” có thể xảy ra. Để đảm bảo rằng dữ liệu không bị lạm dụng, các giả thiết và các giới hạn ảnh hưởng đến việc tạo dữ liệu phải được tài liệu hóa đầy đủ. Điển hình, dữ liệu được sử dụng bởi nhiều người hơn là nhà sản xuất. Dữ liệu đặc tả cho pháp nhà sản xuất mô tả các tài nguyên để người sử dụng có thể hiểu được các giả thiết và các giới hạn và đánh giá các tài nguyên thích hợp cho mục đích sử dụng của họ. Tài liệu có chất lượng cũng sẽ cung cấp cho các nhà sản xuất dữ liệu 27 với kiến thức sẵn có của họ và cho phép họ quản lý tốt hơn việc sản xuất dữ liệu, lưu trữ, cập nhật và tái sử dụng. Tập dữ liệu địa lý được coi như dữ liệu bảng, có cấu trúc với vị trí kết hợp với mỗi hàng trong một bảng hoặc điểm trong lưới. Nhằm mục đích mở ra đám mây thông tin dựa trên web, khái niệm tập dữ liệu có thể được mở rộng để bao gồm mọi sản phẩm thông tin được coi như một đơn vị, xác định bởi phạm vi của nó, quyền và mục đích mong đợi. Trong một cách nhìn rộng hơn, mọi tài liệu chưa các quan sát hoặc trình diễn cục bộ có thể được xem là tập dữ liệu địa lý, có cấu trúc hoặc không có cấu trúc. Hệ thống thông tin phân tán được kích hoạt bởi internét đang thúc đẩy sự phát triển của kiến trúc hướng dịch vụ mà các dịch vụ web đang trở nên quan trọng như nguồn thông tin hoặc khả năng xử lý, nhiều trong số các dịch vụ này cung cấp thông tin hoặc chức năng dựa trên vị trí. Mô tả các dịch vụ phát hiện và sử dụng này trở thành một chức năng quan trọng của dữ liệu đặc tả. Tổ chức thông tin quan trọng với tham chiếu địa lý được chứa trong tài nguyên không phải là dạng số. Các tài nguyên này bao gồm bản đồ và tài liệu của các loại khác nhau cũng như các mẫu hoặc các sản phẩm khác được tập hợp để miêu tả một số khía cạnh của trái đất – vật lý, sinh học và văn hóa. Lược đồ dữ liệu đặc tả thể hiện trong tiêu chuẩn này cũng thích hợp với tài nguyên như vậy. Mục tiêu của tiêu chuẩn này là cung cấp mô hình cho việc mô tả thông tin hoặc tài nguyên chứa các phần mở rộng. Tiêu chuẩn này được sử dụng bởi nhà phân tích hệ thống thông tin, nhà lập kế hoạch chương trình và nhà phát triển các hệ thống thông tin nhằm xác định các nguyên tắc cơ bản và các yêu cầu cho việc mô tả tài nguyên thông tin. Tiêu chuẩn này cũng xác định các phần tử dữ liệu đặc tả, các đặc tính của chúng và mối quan hệ giữa các phần tử và thiết lập tập thuật ngữ dữ liệu đặc tả chung, các định nghĩa và các thủ tục mở rộng. Mặc dù mục đích chính của tiêu chuẩn này là mô tả thông tin số được mở rộng, nhưng có thể được sử dụng để mô tả tất cả các kiểu tài nguyên bao gồm tài liệu nguyên văn, sáng kiến, phần mềm, thông tin phi địa lý, đặc tả sản phẩm và các kho dữ liệu, nghĩa là có thể được sử dụng để mô tả tài nguyên thông tin mà không có phần mở rộng địa lý. Một số vùng có các chuẩn dữ liệu đặc tả của chính nó như là Dublin core cho các thư 28 viện. Nếu cần, các tiêu chuẩn như vậy và tiêu chuẩn này có thể được môt tả sơ lược để tạo ra các lược đồ chung. Khi được thực hiện bởi nhà cung cấp tài nguyên, tiêu chuẩn này sẽ: 1) cho phép các nhà cung cấp tài nguyên thông tin miêu tả hoàn thiện và hiệu quả các tài nguyên của họ 2) Thuận lợi hóa tổ chức và quản lý dữ liệu đặc tả cho các tài nguyên thông tin 3) Cho phép sử dụng các tài nguyên thông tin thích hợp thông qua việc hiểu được các đặc điểm của chúng. 4) Thuận lợi hóa việc phát hiện, truy cập, lấy lại và tái sử dụng 5) Cho phép người sử dụng xác định xem liệu tài nguyên thông tin có hữu ích với họ hay không Tiêu chuẩn này xác định dữ liệu đặc tả mục đích chung. Nhiều mô hình chi tiết cho các khía cạnh của mô tả tài nguyên, bao gồm chất lượng, cấu trúc dữ liệu hoặc ảnh được xác định trong các tiêu chuẩn thông tin địa lý khác. Mô hình dữ liệu đặc tả ở đây cho phép thực hiện các phần mở rộng dựa trên mẫu chung nhằm tạo thuận lợi cho việc thực hiện phần mềm sử dụng các phần mở rộng đó. Tiêu chuẩn này là sự sửa đổi của ISO 19115:2003 và ISO ISO 19115:2003/Cor 1:2006. Phần sửa đổi này được thực hiện bởi các tiến bộ của công nghệ thông tin và sự thay đổi về việc sử dụng internét cho việc truy cập, sủa dụng và quản lý dữ liệu đặc tả cũng như các sửa đổi cho các tài liệu tham chiếu và người sử dụng riêng lẻ cung cấp các gợi ý dựa trên tám năm kinh nghiệm trong việc sử dụng. Tiêu chuẩn này độc lập hoàn toàn với phiên bản trước đó với tên và ngày tháng mới. Các gói UML, các lớp, các phần tử có định danh khác nhau so với phiên bản trước. Mục đích của siêu dữ liẹu là mô tả các tài nguyên. Việc mô tả này có thể giữ lại dữ liệu và không thay đổi. Có thể sử dụng cả hai để trình diễn dữ liệu và tìm dữ liệu. Số lượng lớn dữ liệu cũ hơn tồn tại trong ISO 19115:2003, và dữ liệu mới hơn tồn tại ở các bản mô tả sơ lược quốc gia hoặc vùng miền ISO 19115:2003. Dữ liệu này sẽ vẫn giữ nguyên như đã được xác định. Việc tạo ra dữ liệu mới cho các dặc tả sản phẩm mới dựa trên việc sửa đổi ISO 19115 tận dụng các khả năng mô tả mở rộng. Với việc giới thiệu sửa đổi ISO 19115 này, tồn tại môi trường dữ liệu hỗn hợp. Các hệ thống mà 29 hỗ trợ việc phát hiện dữ liệu theo sửa đổi của ISO 19115 có thể nhận ra và biểu diễn dữ liệu đặc tả trong ISO 19115:2003 sao cho tất cả dữ liệu trong môi trường hỗn hợp có thể được phát hiện. Các hệ thống mà hỗ trợ việc trình diễn dữ liệu theo sửa đổi của ISO 19115 cũng có thể nhận ra và trình diễn dữ liệu đặc tả trong ISO 19115:2003 sao cho tất cả các dữ liệu được trình diễn. Việc sử dụng các định danh riêng biệt cho các phần tử sửa đổi và cách thức mà chuẩn dữ liệu đặc tả được sửa đổi tạo thuận lợi cho điều này. Để hỗ trợ cho việc đảm bảo tính tương thích và nới lỏng việc biến đổi các trường hợp dữ liệu đặc tả cho phiên bản sửa đổi của ISO 19115: — Không có phần tử bắt buộc mới nào được tạo; — Nếu định nghĩa của phần tử dữ liệu đặc tả yêu cầu thay đổi thì nó sẽ bị xóa hoặc thay thế bởi phần tử dữ liệu đặc tả mới; các tên phần tử dữ liệu đặc tả không được tái sử dụng cho các khái niệm khác; — Các định nghĩa của các phần tử dữ liệu đặc tả được mở rộng; — Các phần tử dữ liệu đặc tả được tái sử dụng khi kiểu dữ liệu của chúng thay đổi nhưng tên và tên và định nghĩa vẫn không đổi; — Các thuộc tính còn lại được giữ trong cùng trật tự như trong chuẩn thay thế; — Danh sách các phần tử bị xóa, các phần tử mới và ánh xạ giữa các phần tử cũ và việc thay thế của chúng được cung cấp trong Phụ lục G; — Tái cấu trúc ULL được giữ ở mức tối thiểu. Tóm tắt một số thay đổi chính: — Khái niệm của “dữ liệu đặc tả lõi” bị loại bỏ; — Dữ liệu đặc tả về các dịch vụ được thêm vào, bắt nguồn từ ISO 19119:2005 và ISO 19119:2005/Amd 1:2008; — Chất lượng dữ liệu được chuyển tới ISO 19157; — Phụ lục F được thêm vào để mô tả dữ liệu đặc tả cho việc phát hiện dịch vụ và tài nguyên phi dịch vụ; — Nhiều danh sách mã được mở rộng; 30 — Sủ dụng “tên ngắn” và “mã vùng” được giảm bới cho các phần tử dữ liệu đặc tả và các mã tương ứng. ISO 19115 với tên chung là Thông tin địa lý – Dữ liệu đặc tả, bao gồm các phần sau đây, — Phần 1: Nguyên tắc cơ bản — Part 2: Mở rộng cho dữ liệu ảnh và dữ liệu lưới — Part 3: Thực thi nguyên tắc cơ bản về dữ liệu đặc tả theo lược đồ XML ISO 19115-1:2014 xác định lược đồ được yêu cầu để mô tả thông tin địa lý và các dịch vụ bằng dữ liệu đặc tả. Tiêu chuẩn này còn cung cấp thông tin về việc định danh, mở rộng, chất lượng, khía cạnh không gian và thời gian, nội dung, tham chiếu không gian và các đặc tính khác của dữ liệu và các dịch vụ địa lý số. ISO 19115-1:2014 có thể áp dụng cho: - ghi vào mục lục tất cả các loại tài nguyên, mô tả đầy đủ các tập dữ liệu và dịch vụ; - các dịch vụ địa lý, tập dữ liệu địa lý, các đặc trưng địa lý riêng và các đặc tính đặc trưng. ISO 19115-1:2014 xác định: - các phần dữ liệu đặc tả bắt buộc và có điều kiện, các thực thể dữ liệu đặc tả và các phần tử dữ liệu đặc tả; - tập dữ liệu đặc tả tối thiểu được yêu cầu nhằm đáp ứng hầu hết các ứng dụng dữ liệu đặc tả (phát hiện dữ liệu, xác định dữ liệu phù hợp để sử dụng, truy cập dữ liệu, truyền dữ liệu và sử dụng dữ liệu số và các dịch vụ số); - các phần tử dữ liệu đặc tả tùy chọn cấp phát nhiều mô tả tài nguyên chuẩn mở rộng, nếu được yêu cầu; - phương pháp mở rộng dữ liệu đặc tả phù hợp với các nhu cầu chuyên dụng. ISO 19115-1:2014 cũng áp dụng cho dữ liệu và các dịch vụ số, các nguyên tắc của nó được mở rộng đến các loại tài nguyên khác như là bản đồ, sơ đồ và tài liệu nguyên bản cũng như dữ liệu phi địa lý. Các phần tử dữ liệu đặc tả có điều kiện nào đó có thể không áp dụng các dạng dữ liệu khác này. 31 3.1.3 ISO 19115-2:2009 ISO 19115-2:2009 do ban kỹ thuật ISO/TC 211 “Thông tin địa lý” biên soạn ISO 19115-2:2009 mở rộng chuẩn dữ liệu đặc tả về địa lý hiện có bằng cách xác định lược đồ được yêu cầu để mô tả dữ liệu ảnh và dữ liệu lưới. Tiêu chuẩn này còn cung cấp thông tin về các đặc tính đo trang thiết bị được sử dụng để có được dữ liệu, hình dạng việc đo quá trình sử dụng thiết bị và quá trình sản xuất được sử dụng đẻ số hóa dữ liệu thô. Phần mở rộng này đề cập đến dữ liệu đặc tả cần để mô tả việc chuyển hóa thông tin địa lý từ dữ liệu thô, bao gồm các đặc tính của hệ thống đo và các phương pháp bằng số và các thủ tục điện toán sử dụng trong việc chuyển hóa. Dữ liệu đặc tả được yêu cầu để đề cập đến dữ liệu được bao phủ nói chung và được đề cập trong phần tổng quát của ISO 19115. Dữ liệu ảnh và dữ liệu lưới là các nguồn thông tin và sản phẩm quan trọng sử dụng trong môi trường địa không gian bởi các hệ thống thông tin địa lý. Việc tạo ra dữ liệu ảnh và dữ liệu lưới theo sau một hoặc nhiều chuỗi quá trình bắt đầu với dữ liệu cảm ứng từ xa, bản đồ quét, thu thập dữ liệu trường hoặc các phương pháp cảm ứng khác và kết thúc với việc tạo các sản phẩm dữ liệu liệu cuối. Quá trình sản xuất cần được tài liệu hóa để duy trì việc kiểm soát chất lượng qua các sản phẩm cuối. Ngoài ra, dữ liệu đặc tả về hình quá trình đo và các đặc tính của thiết bị đo yêu cầu được giữ lại dữ liệu thô để hỗ trợ quá trình sản xuất Trong bộ các tiêu chuẩn thông tin địa lý của ISO, ISO 19115 xác định các hướng dẫn để mô hả thông tin địa lý và các dịch vụ. Khi mô hình dữ liệu đặc tả trong ISO 19115 cung cấp một số điều khoản về dữ liệu ảnh và dữ liệu lưới, các yêu cầu không được xây dựng đầy đủ tại thời điểm ISO 19115:2003 đang trong giai đoạn bản thảo. Để tiếp tục xây dựng ISO 19115, bao gồm các định nghĩa dữ liệu đặc tả cho dữ liệu ảnh và dữ liệu lưới được hoãn lại cho đến khi khung tổng quát của các dữ liệu này được qui định đầy đủ trong bộ tiêu chuẩn thông tin địa lý ISO. Ngoài ra, các tiêu chuẩn khác thực thi dữ liệu đặc tả về dữ liệu ảnh và dữ liệu lưới được khảo sát và mô tả trong ISO/TR 19121. Mục tiêu của tiêu chuẩn này là cung cấp cấu trúc bổ sung để mô tả việc chuyển hóa dữ liệu ảnh và dữ liệu lưới. Cấu trúc này là yếu tố thêm của ISO 19115. 3.1.4 Tiêu chuẩn quy trình số hóa A000015 Alberta. 32 Tiêu chuẩn có hiệu lực vào 01-03-2013 do IMT tiêu chuẩn giám sát Ủy ban Chính phủ của Alberta. Tiêu chuẩn này mô tả các quá trình mà chính phủ, bộ, ban ngành cần thực hiện cho tất cả các dự án số hóa và phải thực hiện khi mục tiêu của dự án số hóa là tạo ra hồ sơ số. Tiêu chuẩn xây dựng phù hợp với tiêu chuẩn chung của Canada CAN/CGSB-72.11-93, Microfilm and Electronic Images as Documentary Evidence Theo đó quy trình số hóa bao gồm các bước sau: - Phân tích nghiệp vụ - Chương trình số hóa và phân quyền - Xử lý tài liệu gốc - Chụp ảnh, scan và lặp lại - Đánh dấu chỉ mục và dữ liệu đặc tả - -Đảm bảo chất lượng - -Lưu trữ hình ảnh - Trong quá trình số hóa cần lưu ý : - Quản lý dữ liệu - Quản lý chất lượng - Lưu vết - Xem các yêu cầu kỹ thuật Trong đó từng bước trong quy trình đều được mô tả cụ thể. Tiêu chuẩn này được áp dụng cho các ban ngành chỉnh phủ, cơ quan, doanh nghiệp. 3.1.5 Tiêu chuẩn ANSI/NISO Z39.87-2006 Các viện văn hóa và các tổ chức thương mại được tham gia vào việc tạo các thư viện ảnh tĩnh số. Một thách thức tạo ra cho các tập hợp này là xây dựng lên các hệ thống, được định nghĩa rộng rãi là “kho kỹ thuật số ” duy trì chức năng và chất lượng bên trong ảnh. Một chiến lược quản lý, các mục đích bảo quản dữ liệu ảnh bằng cách sao chép các tệp tin cho các định dạng mới tại khoảng thời gian đã định. Giả thiết rằng, các công nghệ kỹ thuật số đưa ra cơ hội chưa từng xảy ra để bảo quản nội dung mà không mất bất kỳ thông tin nào 33 từ việc tạo đến việc tạo. Điều này có thể xảy ra hay không và theo các điều kiện nào là hai câu hỏi mà tổ chức tiêu chuẩn thông tin quốc gia, hội đồng về thư viện và tài nguyên thông tin và RLG bảo trợ “Hội thảo về dữ liệu đặc tả ảnh” vào tháng 4 năm 1999. Mục đích của hội thảo là mở đầu một nỗ lực hợp tác nhằm xác định tập hợp các phần tử dữ liệu đặc tả để tài liệu hóa các thuộc tính kỹ thuật của ảnh tĩnh số. Các nhà tổ chức hội thảo thấy rằng các viện văn hóa tập trung chủ yếu vào việc xác định các dữ liệu đặc tả mô tả nhằm mục đích khám phá và định danh, công việc tương đối nhỏ đó được hoàn thành để hệ thống hóa các thuộc tính kỹ thuật của các ảnh kỹ thuật số và việc sản xuất. Người tham gia hội thảo nhất trí rằng dữ liệu đặc tả kỹ thuật cần thiết để hỗ trợ hai mục tiêu cơ bản: nhằm tài liệu hóa lịch sử và nguồn gốc ảnh (dữ liệu đặc tả sản xuất); và nhằm đảm bảo rằng dữ liệu ảnh sẽ được trả lại đầu ra một cách chính xác (màn hình, máy in hoặc phim). Một số người tham gia cũng quan sát rằng việc quản lý đang diễn ra hoặc “việc bảo quản” của các chức năng lõi này sẽ yêu cầu xây dựng các ứng dụng nhằm kiểm tra tính hợp lệ, xử lý, làm mới và di chuyển ảnh dựa vào các tiêu chí đã mã hóa như dữ liệu đặc tả kỹ thuật. Hai mục đích bao quát giúp cho NISO xây dựng từ điển dữ liệu này. Đầu tiên là định danh các phần tử dữ liệu được sử dụng bởi các ứng dụng nhằm kiểm soát các phép biến đổi của hình ảnh dựa vào hệ mét cho các thuộc tính chất lượng như là âm lượng, màu sắc và kích cỡ. Thứ hai là đề xuất các phần tử được các nhà quản lý, người phụ trách hoặc các chuyên gia về ảnh kỹ thuật số sử dụng nhằm đánh giá giá trị hiện thời (có thẩm mỹ hoặc có chức năng) của hình ảnh hoặc bộ ảnh. 3.1.6 Dữ liệu đặc tả theo tiêu chuẩn ISO 15836. Bộ phần tử dữ liệu đặc tả Dublin Core là một chuẩn đề cập đến việc mô tả tài nguyên thông tin liên lĩnh vực. Ở đây, tài nguyên thông tin được định nghĩa là các thông tin được định danh. Đây là định nghĩa được sử dụng trong chuẩn Internet RFC 2396, “các thẻ định danh tài nguyên thống nhất (URI): Cú pháp chung” do Tim Berners-Lee và cộng sự phát triển. Đối với các ứng dụng Dublin Core, tài nguyên thông tin là một tài liệu điện tử. Tiêu chuẩn này chỉ áp dụng cho bộ phần tử được sử dụng chung trong các ứng dụng hoặc dự án cụ thể. Các chính sách, yêu cầu của cộng đồng và địa phương khác nhau có thể áp đặt thêm một số giới hạn, quy tắc và cách thông dịch. Tiêu chuẩn này không định nghĩa chi tiết tiêu chí mà bộ phần tử được sử dụng trong các ứng dụng và dự án cụ thể. Tiêu chuẩn này thay thế cho chuẩn RFC 2413, đây là phiên bản phát hành đầu tiên về Dublin Core. Trong các mô tả phần tử, mỗi phần tử có một nhãn mô tả nhằm truyền đạt sự am hiểu ngữ nghĩa về phần tử và mỗi phần tử còn có một tên duy nhất, gồm một từ mà máy có thể hiểu 34 được, dùng để tạo ra đặc tả cú pháp của các phần tử đơn giản hơn trong lược đồ mã hóa. Tuy nhiên trong một vài môi trường, như HTML, không phân biệt dạng chữ hoa và chữ thường thì việc tuân thủ các quy ước về tên các phần tử là cách tốt nhất nhằm tránh xung đột khi dữ liệu đặc tả được trích dẫn hoặc chuyển đổi sang các môi trường có sự phân biệt chữ hoa, chữ thường, như XML (Ngôn ngữ đánh dấu mở rộng). Mỗi phần tử là tùy chọn và có thể lặp lại. Các phần tử dữ liệu đặc tả có thể xuất hiện ở mọi thứ tự. Việc sắp xếp theo thứ tự số lần xuất hiện của một phần tử (ví dụ: tác giả) có ý nghĩa đối với nhà cung cấp, nhưng không đảm bảo các phần tử được duy trì trong mỗi hệ thống. 9 Để thúc đẩy tính tương tác toàn cầu, một số mô tả phần tử nên có một từ điển đối với các giá trị phần tử tương ứng. Điều này được giả định rằng các từ vựng được kiểm soát khác sẽ được phát triển về tính tương tác trong các miền cục bộ nào đó. Các phần tử gồm có: 1. Tiêu đề: Tên được đặt cho một tài nguyên. Thông thường, Tiêu đề được hiểu là tên chính thức của một tài nguyên. 2. Tác giả: Một thực thể trách nhiệm chính là tạo ra nội dung cho tài nguyên. Thông thường, tên của tác giả nên được sử dụng để định danh thực thể này. 3. Chủ đề: Một chủ điểm nội dung của tài nguyên. Thông thường, Chủ đề được thể hiện là các từ khóa, cụm từ khóa, hoặc các mã phân loại mô tả chủ điểm của tài nguyên. Cách tốt nhất được khuyến cáo là lựa chọn một giá trị từ một từ vựng được kiểm soát hay từ một lược đồ phân loại chính thức. 4. Mô tả: Mô tả nội dung của tài nguyên. Các ví dụ về mô tả bao gồm, nhưng không chỉ như vậy, một tóm tắt, mục lục, tham chiếu đến nội dung của tài liệu bằng đồ họa, văn bản. 5. Nhà phát hành: Thực thể có trách nhiệm tạo ra tài nguyên thông tin sẵn sàng để sử dụng. Thông thường, tên của nhà phát hành nên được sử dụng để chỉ ra thực thể đó. 6. Người đóng góp: Thực thể có trách nhiệm đóng góp vào nội dung của tài nguyên thông tin đó. Thông thường, tên của người đóng góp nên được sử dụng để chỉ ra thực thể đó. 7. Ngày tháng: Ngày tháng của sự kiện trong vòng đời của tài nguyên. Thông thường, Ngày tháng là ngày tạo ra tài nguyên hoặc ngày tài nguyên sẵn sàng sử dụng. Cách tốt nhất được khuyến cáo đối với việc mã hóa giá trị ngày tháng được xác định trong một hồ sơ theo TCVN ISO 8601:2004 [W3CDTF] và bao gồm ngày tháng theo dạng YYYY-MM-DD. 8. Kiểu: Bản chất hoặc dạng nội dung của tài nguyên. Kiểu bao gồm các thuật ngữ mô tả các danh mục phân loại chung, các chức năng, các dạng hoặc các mức kết hợp nội 10 dung. Cách tốt nhất được khuyến cáo để chọn một giá trị từ một từ vựng được kiểm soát (ví dụ, từ vựng kiểu DCMI [DCT]). Để mô tả biểu thị dạng vật lý hoặc dạng số của tài nguyên, sử dụng phần tử định dạng. 9. Định dạng: Biểu thị dạng vật lý hoặc số của tài nguyên. Thông thường, định dạng bao gồm kiểu phương tiện hoặc các kích cỡ của tài nguyên. Định dạng được sử dụng để định danh phần mềm, phần cứng, 35 hoặc thiết bị cần thiết khác dùng cho việc điều hành hoặc hiển thị. Các ví dụ về kích thước bao gồm kích cỡ và khoảng thời gian. Cách tốt nhất được khuyến cáo là lựa chọn giá trị từ một từ vựng được kiểm soát (ví dụ, danh sách các kiểu phương tiện Internet (Internet Media Types [MIME]) định nghĩa các định dạng môi trường máy tính). 10. Thẻ định danh: Tham chiếu đến tài nguyên thông tin trong ngữ cảnh cụ thể. Cách tốt nhất được khuyến cáo là định danh tài nguyên bằng một chuỗi hoặc số phù hợp với hệ thống định danh chính thức. Hệ thống định danh chính thức bao gồm nhưng không hạn chế đối với thẻ định danh tài nguyên thông tin thống nhất (URI) (gồm người quy định tài nguyên thống nhất (URL), thẻ định danh đối tượng dạng số (DOI), và mã số sách tiêu chuẩn quốc tế ( (ISBN)). 11. Nguồn: Tham chiếu đến một tài nguyên ở đó tài nguyên hiện tại được tạo. Tài nguyên hiện tại có thể được lấy từ toàn bộ hoặc một phần tài nguyên gốc. Cách tốt nhất được khuyến cáo là định danh tài nguyên được tham chiếu bởi chuỗi hoặc bởi số phù hợp với hệ thống định danh chính thức. 12. Ngôn ngữ: Ngôn ngữ mô tả nội dung tri thức của tài nguyên. Cách tốt nhất là sử dụng RFC 3066 kết hợp với ISO 639 [ISO639], định nghĩa các thẻ ngôn ngữ chính gồm hai và ba chữ cái cùng với các thẻ nhỏ tùy chọn. 13. Quan hệ: Tham chiếu đến tài nguyên có liên quan. Cách tốt nhất được khuyến cáo là định danh tài nguyên được tham chiếu bằng chuỗi hoặc số phù hợp với hệ thống định danh chính thức. 3.1.7 Các dữ liệu đặc tả theo tiêu chuẩn ISO 23081. ISO 23081 lập một khuôn khổ cho việc tạo, quản lý và sử dụng dữ liệu đặc tả quản lý hồ sơ và giải thích các nguyên tắc chi phối chúng. Tiêu chuẩn này là một hướng dẫn để hiểu biết, thực hiện và sử dụng dữ liệu đặc tả trong khuôn khổ ISO 15489. Nó đề cập đến sự liên quan của dữ liệu đặc tả quản lý hồ sơ trong quá trình kinh doanh và các vai trò và các loại dữ liệu đặc tả khác nhau để hỗ trợ các quy trình quản lý kinh doanh và hồ sơ. Nó cũng đặt ra một khuôn khổ để quản lý các dữ liệu đặc tả. Tiêu chuẩn bao gồm các nguyên tắc làm nền tảng và chi phối dữ liệu đặc tả quản lý hồ sơ. Những nguyên tắc này áp dụng cho: - Các hồ sơ và các dữ liệu đặc tả của chúng - Tất cả các quá trình ảnh hưởng đến chúng - Tất cả các hệ thống mà chúng cư trú - Bất kỳ tổ chức có trách nhiệm quản lý chúng. Quản lý dữ liệu đặc tả là một phần không thể tách rời của quản lý hồ sơ, phục vụ một loạt các chức năng và mục đích. Trong bối cảnh quản lý hồ sơ, dữ liệu đặc tả được định nghĩa là dữ liệu mô tả bối cảnh, nội dung và cấu trúc của hồ sơ và quản lý chúng thông qua thời gian. Như vậy, dữ liệu đặc tả là thông tin có cấu trúc hoặc bán cấu trúc cho phép sự sáng 36 tạo, đăng ký, phân loại, truy cập, bảo quản và huỷ bỏ các hồ sơ qua thời gian và giữa các lĩnh vực. Mỗi lĩnh vực này đại diện cho một tài sản trí tuệ, hoạt động xã hội và tổ chức với một nhóm đặc biệt hoặc hạn chế những người chia sẻ các giá trị và kiến thức nhất định. Dữ liệu đặc tả quản lý hồ sơ có thể được sử dụng để xác định, xác thực và bối cảnh hồ sơ và tác nhân, quy trình và hệ thống tạo, quản lý, duy trì và sử dụng chúng và các chính sách chi phối chúng. Ban đầu, dữ liệu đặc tả xác định bản ghi tại thời điểm nắm bắt, sửa chữa các bản ghi trong bối cảnh kinh doanh và thiết lập kiểm soát quản lý trên nó. Trong sự tồn tại của hồ sơ hoặc các tổ hợp của chúng, các lớp mới của dữ liệu đặc tả sẽ được thêm vào vì mục đích sử dụng mới trong bối cảnh kinh doanh hoặc sử dụng khác. Điều này có nghĩa là dữ liệu đặc tả tiếp tục tích luỹ, theo thời gian, thông tin liên quan đến bối cảnh của quản lý hồ sơ và quy trình kinh doanh, trong đó hồ sơ được sử dụng và liên quan đến thay đổi cấu trúc để ghi lại hoặc xuất hiện của nó. Dữ liệu đặc tả có thể được nguồn gốc hoặc tái sử dụng bởi nhiều hệ thống và đa mục đích. Dữ liệu đặc tả áp dụng cho các hồ sơ trong vòng đời của chúng cũng có thể tiếp tục áp dụng khi chúng không còn được yêu cầu cho mục đích kinh doanh hiện tại nhưng được giữ lại để nghiên cứu hoặc vì các giá trị khác. Dữ liệu đặc tả đảm bảo tính xác thực, độ tin cậy, khả năng sử dụng và tính toàn vẹn theo thời gian và cho phép quản lý và hiểu biết các đối tượng thông tin, dù đây là vật lý, tương tự hoặc kỹ thuật số. Tuy nhiên, dữ liệu đặc tả cũng cần phải được quản lý. Quản lý hồ sơ luôn luôn liên quan đến việc quản lý dữ liệu đặc tả. Tuy nhiên, môi trường kỹ thuật số đòi hỏi phải có một biểu hiện khác nhau của yêu cầu truyền thống và cơ chế khác nhau để xác định, chụp, gán và sử dụng dữ liệu đặc tả. Trong môi trường kỹ thuật số, hồ sơ có thẩm quyền luôn được đi kèm với dữ liệu đặc tả xác định các đặc tính quan trọng của chúng. Những đặc điểm này phải được ghi nhận một cách rõ ràng hơn là tiềm ẩn như trong một số quy trình trên giấy. Trong môi trường kỹ thuật số, đó là điều cần thiết để đảm bảo rằng việc tạo lập và nắm bắt các dữ liệu đặc tả quản lý hồ sơ được thực hiện trong các hệ thống tạo lập, nắm bắt và quản lý hồ sơ. Ngược lại, môi trường kỹ thuật số thể hiện những cơ hội mới để xác định và tạo ra dữ liệu đặc tả phản ánh hồ sơ. Những hồ sơ này có thể là bằng chứng của các giao dịch hoặc bản thân là các giao dịch. Dữ liệu đặc tả hỗ trợ quản lý hồ sơ và kinh doanh có mục đích: - Bảo vệ các hồ sơ làm bằng chứng và đảm bảo khả năng tiếp cận và khả năng sử dụng của chúng thông qua thời gian; 37 - Tạo điều kiện cho khả năng hiểu hồ sơ; - Hỗ trợ và đảm bảo giá trị bằng chứng của hồ sơ; - Giúp đảm bảo tính xác thực, độ tin cậy và tính toàn vẹn của hồ sơ; - Hỗ trợ và quản lý truy cập, bảo mật và quyền; - Hỗ trợ phục hồi hiệu quả; - Hỗ trợ chiến lược hoạt động tương tác bằng cách cho phép thu nhận các bản ghi được tạo ra trong môi trường kỹ thuật và kinh doanh đa dạng; - Cung cấp liên kết hợp lý giữa hồ sơ và bối cảnh sáng tạo chúng và duy trì chúng dưới cách thức có cấu trúc, đáng tin cậy và có ý nghĩa; - Hỗ trợ việc xác định các môi trường công nghệ, trong đó hồ sơ kỹ thuật số được tạo ra hoặc nắm bắt và quản lý môi trường công nghệ, trong đó chúng được duy trì theo thứ tự hồ sơ xác thực có thể được sao chép; - Hỗ trợ hiệu quả và thành công di chuyển các bản ghi từ một môi trường này đến môi trường khác. Tiêu chuẩn ISO 23081 cung cấp nhân tố căn bản cho dữ liệu đặc tả để quản lý hồ sơ trong các tổ chức, mô hình khái niệm cho các dữ liệu đặc tả và một bộ phần tử cấp cao của các loại dữ liệu đặc tả chung phù hợp với bất kỳ môi trường các hồ sơ bao gồm, tài liệu hay việc triển khai quản lý và lưu trữ hồ sơ. Nó định nghĩa các loại dữ liệu đặc tả chung cho cả thực thể hồ sơ và các thực thể khác cần thiết cho việc quản lý tài liệu và hiểu về ngữ cảnh hồ sơ. Tiêu chuẩn cũng xác định một số lượng tối thiểu các tổ hợp. được yêu cầu cho mục đích tương thích. Các mô hình và các loại dữ liệu đặc tả chung được nêu trong ISO 23081 chủ yếu tập trung vào các thực thể hồ sơ. Tuy nhiên, chúng cũng có liên quan đến các đối tượng khác. Tiêu chuẩn xác định các kiểu chung của dữ liệu đặc tả được yêu cầu để thực hiện các yêu cầu quản lý hồ sơ. Cách tiếp cận này cung cấp cho các tổ chức với sự linh hoạt để chọn dữ liệu đặc tả cụ thể để đáp ứng yêu cầu kinh doanh, để quản lý hồ sơ khi được yêu cầu. Nó cung cấp sơ đồ để xác định các yếu tố dữ liệu đặc tả có thể được định nghĩa trong một thực hiện cụ thể và dữ liệu đặc tả có thể áp dụng cho mỗi tổ hợp của thực thể. Nó thừa nhận rằng những thực thể có thể tồn tại ở các lớp khác nhau của tổ hợp. Nó định nghĩa các loại dữ liệu đặc tả chung được dự kiến sẽ áp dụng ở tất cả các lớp tổ hợp, trong khi cảnh báo người thực hiện các yếu tố dữ liệu đặc tả cụ thể mà chỉ có thể áp dụng ở các lớp cụ thể của tổ hợp. Tiêu chuẩn ISO 23081 thiết lập một khuôn khổ để xác định 38 các yếu tố dữ liệu đặc tả phù hợp với các nguyên tắc quản lý và lưu trữ dữ liệu. Mục đích của khuôn khổ này là: - Cho phép mô tả tiêu chuẩn hóa các hồ sơ và các tổ chức theo ngữ cảnh đối với các hồ sơ, - Cung cấp hiểu biết chung về các điểm cố định của tập hợp để cho phép khả năng tương tác của các hồ sơ và thông tin liên quan đến hồ sơ giữa các tổ chức - Cho phép tái sử dụng và tiêu chuẩn của dữ liệu đặc tả để quản lý hồ sơ theo thời gian, không gian và trên các ứng dụng. Nó tiếp tục xác định một số điểm quyết định cần phải được giải quyết và tài liệu để cho phép thực hiện các dữ liệu đặc tả để quản lý hồ sơ. Nó nhằm mục đích: - Xác định những vấn đề cần được giải quyết trong việc thực hiện dữ liệu đặc tả để quản lý hồ sơ, - Xác định và giải thích những lựa chọn khác nhau để giải quyết các vấn đề, - Xác định các cách khác nhau để đưa ra quyết định và các tùy chọn trong việc thực hiện dữ liệu đặc tả để quản lý hồ sơ lựa chọn. Hệ thống được thiết kế để quản lý hồ sơ yêu cầu dữ liệu đặc tả để hỗ trợ các quy trình quản lý hoặc lưu trữ hồ sơ. Một trong những ứng dụng chính của dữ liệu đặc tả là đại diện cho các thực thể từ môi trường kinh doanh trong hệ thống kinh doanh. Các thực thể hỗ trợ đối chiếu hồ sơ để hiểu về môi trường kinh doanh nhưng chúng không phải lúc nào cũng nằm trong các đôi tượng hưu hình. Hình dưới đây chỉ ra các mô hình thực sau: - Thực thể hồ sơ (các đơn vị tài liệu hay các tổ hợp hồ sơ khác) - Thực thể tác nhân (người và tổ chức trong môi trường kinh doanh) - Thực thể kinh doanh (các giao dịch kinh doanh) 3.1.8 Các dữ liệu đặc tả theo tiêu chuẩn tiêu chuẩn của Australia. Tại Australia, tiêu chuẩn dữ liệu đặc tả trong công tác văn thư do Cục Lưu trữ quốc gia Australia biên soạn và áp dụng cho các cơ quan nhà nước: hướng dẫn và mô tả chi tiết 26 thuộc tính cơ bản và 44 thuộc tính con của dữ liệu đặc tả. Tiêu chuẩn này là một phiên bản sửa đổi hoàn toàn của Tiêu chuẩn dữ liệu đặc tả Lưu trữ hồ sơ cho các cơ quan Khối liên hiệp Thịnh vượng chung phiên bản 1.0 (RMSCA), được xuất bản bởi Cục lưu trữ quốc gia vào năm 1999. Nó được thiết kế để sử dụng như một công cụ tham khảo cho các nhà quản lý cơ quan doanh nghiệp và hồ sơ, nhân viên 39 công nghệ thông tin và các nhà cung cấp phần mềm liên quan đến việc thiết kế, lựa chọn và thực hiện quản lý hồ sơ điện tử và hệ thống kinh doanh. Tại thời điểm phát hành tiêu chuẩn RMSCA năm 1999, cộng đồng lưu trữ hồ sơ Australia đã thiết lập một khuôn khổ cấp cao nhằm tham chiếu, chỉ định và chuẩn hóa tiêu chuẩn dữ liệu đặc tả lưu trữ. Dự án dữ liệu đặc tả lưu trữ hồ sơ SPIRIT, đứng đầu là trường đại học Monash đã phát triển phương pháp tiếp cận đa thực thể đầu tiên cho dữ liệu đặc tả lưu trữ hồ sơ. Cục Lưu trữ Quốc gia là một đối tác công nghiệp trong dự án này. Các kết quả của dự án SPIRIT đã được công bố trực tuyến vào năm 2000. Cục Lưu trữ Quốc gia phát hành tiêu chuẩn RMSCA vào năm 1999, trước khi kết thúc dự án SPIRIT vì những yêu cầu rõ ràng cho một tiêu chuẩn dữ liệu đặc tả lưu trữ hồ sơ để hướng dẫn các cơ quan Chính phủ Australia và các nhà cung cấp trong việc phát triển hệ thống quản lý hồ sơ điện tử. Cụ thể hơn, tiêu chuẩn năm 1999 phù hợp với khuôn khổ dự án SPIRIT và mục tiêu là để phát hành các phiên bản tiếp theo của tiêu chuẩn với cách tiêp cận đa thực thể. Từ năm 2000, việc nghiên cứu về dữ liệu đặc tả cho lưu trữ hồ sơ vẫn được tiếp tục cả trong cộng đồng ISO và cộng đồng tiêu chuẩn Australia. Công việc này, trong đó Cục Lưu trữ quốc gia có liên quan, đã đem đến kết quả là 2 tiêu chuẩn AS ISO 23081: Dữ liệu đặc tả cho hồ sơ – Nguyên tắc và Dữ liệu đặc tả cho hồ sơ – Các vấn đề khái niệm và thực hiện. Những tiêu chuẩn ISO này được dựa trên cách tiếp cận đa thực thể và ảnh hưởng quan trọng đến việc phát triển phiên bản tiêu chuẩn lưu trữ mới. Cần nhấn mạnh thêm là ở phạm vi rộng còn có tiêu chuẩn dữ liệu đặc tả do các cơ quan lưu trữ các bang New South Wales biên soạn năm 2000, khu vực Nam Australia năm 2003 và bang Queensland năm 2008. Tất cả các tiêu chuẩn này dựa trên việc tiếp cận mô hình ba thực thể của dự án SPIRIT. Cục Lưu trữ quốc gia Australia phát triển dự thảo ban đầu của Bộ tiêu chuẩn siêu dữ liệu lưu trữ dữ liệu Chính phủ Australia (AGRMS). Từ cuối năm 2007, Cục Lưu trữ quốc gia Australia phối hợp với Cục Lưu trữ New Zealand hoàn chỉnh Bộ tiêu chuẩn dữ liệu đặc tả lưu trữ dữ liệu Chính phủ Australia phiên bản 2.0 để đáp ứng với thông tin phản hồi từ các bên liên quan ở cả hai vùng lãnh thổ. AGRMS mô tả các thông tin về hồ sơ và bối cảnh mà các hồ sơ được thu nhận và sử dụng. Đây là thông tin mà Cục lưu trữ quốc gia đề nghị được lấy trong hệ thống kinh doanh được sử dụng bởi các cơ quan chính phủ Úc để tạo ra và thu nhận hồ sơ. Tiêu chuẩn này 40 phù hợp với các tiêu chuẩn của Australia về quản lý hồ sơ (AS ISO 15489) và dữ liệu đặc tả cho hồ sơ (AS ISO 23081) Tiêu chuẩn mới khác với tiêu chuẩn trước đó là nó được dựa trên một mô hình đa thực thể, cho phép các mô tả về năm thực thể riêng biệt: Hồ sơ, Tác nhân, Kinh doanh, Ủy quyền và Quan hệ. Nó định nghĩa một cẩu trúc cơ bản gồm 26 thuộc tính dữ liệu đặc tả và thêm 44 phụ thuộc tính con có thể được sử dụng để mô tả các thực thể. Tiêu chuẩn này được thiết kế chủ yếu để sử dụng trong quản lý hồ sơ và hệ thống kinh doanh điện tử. Nhiều khái niệm của nó cũng được áp dụng cho môi trường quản lý hồ sơ trên giấy truyền thống hoặc hồ sơ hỗn hợp vẫn được sử dụng bởi các cơ quan. Tiêu chuẩn này liên quan đến quá trình thiết kế và vận hành hệ thống công nghệ thông tin trong đó có việc tạo lập và quản lý dữ liệu, bao gồm cả các hệ thống quản lý hồ sơ và tài liệu điện tử (eDRMS) và đánh giá các hệ thống công nghệ thông tin để xác định quy tắc lưu trữ dữ liệu. Trọng tâm của các tiêu chuẩn kỹ thuật đối với dữ liệu đặc tả cần thiết cho quá trình quản lý dữ liệu. Dữ liệu đặc tả cấu trúc và lưu trữ có thể được yêu cầu để bảo quản lâu dài hồ sơ điện tử. Dữ liệu đặc tả lưu trữ dữ liệu là một công cụ cơ bản để nắm bắt và quản lý hồ sơ đầy đủ và chính xác. Bộ tiêu chuẩn và hướng dẫn này trình bày chi tiết các yêu cầu đối với dữ liệu đặc tả lưu trữ dữ liệu và tư vấn cho các cơ quan công quyền về việc thực hiện. Dữ liệu đặc tả là dữ liệu mô tả các nguồn thông tin. Nó cho phép người dùng tìm kiếm các nguồn thông tin và giúp họ xác định xem dữ liệu hoặc thông tin sẽ đáp ứng nhu cầu của họ. Dữ liệu đặc tả cũng hỗ trợ các nhà quản lý và người sử dụng hiểu, tải về, hiển thị, di chuyển, sử dụng, kiểm soát, phục hồi dữ liệu và thông tin. 3.2 Lựa chọn tài liệu tiêu chuẩn Qua phân tích và so sánh các tiêu chuẩn ở Điều 3.1, căn cứ trên nhu cầu mục tiêu của dự án, nhóm soạn thảo đã lựa chọn các phần nội dung trong các tài liệu đã thu thập: ISO/TR 23081-1:2006, ISO 19104, ISO 19115 và ISO/IEC 19775-1. Lựa chọn các phần nội dung phù hợp với nhu cầu nội dung của từng phần dự thảo. Số hóa đã và đang bùng nổ, thị trường cho lĩnh vực này rất lớn và tiềm năng. Các doanh nghiệp cũng như các cơ quan nhà nước, thư viện, trường đại học… cũng đã có những giải pháp dịch vụ, quy trình cho việc số hóa tài liệu. Tuy nhiên để hiệu quả và chuẩn xác thì việc xây dựng tiêu chuẩn quy trình số hóa là việc làm cần thiết. Quy 41 trình số hóa cần tuân theo các tiêu chuẩn quốc tế đồng thời cũng phải có những điều chỉnh nhất định để phù hợp với yêu cầu cũng như hoàn cảnh tại Việt Nam. Sau khi rà soát, nghiên cứu các tiêu chuẩn của quốc tế và quốc gia về quy trinh số hóa văn bản chúng tối nhận thấy: Tại Việt Nam các bước cho quy trình số hóa cũng đã được Cục Văn Thư Lưu Trữ đưa vào quyết định số 176/QĐ – CVTLT, trong đó đề cập tới 12 bước. Tuy nhiên tại Việt Nam chưa có ban hành Tiêu Chuẩn Việt Nam nào cho Quy Trình Số Hóa văn bản. Qua phân tích và so sánh các tiêu chuẩn ở Điều 3.1, căn cứ trên nhu cầu mục tiêu của dự án, nhóm soạn thảo đã lựa chọn các phần nội dung trong các tài liệu đã thu thập: ISO 19115-2:2009, ISO/TR 13028:2010, Digiitization standard process num A000015, Thông tư số 26/2014/TT-BTNMT. Lựa chọn các phần nội dung phù hợp với nhu cầu nội dung của từng phần dự thảo. Cụ thể như sau: —Về bộ khung sườn của quy trình số hóa dữ liệu: tham khảo ISO 13028 : 2010 Information and documentation - Implementation guidelines for digitization of records (Thông tin và tư liệu – Hướng dẫn thực hiện đối với số hóa bản ghi); —Về các bước tổ chức, thực hiện: tham khảo Quyết định số 176/QĐ-VTLTNN ngày 21/10/2011 của Cục Văn thư và Lưu trữ Nhà nước đặt ra quy trình số hóa tài liệu lưu trữ; Thông tư số 26/2014/TT-BTNMT về Quy trình và định mức kinh tế kỹ thuật xây dựng cơ sở dữ liệu tài nguyên môi trường; quy trình số hóa “Digitization standard process num A000015 xuất bản ngày 23-04-2013” của Chính phủ Alberta; —Về các điều kiện, yêu cầu kỹ thuật: tham khảo - ISO 19115-1:2014 Geographic information -- Metadata -- Part 1: Fundamentals (Thông tin địa lý – Dữ liệu đặc tả – Phần 1: Nguyên tắc cơ bản) và ISO 19115-2:2009 Geographic information -- Metadata -- Part 2: Extensions for imagery and gridded data (Thông tin địa lý – Dữ liệu đặc tả – Phần 2: Mở rộng đổi với dữ liệu ảnh và dữ liệu lưới) Tiêu chuẩn xây dựng mới đảm bảo phù hợp với các tiêu chuẩn quốc tế. 3.3 Hình thức xây dựng tiêu chuẩn Tiêu chuẩn được xây dựng theo phương pháp chấp thuận áp dụng các quy định kỹ thuật của tiêu chuẩn quốc tế. Nội dung của tiêu chuẩn quốc tế được chuyển thành nội dung của Tiêu chuẩn kỹ thuâ ̣t quốc gia, có thay đổi bố cục và hình thức trình bày cho phù hợp với 42 hướng dẫn xây dựng quy chuẩn kỹ thuật theo thông tư 03/2011/TT-BTTTT “Quy định hoạt động xây dựng quy chuẩn kỹ thuật quốc gia và tiêu chuẩn quốc gia thuộc Bộ Thông tin và Truyền thông” 3.4 Phương pháp xây dựng tiêu chuẩn Thông tư 03/2011/TT-BTTTT “Quy định hoạt động xây dựng quy chuẩn kỹ thuật quốc gia và tiêu chuẩn quốc gia thuộc Bộ Thông tin và Truyền thông” do Bộ Thông tin và Truyền thông ban hành ngày 04/01/2011. Mức độ tương đương: tham khảo. Phương pháp chấp nhận: xuất bản lại (biên dịch) có sửa đổi. 4 Nội dung tiêu chuẩn 4.1 Tên gọi tiêu chuẩn TIÊU CHUẨN KỸ THUẬT VỀ QUY TRÌNH TẠO LẬP DỮ LIỆU SỐ 2D (SỐ HÓA, TẠO LẬP METADATA CẤU TRÚC TRONG, METADATA MÔ TẢ DỮ LIỆU) - QUY TRÌNH TẠO LẬP DỮ LIỆU ĐẶC TẢ 43 4.2 Bố cục tiêu chuẩn Dự thảo tiêu chuẩn bao gồm các phần sau: Lời nói đầu 1 Phạm vi áp dụng 2 Tài liệu viện dẫn 3 Thuật ngữ, Định nghĩa 4 Quy trình số hóa 5 Lên kế hoạch 6 Thiết kế mô hình và thử nghiệm 7 Tạo lập dữ liệu 2D 8 Biên tập dữ liệu 2D 9 Lập chỉ mục và dữ liệu đặc tả 10 11 Kiểm tra sản phẩm Ghi nhật ký 12 Dữ liệu đặc tả trong quy trình số hóa 13 Quy trình thiết lập dữ liệu đặc tả cho dữ liệu 2D 13.1 Ước lượng yêu cầu và phân tích nội dung đối tượng 13.2 Biên tập các yêu cầu chức năng dữ liệu đặc tả 13.3 Thiết lập hệ thống dữ liệu đặc tả 13.4 Xây dựng dịch vụ và đánh giá 14 Lập danh mục liệt kê dữ liệu đặc tả cho dữ liệu 2D 15 Dữ liệu đặc tả cho đối tượng 2D cơ bản 15.1 Điểm (Point) 15.2 Đường (line) 15.3 Cung tròn (Arc) 15.4 Đường tròn (Circle) 15.5 Dạng đĩa (Disk) 16 Dữ liệu đặc tả mô tả đối tượng 2D Phụ lục A (tham khảo) Dữ liệu đặc tả mô tả dạng ảnh 44 Phụ lục B Khuyến nghị đặt tên siêu dữ liệu tập tin Phụ lục C Kiến nghị kiểm soát chất lượng Phụ lục D Các kỹ năng yêu cầu đối với nhân viên Thư mục tài liệu tham khảo 4.3 Bảng đối chiếu nội dụng dự thảo và các tài liệu tham khảo Dư ̣ thảo TCVN ISO/TR 13028:20 10 ISO 191152:2008 Digitizati on Standard Process num A000015 QT CSDL của Bộ TNMT ISO/TR 230811:2006; ISO 19104 ISO/IEC 19775-1 Sửa đổi bổ sung 1 Phạm vi áp dụng Tự xây dựng 2 Tài liệu viện dẫn Tự xây dựng 3 Thuật ngữ và định nghĩa 2.2 Definition s of Terms Tự xây dựng 4 Quy trình số hóa 5 Lên kế 6.2Planni hoạch ng processes 6 Thiết kế mô hình và thử nghiệm Chấp nhận có sửa đổi và chọn lọc Nondigital source record preparatio n Thiết kế mô hình 45 Dư ̣ thảo TCVN 7 Tạo lập dữ liệu 2D 8 Biên tập dữ liệu 2D ISO/TR 13028:20 10 ISO 191152:2008 6.2.2 Selection of a digitization approach 6.2.3 Selection of technical specificati ons 6.2.4 Equipment and software 6.2.5 Enhancem ent technicque s Digitizati on Standard Process num A000015 QT CSDL của Bộ TNMT ISO/TR 230811:2006; ISO 19104 ISO/IEC 19775-1 Sửa đổi bổ sung Tổng hợp và điều chỉnh cho phù hợp Image capture and recapture Preparatio n of Original Document s 2.5 Biên tập dữ liệu 2D 46 Thay đổi cho phù hợp yêu cầu Dư ̣ thảo TCVN ISO/TR 13028:20 10 ISO 191152:2008 9 Lập chỉ mục – Dữ liệu đặc tả 6.3.4: Metadata 6.3.4.2: Imagelever metadata 3. Metadata Digitizati on Standard Process num A000015 QT CSDL của Bộ TNMT ISO/TR 230811:2006; ISO 19104 ISO/IEC 19775-1 Sửa đổi bổ sung 5 Indexing and metadata 6.3.4.2: Businesspr ocess digitization metadata cosideratio ns 6.3.4.3: Digitizatio n projects metadata cosideratio ns 10 Kiểm tra sản phẩm 11 Ghi nhật ký 6.3.2: Digitized records managem ent 6.3.5: Quality control 8: Records Managem ent Requirem ents 9: Quality control 6.2.5.5: Storage media 2.6 Kiểm tra sản phẩm 10 Logging 47 Tổng hợp và điều chỉnh cho phù hợp Thư mục tài liêụ tham khảo Tài liệu Việt Nam TCVN 5453:2009: Thông tin và tư liệu. Từ vựng. TCVN 7420-1:2004: Thông tin và tư liệu. Quản lý hồ sơ. Phần 1: Tổng quát chung. TCVN 7420-2:2004: Thông tin và tư liệu. Quản lý hồ sơ. Phần 2: Hướng dẫn. Tài liệu nước ngoài [1] ISO/TR 13028:2010, Information and documentation — Implementation guidelines for digitization of records (Thông tin và tài liệu - hướng dẫn thực hiện cho việc số hóa hồ sơ) [2] ISO/TR 15489-1:2001, Information and documentation — Records management — Part 1: General (Thông tin và tài liệu – Quản lý hồ sơ - Phần 1: Tổng quát) [3] ISO/TR 15489-2:2001, Information and documentation — Records management — Part 2: Guidelines (Thông tin và tài liệu – Quản lý hồ sơ - Phần 2: Hướng dẫn) [4] ISO/TR 23081-1:2006, Information and documentation — Records management processes — Metadata for records — Part 1: Principles (Thông tin và tài liệu - Quy trình quản lý hồ sơ - Siêu dữ liệu cho các hồ sơ - Phần 1: Nguyên tắc) [5] ISO 23081-2:2009, Information and documentation — Managing metadata for records — Part 2: Conceptual and implementation issues (Thông tin và tài liệu - Quản lý siêu dữ liệu cho các hồ sơ - Phần 2: Những vấn đề khái niệm và thực hiện) [6] ISO/TR 15801:2009, Document management — Information stored electronically — Recommendations for trustworthiness and reliability (Quản lý tài liệu - Thông tin lưu trữ điện tử - Khuyến nghị cho sự tin cậy và độ tin cậy) [7] ISO 29861:2009, Document management applications — Quality control for scanning office documents in colour (Ứng dụng quản lý tài liệu - Kiểm soát chất lượng cho các tài liệu văn phòng quét màu) [8] IEC 82045-2:2004, Document management — Part 2: Metadata elements and information reference model (Quản lý tài liệu - Phần 2: Nguyên tố Siêu dữ liệu và mô hình tham khảo thông tin) 48 [9] Digitization standard process num A000015 (Quy trình tiêu chuẩn số hóa A000015) [10] Digitization Technical Requirements Standard A000013 (Yêu cầu tiêu chuẩn kỹ thuật số hóa A0000013) [11] CAN/CGSB-72.11-93ISO 19115-1:2014 Geographic information -- Metadata -Part 1: Fundamentals ISO 19115-2:2009 Geographic information -- Metadata -- Part 2: Extensions for imagery and gridded data ISO/TR 13028:2010 Information and documentation - Implementation guidelines for digitization of records Digitization standard process num A000015, 01-03-2013 Government of Alberta ----------------------------------------------------------------------------- 49