Bộ TT&TT. QUY TRÌNH TẠO LẬP DỮ LIỆU SỐ 2D

advertisement
BỘ THÔNG TIN VÀ TRUYỀN THÔNG
THUYẾT MINH TIÊU CHUẨN
CÔNG NGHỆ THÔNG TIN- QUY TRÌNH TẠO LẬP
DỮ LIỆU SỐ 2D (SỐ HÓA, TẠO LẬP METADATA
CẤU TRÚC TRONG, METADATA MÔ TẢ DỮ LIỆU)
HÀ NỘI - 2017
1
Mục lục
1 GIỚI THIỆU ......................................................................................................................... 2
1.1 TÊN GỌI CỦA TIÊU CHUẨN VIỆT NAM................................................................................ 2
1.2 KÝ HIỆU CỦA TCVN ......................................................................................................... 2
1.3 MỤC ĐÍCH CHUNG ............................................................................................................. 2
1.4 MỤC ĐÍCH CỦA VIỆC XÂY DỰNG TIÊU CHUẨN.................................................................... 2
2 TÌNH HÌ NH TRONG VÀ NGOÀ I NƯỚC ........................................................................ 4
3 CƠ SỞ XÂY DỰNG CÁC YÊU CẦU KỸ THUẬT ........................................................ 23
3.1 PHÂN TÍCH CÁC TÀI LIỆU TIÊU CHUẨN ............................................................................ 23
3.2 LỰA CHỌN TÀI LIỆU TIÊU CHUẨN .................................................................................... 41
3.3 HÌNH THỨC XÂY DỰNG TIÊU CHUẨN ............................................................................... 42
3.4 PHƯƠNG PHÁP XÂY DỰNG TIÊU CHUẨN .......................................................................... 43
4 NỘI DUNG TIÊU CHUẨN .............................................................................................. 43
4.1 TÊN GỌI TIÊU CHUẨN ...................................................................................................... 43
4.2 BỐ CỤC TIÊU CHUẨN ...................................................................................................... 44
4.3 BẢNG ĐỐI CHIẾU NỘI DỤNG DỰ THẢO VÀ CÁC TÀI LIỆU THAM KHẢO ............................... 45
TÀ I LIỆU THAM KHẢO...................................................................................................... 48
1
THUYẾT MINH TIÊU CHUẨN
CÔNG NGHỆ THÔNG TIN- QUY TRÌNH TẠO LẬP DỮ LIỆU SỐ 2D
(SỐ HÓA, TẠO LẬP METADATA CẤU TRÚC TRONG, METADATA
MÔ TẢ DỮ LIỆU)
1 Giới thiệu
1.1 Tên gọi của tiêu chuẩn Việt Nam
CÔNG NGHỆ THÔNG TIN- QUY TRÌNH TẠO LẬP DỮ LIỆU SỐ 2D (SỐ HÓA, TẠO
LẬP METADATA CẤU TRÚC TRONG, METADATA MÔ TẢ DỮ LIỆU)
1.2 Ký hiệu của TCVN
TCVN XXXX:201X
1.3 Mục đích chung
Đáp ứng mục tiêu của dự án “Xây dựng chuẩn thông tin số và chuẩn trao đổi thông tin”
của Bộ Thông tin và Truyền thông: “Bảo đảm sự phát triển ứng dụng công nghệ thông tin
nói chung, công nghiệp phần mềm và công nghiệp nội dung số nói riêng được phát triển
thống nhất, đồng bộ theo một kiến trúc quy hoạch tổng thể Công nghệ thông tin và Truyền
thông Quốc gia với một hạ tầng thông tin hiện đại, tốc độ cao và môi trường pháp lý phù
hợp”;
1.4 Mục đích của việc xây dựng tiêu chuẩn
Các năm gần đây, một trong các biện pháp quản lý tài liệu lưu trữ đã được nhắc đến là
số hóa tài liệu và trong xã hội đã manh nha thị trường các dịch vụ số hóa tài liệu lưu
trữ. Luật lưu trữ do Quốc hội thông qua ngày 11/11/2011 đã quy định về tài liệu lưu
trữ điện tử, không quy định chi tiết đến tài liệu lưu trữ số hóa. Chúng ta có thể hiểu
tóm tắt tài liệu điện tử là một bản ghi được tạo ra, gửi, chuyển giao, nhận được, hoặc
lưu trữ, sử dụng bằng phương tiện điện tử. Tài liệu điện tử được hình thành từ hai
nguồn chính:
-Một là, bản ghi các thông diệp dữ liệu được khởi tạo từ đầu;
-Hai là, bản ghi các dữ liệu số từ tài liệu truyền thống.
2
Vậy, tài liệu số hóa có nguồn gốc từ tài liệu điện tử, nhưng không đồng nhất với tài
liệu điện tử. Tài liệu số hóa trở thành tài liệu điện tử qua quá trình số hóa dữ liệu. Đây
là quá trình chuyển các dạng dữ liệu truyền thống như các bản viết tay, bản in trên giấy,
hình ảnh… sang chuẩn dữ liệu trên các phương tiện điện tử và được các phương tiện
đó nhận biết được gọi là số hóa dữ liệu và chúng trở thành dữ liệu số.
Từ đó, về mặt lý thuyết, ta hiểu số hóa dữ liệu là quá trình chuyển các dạng dữ liệu
truyền thống sang chuẩn dữ liệu trên máy tính và được máy tính nhận biết.
Để việc số hóa dữ liệu được hiệu quả và chính xác thì việc áp dụng quy trình số hóa
theo chuẩn là điều cần thiết.
Quy trình số hóa dữ liệu 2D là quá trình chuyển các dạng dữ liệu truyền thống như các
bản viết tay, bản in trên giấy, hình ảnh… sang chuẩn dữ liệu trên các phương tiện điện
tử và được các phương tiện đó nhận biết được gọi là số hóa dữ liệu và chúng trở thành
dữ liệu số.
Từ đó, về mặt lý thuyết, ta hiểu số hóa dữ liệu 2D là quá trình chuyển các dạng dữ liệu
truyền thống sang chuẩn dữ liệu trên máy tính và được máy tính nhận biết. Để việc số
hóa dữ liệu được hiệu quả và chính xác thì việc áp dụng quy trình số hóa theo chuẩn là
điều cần thiết.
Số hóa dữ liệu giúp việc lưu trữ, truy xuất, chia sẻ, tìm kiếm thông tin một cách dễ
dàng, linh hoạt trong việc chuyển đổi sang các loại dữ liệu số khác nhau, giảm chi phí
tối đa cho việc quản lý, không gian lưu trữ và có khả năng chỉnh sửa và tái sử dụng dữ
liệu. Do vậy việc xây dựng nên quy trình số hóa theo tiêu chuẩn quốc tế và có sự điều
chỉnh để phù hợp với Việt Nam là điều cần thiết và cấp bách. Tránh sau này các dữ liệu số
hóa không đồng bộ và không theo quy trình chung. Việc xây dựng tiêu chuẩn quốc gia về
“Quy trình tạo lập dữ liệu số 2D” góp phần phát triển công nghiệp nội dung số Việt Nam
theo Quyết định số 50/2009/QĐ-TTg về Quản lý Chương trình phát triển công nghiệp
phần mềm và Chương trình phát triển công nghiệp nội dung số Việt Nam
Tất cả hình ảnh được số hóa nên được chỉ định dữ liệu đặc tả cho quá trình số hóa dữ liệu
2D và hỗ trợ các quy trình nghiệp vụ đang diễn ra. Các tổ chức, cơ quan có thể đưa ra các
yêu cầu cụ thể và để tối đa hóa sự kế thừa các giá trị dữ liệu từ các hệ thống và thiết bị
hiện có. Trong hoạt động hành chính, dữ liệu 2D chủ yếu tập trung vào ảnh quét hoặc ảnh
chụp mà dữ liệu ảnh chủ yếu lấy từ nguồn số hóa. Việc xây dựng tiêu chuẩn về Quy trình
3
tạo lập metadata mô tả dữ liệu 2D giúp đưa ra được quy trình tạo lập dữ liệu đặc tả, các
bước cần thiết, các yêu cầu bắt buộc cho mỗi bước trong quy trình để đảm bảo cho dữ liệu
đặc tả được tạo ra đúng thời điểm và đúng tiêu chuẩn kỹ thuật.
Nhu cầu thực tế và khả năng áp dụng: Cần có bộ tiêu chuẩn kỹ thuật quốc gia về quy trình
tạo lập dữ liệu đặc tả trong quy trình số hóa để áp dụng tại Việt Nam.
2 Tin
̀ h hin
̀ h trong và ngoài nước
2.1 Tình hình trong nước
Lĩnh vực số hóa đang là điểm nóng, số lượng tài liệu cần số hóa ngày 1 nhiều. Theo sự
chỉ đạo của Chính phủ, năm 2013 một số bộ ban ngành, đơn vị đứng đầu đã bắt đầu áp
dụng số hóa cho kho tài liệu lưu trữ của mình. Các doanh nghiệp lớn trong lĩnh vực
kiểm toán, ngân hàng, bảo hiểm cũng đã quan tâm tới việc số hóa tài liệu khi lượng hồ
sơ giấy tờ đó ngày một tăng lên với số lượng lớn. Ngoài ra còn có các đơn vị đặc thù
như Bộ công an, quân đội, trường học cũng đã bắt đầu vào việc tư vấn, lập dự toán cho
một dự án số hóa tổng thể bao gồm cả phần mềm chuyên dụng cho đơn vị mình…
Tại Việt nam hiện tại có khá nhiều đơn vị doanh nghiệp, cơ quan nhà nước đưa ra các
giải pháp quy trình số hóa của riêng họ. Do mục tiêu số hóa tài liệu khác nhau, mà có
thể đặt ra các bước số hóa tài liệu khác nhau phù hợp đối với từng cơ quan, tổ chức.
Cục Văn thư và Lưu trữ Nhà nước đặt ra quy trình số hóa tài liệu lưu trữ gồm 12 bước
theo Quyết định số 176/QĐ-VTLTNN ngày 21/10/2011 với yêu cầu phân loại ảnh và
sao lưu ảnh. Nhưng nếu với yêu cầu phổ thông, quá trình thực hiện số hóa tài liệu lưu
trữ chỉ giản đơn có 5 bước là:
Bước 1. Nhận tài liệu lưu trữ đã được lựa chọn để thực hiện số hóa. Việc lựa chọn này
là cần thiết, vì không có một cơ quan, tổ chức nào lại có thể số hóa một lần cả kho lưu
trữ của mình. Tiêu chuẩn để số hóa tùy thuộc vào mục tiêu của chủ sở hữu tài liệu lưu
trữ. Ví dụ, số hóa để bảo hiểm tài liệu lưu trữ, thì tài liệu được chọn phải là tài liệu
thuộc diện quý, hiếm theo quy định của pháp luật.
Bước 2. Chuẩn bị tài liệu. Công việc bao gồm:
- Lấy ra các bìa cứng, ghim kẹp; làm phẳng các trang tài liệu; Phân loại TL, tách riêng
những TL rách, hư hỏng, nếu việc số hóa áp dụng cho các hồ sơ lưu trữ và dùng kỹ
4
thuật scan từng tờ tài liệu. Nếu việc số hóa các tư liệu lưu trữ dạng đóng quyển, thì có
thể áp dụng công nghệ mới tiến bộ hơn như Bookscan cho việc số hóa tài liệu lưu trữ.
Bước 3. Scan và thiết lập hệ thống ảnh; đặt tên file; đặt định dạng; đóng, ghim lại theo
tổ chức tài liệu ban đầu; tạo siêu siêu dữ liệu (metadata). Đây là bước quyết định nhất
để chuyển đổi tài liệu truyền thống sang tài liệu số hóa. Danh mục tài liệu số hóa được
lập và nhúng (gắn) và tài liệu thông qua một phần mềm ứng dụng và tạo ra metadata.
Đồng thời, tài liệu được đặt định dạng theo sự lựa chọn được định trước.
Bước 4. Kiểm tra chất lượng tài liệu đã được số hóa và làm lại những ảnh không đạt
yêu cầu.
Bước 5. Nghiệm thu, bàn giao tài liệu lưu trữ.
Công việc bao gồm bàn giao tài liệu số hóa và bàn giao tài liệu gốc. Nếu tài liệu số hóa
là tài liệu lưu trữ của một Lưu trữ lich sử thì với những văn bản không đóng quyển
trong một hồ sơ, việc bàn giao phải được kiểm tra chặt chẽ từng trang tài liệu để bảo
đảm đầy đủ như tài liệu ban đầu đã nhận ở bước 1.
Tại các đơn vị khác nhau quy trình số hóa thường gắn liền với thiết bị số hóa mà họ
cung cấp, ví dụ tại ĐHQGHN và 1 số doanh nghiệp khác quy trình hiện đang được sử
dụng cho quy trình số hóa:
Hình 1. Quy trình sử dụng trong thư viện ĐHQGHN và 1 số doanh nghiệp tư
nhân
5
6
Hoặc bên 1 số trường đại học, thư viện khác
Hình 2. Quy trình số hóa tài 1 số thư viện tài Việt nam
Hiện nay lĩnh vực số hóa trong các bộ ban ngành cũng đang là điểm nóng, theo sự chỉ
đạo của chính phủ Bộ Tài nguyên và Môi trường đã ban hành thông tư số 26/2014/TTBTNMT về Quy trình và định mức kinh tế kỹ thuật xây dựng cơ sở dữ liệu tài nguyên
môi trường. Dưới đây là sơ đồ quy trình xây dựng cơ sở dữ liệu tài nguyên môi
trường:
7
Hình 3 – Quy trình số hóa tài liệu của Bộ Tài nguyên và Môi trường
Việc xây dựng cơ sở dữ liệu tài nguyên môi trường là dựa trên thông tin, dữ liệu từ các
kết quả điều tra cơ bản của các lĩnh vực tài nguyên và môi trường đã được kiểm tra,
nghiệm thu và được lưu trữ tại cơ quan chuyên môn theo một hay nhiều khuôn dạng
khác nhau.
Các nội dung khảo sát, thu thập thông tin dữ liệu được thực hiện theo các qui định hiện
hành.
1. Quy trình chi tiết xây dựng CSDL tài nguyên môi trường
1.1 Rà soát, phân tích nội dung thông tin dữ liệu
8
1.1.1 Rà soát, phân loại các thông tin dữ liệu
- Mục đích
Rà soát, phân loại và đánh giá chi tiết các thông tin dữ liệu phục vụ xây dựng cơ sở dữ
liệu phù hợp với yêu cầu.
- Các bước thực hiện
+ Rà soát, đánh giá và phân loại chi tiết dữ liệu đã được chuẩn hóa và chưa được
chuẩn hóa.
+ Chuẩn bị dữ liệu mẫu.
- Sản phẩm
+ Báo cáo rà soát, phân loại và đánh giá các thông tin dữ liệu
+ Bộ dữ liệu mẫu
1.1.2 Phân tích nội dung thông tin dữ liệu
- Mục đích
Phân tích, xác định chi tiết các thông tin dữ liệu phục vụ thiết kế và lập dự toán xây
dựng cơ sở dữ liệu.
- Các bước thực hiện
+ Xác định danh mục CSDL
+ Xác định chi tiết các thông tin cho từng ĐTQL
+ Xác định chi tiết các quan hệ giữa các ĐTQL
+ Xác định chi tiết các tài liệu quét và các tài liệu dạng giấy cần nhập vào CSDL từ
bàn phím
+ Xác định khung danh mục dữ liệu, dữ liệu đặc tả sử dụng trong cơ sở dữ liệu.
+ Xác định các yếu tố ảnh hưởng đến việc xây dựng CSDL.
+ Qui đổi đối tượng quản lý
- Sản phẩm
+ Danh mục đối tượng quản lý và các thông tin chi tiết
+ Danh mục chi tiết các tài liệu quét và giấy cần nhập vào CSDL
+ Báo cáo qui định khung danh mục dữ liệu, dữ liệu đặc tả
+ Báo cáo qui đổi đối tượng quản lý.
1.2 Thiết kế mô hình cơ sở dữ liệu
9
Trường hợp nhiệm vụ, dự án có cả hai nội dung xây dựng CSDL và xây dựng ứng
dụng phần mềm thì các bước “Thiết kế mô hình cơ sở dữ liệu” và “nhập dữ liệu mẫu
để kiểm tra mô hình cơ sở dữ liệu” chỉ thực hiện một lần ở bước này.
- Mục đích
+ Thiết kế mô hình danh mục dữ liệu, dữ liệu đặc tả theo (chuẩn dữ liệu, khung dữ
liệu) dựa trên kết quả rà soát, phân tích.
+ Thiết kế mô hình cơ sở dữ liệu dựa trên kết quả rà soát, phân tích.
- Các bước thực hiện
+ Thiết kế mô hình danh mục dữ liệu, dữ liệu đặc tả.
+ Thiết kế mô hình cơ sở dữ liệu:
- Thiết kế mô hình cơ sở dữ liệu
- Nhập dữ liệu mẫu để kiểm tra mô hình cơ sở dữ liệu.
- Sản phẩm
+ Mô hình cơ sở dữ liệu, mô hình danh mục dữ liệu, dữ liệu đặc tả dưới dạng XML
+ Báo cáo thuyết minh mô hình danh mục dữ liệu, dữ liệu đặc tả
+ Báo cáo thuyết minh mô hình CSDL
+ Báo cáo kết quả kiểm tra mô hình CSDL trên dữ liệu mẫu
1.3 Tạo lập dữ liệu cho danh mục dữ liệu, dữ liệu đặc tả
- Mục đích
Tạo lập nội dung dữ liệu cho danh mục dữ liệu, dữ liệu đặc tả dựa trên kết quả rà soát,
phân tích và thiết kế
- Các bước thực hiện
+ Tạo lập nội dung cho danh mục dữ liệu
+ Tạo lập nội dung cho dữ liệu đặc tả
- Sản phẩm
+ CSDL danh mục dữ liệu, dữ liệu đặc tả đã nhập đủ nội dung
+ Báo cáo kết quả thực hiện
1.4 Tạo lập dữ liệu cho CSDL
1.4.1 Chuyển đổi dữ liệu
- Mục đích
10
Chuyển đổi dữ liệu dạng số (không gian và phi không gian) đã được chuẩn hóa vào
CSDL.
- Các bước thực hiện
+ Đối với dữ liệu không gian dạng số chưa được chuẩn hóa thì việc chuẩn hóa dữ liệu
được thực hiện theo các qui định của từng chuyên ngành trước khi thực hiện chuyển
đổi vào CSDL (biên tập bản đồ, chuyển đổi tọa độ…).
- Đối với dữ liệu phi không gian dạng số chưa được chuẩn hóa:
+ Chuẩn hóa phông chữ theo tiêu chuẩn TCVN 6909
+ Chuẩn hóa dữ liệu phi không gian theo thiết kế mô hình cơ sở dữ liệu
- Chuyển đổi dữ liệu dạng số đã chuẩn hóa vào cơ sở dữ liệu.
- Sản phẩm
+ Dữ liệu dạng số trước khi chuyển đổi.
+ Dữ liệu phi không gian trước khi chuyển hóa
+ Cơ sở dữ liệu đã được chuyển đổi
+ Báo cáo kết quả thực hiện chuyển đổi dữ liệu
1.4.2 Quét (chụp) tài liệu
- Mục đích
Quét (chụp) các tài liệu để phục vụ đính kèm vào các trường thông tin cho các lớp,
bảng dữ liệu của ĐTQL.
- Các bước thực hiện
+ Quét (chụp) các tài liệu
+ Xử lý và đính kèm tài liệu quét.
- Sản phẩm
Danh mục các tài liệu quét và đã được đính kèm vào các lớp, bảng dữ liệu của các
ĐTQL
1.4.3 Nhập, đối soát dữ liệu
- Mục đích
Nhập, đối soát các dữ liệu từ dạng giấy vào cơ sở dữ liệu đã được thiết kế. Dữ liệu sau
khi nhập vào cơ sở dữ liệu phải được đối chiếu, kiểm soát để đảm bảo tính chính xác
dữ liệu
11
- Các bước thực hiện
+ Đối với các dữ liệu không gian dạng giấy: Số hóa theo qui định chuyên ngành sau đó
thực hiện bước “Chuyển đổi dữ liệu”.
+ Đối với nhập dữ liệu dạng giấy (phi không gian):
-
Nhập dữ liệu có cấu trúc cho đối tượng phi không gian
-
Nhập dữ liệu có cấu trúc cho đối tượng không gian
-
Nhập dữ liệu phi cấu trúc cho đối tượng phi không gian
-
Nhập dữ liệu phi cấu trúc cho đối tượng không gian
+ Đối soát dữ liệu:
-
Dữ liệu có cấu trúc đã nhập cho đối tượng phi không gian
-
Dữ liệu có cấu trúc đã nhập cho đối tượng không gian
-
Dữ liệu phi cấu trúc đã nhập cho đối tượng phi không gian
-
Dữ liệu phi cấu trúc đã nhập cho đối tượng không gian
- Sản phẩm
+ Dữ liệu dạng giấy dùng để nhập dữ liệu
+ Báo cáo đối soát dữ liệu và các vấn đề phát sinh trong quá trình nhập dữ liệu
+ Cơ sở dữ liệu đã được nhập đầy đủ nội dung
+ Danh mục dữ liệu để cung cấp, khai thác, sử dụng phục vụ yêu cầu quản lý nhà nước.
1.5 Biên tập dữ liệu
- Mục đích
Biên tập CSDL theo qui định
- Các bước thực hiện
+ Đối với dữ liệu không gian
-
Tuyên bố đối tượng
-
Sửa lỗi tương quan của dữ liệu không gian
+ Đối với dữ liệu phi không gian: Hiệu đính nội dung
+ Trình bày hiển thị dữ liệu không gian
- Sản phẩm
+ CSDL đã được biên tập
12
+ Tệp trình bày hiển thị dữ liệu không gian
1.6 Kiểm tra sản phẩm
- Mục đích
Kiểm tra CSDL đã được tạo lập đảm bảo tính đầy đủ, chính xác, phù hợp với nội dung
đã được phê duyệt.
- các bước thực hiện
+ Kiểm tra mô hình CSDL
+ Kiểm tra nội dung CSDL
-
Kiểm tra dữ liệu không gian
-
Kiểm tra dữ liệu phi không gian
+ Kiểm tra danh mục dữ liệu, dữ liệu đặc tả
- Sản phẩm
+ Báo cáo kết quả kiểm tra sản phẩm
+ Báo cáo kết quả sửa chữa
+ Báo cáo kiểm tra, nghiệm thu chất lượng, khối lượng
1.7 Phục vụ nghiệm thu và giao nộp sản phẩm
- Mục đích
Phục vụ nghiệm thu và bàn giao các sản phẩm đã kiểm tra.
- Các bước thực hiện
+ Lập báo cáo tổng kết nhiệm vụ và phục vụ nghiệm thu sản phẩm đã kiểm tra.
+ Đóng gói các sản phẩm dạng giấy và dạng số
+ Giao nộp sản phẩm về đơn vị sử dụng và đơn vị chuyên trách công nghệ thông tin
theo phân cấp/qui định quản lý phục vụ quản lý, lưu trữ và đưa vào hệ thống thông tin
ngành tài nguyên và môi trương.
- Sản phẩm
+ Báo cáo tổng kết nhiệm vụ và hồ sơ nghiệm thu kèm theo
+ Biên bản bàn giao đã được xác nhận
+ Các sản phẩm dạng giấy và số.
Dữ liệu đặc tả được sử dụng để mô tả các đối tượng, các thông tin cần thiết để
13
lưu trữ.
Tất cả hình ảnh được số hóa nên được chỉ định dữ liệu đặc tả cho quá trình số hóa tài liệu
và hỗ trợ các quy trình nghiệp vụ đang diễn ra. Các tổ chức, cơ quan có thể đưa ra các yêu
cầu cụ thể và để tối đa hóa sự kế thừa các giá trị dữ liệu từ các hệ thống và thiết bị hiện có.
Quy trình quản lý dữ liệu đặc tả nên tối đa hóa tự động chụp dữ liệu đặc tả, giảm thiểu
việc xử lý thủ công. Bất kỳ việc sử dụng, áp dụng dữ liệu đặc tả nên được thực hiện có sự
tham khảo tiêu chuẩn ISO 23081-1: 2006.
Dữ liệu đặc tả kết hợp với hình ảnh là một
thành phần thiết yếu trong việc quản lý và truy vấn các hình ảnh.
Dữ liệu đặc tả có thể được nhúng với các nguồn tài nguyên tại thông tin tiêu đề, hoặc có thể
được quản lý trong một hệ thống riêng biệt,hoặc cả hai,nhưng trong cả hai trường hợp đó phải
có một mối quan hệ trực tiếp hoặc liên hệ giữa chúng; tức là khi dữ liệu đặc tả nằm trong một
hệ thống riêng biệt,nó cần phải có liên kết trực tiếp đến các hồ sơ. Dữ liệu đặc tả cũng có thể
được đóng gói trong các định dạng hình ảnh.
Trong quy trình số hóa bao gồm các giai đoạn mà dữ liệu đặc tả phải được áp dụng. Các
giai đoạn này là:
- chụp ảnh (quét);
- hình ảnh chụp lại (tái quét);
- đảm bảo chất lượng;
- truyền tải dữ liệu.
Hình dưới đây mô tả quy trình số hóa văn bản, trong đó các quá trình bắt buộc áp dụng dữ
liệu đặc tả được đánh dấu bằng nét đậm.
Tạo lập dữ liệu 2D
Dạng số
Lên kế
hoạch
Thiết kế mô
hình và thử
nghiệm
Dạng giấy
Khuôn dạng dữ liệu
Chuyển đổi dữ liệu
Đảm bảo
chất lượng
Quét (chụp) tài liệu
Dữ liệu đặc tả
14
Kiểm tra sản phẩm
Lập chỉ mục – Dữ liệu đặc tả
Biên tập dữ liệu
Hiện nay, Các dự thảo TCVN về GIS đã và đang được các Bộ, ngành liên quan triển khai
xây dựng dự thảo QCVN, TCVN và Qui định kỹ thuật, Một số QCVN và TCVN đã được
Bộ Tài nguyên và Mội trường xây dựng như sau:
TT
Tên QCVN/TCVN
Số hiệu
Ghi chú
Ghi nhật ký
A
Hệ thống QCVN
1.
QCVN về xây dựng lưới độ cao
QCVN
11:2008/BTNMT
2.
QCVN về xây dựng lưới tọa độ
QCVN
04:2009/BTNMT
3.
QCVN về Phân định địa giới hành QCVN
chính và lập hồ sơ địa giới hành 12:2008/BTNMT
chính các cấp
4.
QCVN về Chuẩn hóa địa danh phục QCVN
vụ công tác lập bản đồ
37:2011/BTNMT
5.
QCVN về Thông tin địa lý cơ sở
6.
Mô hình số độ cao (DEM)
39/2014/TTBTNMT (Lidar),
chưa có quy định
SP chụp ảnh KT
số
7.
Dữ liệu đồ họa đường nét
96TCN
42-90
Quy phạm thành
lập bản đồ địa
hình tỷ lệ 1:500,
1:1 000, 1:2 000,
1:5 000 , 1:10 000
và
1:25
000
QCVN
42:2012/BTNMT
15
(phần trong nhà)
8.
Dữ liệu nền địa lý gốc (thành lập
trực tiếp ở mức 1:2000, 1:5000,
1:10.000)
21/2014/TTBTNMT,
55/2014/TTBTNMT
9.
Dữ liệu địa lý
(1:25.000,1:50.000,
1:500.000, 1:1tr)
20/2014/TTBTNMT
(1:50.000)
10.
Bản đồ địa hình gốc dạng số các
loại tỷ lệ cơ bản
70/2000/QĐ-ĐC
(Quy định kỹ
thuật số hóa bản
đồ địa hình tỷ lệ
1:10 000, 1:25
000, 1:50 000 và
1:100 000)
11.
Dữ liệu, bản đồ biên giới địa giới
Xây dựng mới
12.
Dữ liệu, bản đồ địa hình đáy biển
180/1998/QĐĐC, Quy định cơ
sở toán học, độ
chính xác nội
dung và ký hiệu
bản đồ địa hình
đáy biển tỷ lệ
1:10 000
B
Hệ thống QĐKT
13.
Quy phạm thành lập bản đồ địa 24/KHKT
hình tỷ lệ 1:10 000 - 1:25 000 (phần
ngoài trời)
3/26/1977
14.
Ký hiệu bản đồ địa hình tỷ lệ 1:500, 1125/ĐĐBĐ
1:1 000, 1:2 000 và 1:5 000
11/19/1994
15.
Ký hiệu bản đồ địa hình tỉ lệ 1:10 1126/ĐĐBĐ
000 và 1:25 000
11/19/1994
16.
Những yêu cầu cơ bản và qui định 541/QĐ/ĐC
kiểm tra, đánh giá chất lượng phim
ảnh chụp từ máy bay phục vụ công
9/1/1995
thứ cấp
1:100.000,
16
tác đo vẽ và hiện chỉnh bản đồ
17.
Quy định kỹ thuật xây dựng lưới 1284/ĐĐBĐ
cấp 0 Nhà nước CHXHCNVN
9/16/1995
18.
Quy định cơ sở toán học, độ chính 180/1998/QĐ-ĐC
xác nội dung và ký hiệu bản đồ địa
hình đáy biển tỷ lệ 1:10 000
3/31/1998
19.
Quy định tạm thời về quy trình đo 431/2001/QĐ-TCĐC
thủy chuẩn hạng 1, 2 bằng máy
thủy chuẩn điện tử và bộ mia có
dạng mã vạch
11/13/2001
20.
Quy phạm thành lập BĐ ĐH 1:250 09/2006/QĐ-BTNMT
000, 1:500 000 và 1:1 000 000
8/16/2006
21.
Ký hiệu BĐĐH 1:250 000, 1:500 11/2006/QĐ-BTNMT
000 và 1:1 000 000
8/22/2006
22.
Quy định kỹ thuật thành lập bản đồ 03/2007/QĐ-BTNMT
địa hình đáy biển tỷ lệ 1:50 000
2/12/2007
23.
Sử dụng hệ thống tham số tính 05/2007/QĐ-BTNMT
chuyển giữa Hệ tọa độ quốc tế
WGS-84 và Hệ tọa độ quốc gia
VN-2000
2/27/2007
24.
Quy định kỹ thuật và quy trình công 2097/QĐ-BTNMT
nghệ (tạm thời) thành lập mô hình
số độ cao bằng công nghệ Lidar
10/22/2008
25.
Quy định về quy phạm xây dựng 01/2009/TT-BTNMT
lưới trọng lực quốc gia
1/14/2009
26.
Quy định kỹ thuật thành lập bản đồ 34/2011/TT-BTNMT
địa hình đáy biển tỷ lệ 1: 100.000
bằng phương pháp đo vẽ trực tiếp
8/1/2011
27.
Quy định kỹ thuật hiện chỉnh bản 05/2012/TT-BTNMT
đồ địa hình quốc gia tỷ lệ 1:25.000
và 1:50.000 bằng ảnh vệ tinh
5/8/2012
28.
Quy định kỹ thuật về đo trọng lực 08/2012/TT-BTNMT
chi tiết
8/8/2012
17
C
Hệ thống TCVN dự kiến xây dựng
29.
Thông tin địa lý – Mô hình quy
chiếu
Đang dự thảo
30.
Thông tin địa lý – Thuật ngữ.
Đang dự thảo
31.
Thông tin địa lý – Phương pháp
phân loại đối tượng
Đang dự thảo
32.
Thông tin địa lý - Các nguyên tắc
về chất lượng
Đang dự thảo
33.
Thông tin địa lý: - Mô hình tham
chiếu, phần 2 - Ảnh
Đang dự thảo
34.
Thông tin địa lý: Thủ tục đánh giá
chất lượng
Đang dự thảo
35.
Thông tin địa lý - Siêu dữ liệu
Đang dự thảo
Nhận xét : Các tiêu chuẩn và quy chuẩn đều được xây dựng bằng hình thức nghiên cứu
các tài liệu và tiêu chuẩn của ISO hoặc tổ chức OGC. Các QCVN này được Bộ Tài
nguyên và Môi trường ban hành.
2.2 Tình hình trên thế giới
Hiện nay, Tổ chức Tiêu chuẩn hóa Quốc tế đã ban hành các Tiêu chuẩn quốc tế ISO
liên quan đến quy trình số hóa:
- ISO 19115-1:2014 Geographic information -- Metadata -- Part 1: Fundamentals
(Thông tin địa lý – Dữ liệu đặc tả – Phần 1: Nguyên tắc cơ bản)
- ISO 19115-2:2009 Geographic information -- Metadata -- Part 2: Extensions for
imagery and gridded data (Thông tin địa lý – Dữ liệu đặc tả – Phần 2: Mở rộng đổi với
dữ liệu ảnh và dữ liệu lưới)
- ISO/TR 13028:2010 Information and documentation - Implementation guidelines for
digitization of records (Thông tin và tư liệu – Hướng dẫn thực hiện đối với số hóa bản
ghi)
Tiêu chuẩn ISO / TR 13028: 2010: thiết lập các hướng dẫn để tạo ra và duy trì các bản
ghi trong định dạng kỹ thuật số duy nhất, nơi mà các bài báo gốc, hoặc hồ sơ nguồn
không kỹ thuật số khác, đã được sao chép bằng cách số hóa; thiết lập các hướng dẫn
18
thực hành tốt nhất cho việc số hóa để đảm bảo độ tin cậy và độ tin cậy của hồ sơ và
cho phép xem xét xử lý các hồ sơ nguồn không kỹ thuật số; thiết lập các hướng dẫn
thực hành tốt nhất cho sự tin cậy của các hồ sơ số hóa có thể ảnh hưởng đến việc chấp
nhận bằng chứng pháp lý và trọng lượng của các hồ sơ đó; thiết lập các hướng dẫn
thực hành tốt nhất cho việc tiếp cận các hồ sơ số hoá cho đến khi họ được yêu cầu; xác
định chiến lược để hỗ trợ trong việc tạo ra các bản ghi số hóa phù hợp để duy trì lâu
dài; và thiết lập các hướng dẫn thực hành tốt nhất cho việc quản lý các hồ sơ nguồn
không kỹ thuật số sau số hóa.
ISO / TR 13028: 2010 được áp dụng để sử dụng trong việc thiết kế và tiến hành số hóa
trách nhiệm của tất cả các tổ chức thực hiện số hóa, hoặc quá trình kinh doanh số hóa,
dự án số hóa chụp lại cho các mục đích quản lý hồ sơ, như được nêu trong ISO 154891: 2001 và ISO / TR 15801: 2009.
ISO / TR 13028: 2010 không áp dụng cho: nắm bắt và quản lý hồ sơ kỹ thuật số sinh;
thông số kỹ thuật cho chụp kỹ thuật số của hồ sơ; thủ tục để ra quyết định cuối cùng về
bố trí hồ sơ; thông số kỹ thuật cho việc bảo tồn lâu dài của hồ sơ kỹ thuật số; số hóa
hoặc cổ phần lưu trữ hiện có cho các mục đích bảo quản.
AS / NZS ISO 13028: 2012 là một tiêu chuẩn của Úc - New Zealand. Đây là một áp
dụng giống hệt nhau của tiêu chuẩn ISO / TR 13028: 2010.
UNE-ISO/TR 13028:2011 IN Tiêu chuẩn của Tây Ban Nha cũng dựa trên tiêu chuẩn
ISO / TR 13028: 2010.
Chính phủ Alberta cũng đưa ra quy trình số hóa “Digitization standard process num
A000015 xuất bản ngày 23-04-2013” được áp dụng cho tất cả các cơ quan ban ngành,
chỉnh phủ và doanh nghiệp của họ với 10 bước bắt buộc phải sử dụng. Bên cạnh đó đi
kèm theo các yêu cầu kỹ thuật cho tiêu chuẩn này “Digitization Technical
Requirements Standard A000013 xuất bản 14-07-2012”
Hiện nay, các tiêu chuẩn quốc tế thuộc họ tiêu chuẩn ISO 191xx rơi vào một số
nhóm tiêu chuẩn sau đây:
-Các tiêu chuẩn qui định hạ tầng cho việc tiêu chuẩn hóa về không gian địa lý:

ISO 19101 Geographic information — Reference model (Thông tin địa lý –
Mô hình tham chiếu);
19

ISO/TS 19103 Geographic information — Conceptual schema language
(Thông tin địa lý – Ngôn ngữ lược đồ khái niệm);

ISO/TS 19104 Geographic information — Terminology (Thông tin địa lý –
Thuật ngữ);

ISO 19105 Geographic information — Conformance and testing (Thông tin
địa lý – Kiểm thử và sự phù hợp);

ISO 19106 Geographic information — Profiles (Thông tin địa lý – Hồ sơ);
-Các tiêu chuẩn mô tả các mô hình dữ liệu đối với thông tin địa lý:

ISO 19109 Geographic information — Rules for application schema (Thông
tin địa lý – Qui tắc cho lược đồ ứng dụng);

ISO 19107 Geographic information — Spatial schema (Thông tin địa lý –
Lược đồ không gian);

ISO 19137 Geographic information — Core profile of the spatial schema
(Thông tin địa lý – Hồ sơ lõi của lược đồ không gian);

ISO 19123 Geographic information — Schema for coverage geometry and
functions (Thông tin địa lý – Lược đồ đối với các chức năng và hình học bao
phủ);

ISO 19108 Geographic information — Temporal schema (Thông tin địa lý –
Lược đồ thời gian);

ISO 19141 Geographic information — Schema for moving features (Thông
tin địa lý – Lược đồ đối với việc dịch chuyển các đối tượng địa lý);

ISO 19111 Geographic information — Spatial referencing by coordinates
(Thông tin địa lý – Tham chiếu không gian bằng tọa độ);

ISO 19112 Geographic information — Spatial referencing by geographic
identifiers (Thông tin địa lý – Tham chiếu không gian bằng các định danh địa
lý);
-Các tiêu chuẩn cho việc quản lý thông tin địa lý:

ISO 19110 Geographic information — Methodology for feature cataloguing
(Thông tin địa lý – Phương pháp luận phân loại đối tượng địa lý);
20

ISO 19115 Geographic information — Metadata (Thông tin địa lý – Dữ liệu
đặc tả);

ISO 19113 Geographic information — Quality principles (Thông tin địa lý –
Nguyên tắc chất lượng);

ISO 19114 Geographic information — Quality evaluation procedures (Thông
tin địa lý – Thủ tục ước lượng chất lượng);

ISO 19131 Geographic information — Data product specifications (Thông
tin địa lý – Đặc tả sản phẩm dữ liệu);

ISO 19135 Geographic information — Procedures for item registration
(Thông tin địa lý – Thủ tục đăng ký hạng mục);

ISO/TS 19127 Geographic information — Geodetic codes and parameters
(Thông tin địa lý – Tham số và mã trắc địa);

ISO/TS 19138 Geographic information — Data quality measures (Thông tin
địa lý – Đo lường chất lượng dữ liệu);
-Các tiêu chuẩn đối với các dịch vụ thông tin địa lý:

ISO 19119 Geographic information — Services (Thông tin địa lý – Dịch vụ);

ISO 19116 Geographic information — Positioning services (Thông tin địa lý
– Dịch vụ định vị);

ISO 19117 Geographic information — Portrayal (Thông tin địa lý – Phác
họa);

ISO 19125-1 Geographic information — Simple feature access — Part 1:
Common architecture (Thông tin địa lý – Truy cập đối tượng địa lý đơn giản
– Phần 1: Kiến trúc chung);

ISO 19125-2 Geographic information — Simple feature access — Part 2:
SQL option (Thông tin địa lý – Truy cập đối tượng địa lý đơn giản – Phần 2:
Tùy chọn SQL);

ISO 19128 Geographic information — Web map server interface (Thông tin
địa lý – Giao diện máy chủ bản đồ web);

ISO 19132 Geographic information — Location based services — Reference
21
model (Thông tin địa lý – Dịch vụ dựa trên định vị - Mô hình tham chiếu);

ISO 19133 Geographic information — Location based services — Tracking
and navigation (Thông tin địa lý – Dịch vụ dựa trên định vị - Điều hướng và
truy vết);

ISO 19134 Geographic information — Location base services — Multimodal
routing and navigation (Thông tin địa lý – Dịch vụ dựa trên định vị - Điều
hướng và định tuyến đa phương tiện);
-Các tiêu chuẩn mã hóa thông tin địa lý:

ISO 19118 Geographic information — Encoding (Thông tin địa lý – Mã
hóa);

ISO 6709 Standard representation of geographic point location by
coordinates (Thể hiện chuẩn vị trí điểm địa lý theo các tọa độ);

ISO 19136 Geographic information — Geography Markup Language (GML)
(Thông tin địa lý – Ngôn ngữ đánh dấu địa lý (GML));

ISO/TS 19139 Geographic information — Metadata — XML schema
implementation (Thông tin địa lý – Siêu dữ liệu – Triển khai lược đồ XML);
-Các tiêu chuẩn đối với các lĩnh vực chủ đề cụ thể:

ISO/TS 19101-2 Geographic information — Reference model — Part 2:
Imagery (Thông tin địa lý – Mô hình tham chiếu – Phần 2: Ảnh);

ISO 19115-2 Geographic information — Metadata — Part 2: Extensions for
imagery and gridded data (Thông tin địa lý – Dữ liệu đặc tả - Mở rộng đối
với dữ liệu lưới và Ảnh);
2.3 Kết luận
Số hóa đã và đang bùng nổ, thị trường cho lĩnh vực này rất lớn và tiềm năng. Các
doanh nghiệp cũng như các cơ quan nhà nước, thư viện, trường đại học… cũng đã có
những giải pháp dịch vụ, quy trình cho việc số hóa tài liệu. Tuy nhiên để hiệu quả và
chuẩn xác thì việc xây dựng tiêu chuẩn quy trình số hóa là việc làm cần thiết. Quy
trình số hóa cần tuân theo các tiêu chuẩn quốc tế đồng thời cũng phải có những điều
chỉnh nhất định để phù hợp với yêu cầu cũng như hoàn cảnh tại Việt Nam.
22
3 Cơ sở xây dựng các yêu cầu kỹ thuật
3.1 Phân tích các tài liệu tiêu chuẩn
3.1.1 Tiêu chuẩn ISO 13028 : 2010
ISO / TR 13028 do Ủy ban kỹ thuật ISO / TC 46, Thông tin và tài liệu biên soạn
hướng dẫn, Tiểu ban SC 11, Lưu trữ / quản lý hồ sơ.
Báo cáo kỹ thuật này được dựa trên tiêu chuẩn S6 Lưu trữ hồ sơ của Lưu trữ New
Zealand: Tiêu chuẩn số hóa, được công bố vào tháng 01 năm 2006.
Báo cáo kỹ thuật này:
Thiết lập các hướng dẫn để tạo ra và duy trì các bản ghi trong định dạng kỹ thuật số
duy nhất, nơi mà các bài báo gốc, hoặc hồ sơ nguồn không kỹ thuật số khác, đã được
sao chép bằng cách số hóa;
- Thiết lập hướng dẫn thực hành tốt nhất cho việc số hóa để đảm bảo độ tin cậy và độ
tin cậy của hồ sơ và cho phép xem xét xử lý các hồ sơ nguồn không kỹ thuật số;
- Thiết lập hướng dẫn thực hành tốt nhất cho sự tin cậy của các hồ sơ số hóa có thể ảnh
hưởng đến việc chấp nhận bằng chứng pháp lý và trọng lượng của các hồ sơ đó;
- Thiết lập hướng dẫn thực hành tốt nhất cho việc tiếp cận các hồ sơ số hoá cho đếnkhi
họ được yêu cầu;
- Xác định các chiến lược để hỗ trợ trong việc tạo ra các bản ghi số hóa phù hợp để
duy trì lâu dài;
Thiết lập hướng dẫn thực hành tốt nhất cho việc quản lý các hồ sơ nguồn không
kỹ thuật số sau số hóa.
Báo cáo kỹ thuật này được áp dụng để sử dụng trong việc thiết kế và tiến hành số hóa
trách nhiệm của tất cả các tổ chức thực hiện số hóa, hoặc quá trình kinh doanh số hóa,
dự án số hóa chụp lại cho các mục đích quản lý hồ sơ, như được nêu trong ISO 154891: 2001 và ISO / TR 15801: 2009.
Báo cáo kỹ thuật này là không áp dụng đối với:
a)khai thác và quản lý hồ sơ sinh-kỹ thuật số;
23
b)thông số kỹ thuật cho quét hồ sơ kỹ thuật số;
c)các thủ tục để ra quyết định cuối cùng về xác định giá trị hồ sơ;
d)thông số kỹ thuật cho việc bảo tồn lâu dài của hồ sơ kỹ thuật số;
e)số hóa của các tài lưu trữ hiện có cho các mục đích bảo quản.
Nội dung của tiêu chuẩn bao gồm các phần chính sau:
Tài liệu bắt đầu bằng việc phân tích đánh giá các lợi ích cũng như rủi ro của việc số
hóa.
Số hóa cung cấp các lợi ích tiềm năng sau đây cho các tổ chức:
có thể truy cập hình ảnh đồng thời cho nhiều người;
truy cập mạng cho phép truy cập từ nhiều nơi bất cứ lúc nào;
hội nhập sâu hơn với các hệ thống thông tin kinh doanh;
khả năng truyền tải hình ảnh trong một quy trình làm việc có cấu trúc, do đó hỗ trợ xử
lý công việc;
loại bỏ tạp chủng (cả giấy và kỹ thuật số) của hệ thống mà có thể gây nhầm lẫn cho
người dùng khi yêu cầu truy cập xem toàn bộ lịch sử của một sự việc nào đó;
khả năng tái sử dụng nguồn lực hạn chế hiện có của mình bằng cách định dạng của họ,
ví dụ: bản đồ rất lớn hoặc các tài liệu được tổ chức trên vi phim hoặc băng từ; áp dụng
phân loại phù hợp và lập chỉ mục cho các tài liệu đặc biệt cho các tập tin lai;
tích hợp với các tổ chức khắc phục thảm họa và các chế độ sao lưu hiện có;
cung cấp một khả năng bảo mật và bảo đảm khả năng làm giảm không gian lưu trữ vật
lý bị chiếm đóng bởi các hồ sơ bản giấy;
tiềm năng để tăng năng suất của tổ chức.
Có một số rủi ro liên quan đến việc thực hiện một quá trình số hóa:
tiết kiệm chi phí ngắn hạn có thể đến chi phí dài hạn trong việc duy trì khả năng tiếp
cận tới các hình ảnh kỹ thuật số theo thời gian;
tiêu chuẩn công nghệ và kỹ thuật được sử dụng để tạo ra hình ảnh kỹ thuật số có thể
ảnh hưởng đáng kể tuổi thọ và khả năng tái sử dụng các hình ảnh trong tương lai;
24
Lê kế hoạch là bước đầu tiên và quan trọng nhất trong quy trình số hóa.
Tất cả quá trình số hóa phải được lên kế hoạch, xác định phạm vi và ghi lại tài liệu.
Các tài liệu dự án bao gồm:
a) phạm vi định nghĩa: xác định rõ ràng nghiệp vụ, mục tiêu, quy mô, kích thước và
những hạn chế của dự án;
b) tuyên bố về mục đích và dự kiến sử dụng của các hồ sơ kỹ thuật số, minh họa nếu
cần thiết với các ví dụ;
c) tuyên bố về lợi ích, rủi ro: xác định rõ ràng về những lợi ích, rủi ro dự kiến từ việc
số hóa;
d) báo cáo kết quả nhu cầu và tác động của người dùng: ví dụ, làm thế nào các hồ sơ
số hoá sẽ được sử dụng truy cập và ảnh hưởng thế nào người sử dụng;
e) tuyên bố về tiêu chuẩn kỹ thuật áp dụng: bao gồm định dạng, nén và dữ liệu đặc tả;
f) thiết bị và các nguồn lực để hỗ trợ cho việc số hóa;
g) quy trình lập kế hoạch, kiểm soát và thực hiện việc số hóa, bao gồm cả những người
thực hiện trước, trong và sau khi số hóa;
h) quy trình kiểm soát chất lượng;
i) chiến lược cho việc tích hợp các hình ảnh số hóa vào quy trình làm việc để hỗ trợ
các hoạt động nghiệp vụ đang diễn ra; chiến lược cho quản lý đối với các hồ sơ được
số hóa và hồ sơ nguồn không kỹ thuật số phải luôn sẵn sang khi được yêu cầu.
Song song với đó là việc xác định lựa chọn các giải pháp cũng như phần mềm thiết bị
cho phù hợp với yêu cầu và mục đích số hóa.
25
Quản lý bản ghi số hóa
Suốt quá trình thực hiện các giai đoạn của một dự án số hóa, yêu cầu quản lý hồ sơ
phải được đưa vào để đảm bảo rằng nguồn dữ liệu ban đầu và các tài liệu số hóa là
toàn vẹn và trong suốt. Quá trình này phải đảm bảo phù hợp với tiêu chuẩn ISO
15489-1: 2001
Trong trường hợp các hình ảnh số hóa được sử dụng như bản ghi hiện tại hoặc sẽ được
sử dụng trong quy trình hiện tại thì quy trình này nên được tích hợp với các thông tin
nghiệp vụ khác hoặc hệ thống quản lý hồ sơ điện tử.
Điều này đảm bảo rằng các hình ảnh số được thừa hưởng việc phân loại quy trình
nghiệp vụ và dữ liệu đặc tả lien quan tới quy trình nghiệp vụ sẽ được đưa vào trong
quy trình nghiệp vụ và tăng cường tính xác thực bằng cách tích hợp với hệ thống thông
tin nghiệp vụ.
Dự án số hóa thường được thực hiện như một biện pháp bảo quản để kéo dài tuổi thọ
của các hồ sơ không kỹ thuật số dễ mất mát hoặc để tăng truy cập của người dùng đến
nội dung thông tin của hồ sơ và thường được đầu tư mạnh. Trong trường hợp kết quả
của các dự án này không được liên kết ngay lập tức với một hệ thống thông tin nghiệp
vụ đã tồn tại, thì cũng cần phải xem xét luôn việc đảm bảo sự phù hợp với hệ thống
đối với các quá trình như định danh, đánh chỉ số, phân loại, kiểm soát an ninh và truy
cập, quản lý bản quyền và bảo quản.
Tiêu chuẩn mô tả và hướng dẫn các bước liên quan tới việc chuẩn bị hồ sơ gốc, dữ liệu
đặc tả và đảm bảo chất lượng.
Hệ thống quản lý
Dữ liệu số hóa và chưa số hóa để đảm bảo chất lượng luôn phải đi kèm với 1 hệ thống
quản lý chuẩn mực và đảm bảo được các yêu cầu bắt buộc.
Trong đó việc xác định chiến lược cho việc lưu trữ cũng như kế hoạch và các thủ tục
sao lưu được mô tả và hướng dẫn cụ thể.
26
Xác định giá trị bản ghi
Trong đó đưa ra một loạt các quá trình lien quan đến việc thực hiện những quyết định
về lưu trữ, tiêu hủy hoặc chuyển giao hồ sơ, được quy định bằng văn bản về thẩm
quyền xác định giá trị hồ sơ hoặc các công cụ khác.
Các tiêu chuẩn tham khảo và tham chiếu:
ISO 15489-1:2001, Information and documentation — Records management — Part
1: General
ISO/TR 15801:2009, Document management — Information stored electronically —
Recommendations for trustworthiness and reliability
ISO 23081-1:2006, Information and documentation — Records management processes
— Metadata for records — Part 1: Principles
ISO 23081-2:2009, Information and documentation — Managing metadata for records
— Part 2: Conceptual and implementation issues
3.1.2 ISO 19115-1:2014
ISO 19115-1 do ban kỹ thuật ISO/TC 211 “Thông tin địa lý” biên soạn
Sự tiến bộ của phần mềm và phần cứng máy tính đối với việc quản lý và phân tích dữ
liệu, cụ thể việc hợp nhất các quan sát tham chiếu địa lý dẫn đến sự tăng nhanh việc sử
dụng các giải pháp thông tin số trên phạm vi toàn cầu. Nhận thức được tầm quan trọng
địa lý và những thứ liên quan đang tác động đến hầu hết các khía cạnh của xã hội. Tập
dữ liệu địa lý số là sự biểu diễn của một số mô hình của thế giới để sử dụng trong phân
tích máy tính và hiện thị thông tin tin bằng đồ họa. Các mô hình cơ sở là sự trừu tượng,
yêu cầu tính gần đúng, sự đơn giản hóa và sự bỏ qua một vài khía cạnh và luôn luôn là
một trong nhiều “cách nhìn” có thể xảy ra. Để đảm bảo rằng dữ liệu không bị lạm
dụng, các giả thiết và các giới hạn ảnh hưởng đến việc tạo dữ liệu phải được tài liệu
hóa đầy đủ. Điển hình, dữ liệu được sử dụng bởi nhiều người hơn là nhà sản xuất. Dữ
liệu đặc tả cho pháp nhà sản xuất mô tả các tài nguyên để người sử dụng có thể hiểu
được các giả thiết và các giới hạn và đánh giá các tài nguyên thích hợp cho mục đích
sử dụng của họ. Tài liệu có chất lượng cũng sẽ cung cấp cho các nhà sản xuất dữ liệu
27
với kiến thức sẵn có của họ và cho phép họ quản lý tốt hơn việc sản xuất dữ liệu, lưu
trữ, cập nhật và tái sử dụng.
Tập dữ liệu địa lý được coi như dữ liệu bảng, có cấu trúc với vị trí kết hợp với mỗi
hàng trong một bảng hoặc điểm trong lưới. Nhằm mục đích mở ra đám mây thông tin
dựa trên web, khái niệm tập dữ liệu có thể được mở rộng để bao gồm mọi sản phẩm
thông tin được coi như một đơn vị, xác định bởi phạm vi của nó, quyền và mục đích
mong đợi. Trong một cách nhìn rộng hơn, mọi tài liệu chưa các quan sát hoặc trình
diễn cục bộ có thể được xem là tập dữ liệu địa lý, có cấu trúc hoặc không có cấu trúc.
Hệ thống thông tin phân tán được kích hoạt bởi internét đang thúc đẩy sự phát triển
của kiến trúc hướng dịch vụ mà các dịch vụ web đang trở nên quan trọng như nguồn
thông tin hoặc khả năng xử lý, nhiều trong số các dịch vụ này cung cấp thông tin hoặc
chức năng dựa trên vị trí. Mô tả các dịch vụ phát hiện và sử dụng này trở thành một
chức năng quan trọng của dữ liệu đặc tả.
Tổ chức thông tin quan trọng với tham chiếu địa lý được chứa trong tài nguyên không
phải là dạng số. Các tài nguyên này bao gồm bản đồ và tài liệu của các loại khác nhau
cũng như các mẫu hoặc các sản phẩm khác được tập hợp để miêu tả một số khía cạnh
của trái đất – vật lý, sinh học và văn hóa. Lược đồ dữ liệu đặc tả thể hiện trong tiêu
chuẩn này cũng thích hợp với tài nguyên như vậy.
Mục tiêu của tiêu chuẩn này là cung cấp mô hình cho việc mô tả thông tin hoặc tài
nguyên chứa các phần mở rộng. Tiêu chuẩn này được sử dụng bởi nhà phân tích hệ
thống thông tin, nhà lập kế hoạch chương trình và nhà phát triển các hệ thống thông tin
nhằm xác định các nguyên tắc cơ bản và các yêu cầu cho việc mô tả tài nguyên thông
tin. Tiêu chuẩn này cũng xác định các phần tử dữ liệu đặc tả, các đặc tính của chúng và
mối quan hệ giữa các phần tử và thiết lập tập thuật ngữ dữ liệu đặc tả chung, các định
nghĩa và các thủ tục mở rộng.
Mặc dù mục đích chính của tiêu chuẩn này là mô tả thông tin số được mở rộng, nhưng
có thể được sử dụng để mô tả tất cả các kiểu tài nguyên bao gồm tài liệu nguyên văn,
sáng kiến, phần mềm, thông tin phi địa lý, đặc tả sản phẩm và các kho dữ liệu, nghĩa là
có thể được sử dụng để mô tả tài nguyên thông tin mà không có phần mở rộng địa lý.
Một số vùng có các chuẩn dữ liệu đặc tả của chính nó như là Dublin core cho các thư
28
viện. Nếu cần, các tiêu chuẩn như vậy và tiêu chuẩn này có thể được môt tả sơ lược để
tạo ra các lược đồ chung.
Khi được thực hiện bởi nhà cung cấp tài nguyên, tiêu chuẩn này sẽ:

1) cho phép các nhà cung cấp tài nguyên thông tin miêu tả hoàn thiện và hiệu
quả các tài nguyên của họ

2) Thuận lợi hóa tổ chức và quản lý dữ liệu đặc tả cho các tài nguyên thông tin

3) Cho phép sử dụng các tài nguyên thông tin thích hợp thông qua việc hiểu
được các đặc điểm của chúng.

4) Thuận lợi hóa việc phát hiện, truy cập, lấy lại và tái sử dụng

5) Cho phép người sử dụng xác định xem liệu tài nguyên thông tin có hữu ích
với họ hay không
Tiêu chuẩn này xác định dữ liệu đặc tả mục đích chung. Nhiều mô hình chi tiết cho các
khía cạnh của mô tả tài nguyên, bao gồm chất lượng, cấu trúc dữ liệu hoặc ảnh được
xác định trong các tiêu chuẩn thông tin địa lý khác. Mô hình dữ liệu đặc tả ở đây cho
phép thực hiện các phần mở rộng dựa trên mẫu chung nhằm tạo thuận lợi cho việc
thực hiện phần mềm sử dụng các phần mở rộng đó.
Tiêu chuẩn này là sự sửa đổi của ISO 19115:2003 và ISO ISO 19115:2003/Cor 1:2006.
Phần sửa đổi này được thực hiện bởi các tiến bộ của công nghệ thông tin và sự thay
đổi về việc sử dụng internét cho việc truy cập, sủa dụng và quản lý dữ liệu đặc tả cũng
như các sửa đổi cho các tài liệu tham chiếu và người sử dụng riêng lẻ cung cấp các gợi
ý dựa trên tám năm kinh nghiệm trong việc sử dụng.
Tiêu chuẩn này độc lập hoàn toàn với phiên bản trước đó với tên và ngày tháng mới.
Các gói UML, các lớp, các phần tử có định danh khác nhau so với phiên bản trước.
Mục đích của siêu dữ liẹu là mô tả các tài nguyên. Việc mô tả này có thể giữ lại dữ
liệu và không thay đổi. Có thể sử dụng cả hai để trình diễn dữ liệu và tìm dữ liệu. Số
lượng lớn dữ liệu cũ hơn tồn tại trong ISO 19115:2003, và dữ liệu mới hơn tồn tại ở
các bản mô tả sơ lược quốc gia hoặc vùng miền ISO 19115:2003. Dữ liệu này sẽ vẫn
giữ nguyên như đã được xác định. Việc tạo ra dữ liệu mới cho các dặc tả sản phẩm
mới dựa trên việc sửa đổi ISO 19115 tận dụng các khả năng mô tả mở rộng. Với việc
giới thiệu sửa đổi ISO 19115 này, tồn tại môi trường dữ liệu hỗn hợp. Các hệ thống mà
29
hỗ trợ việc phát hiện dữ liệu theo sửa đổi của ISO 19115 có thể nhận ra và biểu diễn
dữ liệu đặc tả trong ISO 19115:2003 sao cho tất cả dữ liệu trong môi trường hỗn hợp
có thể được phát hiện. Các hệ thống mà hỗ trợ việc trình diễn dữ liệu theo sửa đổi của
ISO 19115 cũng có thể nhận ra và trình diễn dữ liệu đặc tả trong ISO 19115:2003 sao
cho tất cả các dữ liệu được trình diễn. Việc sử dụng các định danh riêng biệt cho các
phần tử sửa đổi và cách thức mà chuẩn dữ liệu đặc tả được sửa đổi tạo thuận lợi cho
điều này.
Để hỗ trợ cho việc đảm bảo tính tương thích và nới lỏng việc biến đổi các trường hợp
dữ liệu đặc tả cho phiên bản sửa đổi của ISO 19115:

— Không có phần tử bắt buộc mới nào được tạo;

— Nếu định nghĩa của phần tử dữ liệu đặc tả yêu cầu thay đổi thì nó sẽ bị xóa
hoặc thay thế bởi phần tử dữ liệu đặc tả mới; các tên phần tử dữ liệu đặc tả
không được tái sử dụng cho các khái niệm khác;

— Các định nghĩa của các phần tử dữ liệu đặc tả được mở rộng;

— Các phần tử dữ liệu đặc tả được tái sử dụng khi kiểu dữ liệu của chúng thay
đổi nhưng tên và tên và định nghĩa vẫn không đổi;

— Các thuộc tính còn lại được giữ trong cùng trật tự như trong chuẩn thay thế;

— Danh sách các phần tử bị xóa, các phần tử mới và ánh xạ giữa các phần tử cũ
và việc thay thế của chúng được cung cấp trong Phụ lục G;

— Tái cấu trúc ULL được giữ ở mức tối thiểu.
Tóm tắt một số thay đổi chính:

— Khái niệm của “dữ liệu đặc tả lõi” bị loại bỏ;

— Dữ liệu đặc tả về các dịch vụ được thêm vào, bắt nguồn
từ ISO 19119:2005 và ISO 19119:2005/Amd 1:2008;

— Chất lượng dữ liệu được chuyển tới ISO 19157;

— Phụ lục F được thêm vào để mô tả dữ liệu đặc tả cho việc phát hiện dịch vụ
và tài nguyên phi dịch vụ;

— Nhiều danh sách mã được mở rộng;
30

— Sủ dụng “tên ngắn” và “mã vùng” được giảm bới cho các phần tử dữ liệu
đặc tả và các mã tương ứng.
ISO 19115 với tên chung là Thông tin địa lý – Dữ liệu đặc tả, bao gồm các phần
sau đây,
— Phần 1: Nguyên tắc cơ bản
— Part 2: Mở rộng cho dữ liệu ảnh và dữ liệu lưới
— Part 3: Thực thi nguyên tắc cơ bản về dữ liệu đặc tả theo lược đồ XML
ISO 19115-1:2014 xác định lược đồ được yêu cầu để mô tả thông tin địa lý và các dịch
vụ bằng dữ liệu đặc tả. Tiêu chuẩn này còn cung cấp thông tin về việc định danh, mở
rộng, chất lượng, khía cạnh không gian và thời gian, nội dung, tham chiếu không gian
và các đặc tính khác của dữ liệu và các dịch vụ địa lý số.
ISO 19115-1:2014 có thể áp dụng cho:
- ghi vào mục lục tất cả các loại tài nguyên, mô tả đầy đủ các tập dữ liệu và dịch vụ;
- các dịch vụ địa lý, tập dữ liệu địa lý, các đặc trưng địa lý riêng và các đặc tính đặc
trưng.
ISO 19115-1:2014 xác định:
- các phần dữ liệu đặc tả bắt buộc và có điều kiện, các thực thể dữ liệu đặc tả và các
phần tử dữ liệu đặc tả;
- tập dữ liệu đặc tả tối thiểu được yêu cầu nhằm đáp ứng hầu hết các ứng dụng dữ liệu
đặc tả (phát hiện dữ liệu, xác định dữ liệu phù hợp để sử dụng, truy cập dữ liệu, truyền
dữ liệu và sử dụng dữ liệu số và các dịch vụ số);
- các phần tử dữ liệu đặc tả tùy chọn cấp phát nhiều mô tả tài nguyên chuẩn mở rộng,
nếu được yêu cầu;
- phương pháp mở rộng dữ liệu đặc tả phù hợp với các nhu cầu chuyên dụng.
ISO 19115-1:2014 cũng áp dụng cho dữ liệu và các dịch vụ số, các nguyên tắc của nó
được mở rộng đến các loại tài nguyên khác như là bản đồ, sơ đồ và tài liệu nguyên bản
cũng như dữ liệu phi địa lý. Các phần tử dữ liệu đặc tả có điều kiện nào đó có thể
không áp dụng các dạng dữ liệu khác này.
31
3.1.3 ISO 19115-2:2009
ISO 19115-2:2009 do ban kỹ thuật ISO/TC 211 “Thông tin địa lý” biên soạn
ISO 19115-2:2009 mở rộng chuẩn dữ liệu đặc tả về địa lý hiện có bằng cách xác định
lược đồ được yêu cầu để mô tả dữ liệu ảnh và dữ liệu lưới. Tiêu chuẩn này còn cung
cấp thông tin về các đặc tính đo trang thiết bị được sử dụng để có được dữ liệu, hình
dạng việc đo quá trình sử dụng thiết bị và quá trình sản xuất được sử dụng đẻ số hóa
dữ liệu thô. Phần mở rộng này đề cập đến dữ liệu đặc tả cần để mô tả việc chuyển hóa
thông tin địa lý từ dữ liệu thô, bao gồm các đặc tính của hệ thống đo và các phương
pháp bằng số và các thủ tục điện toán sử dụng trong việc chuyển hóa. Dữ liệu đặc tả
được yêu cầu để đề cập đến dữ liệu được bao phủ nói chung và được đề cập trong phần
tổng quát của ISO 19115.
Dữ liệu ảnh và dữ liệu lưới là các nguồn thông tin và sản phẩm quan trọng sử dụng
trong môi trường địa không gian bởi các hệ thống thông tin địa lý. Việc tạo ra dữ liệu
ảnh và dữ liệu lưới theo sau một hoặc nhiều chuỗi quá trình bắt đầu với dữ liệu cảm
ứng từ xa, bản đồ quét, thu thập dữ liệu trường hoặc các phương pháp cảm ứng khác
và kết thúc với việc tạo các sản phẩm dữ liệu liệu cuối. Quá trình sản xuất cần được tài
liệu hóa để duy trì việc kiểm soát chất lượng qua các sản phẩm cuối. Ngoài ra, dữ liệu
đặc tả về hình quá trình đo và các đặc tính của thiết bị đo yêu cầu được giữ lại dữ liệu
thô để hỗ trợ quá trình sản xuất
Trong bộ các tiêu chuẩn thông tin địa lý của ISO, ISO 19115 xác định các hướng dẫn
để mô hả thông tin địa lý và các dịch vụ. Khi mô hình dữ liệu đặc tả trong ISO 19115
cung cấp một số điều khoản về dữ liệu ảnh và dữ liệu lưới, các yêu cầu không được
xây dựng đầy đủ tại thời điểm ISO 19115:2003 đang trong giai đoạn bản thảo. Để tiếp
tục xây dựng ISO 19115, bao gồm các định nghĩa dữ liệu đặc tả cho dữ liệu ảnh và dữ
liệu lưới được hoãn lại cho đến khi khung tổng quát của các dữ liệu này được qui định
đầy đủ trong bộ tiêu chuẩn thông tin địa lý ISO. Ngoài ra, các tiêu chuẩn khác thực thi
dữ liệu đặc tả về dữ liệu ảnh và dữ liệu lưới được khảo sát và mô tả trong ISO/TR
19121.
Mục tiêu của tiêu chuẩn này là cung cấp cấu trúc bổ sung để mô tả việc chuyển hóa dữ
liệu ảnh và dữ liệu lưới. Cấu trúc này là yếu tố thêm của ISO 19115.
3.1.4 Tiêu chuẩn quy trình số hóa A000015 Alberta.
32
Tiêu chuẩn có hiệu lực vào 01-03-2013 do IMT tiêu chuẩn giám sát Ủy ban Chính phủ
của Alberta. Tiêu chuẩn này mô tả các quá trình mà chính phủ, bộ, ban ngành cần thực
hiện cho tất cả các dự án số hóa và phải thực hiện khi mục tiêu của dự án số hóa là tạo
ra hồ sơ số.
Tiêu chuẩn xây dựng phù hợp với tiêu chuẩn chung của Canada CAN/CGSB-72.11-93,
Microfilm and Electronic Images as Documentary Evidence
Theo đó quy trình số hóa bao gồm các bước sau:
- Phân tích nghiệp vụ
- Chương trình số hóa và phân quyền
- Xử lý tài liệu gốc
- Chụp ảnh, scan và lặp lại
- Đánh dấu chỉ mục và dữ liệu đặc tả
- -Đảm bảo chất lượng
- -Lưu trữ hình ảnh
- Trong quá trình số hóa cần lưu ý :
- Quản lý dữ liệu
- Quản lý chất lượng
- Lưu vết
- Xem các yêu cầu kỹ thuật
Trong đó từng bước trong quy trình đều được mô tả cụ thể.
Tiêu chuẩn này được áp dụng cho các ban ngành chỉnh phủ, cơ quan, doanh nghiệp.
3.1.5 Tiêu chuẩn ANSI/NISO Z39.87-2006
Các viện văn hóa và các tổ chức thương mại được tham gia vào việc tạo các thư viện ảnh
tĩnh số. Một thách thức tạo ra cho các tập hợp này là xây dựng lên các hệ thống, được định
nghĩa rộng rãi là “kho kỹ thuật số ” duy trì chức năng và chất lượng bên trong ảnh. Một
chiến lược quản lý, các mục đích bảo quản dữ liệu ảnh bằng cách sao chép các tệp tin cho
các định dạng mới tại khoảng thời gian đã định. Giả thiết rằng, các công nghệ kỹ thuật số
đưa ra cơ hội chưa từng xảy ra để bảo quản nội dung mà không mất bất kỳ thông tin nào
33
từ việc tạo đến việc tạo. Điều này có thể xảy ra hay không và theo các điều kiện nào là hai
câu hỏi mà tổ chức tiêu chuẩn thông tin quốc gia, hội đồng về thư viện và tài nguyên
thông tin và RLG bảo trợ “Hội thảo về dữ liệu đặc tả ảnh” vào tháng 4 năm 1999. Mục
đích của hội thảo là mở đầu một nỗ lực hợp tác nhằm xác định tập hợp các phần tử dữ liệu
đặc tả để tài liệu hóa các thuộc tính kỹ thuật của ảnh tĩnh số. Các nhà tổ chức hội thảo
thấy rằng các viện văn hóa tập trung chủ yếu vào việc xác định các dữ liệu đặc tả mô tả
nhằm mục đích khám phá và định danh, công việc tương đối nhỏ đó được hoàn thành để
hệ thống hóa các thuộc tính kỹ thuật của các ảnh kỹ thuật số và việc sản xuất. Người tham
gia hội thảo nhất trí rằng dữ liệu đặc tả kỹ thuật cần thiết để hỗ trợ hai mục tiêu cơ bản:
nhằm tài liệu hóa lịch sử và nguồn gốc ảnh (dữ liệu đặc tả sản xuất); và nhằm đảm bảo
rằng dữ liệu ảnh sẽ được trả lại đầu ra một cách chính xác (màn hình, máy in hoặc phim).
Một số người tham gia cũng quan sát rằng việc quản lý đang diễn ra hoặc “việc bảo quản”
của các chức năng lõi này sẽ yêu cầu xây dựng các ứng dụng nhằm kiểm tra tính hợp lệ,
xử lý, làm mới và di chuyển ảnh dựa vào các tiêu chí đã mã hóa như dữ liệu đặc tả kỹ
thuật. Hai mục đích bao quát giúp cho NISO xây dựng từ điển dữ liệu này. Đầu tiên là
định danh các phần tử dữ liệu được sử dụng bởi các ứng dụng nhằm kiểm soát các phép
biến đổi của hình ảnh dựa vào hệ mét cho các thuộc tính chất lượng như là âm lượng, màu
sắc và kích cỡ. Thứ hai là đề xuất các phần tử được các nhà quản lý, người phụ trách hoặc
các chuyên gia về ảnh kỹ thuật số sử dụng nhằm đánh giá giá trị hiện thời (có thẩm mỹ
hoặc có chức năng) của hình ảnh hoặc bộ ảnh.
3.1.6
Dữ liệu đặc tả theo tiêu chuẩn ISO 15836.
Bộ phần tử dữ liệu đặc tả Dublin Core là một chuẩn đề cập đến việc mô tả tài nguyên
thông tin liên lĩnh vực. Ở đây, tài nguyên thông tin được định nghĩa là các thông tin được
định danh. Đây là định nghĩa được sử dụng trong chuẩn Internet RFC 2396, “các thẻ định
danh tài nguyên thống nhất (URI): Cú pháp chung” do Tim Berners-Lee và cộng sự phát
triển. Đối với các ứng dụng Dublin Core, tài nguyên thông tin là một tài liệu điện tử. Tiêu
chuẩn này chỉ áp dụng cho bộ phần tử được sử dụng chung trong các ứng dụng hoặc dự án
cụ thể. Các chính sách, yêu cầu của cộng đồng và địa phương khác nhau có thể áp đặt
thêm một số giới hạn, quy tắc và cách thông dịch. Tiêu chuẩn này không định nghĩa chi
tiết tiêu chí mà bộ phần tử được sử dụng trong các ứng dụng và dự án cụ thể. Tiêu chuẩn
này thay thế cho chuẩn RFC 2413, đây là phiên bản phát hành đầu tiên về Dublin Core.
Trong các mô tả phần tử, mỗi phần tử có một nhãn mô tả nhằm truyền đạt sự am hiểu ngữ
nghĩa về phần tử và mỗi phần tử còn có một tên duy nhất, gồm một từ mà máy có thể hiểu
34
được, dùng để tạo ra đặc tả cú pháp của các phần tử đơn giản hơn trong lược đồ mã hóa.
Tuy nhiên trong một vài môi trường, như HTML, không phân biệt dạng chữ hoa và chữ
thường thì việc tuân thủ các quy ước về tên các phần tử là cách tốt nhất nhằm tránh xung
đột khi dữ liệu đặc tả được trích dẫn hoặc chuyển đổi sang các môi trường có sự phân biệt
chữ hoa, chữ thường, như XML (Ngôn ngữ đánh dấu mở rộng). Mỗi phần tử là tùy chọn
và có thể lặp lại. Các phần tử dữ liệu đặc tả có thể xuất hiện ở mọi thứ tự. Việc sắp xếp
theo thứ tự số lần xuất hiện của một phần tử (ví dụ: tác giả) có ý nghĩa đối với nhà cung
cấp, nhưng không đảm bảo các phần tử được duy trì trong mỗi hệ thống. 9 Để thúc đẩy
tính tương tác toàn cầu, một số mô tả phần tử nên có một từ điển đối với các giá trị phần
tử tương ứng. Điều này được giả định rằng các từ vựng được kiểm soát khác sẽ được phát
triển về tính tương tác trong các miền cục bộ nào đó. Các phần tử gồm có: 1. Tiêu đề: Tên
được đặt cho một tài nguyên. Thông thường, Tiêu đề được hiểu là tên chính thức của một
tài nguyên. 2. Tác giả: Một thực thể trách nhiệm chính là tạo ra nội dung cho tài nguyên.
Thông thường, tên của tác giả nên được sử dụng để định danh thực thể này. 3. Chủ đề:
Một chủ điểm nội dung của tài nguyên. Thông thường, Chủ đề được thể hiện là các từ
khóa, cụm từ khóa, hoặc các mã phân loại mô tả chủ điểm của tài nguyên. Cách tốt nhất
được khuyến cáo là lựa chọn một giá trị từ một từ vựng được kiểm soát hay từ một lược
đồ phân loại chính thức. 4. Mô tả: Mô tả nội dung của tài nguyên. Các ví dụ về mô tả bao
gồm, nhưng không chỉ như vậy, một tóm tắt, mục lục, tham chiếu đến nội dung của tài
liệu bằng đồ họa, văn bản. 5. Nhà phát hành: Thực thể có trách nhiệm tạo ra tài nguyên
thông tin sẵn sàng để sử dụng. Thông thường, tên của nhà phát hành nên được sử dụng để
chỉ ra thực thể đó. 6. Người đóng góp: Thực thể có trách nhiệm đóng góp vào nội dung
của tài nguyên thông tin đó. Thông thường, tên của người đóng góp nên được sử dụng để
chỉ ra thực thể đó. 7. Ngày tháng: Ngày tháng của sự kiện trong vòng đời của tài nguyên.
Thông thường, Ngày tháng là ngày tạo ra tài nguyên hoặc ngày tài nguyên sẵn sàng sử
dụng. Cách tốt nhất được khuyến cáo đối với việc mã hóa giá trị ngày tháng được xác
định trong một hồ sơ theo TCVN ISO 8601:2004 [W3CDTF] và bao gồm ngày tháng theo
dạng YYYY-MM-DD. 8. Kiểu: Bản chất hoặc dạng nội dung của tài nguyên. Kiểu bao
gồm các thuật ngữ mô tả các danh mục phân loại chung, các chức năng, các dạng hoặc các
mức kết hợp nội 10 dung. Cách tốt nhất được khuyến cáo để chọn một giá trị từ một từ
vựng được kiểm soát (ví dụ, từ vựng kiểu DCMI [DCT]). Để mô tả biểu thị dạng vật lý
hoặc dạng số của tài nguyên, sử dụng phần tử định dạng. 9. Định dạng: Biểu thị dạng vật
lý hoặc số của tài nguyên. Thông thường, định dạng bao gồm kiểu phương tiện hoặc các
kích cỡ của tài nguyên. Định dạng được sử dụng để định danh phần mềm, phần cứng,
35
hoặc thiết bị cần thiết khác dùng cho việc điều hành hoặc hiển thị. Các ví dụ về kích thước
bao gồm kích cỡ và khoảng thời gian. Cách tốt nhất được khuyến cáo là lựa chọn giá trị từ
một từ vựng được kiểm soát (ví dụ, danh sách các kiểu phương tiện Internet (Internet
Media Types [MIME]) định nghĩa các định dạng môi trường máy tính). 10. Thẻ định
danh: Tham chiếu đến tài nguyên thông tin trong ngữ cảnh cụ thể. Cách tốt nhất được
khuyến cáo là định danh tài nguyên bằng một chuỗi hoặc số phù hợp với hệ thống định
danh chính thức. Hệ thống định danh chính thức bao gồm nhưng không hạn chế đối với
thẻ định danh tài nguyên thông tin thống nhất (URI) (gồm người quy định tài nguyên
thống nhất (URL), thẻ định danh đối tượng dạng số (DOI), và mã số sách tiêu chuẩn quốc
tế ( (ISBN)). 11. Nguồn: Tham chiếu đến một tài nguyên ở đó tài nguyên hiện tại được tạo.
Tài nguyên hiện tại có thể được lấy từ toàn bộ hoặc một phần tài nguyên gốc. Cách tốt
nhất được khuyến cáo là định danh tài nguyên được tham chiếu bởi chuỗi hoặc bởi số phù
hợp với hệ thống định danh chính thức. 12. Ngôn ngữ: Ngôn ngữ mô tả nội dung tri thức
của tài nguyên. Cách tốt nhất là sử dụng RFC 3066 kết hợp với ISO 639 [ISO639], định
nghĩa các thẻ ngôn ngữ chính gồm hai và ba chữ cái cùng với các thẻ nhỏ tùy chọn. 13.
Quan hệ: Tham chiếu đến tài nguyên có liên quan. Cách tốt nhất được khuyến cáo là định
danh tài nguyên được tham chiếu bằng chuỗi hoặc số phù hợp với hệ thống định danh
chính thức.
3.1.7 Các dữ liệu đặc tả theo tiêu chuẩn ISO 23081.
ISO 23081 lập một khuôn khổ cho việc tạo, quản lý và sử dụng dữ liệu đặc tả quản lý hồ
sơ và giải thích các nguyên tắc chi phối chúng. Tiêu chuẩn này là một hướng dẫn để hiểu
biết, thực hiện và sử dụng dữ liệu đặc tả trong khuôn khổ ISO 15489. Nó đề cập đến sự
liên quan của dữ liệu đặc tả quản lý hồ sơ trong quá trình kinh doanh và các vai trò và các
loại dữ liệu đặc tả khác nhau để hỗ trợ các quy trình quản lý kinh doanh và hồ sơ. Nó cũng
đặt ra một khuôn khổ để quản lý các dữ liệu đặc tả.
Tiêu chuẩn bao gồm các nguyên tắc làm nền tảng và chi phối dữ liệu đặc tả quản lý hồ sơ.
Những nguyên tắc này áp dụng cho: - Các hồ sơ và các dữ liệu đặc tả của chúng - Tất cả
các quá trình ảnh hưởng đến chúng - Tất cả các hệ thống mà chúng cư trú - Bất kỳ tổ chức
có trách nhiệm quản lý chúng.
Quản lý dữ liệu đặc tả là một phần không thể tách rời của quản lý hồ sơ, phục vụ một loạt
các chức năng và mục đích. Trong bối cảnh quản lý hồ sơ, dữ liệu đặc tả được định nghĩa
là dữ liệu mô tả bối cảnh, nội dung và cấu trúc của hồ sơ và quản lý chúng thông qua thời
gian. Như vậy, dữ liệu đặc tả là thông tin có cấu trúc hoặc bán cấu trúc cho phép sự sáng
36
tạo, đăng ký, phân loại, truy cập, bảo quản và huỷ bỏ các hồ sơ qua thời gian và giữa các
lĩnh vực. Mỗi lĩnh vực này đại diện cho một tài sản trí tuệ, hoạt động xã hội và tổ chức với
một nhóm đặc biệt hoặc hạn chế những người chia sẻ các giá trị và kiến thức nhất định.
Dữ liệu đặc tả quản lý hồ sơ có thể được sử dụng để xác định, xác thực và bối cảnh hồ sơ
và tác nhân, quy trình và hệ thống tạo, quản lý, duy trì và sử dụng chúng và các chính sách
chi phối chúng.
Ban đầu, dữ liệu đặc tả xác định bản ghi tại thời điểm nắm bắt, sửa chữa các bản ghi trong
bối cảnh kinh doanh và thiết lập kiểm soát quản lý trên nó. Trong sự tồn tại của hồ sơ
hoặc các tổ hợp của chúng, các lớp mới của dữ liệu đặc tả sẽ được thêm vào vì mục đích
sử dụng mới trong bối cảnh kinh doanh hoặc sử dụng khác. Điều này có nghĩa là dữ liệu
đặc tả tiếp tục tích luỹ, theo thời gian, thông tin liên quan đến bối cảnh của quản lý hồ sơ
và quy trình kinh doanh, trong đó hồ sơ được sử dụng và liên quan đến thay đổi cấu trúc
để ghi lại hoặc xuất hiện của nó. Dữ liệu đặc tả có thể được nguồn gốc hoặc tái sử dụng
bởi nhiều hệ thống và đa mục đích. Dữ liệu đặc tả áp dụng cho các hồ sơ trong vòng đời
của chúng cũng có thể tiếp tục áp dụng khi chúng không còn được yêu cầu cho mục đích
kinh doanh hiện tại nhưng được giữ lại để nghiên cứu hoặc vì các giá trị khác.
Dữ liệu đặc tả đảm bảo tính xác thực, độ tin cậy, khả năng sử dụng và tính toàn vẹn theo
thời gian và cho phép quản lý và hiểu biết các đối tượng thông tin, dù đây là vật lý, tương
tự hoặc kỹ thuật số. Tuy nhiên, dữ liệu đặc tả cũng cần phải được quản lý. Quản lý hồ sơ
luôn luôn liên quan đến việc quản lý dữ liệu đặc tả. Tuy nhiên, môi trường kỹ thuật số đòi
hỏi phải có một biểu hiện khác nhau của yêu cầu truyền thống và cơ chế khác nhau để xác
định, chụp, gán và sử dụng dữ liệu đặc tả. Trong môi trường kỹ thuật số, hồ sơ có thẩm
quyền luôn được đi kèm với dữ liệu đặc tả xác định các đặc tính quan trọng của chúng.
Những đặc điểm này phải được ghi nhận một cách rõ ràng hơn là tiềm ẩn như trong một
số quy trình trên giấy. Trong môi trường kỹ thuật số, đó là điều cần thiết để đảm bảo rằng
việc tạo lập và nắm bắt các dữ liệu đặc tả quản lý hồ sơ được thực hiện trong các hệ thống
tạo lập, nắm bắt và quản lý hồ sơ. Ngược lại, môi trường kỹ thuật số thể hiện những cơ
hội mới để xác định và tạo ra dữ liệu đặc tả phản ánh hồ sơ. Những hồ sơ này có thể là
bằng chứng của các giao dịch hoặc bản thân là các giao dịch.
Dữ liệu đặc tả hỗ trợ quản lý hồ sơ và kinh doanh có mục đích:
- Bảo vệ các hồ sơ làm bằng chứng và đảm bảo khả năng tiếp cận và khả năng sử dụng
của chúng thông qua thời gian;
37
- Tạo điều kiện cho khả năng hiểu hồ sơ;
- Hỗ trợ và đảm bảo giá trị bằng chứng của hồ sơ;
- Giúp đảm bảo tính xác thực, độ tin cậy và tính toàn vẹn của hồ sơ;
- Hỗ trợ và quản lý truy cập, bảo mật và quyền;
- Hỗ trợ phục hồi hiệu quả;
- Hỗ trợ chiến lược hoạt động tương tác bằng cách cho phép thu nhận các bản ghi được
tạo ra trong môi trường kỹ thuật và kinh doanh đa dạng;
- Cung cấp liên kết hợp lý giữa hồ sơ và bối cảnh sáng tạo chúng và duy trì chúng dưới
cách thức có cấu trúc, đáng tin cậy và có ý nghĩa;
- Hỗ trợ việc xác định các môi trường công nghệ, trong đó hồ sơ kỹ thuật số được tạo ra
hoặc nắm bắt và quản lý môi trường công nghệ, trong đó chúng được duy trì theo thứ tự
hồ sơ xác thực có thể được sao chép;
- Hỗ trợ hiệu quả và thành công di chuyển các bản ghi từ một môi trường này đến môi
trường khác.
Tiêu chuẩn ISO 23081 cung cấp nhân tố căn bản cho dữ liệu đặc tả để quản lý hồ sơ trong
các tổ chức, mô hình khái niệm cho các dữ liệu đặc tả và một bộ phần tử cấp cao của các
loại dữ liệu đặc tả chung phù hợp với bất kỳ môi trường các hồ sơ bao gồm, tài liệu hay
việc triển khai quản lý và lưu trữ hồ sơ. Nó định nghĩa các loại dữ liệu đặc tả chung cho cả
thực thể hồ sơ và các thực thể khác cần thiết cho việc quản lý tài liệu và hiểu về ngữ cảnh
hồ sơ. Tiêu chuẩn cũng xác định một số lượng tối thiểu các tổ hợp. được yêu cầu cho mục
đích tương thích. Các mô hình và các loại dữ liệu đặc tả chung được nêu trong ISO 23081
chủ yếu tập trung vào các thực thể hồ sơ. Tuy nhiên, chúng cũng có liên quan đến các đối
tượng khác. Tiêu chuẩn xác định các kiểu chung của dữ liệu đặc tả được yêu cầu để thực
hiện các yêu cầu quản lý hồ sơ. Cách tiếp cận này cung cấp cho các tổ chức với sự linh
hoạt để chọn dữ liệu đặc tả cụ thể để đáp ứng yêu cầu kinh doanh, để quản lý hồ sơ khi
được yêu cầu. Nó cung cấp sơ đồ để xác định các yếu tố dữ liệu đặc tả có thể được định
nghĩa trong một thực hiện cụ thể và dữ liệu đặc tả có thể áp dụng cho mỗi tổ hợp của thực
thể. Nó thừa nhận rằng những thực thể có thể tồn tại ở các lớp khác nhau của tổ hợp. Nó
định nghĩa các loại dữ liệu đặc tả chung được dự kiến sẽ áp dụng ở tất cả các lớp tổ hợp,
trong khi cảnh báo người thực hiện các yếu tố dữ liệu đặc tả cụ thể mà chỉ có thể áp dụng
ở các lớp cụ thể của tổ hợp. Tiêu chuẩn ISO 23081 thiết lập một khuôn khổ để xác định
38
các yếu tố dữ liệu đặc tả phù hợp với các nguyên tắc quản lý và lưu trữ dữ liệu. Mục đích
của khuôn khổ này là:
- Cho phép mô tả tiêu chuẩn hóa các hồ sơ và các tổ chức theo ngữ cảnh đối với các hồ sơ,
- Cung cấp hiểu biết chung về các điểm cố định của tập hợp để cho phép khả năng tương
tác của các hồ sơ và thông tin liên quan đến hồ sơ giữa các tổ chức
- Cho phép tái sử dụng và tiêu chuẩn của dữ liệu đặc tả để quản lý hồ sơ theo thời gian,
không gian và trên các ứng dụng.
Nó tiếp tục xác định một số điểm quyết định cần phải được giải quyết và tài liệu để cho
phép thực hiện các dữ liệu đặc tả để quản lý hồ sơ.
Nó nhằm mục đích:
- Xác định những vấn đề cần được giải quyết trong việc thực hiện dữ liệu đặc tả để quản
lý hồ sơ,
- Xác định và giải thích những lựa chọn khác nhau để giải quyết các vấn đề,
- Xác định các cách khác nhau để đưa ra quyết định và các tùy chọn trong việc thực hiện
dữ liệu đặc tả để quản lý hồ sơ lựa chọn. Hệ thống được thiết kế để quản lý hồ sơ yêu cầu
dữ liệu đặc tả để hỗ trợ các quy trình quản lý hoặc lưu trữ hồ sơ. Một trong những ứng
dụng chính của dữ liệu đặc tả là đại diện cho các thực thể từ môi trường kinh doanh trong
hệ thống kinh doanh. Các thực thể hỗ trợ đối chiếu hồ sơ để hiểu về môi trường kinh
doanh nhưng chúng không phải lúc nào cũng nằm trong các đôi tượng hưu hình. Hình
dưới đây chỉ ra các mô hình thực sau: - Thực thể hồ sơ (các đơn vị tài liệu hay các tổ hợp
hồ sơ khác) - Thực thể tác nhân (người và tổ chức trong môi trường kinh doanh) - Thực
thể kinh doanh (các giao dịch kinh doanh)
3.1.8 Các dữ liệu đặc tả theo tiêu chuẩn tiêu chuẩn của Australia.
Tại Australia, tiêu chuẩn dữ liệu đặc tả trong công tác văn thư do Cục Lưu trữ quốc gia
Australia biên soạn và áp dụng cho các cơ quan nhà nước: hướng dẫn và mô tả chi tiết 26
thuộc tính cơ bản và 44 thuộc tính con của dữ liệu đặc tả.
Tiêu chuẩn này là một phiên bản sửa đổi hoàn toàn của Tiêu chuẩn dữ liệu đặc tả Lưu
trữ hồ sơ cho các cơ quan Khối liên hiệp Thịnh vượng chung phiên bản 1.0 (RMSCA),
được xuất bản bởi Cục lưu trữ quốc gia vào năm 1999. Nó được thiết kế để sử dụng như
một công cụ tham khảo cho các nhà quản lý cơ quan doanh nghiệp và hồ sơ, nhân viên
39
công nghệ thông tin và các nhà cung cấp phần mềm liên quan đến việc thiết kế, lựa chọn
và thực hiện quản lý hồ sơ điện tử và hệ thống kinh doanh.
Tại thời điểm phát hành tiêu chuẩn RMSCA năm 1999, cộng đồng lưu trữ hồ sơ Australia
đã thiết lập một khuôn khổ cấp cao nhằm tham chiếu, chỉ định và chuẩn hóa tiêu chuẩn dữ
liệu đặc tả lưu trữ. Dự án dữ liệu đặc tả lưu trữ hồ sơ SPIRIT, đứng đầu là trường đại học
Monash đã phát triển phương pháp tiếp cận đa thực thể đầu tiên cho dữ liệu đặc tả lưu trữ
hồ sơ. Cục Lưu trữ Quốc gia là một đối tác công nghiệp trong dự án này. Các kết quả của
dự án SPIRIT đã được công bố trực tuyến vào năm 2000.
Cục Lưu trữ Quốc gia phát hành tiêu chuẩn RMSCA vào năm 1999, trước khi kết thúc dự
án SPIRIT vì những yêu cầu rõ ràng cho một tiêu chuẩn dữ liệu đặc tả lưu trữ hồ sơ để
hướng dẫn các cơ quan Chính phủ Australia và các nhà cung cấp trong việc phát triển hệ
thống quản lý hồ sơ điện tử. Cụ thể hơn, tiêu chuẩn năm 1999 phù hợp với khuôn khổ dự
án SPIRIT và mục tiêu là để phát hành các phiên bản tiếp theo của tiêu chuẩn với cách
tiêp cận đa thực thể.
Từ năm 2000, việc nghiên cứu về dữ liệu đặc tả cho lưu trữ hồ sơ vẫn được tiếp tục cả
trong cộng đồng ISO và cộng đồng tiêu chuẩn Australia. Công việc này, trong đó Cục Lưu
trữ quốc gia có liên quan, đã đem đến kết quả là 2 tiêu chuẩn AS ISO 23081: Dữ liệu đặc
tả cho hồ sơ – Nguyên tắc và Dữ liệu đặc tả cho hồ sơ – Các vấn đề khái niệm và thực
hiện. Những tiêu chuẩn ISO này được dựa trên cách tiếp cận đa thực thể và ảnh hưởng
quan trọng đến việc phát triển phiên bản tiêu chuẩn lưu trữ mới.
Cần nhấn mạnh thêm là ở phạm vi rộng còn có tiêu chuẩn dữ liệu đặc tả do các cơ quan
lưu trữ các bang New South Wales biên soạn năm 2000, khu vực Nam Australia năm
2003 và bang Queensland năm 2008. Tất cả các tiêu chuẩn này dựa trên việc tiếp cận mô
hình ba thực thể của dự án SPIRIT.
Cục Lưu trữ quốc gia Australia phát triển dự thảo ban đầu của Bộ tiêu chuẩn siêu dữ
liệu lưu trữ dữ liệu Chính phủ Australia (AGRMS). Từ cuối năm 2007, Cục Lưu trữ quốc
gia Australia phối hợp với Cục Lưu trữ New Zealand hoàn chỉnh Bộ tiêu chuẩn
dữ liệu đặc tả lưu trữ dữ liệu Chính phủ Australia phiên bản 2.0 để đáp ứng với thông tin
phản hồi từ các bên liên quan ở cả hai vùng lãnh thổ.
AGRMS mô tả các thông tin về hồ sơ và bối cảnh mà các hồ sơ được thu nhận và sử dụng.
Đây là thông tin mà Cục lưu trữ quốc gia đề nghị được lấy trong hệ thống kinh doanh
được sử dụng bởi các cơ quan chính phủ Úc để tạo ra và thu nhận hồ sơ. Tiêu chuẩn này
40
phù hợp với các tiêu chuẩn của Australia về quản lý hồ sơ (AS ISO 15489) và dữ liệu đặc
tả cho hồ sơ (AS ISO 23081)
Tiêu chuẩn mới khác với tiêu chuẩn trước đó là nó được dựa trên một mô hình đa thực thể,
cho phép các mô tả về năm thực thể riêng biệt: Hồ sơ, Tác nhân, Kinh doanh, Ủy quyền
và Quan hệ. Nó định nghĩa một cẩu trúc cơ bản gồm 26 thuộc tính dữ liệu đặc tả và thêm
44 phụ thuộc tính con có thể được sử dụng để mô tả các
thực thể.
Tiêu chuẩn này được thiết kế chủ yếu để sử dụng trong quản lý hồ sơ và hệ thống kinh
doanh điện tử. Nhiều khái niệm của nó cũng được áp dụng cho môi trường quản lý hồ sơ
trên giấy truyền thống hoặc hồ sơ hỗn hợp vẫn được sử dụng bởi các cơ quan.
Tiêu chuẩn này liên quan đến quá trình thiết kế và vận hành hệ thống công nghệ thông tin
trong đó có việc tạo lập và quản lý dữ liệu, bao gồm cả các hệ thống quản lý hồ sơ và tài
liệu điện tử (eDRMS) và đánh giá các hệ thống công nghệ thông tin để xác định quy tắc
lưu trữ dữ liệu. Trọng tâm của các tiêu chuẩn kỹ thuật đối với dữ liệu đặc tả cần thiết cho
quá trình quản lý dữ liệu. Dữ liệu đặc tả cấu trúc và lưu trữ có thể được yêu cầu để bảo
quản lâu dài hồ sơ điện tử.
Dữ liệu đặc tả lưu trữ dữ liệu là một công cụ cơ bản để nắm bắt và quản lý hồ sơ đầy đủ
và chính xác. Bộ tiêu chuẩn và hướng dẫn này trình bày chi tiết các yêu cầu đối với dữ
liệu đặc tả lưu trữ dữ liệu và tư vấn cho các cơ quan công quyền về việc thực hiện.
Dữ liệu đặc tả là dữ liệu mô tả các nguồn thông tin. Nó cho phép người dùng tìm kiếm các
nguồn thông tin và giúp họ xác định xem dữ liệu hoặc thông tin sẽ đáp ứng nhu cầu của
họ. Dữ liệu đặc tả cũng hỗ trợ các nhà quản lý và người sử dụng hiểu, tải về, hiển thị, di
chuyển, sử dụng, kiểm soát, phục hồi dữ liệu và thông tin.
3.2 Lựa chọn tài liệu tiêu chuẩn
Qua phân tích và so sánh các tiêu chuẩn ở Điều 3.1, căn cứ trên nhu cầu mục tiêu của dự
án, nhóm soạn thảo đã lựa chọn các phần nội dung trong các tài liệu đã thu thập: ISO/TR
23081-1:2006, ISO 19104, ISO 19115 và ISO/IEC 19775-1. Lựa chọn các phần nội dung
phù hợp với nhu cầu nội dung của từng phần dự thảo.
Số hóa đã và đang bùng nổ, thị trường cho lĩnh vực này rất lớn và tiềm năng. Các
doanh nghiệp cũng như các cơ quan nhà nước, thư viện, trường đại học… cũng đã có
những giải pháp dịch vụ, quy trình cho việc số hóa tài liệu. Tuy nhiên để hiệu quả và
chuẩn xác thì việc xây dựng tiêu chuẩn quy trình số hóa là việc làm cần thiết. Quy
41
trình số hóa cần tuân theo các tiêu chuẩn quốc tế đồng thời cũng phải có những điều
chỉnh nhất định để phù hợp với yêu cầu cũng như hoàn cảnh tại Việt Nam.
Sau khi rà soát, nghiên cứu các tiêu chuẩn của quốc tế và quốc gia về quy trinh số hóa
văn bản chúng tối nhận thấy:
Tại Việt Nam các bước cho quy trình số hóa cũng đã được Cục Văn Thư Lưu Trữ đưa
vào quyết định số 176/QĐ – CVTLT, trong đó đề cập tới 12 bước. Tuy nhiên tại Việt
Nam chưa có ban hành Tiêu Chuẩn Việt Nam nào cho Quy Trình Số Hóa văn bản.
Qua phân tích và so sánh các tiêu chuẩn ở Điều 3.1, căn cứ trên nhu cầu mục tiêu của
dự án, nhóm soạn thảo đã lựa chọn các phần nội dung trong các tài liệu đã thu thập:
ISO 19115-2:2009, ISO/TR 13028:2010, Digiitization standard process num
A000015, Thông tư số 26/2014/TT-BTNMT. Lựa chọn các phần nội dung phù hợp
với nhu cầu nội dung của từng phần dự thảo. Cụ thể như sau:
—Về bộ khung sườn của quy trình số hóa dữ liệu: tham khảo ISO 13028 : 2010
Information and documentation - Implementation guidelines for digitization of
records (Thông tin và tư liệu – Hướng dẫn thực hiện đối với số hóa bản ghi);
—Về các bước tổ chức, thực hiện: tham khảo Quyết định số 176/QĐ-VTLTNN
ngày 21/10/2011 của Cục Văn thư và Lưu trữ Nhà nước đặt ra quy trình số hóa
tài liệu lưu trữ; Thông tư số 26/2014/TT-BTNMT về Quy trình và định mức
kinh tế kỹ thuật xây dựng cơ sở dữ liệu tài nguyên môi trường; quy trình số hóa
“Digitization standard process num A000015 xuất bản ngày 23-04-2013” của
Chính phủ Alberta;
—Về các điều kiện, yêu cầu kỹ thuật: tham khảo - ISO 19115-1:2014 Geographic
information -- Metadata -- Part 1: Fundamentals (Thông tin địa lý – Dữ liệu đặc
tả – Phần 1: Nguyên tắc cơ bản) và ISO 19115-2:2009 Geographic information
-- Metadata -- Part 2: Extensions for imagery and gridded data (Thông tin địa lý
– Dữ liệu đặc tả – Phần 2: Mở rộng đổi với dữ liệu ảnh và dữ liệu lưới)
Tiêu chuẩn xây dựng mới đảm bảo phù hợp với các tiêu chuẩn quốc tế.
3.3 Hình thức xây dựng tiêu chuẩn
Tiêu chuẩn được xây dựng theo phương pháp chấp thuận áp dụng các quy định kỹ thuật
của tiêu chuẩn quốc tế. Nội dung của tiêu chuẩn quốc tế được chuyển thành nội dung của
Tiêu chuẩn kỹ thuâ ̣t quốc gia, có thay đổi bố cục và hình thức trình bày cho phù hợp với
42
hướng dẫn xây dựng quy chuẩn kỹ thuật theo thông tư 03/2011/TT-BTTTT “Quy định
hoạt động xây dựng quy chuẩn kỹ thuật quốc gia và tiêu chuẩn quốc gia thuộc Bộ Thông
tin và Truyền thông”
3.4 Phương pháp xây dựng tiêu chuẩn
Thông tư 03/2011/TT-BTTTT “Quy định hoạt động xây dựng quy chuẩn kỹ thuật
quốc gia và tiêu chuẩn quốc gia thuộc Bộ Thông tin và Truyền thông” do Bộ
Thông tin và Truyền thông ban hành ngày 04/01/2011.
Mức độ tương đương: tham khảo.
Phương pháp chấp nhận: xuất bản lại (biên dịch) có sửa đổi.
4 Nội dung tiêu chuẩn
4.1 Tên gọi tiêu chuẩn
TIÊU CHUẨN KỸ THUẬT VỀ QUY TRÌNH TẠO LẬP DỮ LIỆU SỐ 2D (SỐ HÓA,
TẠO LẬP METADATA CẤU TRÚC TRONG, METADATA MÔ TẢ DỮ LIỆU) - QUY
TRÌNH TẠO LẬP DỮ LIỆU ĐẶC TẢ
43
4.2 Bố cục tiêu chuẩn
Dự thảo tiêu chuẩn bao gồm các phần sau:
Lời nói đầu
1 Phạm vi áp dụng
2 Tài liệu viện dẫn
3 Thuật ngữ, Định nghĩa
4
Quy trình số hóa
5
Lên kế hoạch
6
Thiết kế mô hình và thử nghiệm
7
Tạo lập dữ liệu 2D
8
Biên tập dữ liệu 2D
9
Lập chỉ mục và dữ liệu đặc tả
10
11
Kiểm tra sản phẩm
Ghi nhật ký
12 Dữ liệu đặc tả trong quy trình số hóa
13 Quy trình thiết lập dữ liệu đặc tả cho dữ liệu 2D
13.1 Ước lượng yêu cầu và phân tích nội dung đối tượng
13.2 Biên tập các yêu cầu chức năng dữ liệu đặc tả
13.3 Thiết lập hệ thống dữ liệu đặc tả
13.4 Xây dựng dịch vụ và đánh giá
14 Lập danh mục liệt kê dữ liệu đặc tả cho dữ liệu 2D
15 Dữ liệu đặc tả cho đối tượng 2D cơ bản
15.1 Điểm (Point)
15.2 Đường (line)
15.3 Cung tròn (Arc)
15.4 Đường tròn (Circle)
15.5 Dạng đĩa (Disk)
16 Dữ liệu đặc tả mô tả đối tượng 2D
Phụ lục A (tham khảo) Dữ liệu đặc tả mô tả dạng ảnh
44
Phụ lục B Khuyến nghị đặt tên siêu dữ liệu tập tin
Phụ lục C Kiến nghị kiểm soát chất lượng
Phụ lục D Các kỹ năng yêu cầu đối với nhân viên
Thư mục tài liệu tham khảo
4.3 Bảng đối chiếu nội dụng dự thảo và các tài liệu tham khảo
Dư ̣
thảo
TCVN
ISO/TR
13028:20
10
ISO
191152:2008
Digitizati
on
Standard
Process
num
A000015
QT
CSDL
của Bộ
TNMT
ISO/TR
230811:2006;
ISO
19104
ISO/IEC
19775-1
Sửa đổi
bổ sung
1 Phạm
vi áp
dụng
Tự
xây
dựng
2 Tài
liệu
viện
dẫn
Tự
xây
dựng
3 Thuật
ngữ và
định
nghĩa
2.2
Definition
s of Terms
Tự
xây
dựng
4 Quy
trình
số hóa
5 Lên
kế
6.2Planni
hoạch ng
processes
6
Thiết
kế mô
hình và
thử
nghiệm
Chấp nhận
có sửa đổi
và
chọn
lọc
Nondigital
source
record
preparatio
n
Thiết kế
mô hình
45
Dư ̣
thảo
TCVN
7 Tạo
lập dữ
liệu 2D
8 Biên
tập dữ
liệu 2D
ISO/TR
13028:20
10
ISO
191152:2008
6.2.2
Selection
of
a
digitization
approach
6.2.3
Selection
of
technical
specificati
ons
6.2.4
Equipment
and
software
6.2.5
Enhancem
ent
technicque
s
Digitizati
on
Standard
Process
num
A000015
QT
CSDL
của Bộ
TNMT
ISO/TR
230811:2006;
ISO
19104
ISO/IEC
19775-1
Sửa đổi
bổ sung
Tổng hợp
và
điều
chỉnh cho
phù hợp
Image
capture
and
recapture
Preparatio
n
of
Original
Document
s
2.5 Biên
tập
dữ
liệu 2D
46
Thay đổi
cho phù
hợp yêu
cầu
Dư ̣
thảo
TCVN
ISO/TR
13028:20
10
ISO
191152:2008
9 Lập
chỉ
mục –
Dữ
liệu
đặc tả
6.3.4:
Metadata
6.3.4.2:
Imagelever
metadata
3.
Metadata
Digitizati
on
Standard
Process
num
A000015
QT
CSDL
của Bộ
TNMT
ISO/TR
230811:2006;
ISO
19104
ISO/IEC
19775-1
Sửa đổi
bổ sung
5
Indexing
and
metadata
6.3.4.2:
Businesspr
ocess
digitization
metadata
cosideratio
ns
6.3.4.3:
Digitizatio
n projects
metadata
cosideratio
ns
10
Kiểm
tra sản
phẩm
11 Ghi
nhật ký
6.3.2:
Digitized
records
managem
ent
6.3.5:
Quality
control
8:
Records
Managem
ent
Requirem
ents
9: Quality
control
6.2.5.5:
Storage
media
2.6 Kiểm
tra
sản
phẩm
10
Logging
47
Tổng hợp
và
điều
chỉnh cho
phù hợp
Thư mục tài liêụ tham khảo
Tài liệu Việt Nam
TCVN 5453:2009: Thông tin và tư liệu. Từ vựng.
TCVN 7420-1:2004: Thông tin và tư liệu. Quản lý hồ sơ. Phần 1: Tổng quát chung.
TCVN 7420-2:2004: Thông tin và tư liệu. Quản lý hồ sơ. Phần 2: Hướng dẫn.
Tài liệu nước ngoài
[1] ISO/TR 13028:2010, Information and documentation — Implementation
guidelines for digitization of records (Thông tin và tài liệu - hướng dẫn thực hiện cho
việc số hóa hồ sơ)
[2] ISO/TR 15489-1:2001, Information and documentation — Records management
— Part 1: General (Thông tin và tài liệu – Quản lý hồ sơ - Phần 1: Tổng quát)
[3] ISO/TR 15489-2:2001, Information and documentation — Records management
— Part 2: Guidelines (Thông tin và tài liệu – Quản lý hồ sơ - Phần 2: Hướng dẫn)
[4] ISO/TR 23081-1:2006, Information and documentation — Records management
processes — Metadata for records — Part 1: Principles (Thông tin và tài liệu - Quy
trình quản lý hồ sơ - Siêu dữ liệu cho các hồ sơ - Phần 1: Nguyên tắc)
[5] ISO 23081-2:2009, Information and documentation — Managing metadata for
records — Part 2: Conceptual and implementation issues (Thông tin và tài liệu - Quản
lý siêu dữ liệu cho các hồ sơ - Phần 2: Những vấn đề khái niệm và thực hiện)
[6] ISO/TR 15801:2009, Document management — Information stored electronically
— Recommendations for trustworthiness and reliability (Quản lý tài liệu - Thông tin
lưu trữ điện tử - Khuyến nghị cho sự tin cậy và độ tin cậy)
[7] ISO 29861:2009, Document management applications — Quality control for
scanning office documents in colour (Ứng dụng quản lý tài liệu - Kiểm soát chất lượng
cho các tài liệu văn phòng quét màu)
[8] IEC 82045-2:2004, Document management — Part 2: Metadata elements and
information reference model (Quản lý tài liệu - Phần 2: Nguyên tố Siêu dữ liệu và mô
hình tham khảo thông tin)
48
[9] Digitization standard process num A000015 (Quy trình tiêu chuẩn số hóa
A000015)
[10] Digitization Technical Requirements Standard A000013 (Yêu cầu tiêu chuẩn kỹ
thuật số hóa A0000013)
[11] CAN/CGSB-72.11-93ISO 19115-1:2014 Geographic information -- Metadata -Part 1: Fundamentals
ISO 19115-2:2009 Geographic information -- Metadata -- Part 2: Extensions for
imagery and gridded data
ISO/TR 13028:2010 Information and documentation - Implementation guidelines for
digitization of records
Digitization standard process num A000015, 01-03-2013 Government of Alberta
-----------------------------------------------------------------------------
49
Download