Bảo quản tài liệu điện tử (3 năm trước)
> Tin tức > Ngành văn thư lưu trữ
Việc lưu trữ các tài liệu điện tử trình bày một số vấn đề: Sự lỗi thời của công nghệ, sự phụ thuộc vào phần mềm, sự suy giảm của phương tiện lưu trữ được coi là đặc biệt khó khăn. Mặc dù một cách tiếp cận duy nhất để giải quyết những vấn đề này vẫn chưa được phát triển, nhưng có những chiến lược và cách thức để đảm bảo sự an toàn và khả năng tiếp cận của các tài liệu điện tử.
Tính đặc hiệu của các tài liệu điện tử nằm trong thực tế là chúng có sẵn để đọc chỉ với sự hiện diện của một số phần mềm và thiết bị kỹ thuật nhất định. Do đó, khi phần mềm và / hoặc phần cứng trở nên lỗi thời (và điều này xảy ra rất nhanh), các tài liệu điện tử có thể không sử dụng được.
Để đảm bảo sự an toàn và tính sẵn có của các tài liệu điện tử, cần chuyển định kỳ chúng sang phần mềm và phần cứng mới hơn. Đồng thời, cần thiết phải xác thực tính xác thực của nội dung, cấu trúc và bối cảnh, để đảm bảo sự an toàn của siêu dữ liệu đi kèm và kiểm soát các giao thức của các quá trình hệ thống. Ngoài ra, để đảm bảo việc lưu giữ thông tin được ghi lại, lựa chọn đúng nhà cung cấp - phương tiện lưu trữ - cũng như việc tạo ra một môi trường được kiểm soát (các điều kiện tương ứng) để lưu trữ các tài liệu điện tử có tầm quan trọng đặc biệt.
Khi xác định các tính năng của lưu trữ tài liệu, cần phải tính đến, ví dụ, khối lượng và tăng trưởng số lượng tài liệu, mẫu sử dụng, mức độ sẵn có của tài liệu, đặc điểm vật lý, chi phí lưu trữ.
Giống như tài liệu giấy, tài liệu điện tử đòi hỏi sự phát triển của một chiến lược an ninh dài hạn (10 năm hoặc hơn), sự củng cố tiêu chuẩn của nó trong các tài liệu chính của tổ chức. Có thể có một số chiến lược như vậy.
Sáng tạo "bảo tàng máy tính"
Để đảm bảo sự an toàn và khả năng tiếp cận của các tài liệu điện tử và sự hình thành của chúng trên các thiết bị gốc, thiết bị này phải được bảo quản và duy trì trong điều kiện làm việc, tạo ra các “bảo tàng”. Một chiến lược đề xuất việc tạo ra “bảo tàng” của các thiết bị và phần mềm lỗi thời cho việc tái tạo tài liệu trên thiết bị gốc được hầu hết các chuyên gia công nhận là không thực tế và quá đắt. Việc giữ một số lượng lớn phần cứng và phần mềm đã lỗi thời không đảm bảo rằng phần mềm này sẽ hoạt động vào đúng thời điểm, nếu cần.
Chiến lược giả lập
Chiến lược này liên quan đến việc tái tạo các định dạng tài liệu lỗi thời bằng cách sử dụng phần mềm giả lập trong môi trường máy tính mới. Trong trường hợp này, theo GOST 15971-90. “Hệ thống xử lý thông tin. Các thuật ngữ và định nghĩa” hiểu sự bắt chước chức năng của một thiết bị bằng một thiết bị hoặc thiết bị khác của máy tính, trong đó thiết bị mô phỏng cảm nhận cùng một dữ liệu, chạy cùng một chương trình và đạt được kết quả tương tự như mô phỏng.
Các nhà lưu trữ xem xét chiến lược này không thực tế và không hiệu quả, vì nó nhằm bảo vệ chức năng của hệ thống thông tin, chứ không phải là tài liệu làm bằng chứng. Sự cần thiết phải tạo ra các chương trình giả lập cũng làm cho nó đắt tiền.
Sao chép tài liệu điện tử
Chiến lược tạo bản sao các tài liệu điện tử trên giấy hoặc vi phim được hầu hết các nhà lưu trữ coi là có thể áp dụng cho một số ứng dụng phần mềm hạn chế. Nó có thể được sử dụng nếu thông tin tồn tại ở định dạng độc lập với phần mềm hoặc dưới dạng các tệp của một cấu trúc đơn giản đồng nhất. Và nó không thích hợp để bảo tồn các đối tượng số phức tạp trong các hệ thống phức tạp, vì nó có thể dẫn đến mất chức năng độc đáo của chúng (ví dụ, tính năng động, kết nối, phi tuyến, tích hợp).
Do đó, phần lớn các tài liệu web có thể được biểu diễn độc quyền dưới dạng số, vì nội dung của một trang thường là một phần tử thông tin được liên kết bằng các siêu liên kết và khi in một trang web trên giấy, tài sản độc đáo này bị mất.
Bài báo cho phép bạn lưu nội dung của tài liệu và tất cả thông tin cần thiết xác định hiệu lực pháp lý của tài liệu, nhưng làm phức tạp việc tìm kiếm và hệ thống hóa tài liệu.
Chuyển đổi định dạng chuẩn
Chiến lược này liên quan đến việc chuyển đổi tài liệu điện tử sang định dạng chuẩn hoặc định dạng mở để đảm bảo tính độc lập của tài liệu từ phần mềm. Các định dạng ưa thích cho các tài liệu hiện tại là SGML, XML, RTF. Chiến lược này, giống như tất cả những người khác, đang bị chỉ trích vì các định dạng đang trở nên lỗi thời. Ngoài ra, khi chuyển đổi có nguy cơ mất dữ liệu.
Tuy nhiên, hiện nay, hy vọng cao đang được kết hợp với việc sử dụng định dạng XML như một tiêu chuẩn cho việc trao đổi các tài liệu điện tử trong nhiều lĩnh vực hoạt động, đặc biệt là trong lĩnh vực hành chính công.
Di chuyển
Chiến lược phổ biến nhất hiện nay, được gọi là di cư. Bản chất của nó là các tài liệu điện tử (tài liệu kỹ thuật số) được chuyển định kỳ từ phần cứng và phần mềm này sang phần cứng và phần mềm khác hoặc từ thế hệ công nghệ máy tính này sang thế hệ công nghệ máy tính khác.
Ví dụ: tài liệu có thể được chuyển từ băng sang đĩa CD để đảm bảo tính sẵn có lâu dài của chúng. Đây là một chiến lược phức tạp, trong đó có thể mất đi cấu trúc và chức năng của tài liệu (mất mát và hư hỏng thông tin). Tuy nhiên, nó được công nhận là hợp pháp và cùng với chiến lược chuyển đổi tài liệu thành định dạng chuẩn, hứa hẹn nhất, mặc dù yêu cầu kiểm tra thử nghiệm bổ sung. Đặc biệt, chiến lược di chuyển tài liệu sang nền tảng công nghệ mới (nghĩa là sao chép tài liệu điện tử sang phương tiện lưu trữ mới và trong một số trường hợp chuyển đổi sang định dạng phù hợp với hệ thống máy tính mới) được khuyến nghị đảm bảo tính toàn vẹn của tài liệu điện tử của Hội đồng Lưu trữ Quốc tế.
Các cách để đảm bảo sự an toàn của tài liệu
Tiêu chuẩn quốc tế ISO 15489 thiết lập 3 cách để đảm bảo tính bảo mật của tài liệu:
• sao chép - tạo một bản sao giống hệt của một tài liệu trên cùng một sóng mang (giấy, vi sóng, sóng mang điện tử);
• Chuyển đổi sang phương tiện khác - chuyển tài liệu từ môi trường này sang môi trường khác (thay đổi dạng tài liệu) với bảo quản nội dung giống hệt với tài liệu gốc (ví dụ, vi phim tài liệu, bản Scan);
• Di cư - việc chuyển giao định kỳ các tài liệu điện tử từ phần cứng / phần mềm này sang phần cứng / phần mềm khác để đảm bảo khả năng sử dụng các tài liệu này trong tương lai.
Khi chuyển đổi, định dạng của tài liệu điện tử được thay đổi. Ví dụ, bạn có thể chuyển đổi một tài liệu được tạo ở định dạng Word Perfect, lưu nó ở định dạng RTF hoặc MS Word. Trong quá trình di chuyển, tài liệu điện tử được di chuyển từ một nền tảng phần mềm hoặc mạng di động sang một nền tảng phần mềm khác hoặc thứ hai mà không thay đổi định dạng. Ví dụ, bạn có thể di chuyển tài liệu từ đĩa mềm sang đĩa CD. Tuy nhiên, trong quá trình di chuyển, bạn có thể cần chuyển đổi tài liệu điện tử. Ví dụ: nếu bạn di chuyển tài liệu điện tử từ hệ điều hành Macintosh sang hệ điều hành Microsoft Windows, bạn cần chuyển đổi tài liệu điện tử thành định dạng mới (ví dụ: RTF hoặc một định dạng khác).
Trong trường hợp này, có ba loại lỗi chính phải được xem xét khi lưu trữ tài liệu điện tử:
1. Mất dữ liệu Khi dữ liệu bị mất đến một mức độ nhất định, nội dung của tài liệu cũng bị mất. Tài liệu điện tử trở nên lỗi và không đáng tin cậy.
2. Mất cấu trúc của một tài liệu điện tử. Ví dụ: khi chuyển đổi tài liệu văn bản thành RTF, bạn có thể mất một số tính năng của giao diện tài liệu.
3. Mất liên kết giữa dữ liệu (ví dụ: trong bảng tính, cơ sở dữ liệu) và / hoặc mất tính sẵn có của siêu dữ liệu được liên kết với tài liệu cũng làm cho tài liệu không đầy đủ.
Nó phải được lưu ý rằng một bản sao của một tài liệu có thể được công nhận hợp pháp như vậy chỉ khi nó được tạo ra một cách đã được chứng minh và là chính xác, đầy đủ và đáng tin cậy để sử dụng lâu dài.
Định dạng XML cho phép bạn chuyển các tài liệu điện tử từ một loại phần mềm và phần cứng này sang loại phần mềm và phần cứng khác mà không mất thông tin. Các nhà phát triển khái niệm chính phủ điện tử ở Liên minh châu Âu tin rằng các định dạng dựa trên XML mang lại lợi ích cho việc quản lý và cải thiện sự tương tác của chính phủ với các tổ chức và con người khác nhau, do đó các tổ chức chính phủ đặc biệt khuyến khích sử dụng tài liệu ở định dạng XML. Liên bang Nga đã thông qua việc chấp nhận Open XML như một tiêu chuẩn ISO / IEC 29500.
Khi giải quyết vấn đề đảm bảo sự an toàn của tài liệu điện tử không kém phần quan trọng hơn câu hỏi về chuyển đổi và / hoặc di chuyển, vấn đề nén tệp. Ưu điểm của việc nén tập tin là tiết kiệm dung lượng lưu trữ, chuyển tập tin nhanh hơn và dễ dàng hơn. Những bất lợi của việc nén tập tin là nó có thể dẫn đến mất dữ liệu. Ngoài ra, nó đòi hỏi việc sử dụng các chương trình nén tập tin phần mềm bổ sung, cũng có vấn đề về lỗi thời, đa phiên bản và sự phụ thuộc nền tảng.
Các khuyến nghị về lựa chọn phương pháp nén các hình ảnh điện tử của các tài liệu có tiêu chuẩn quốc tế ISO 12033.
Lưu trữ tài liệu email
Một số tin nhắn có thể và nên được in trên giấy. Điều này là cần thiết, ví dụ, trong trường hợp thông điệp là cơ sở để công bố một tài liệu khác - một tài liệu giấy, mà nó đang được hình thành. Nhưng nên lưu ý rằng các bản in như vậy không đầy đủ đối với tài liệu e-mail, vì e-mail chứa thông tin có thể ẩn trên màn hình và / hoặc bị mất khi sao chép tài liệu e-mail sang giấy. Ví dụ, không phải tất cả siêu dữ liệu tài liệu đều hiển thị trên màn hình và MS Outlook không cho phép in danh sách người nhận bản sao của thư từ trường Bcc trong tiêu đề thư hiển thị trên màn hình (cần in nó bằng chức năng PrintScreen). Do đó, trong nhiều trường hợp, bạn nên lưu trữ email ở định dạng mà chúng được tạo,
Ngoài ra, nếu thư được lưu trữ ở định dạng điện tử, bạn nên tổ chức bộ nhớ của mình, dựa trên bộ phân loại tài liệu của tổ chức (danh sách các trường hợp). Điều này sẽ giúp bảo vệ các liên kết giữa các tin nhắn e-mail và bất kỳ tài liệu liên quan khác của tổ chức, cả điện tử và giấy.
Trong thực tế, một số tổ chức đặt thời gian lưu giữ cố định cho thư e-mail với nhân viên (thường là 2-3 tháng), sau đó thư e-mail được chuyển sang bộ nhớ ngoài mạng hoặc bị hủy. Điều này dẫn đến thực tế là các tài liệu được gửi tới bộ nhớ không phải mạng được nhân đôi bởi các bản sao do nhân viên để lại để sử dụng sau này trong công việc hoặc các tài liệu email quan trọng bị mất vĩnh viễn. Rõ ràng là thời gian lưu giữ thư điện tử, cũng như bất kỳ tài liệu nào khác của tổ chức, phải phụ thuộc vào các chức năng và nội dung riêng lẻ, ngắn hoặc dài (và không phổ biến) và được ghi lại trong danh mục các công việc của tổ chức.
Cơ sở dữ liệu toàn vẹn
Đối với việc đảm bảo an toàn cho cơ sở dữ liệu, trước hết, trong mỗi trường hợp cần xác định những gì được hoàn thành (bao gồm nội dung, bối cảnh và cấu trúc) và tài liệu chính xác (đáng tin cậy, tính xác thực, có thể sử dụng)
• các bảng cơ sở dữ liệu;
• thông tin chứa trong các lĩnh vực của cơ sở dữ liệu;
• toàn bộ cơ sở dữ liệu.
Sau đó, bạn có thể chọn một chiến lược để duy trì tính toàn vẹn của các tài liệu cơ sở dữ liệu. Trong trường hợp cơ sở dữ liệu vẫn được yêu cầu cho các hoạt động quản lý hiện tại, thì bạn có thể:
• lưu trữ các báo cáo cơ sở dữ liệu (nếu báo cáo cơ sở dữ liệu là tài liệu);
• lưu trữ ảnh chụp nhanh cơ sở dữ liệu (nếu dữ liệu trong cơ sở dữ liệu là dữ liệu);
• để di chuyển cơ sở dữ liệu (nếu toàn bộ cơ sở dữ liệu được sử dụng trong các hoạt động quản lý hiện tại là một tài liệu).
Nếu cơ sở dữ liệu là một tài liệu và không còn được sử dụng trong các hoạt động quản lý hiện tại, thì nó nên được lưu trữ toàn bộ. Nếu cơ sở dữ liệu không phải là một tài liệu, nó nên được giữ cho đến khi cần thiết.
Bảo quản tài liệu web
Khái niệm đảm bảo tính an toàn của tài liệu web dựa trên giả định rằng không phải tất cả các phần tử của trang web đều là tài liệu, do đó, chỉ một số yếu tố trong số đó có thể được bảo tồn.
Trong tổ chức, trách nhiệm duy trì tài liệu web thường được phân phối trong một số nhóm nhân viên tham gia vào việc tạo, quản trị và sử dụng trang web:
• quản trị viên web (kỹ thuật viên);
• những người chịu trách nhiệm về sự hỗ trợ thông tin của trang web;
• người dùng nội bộ;
• nhân viên văn phòng.
Đồng thời, cần quyết định ai được phép quyết định xóa nội dung của trang web, người thực tế xóa và lưu nội dung của trang web, đó là các quy tắc chính thức nên được thiết lập, ai, khi nào và tại sao thay đổi nội dung của trang web.
Để đảm bảo sự an toàn của tài liệu web, bạn phải trả lời một số câu hỏi:
• Những gì để tiết kiệm (mà các yếu tố của trang web, "sinh ra" dưới dạng điện tử, tất cả hoặc có chọn lọc)?
• Khi nào để tiết kiệm (ở giai đoạn nào của vòng đời, mức độ thường xuyên)?
• Làm thế nào để tiết kiệm (in trên giấy, làm cho "ảnh chụp nhanh" của các phiên bản điện tử bằng cách sử dụng phần mềm đặc biệt)?
Cho đến nay, không có cách tiếp cận duy nhất để giải quyết những vấn đề này, nhưng rõ ràng là các loại bảo mật khác nhau nên tồn tại đối với các loại trang web khác nhau (ví dụ, trang web của mạng sử dụng nội bộ, mạng dùng chung), vì nội dung và mục đích của các trang web đó có thể thay đổi đáng kể.
Cơ sở lưu trữ
Hiện nay, người ta thường được khuyến cáo lưu trữ các tài liệu điện tử trên đĩa quang với ghi một lần và lặp đi lặp lại (CD-R, DVD-R), mà bảo vệ dữ liệu từ xử lý không chính xác. Tuy nhiên, không có phương tiện lưu trữ kỹ thuật số nào phù hợp cho việc lưu giữ tài liệu dài hạn. Theo ước tính chung, thời hạn bảo quản của tài liệu lên đến 30 năm. Về mặt công nghệ, chúng trở nên lỗi thời trong khoảng thời gian từ 5 đến 10 năm. Do đó, các tệp phải được chuyển thường xuyên đến các cơ sở lưu trữ mới.
Đồng thời cần tạo bản sao lưu tài liệu. Thủ tục sao lưu bảo vệ dữ liệu được lưu trữ khỏi mất mát và hư hỏng.
Hệ thống sao lưu yêu cầu phần mềm và phần cứng đặc biệt. Nó là tốt hơn nếu sao lưu được thực hiện trên phương tiện lưu động. Tuy nhiên, đĩa mềm chỉ có thể được sử dụng để lưu trữ ngắn hạn các tài liệu điện tử.
Quy tắc chung để đảm bảo sự an toàn của kho lưu trữ như sau: sạch hơn, mát hơn, khô hơn và ổn định hơn là môi trường lưu trữ tài liệu, thì thời gian sử dụng tài liệu dự kiến càng dài. Tuy nhiên, đối với một số nhà cung cấp dịch vụ, các hướng dẫn của nhà sản xuất phải được tuân theo: ví dụ, có thể cần thiết rằng nhiệt độ không dưới một mức nhất định hoặc nhà cung cấp dịch vụ được làm sạch định kỳ.
Khi lựa chọn nhà cung cấp dịch vụ, phần mềm và phần cứng, nó thích hợp hơn cho những nhà cung cấp có thương hiệu và dẫn đầu thị trường và là những tiến bộ mới nhất trong phát triển công nghệ thay vì những người mới.
Vị trí lưu trữ
Rất nhiều tranh cãi đặt ra câu hỏi về việc lưu trữ các tài liệu điện tử. Theo tiêu chuẩn quốc tế ISO 15489, để đảm bảo lưu trữ tài liệu chất lượng cao, các điều kiện sau đây phải được đáp ứng:
• tài liệu nên dễ dàng truy cập và được đặt ở những nơi dễ tiếp cận;
• hiết bị lưu trữ phải tuân thủ các định dạng tài liệu vật lý và không gây thiệt hại cho chúng;
• phòng lưu trữ phải cung cấp điều kiện nhiệt độ và độ ẩm thích hợp, bảo vệ khỏi lửa, nước và các yếu tố khác của phơi nhiễm bên ngoài (vật lý).
Điều quan trọng nữa là câu hỏi về cách thức lưu trữ các tài liệu điện tử về giá trị lâu dài: tập trung (trong kho lưu trữ), phân phối (tại nơi tạo tài liệu), kết hợp? Trong thực tế, nó là một câu hỏi trong đó các tổ chức lưu trữ tài liệu điện tử và an toàn vật lý của tài liệu có thể được thực hiện. Ví dụ, theo ý kiến của các nhà lưu trữ người Đức, một tổ chức - người tạo ra các tài liệu điện tử không phải là người bảo lãnh lý tưởng cho việc lưu trữ lâu dài của tài liệu, vì đây không phải là nhiệm vụ của các hoạt động của họ. Việc lưu trữ thay thế các tài liệu điện tử trong các trung tâm máy tính cho phép bảo trì và chăm sóc tài liệu tốt hơn, nhưng giải pháp tốt nhất được ghi nhận khi hoàn toàn chịu trách nhiệm về mọi vấn đề lưu trữ và gửi tài liệu điện tử cho người dùng.
Tuy nhiên, mỗi tùy chọn trong số các tùy chọn này đều có mối quan hệ giữa các nhà lý thuyết lưu trữ và mỗi tùy chọn yêu cầu xác minh thử nghiệm.

Giáo sư, Tiến sĩ MIKHAIL LARIN
Giám đốc Viện Nghiên cứu toàn Nga về Quản lý văn bản và công tác lưu trữ (VNIIDAD),
Người dịch TS. Nguyễn Lệ Nhung
 


Chúng tôi trên facebook