Chúng ta cùng tìm hiểu về "Siêu dữ liệu " (3 năm trước)
> Tin tức > Ngành văn thư lưu trữ
Siêu dữ liệu thường được định nghĩa là “dữ liệu của dữ liệu”, siêu dữ liệu phức tạp hơn nhiều so với sự ám chỉ của các từ ngữ này. Thực vậy, siêu dữ liệu là dữ liệu của dữ liệu, nhưng có nhiều loại dữ liệu khác nhau và do đó cũng có nhiều loại siêu dữ liệu khác nhau. Siêu dữ liệu được xác định tốt nhất theo loại hình, cấu trúc, tiêu chuẩn, cách sử dụng, quản trị và quản lý siêu dữ liệu. Tất cả các siêu dữ liệu miêu tả dữ liệu tạo thành một hoặc nhiều khía cạnh của một đối tượng hoặc một nguồn dữ liệu.Tổ chức Tiêu chuẩn Thông tin Quốc gia Hoa Kỳ (NISO) định nghĩa siêu dữ liệu là “thông tin được cấu trúc miêu tả, giải thích, định vị, hoặc nếu không, đơn giản hơn để truy xuất, sử dụng hoặc quản lý nguồn thông tin” (2004, 1). Việc thực hiện siêu dữ liệu nói chung mà nhiều người đã quen là danh mục thẻ thư viện công cộng hoặc danh mục truy cập công cộng trực tuyến trên thư viện. Mỗi một công cụ này cung cấp truy cập vào các nguồn tài liệu thư viện thông qua việc sử dụng các yếu tố siêu dữ liệu khác nhau tạo thành một bản ghi siêu dữ liệu nói chung. Mỗi bản ghi siêu dữ liệu là một tập hợp các yếu tố miêu tả đối tượng thư viện như sách hoặc định kỳ. Các yếu tố siêu dữ liệu phổ biến trong tập hợp siêu dữ liệu miêu tả các đối tượng thư viện bao gồm tên yếu tố, tác giả, nhà xuất bản và ngày tháng.
Các loại siêu dữ liệu
Các định nghĩa về siêu dữ liệu thông thường cho rằng siêu dữ liệu được chia làm 02 hoặc 03 lớp hoặc loại hình khác nhau: siêu dữ liệu cấu trúc, siêu dữ liệu mô tả, và siêu dữ liệu hành chính (Trong một số trường hợp, siêu dữ liệu hành chính đôi khi được gộp lại thành một phần của siêu dữ liệu cấu trúc). Một số loại hình siêu dữ liệu này có các nhóm nhỏ, được bổ sung bởi cộng đồng người sử dụng siêu dữ liệu cụ thể. Siêu dữ liệu, hình thành nên dữ liệu miêu tả vị trí đối tượng dữ liệu và độ phức tạp của đối tượng dữ liệu như các phần hoặc thành phần khác nhau là siêu dữ liệu cấu trúc. Siêu dữ liệu, miêu tả những gì đối tượng dữ liệu nắm giữ hoặc được nói đến, người hoặc vật tạo nên nó, và mục đích của nó, là siêu dữ liệu mô tả.Siêu dữ liệu tạo điểu kiện cho việc sử dụng, quản lý, và bảo quản của đối tượng dữ liệu là siêu dữ liệu hành chính. Trong lớp siêu dữ liệu hành chính là các nhóm nhỏ như siêu dữ liệu quản lý quyền, siêu dữ liệu bảo quản, siêu dữ liệu xác thực và mã hóa/giải mã, các đối tượng dữ liệu kiểm toán và sử dụng cũng như bản thân các đối tượng dữ liệu, miễn là cần thiết. Các đối tượng dữ liệu có thể liên kết với tất cả các loại siêu dữ liệu này và siêu dữ liệu có thể có nhiều hơn một loại hình. Việc triển khai tất cả các đối tượng siêu dữ liệu tạo nên môi trường tốt nhất cho việc tổ chức và xác định các đối tượng dữ liệu, truy xuất các đối tượng dữ liệu tối ưu trong việc hồi đáp các truy vấn, khả năng tương tác tối đa giữa các đối tượng dữ liệu trong các hệ thống khác nhau, và cơ hội tốt nhất để lưu trữ và bảo quản các đối tượng dữ liệu.
Tạo siêu dữ liệu
Siêu dữ liệu có thể được tạo nên bởi máy móc hoặc do con người, không hoặc có cấu trúc, đơn giản hay phức tạp. Siêu dữ liệu có thể được tạo nên nhằm phản ánh các mức độ liên kết khác nhau trong việc miêu tả đối tượng dữ liệu. Các đối tượng dữ liệu mà siêu dữ liệu miêu tả phần lớn xác định nguồn gốc siêu dữ liệu, cấu trúc và tính phức tạp của siêu dữ liệu trong bối cảnh và miền cho trước.Cộng đồng người sử dụng siêu dữ liệu đã khởi xướng việc phát triển các cấu trúc siêu dữ liệu cũng như việc hiệu chỉnh các cấu trúc siêu dữ liệu hiện có được sử dụng cho các đối tượng dữ liệu trong phạm vi cộng đồng quan tâm. Các cấu trúc siêu dữ liệu được tạo nên theo sự mã hóa cú pháp đặc biệt, một bộ các quy tắc quy định các lĩnh vực hoặc yếu tố siêu dữ liệu trong phạm vi cấu trúc siêu dữ liệu. Ví dụ, nhiều các biện pháp thực hiện siêu dữ liệu đối với các đối tượng dữ liệu trên web được thể hiện trên HTML/XHTML, XML và RDF (DCMI 2013).
Các tiêu chuẩn Siêu dữ liệu
Sự phát triển của siêu dữ liệu đã tạo nên một số các tiêu chuẩn và tập hợp các yếu tố siêu dữ liệu. Các tiêu chuẩn hoặc tập hợp siêu dữ liệu có thể được áp dụng cục bộ hoặc có xu hướng được sử dụng cho quốc gia và quốc tế trong phạm vi cộng đồng người sử dụng, miền quan tâm, hoặc bối cảnh pháp luật – xã hội khác. Bộ yếu tố siêu dữ liệu Dublin Core là một ví dụ về tiêu chuẩn siêu dữ liệu quốc tế được thành lập, thường dùng để miêu tả các đối tượng dữ liệu trong mạng lưới (như các trang web) thông qua nhiều miền. DC được sử dụng như một cấu trúc siêu dữ liệu cơ sở cho nhiều tổ chức tư nhân và công cộng và được chỉnh sửa, mở rộng và sử dụng như một mô hình dữ liệu nhằm miêu tả các đối tượng dữ liệu trong các quy trình thực hiện trên toàn thế giới. AGLS là một ví dụ về cấu trúc siêu dữ liệu đối với các nguồn lực dữ liệu của chính phủ được phát hành và sử dụng tại Úc.
Sử dụng Siêu dữ liệu
Siêu dữ liệu được tạo ra và triển khai bởi nhiều tổ chức và các nhóm người sử dụng trong toàn bộ doanh nghiệp dữ liệu và điện toán. Các hồ sơ ứng dụng siêu dữ liệu được phát triển trong phạm vi và giữa các tổ chức, cho phép quản lý tự động truy cập của người sử dụng vào các đối tượng dữ liệu cụ thể và siêu dữ liệu dựa trên các hồ sơ người sử dụng được xác định. Việc sử dụng cơ bản nhất của siêu dữ liệu nhằm cho phép người sử dụng có quyền tìm kiếm, sử dụng và quản lý các nguồn dữ liệu.
Việc quản lý và điều hành siêu dữ liệu xảy ra khi siêu dữ liệu thuộc một phần của đối tượng dữ liệu, tách ra từ đối tượng dữ liệu và được quản lý riêng biệt hoặc là sự kết hợp của cả hai. Từ khi siêu dữ liệu trở nên cần thiết đối với việc quản lý các đối tượng dữ liệu theo thời gian và siêu dữ liệu lũy kế vào một đối tượng dữ liệu khi được tạo ra, sử dụng và duy trì, việc lưu trữ và quản lý siêu dữ liệu vô cùng quan trọng đối với việc bảo quản lâu dài, và truy cập vào các đối tượng dữ liệu. Đặt siêu dữ liệu trong phạm vi nguồn lực tương đối dễ dàng theo định dạng đối tượng dữ liệu cụ thể mà không phải theo định dạng khác. Một số siêu dữ liệu được duy trì tốt hơn một cách độc lập về đối tượng dữ liệu, như trong cơ sở dữ liệu hoặc nơi đăng ký và các liên kết đến đối tượng được miêu tả được cung cấp trong phạm vi bản ghi siêu dữ liệu. Mỗi một phương pháp bảo quản có các ưu nhược điểm khác nhau và các phương pháp bảo quản có thể thay đổi theo thời gian như các điều kiện bảo hành.
Kết luận
Siêu dữ liệu là một khái niệm lâu đời hơn so với công nghệ máy tính web hiện đại. Ứng dụng của siêu dữ liệu không phải là một môi trường điện tử chặt chẽ. Tuy nhiên, siêu dữ liệu thực hiện tiềm năng lớn nhất trong các môi trường điện tử theo mạng lưới, và là nền tảng của nghiên cứu và công nghệ web theo ngữ nghĩa. Chúng tôi mong muốn cung cấp và kiểm soát truy cập vào dữ liệu và thông tin nhiều nhất có thể, siêu dữ liệu đóng một vai trò quan trọng trong việc tổ chức, khám phá, quản lý, xác thực và bảo quản các đối tượng dữ liệu – Lori Lindberg.
Nguyễn Lệ Nhung sưu tầm và dịch từ "Bách khoa toàn thư về khoa học lưu trữ"


Chúng tôi trên facebook