Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên...

85
Dữ liệu Mở Liên kết: Những điều cơ bản Ấn bản Môi giới Tri thức Khí hậu của Florian Bauer (REEEP) và Martin Kaltenböck (Công ty Web Ngữ nghĩa) Ấn bản lần 2 năm 2016 Dịch sang tiếng Việt: Lê Trung Nghĩa Dịch xong: 16/03/2017 Bản gốc tiếng Anh: https://www.semantic-web.at/LOD-TheEssentials2016.pdf Bản dịch tiếng Việt: https://www.dropbox.com/s/hpccg9sk0bjs208/LOD- TheEssentials2016-Vi-16032017.pdf?dl=0 Linked Open Data: The Essentials The Climate Knowledge Brokering Edition by Florian Bauer (REEEP) and Martin Kaltenböck (Semantic Web Company) 2nd edition 2016

Transcript of Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên...

Page 1: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản Ấn bản Môi giới Tri thức Khí hậu

của Florian Bauer (REEEP) và Martin Kaltenböck (Công ty Web Ngữ nghĩa)

Ấn bản lần 2 năm 2016

Dịch sang tiếng Việt: Lê Trung NghĩaDịch xong: 16/03/2017

Bản gốc tiếng Anh: https://www.semantic-web.at/LOD-TheEssentials2016.pdfBản dịch tiếng Việt: https://www.dropbox.com/s/hpccg9sk0bjs208/LOD-

TheEssentials2016-Vi-16032017.pdf?dl=0

Linked Open Data: The EssentialsThe Climate Knowledge Brokering Edition

by Florian Bauer (REEEP) and Martin Kaltenböck (Semantic Web Company)

2nd edition 2016

Page 2: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

In ấnĐược xuất bản bởi: edition mono/monochromZentagasse 31/8, 1050 Wienfax/fon: +431/952 33 [email protected]ất bản phẩm:Lần đầu (2011), lần 2 (2016)ISBN:978-3-902796-54-7Thiết kế & trình bày bìa:Susan Härtig (Semantic Web Company)Biên tập sản xuất:Thomas Thurner (Công ty Web Ngữ nghĩa)Hiệu đính:John Tkacik (REEEP), Maria van Veldhuizen (REEEP)In:DGS – Druck & Grafik, Vienna, Austria

Bản quyền:Nếu không được nêu gì khác, bất kỳ tư liệu nào trong cuốn sách này đều được cấp giấy phépCreative Commons BY 3.0 Áo: http://creativecommons.org/licenses/by/3.0/at/

Phiên bản PDF:Phiên bản PDF của Dữ liệu Mở Liên kết: Ấn bản Môi giới Tri thức về Khí hậu để tải về có sẵn ởđây: http://www.semantic-web.at/LOD-TheEssentials2016.pdf

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 2/85

Page 3: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

ImprintPublished by:edition mono/monochromZentagasse 31/8, 1050 Wienfax/fon: +431/952 33 [email protected]:1st edition (2011), 2nd edition (2016)ISBN:978-3-902796-54-7Cover design & Layout:Susan Härtig (Semantic Web Company)Production Editor:Thomas Thurner (Semantic Web Company)Proofreading:John Tkacik (REEEP), Maria van Veldhuizen (REEEP)Print:DGS – Druck & Grafik, Vienna, Austria

Copyright:If not stated otherwise, any material in this book is licensed under a Creative-Commons-Lizenz BY3.0 Austria: http://creativecommons.org/licenses/by/3.0/at/

PDF Version:PDF Version: A PDF version of Linked Open Data: The Climate Knowledge Brokering Edition fordownload is available here: http://www.semantic-web.at/LOD-TheEssentials2016.pdf

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 3/85

Page 4: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Các lưu ý giới thiệu Các lưu ý biên tập của Geoff Barnard (CDKN), Martin Schöpe (BMU), Martin Hiller(REEEP) và Kaltenböck (SWC)

Geoff BarnardCố vấn Chiến lược Quản lý Tri thức, Mạng Khí hậu và Tri thứcPhát triển - CDKN (Climate and Development KnowledgeNetwork) Với đòi hỏi gia tăng thông tin tin cậy được về các vấn đề khíhậu, và sự cấp bách của các biến đổi khí hậu chúng ta đangđối mặt, việc chia sẻ dữ liệu và thông tin có hiệu quả chắcchắn là điều kiện tiên quyết để hành động có hiệu quả. Vấn

đề là không thiếu các báo cáo, các bản tóm tắt và các tập hợp dữ liệu ngoài đó; chúng làquá dư thừa. Làm thế nào bạn tìm ra và truy cập được những gì thích hợp đối với bạn?Và làm thế nào bạn sử dụng một cách thông minh được nó một khi bạn có nó?Các nguyên tắc của Dữ liệu Mở Liên kết (Linked Open Data) đưa ra chìa khóa để trả lờicho câu hỏi hóc búa này, và cuốn sách này đưa ra nhiều chỉ dẫn thực hành cần thiết vềcách áp dụng chúng. Nó sẽ là đặc biệt có giá trị cho thế hệ mới những người môi giới trithức về khí hậu đang nổi lên để cung cấp các mối liên kết giữa các nhà sản xuất vànhững người sử dụng tri thức về khí hậu, và để kết nối mọi người tới thông tin và dữ liệuhọ cần. REEEP đã và đang đi đầu về các nguyên tắc Dữ liệu Mở Liên kết trong các lĩnh vực khíhậu và tái tạo hơn một thập kỷ qua. CDKN đã và đang hỗ trợ công việc của nó kể từ năm2011, khi Nhóm những Người môi giới Tri thức về Khí hậu – CKB (Climate KnowledgeBrokers) đã được thành lập. Với ngày càng nhiều nguồn thông tin trên trực tuyến trởnên sẵn sàng, xu hướng chúng tôi đã nhấn mạnh “hội chứng bùng nổ cổng”, đã có nhu

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 4/85

Page 5: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

cầu cấp bách cho cả việc tổ chức các nguyên tắc và các công cụ thực hành để điềuhướng cho biển thông tin khí hậu đang gia tăng đó. Làm việc với các đối tác từ Nhóm CKB, REEEP đã có được sự tiến bộ thực sự trên cả 2mặt trận, đạt tới cực điểm trong việc tung ra “Trình gắn thẻ Khí hậu” (Climate Tagger)vào năm 2015. Được xây dựng dựa vào bộ từ điển đa ngôn ngữ thông minh các kháiniệm có liên quan tới biến đổi khí hậu, nó cho phép nội dung được tự động “gắn thẻ”với các từ khóa thích hợp, làm cho dễ hơn nhiều để tìm kiếm. Trong quá trình đó nóbiến “Dữ liệu Mở” (Open Data) thành “Dữ liệu Mở Liên kết” (Linked Open Data), và mởkhóa cho toàn bộ dải các khả năng mới để chia sẻ và sử dụng lại tri thức. Dữ liệu Mở Liên kết: Những điều cơ bản là cuốn sách “phải đọc” cho bất kỳ ai nghĩ vềviệc thiết lập cổng hoặc nền tảng tri thức mới về khí hậu. Nếu bạn muốn làm đượcnhiều nhất với sự đầu tư của bạn vào tri thức về khí hậu, thì hãy bắt đầu từ đây!

Tiến sỹ Martin Schöpe Người đứng đầu Bộ phận KI II 3, Bộ Môi trường, Bảo tồn Tựnhiên và An toàn Hạt nhân Liên bang Đức Quản lý có hiệu quả dữ liệu và thông tin là sống còn đối vớinền kinh tế toàn cầu. Đặc biệt, xem xét sự tăng trưởng bùngnổ trong các lĩnh vực hiệu suất năng lượng và năng lượng táitạo, việc chia sẻ dữ liệu và tri thức có thể đảm bảo cho quảnlý thảm họa và ra quyết định tốt hơn, đảm bảo phát triển dự

án mạnh mẽ hơn và thúc đẩy các cơ chế tài chính có hiệu quả cho năng lượng bền vững.Là một trong những người khởi xướng và ủng hỗ chính của cổng thông tin năng lượngsạch reegle.info, Bộ Môi trường, Bảo tồn Tự nhiên và An toàn Hạt nhân (BMU) Liên bangĐức đã ủng hộ sự thay đổi toàn cầu thông tin năng lượng sạch kể từ khi thành lập reeglevào năm 2006.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 5/85

Page 6: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Ngày nay, Dữ liệu Chính phủ Mở - OGD (Open Government Data) đang nổi lên như làphong trào chính trong chia sẻ tri thức. Tiền đề cơ bản là mở ra dữ liệu và thông tin sởhữu công cộng từ các cơ quan chính phủ và làm cho nó sẵn sàng ở các định dạng máyđọc được để các công dân, giới công nghiệp, giới truyền thông, và giới hàn lâm - cũngnhư bản thân chính phủ dễ dàng sử dụng lại và kết hợp được. Phong trào OGD có sứcmạnh để thúc đẩy sự minh bạch lớn hơn, để xúc tác cho sự cộng tác giữa các bên thamgia đóng góp, và khuyến khích hoạt động kinh tế mới.Công nghệ thực sự dẫn dắt và xúc tác cho OGD được biết tới như là Dữ liệu Mở Liên kết -LOD (Linked Open Data). Để tăng tốc cho việc chia sẻ tri thức trong lĩnh vực năng lượngsạch, BMU đang đỡ đầu cho “việc Liên kết Dữ liệu Mở để Tăng tốc sự Phát triển CarbonThấp” (Linking Open Data to Accelerate Low-Carbon Development), một hội thảo kỹthuật cho những người ra quyết định trong các tổ chức về năng lượng sạch sẽ được tổchức ở Viện Masdar vào tháng 01/2012, và được Đối tác Năng lượng Tái tạo và Hiệu quảNăng lượng - REEEP (Renewable Energy and Energy Efficiency Partnership) tổ chức.Để đồng hành với hội thảo kỹ thuật này, bạn có trong tay xuất bản phẩm hữu dụng, Dữliệu Mở Liên kết: Những điều cơ bản, nó đưa ra sự giới thiệu ngắn gọn về chủ đề này chonhững người ra quyết định và các nhà phát triển dự án. Tôi hy vọng bạn sẽ tìm thấytrong nó sự truyền cảm hứng cho việc phát triển chiến lược quản lý dữ liệu và thông tincủa riêng bạn (lấy từ ấn bản đầu tiên năm 2012).

Martin Hiller Tổng Giám đốc, REEEP - Đầu tư vào các thị trường nănglượng sạch Về lý thuyết, Internet làm cho sự giàu có về tri thức nhân loạisẵn sàng cho bất kỳ ai, bất cứ ở đâu. Từ triển vọng của nănglượng sạch, điều này làm cho Internet trở thành một trongnhững công cụ xây dựng năng lực mạnh mẽ nhất có thể.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 6/85

Page 7: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Trong thực tế, thách thức là làm thế nào để phân loại được qua sử dụng có hiệu quảlượng thông tin sẵn sàng và tăng nhanh chưa từng có như hiện nay. Dữ liệu Mở Liên kết(LOD) chỉ ra một giải pháp có khả năng: phong trào LOD kêu gọi các tổ chức làm cho dữliệu đang tồn tại của họ sẵn sàng ở định dạng máy đọc được. Điều này cho phép nhữngngười sử dụng tạo ra và kết hợp các tập hợp dữ liệu và làm cho những giải thích củariêng họ về dữ liệu là sẵn sàng ở các định dạng và ứng dụng có khả năng tiêu hóa được.Dữ liệu Mở Liên kết: Những điều cơ bản đã được phát triển để trao cho những người raquyết định tổng quan nhanh về khái niệm LOD và cách cam kết tham gia với quy trìnhđó trong các tổ chức tương ứng của họ. Để trả lời cho sự thành công của ấn bản đầutiên, chúng tôi ở REEEP tự hào là có khả năng đưa ra “Ấn bản Môi giới Tri thức” mới này. Chúng tôi tin tưởng bạn sẽ thấy xuất bản phẩm này là hữu dụng để đọc.

Martin Kaltenböck Quản lý Đối tác & CFO, Công ty Web Ngữ nghĩa GmbH, Áo Quản lý dữ liệu đã trở thành yếu tố sống còn cho thành côngvà đổi mới của doanh nghiệp. Việc điều khiển có hiệu quảDữ liệu (Mở) Liên kết và siêu dữ liệu trong các lĩnh vực hànhchính công và giới công nghiệp là chìa khóa. Với sự kết hợpcác phương pháp và các công nghệ phần mềm xã hội, các tổchức có thể hưởng lợi và đạt được ưu thế cạnh tranh.

Xuất bản phẩm Dữ liệu Mở Liên kết: Những điều cơ bản trao cho những người ra quyếtđịnh tổng quan tốt về Chính phủ Mở, Dữ liệu Chính phủ Mở, Dữ liệu Mở và Dữ liệu MởLiên kết (LOD). Nó nhấn mạnh các tiềm năng và những lợi ích của LOD, đưa ra chỉ dẫnnhanh với các bước quan trọng nhất cho việc xuất bản LOD, chiến lược tiêu dùng cho tổchức của bạn và 4 ví dụ thực hành sử dụng LOD tốt nhất.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 7/85

Page 8: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Mục lục In ấn ...........................................................................................................................................2Các lưu ý giới thiệu ...................................................................................................................41. Môi giới tri thức .....................................................................................................................92. Từ dữ liệu mở tới dữ liệu mở liên kết ................................................................................173. Sức mạnh của dữ liệu mở liên kết ....................................................................................324. Chỉ dẫn khởi đầu với dữ liệu mở liên kết ..........................................................................41

4.1. Xuất bản dữ liệu mở liên kết .....................................................................................424.2. Tiêu dùng dữ liệu mở liên kết ...................................................................................49

5. Thực hành tốt nhất và các ví dụ ........................................................................................545.1. Gắn thẻ khí hậu - Climate Tagger .............................................................................585.2. Các định nghĩa của OpenEI .......................................................................................645.3. Enipedia ......................................................................................................................675.4. GBPN ...........................................................................................................................715.5. DEVINIT .......................................................................................................................75

6. Phụ lục ................................................................................................................................796.1. Các tác giả ..................................................................................................................796.2. Ghi công & thừa nhận ................................................................................................83

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 8/85

Page 9: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

1. MÔI GIỚI TRI THỨCDữ liệu Mở Liên kết là chất xúc tác quan trọng cho việc môi giới tri thức về khíhậu thành công.

“Người môi giới Tri thức Khí hậu” có nghĩa là gì Nhân loại đang đối mặt, trong biến đổi khí hậu, một thách thức chưa từng có; một trongnhững tác động khổng lồ mà các hệ thống cơ bản nhất chúng ta đã tạo ra vì sự an toànvà sống sót của chúng ta - như nông nghiệp, nước và năng lượng - cũng như các hệ sinhthái trong đó chúng ta đang sống và chất lượng cuộc sống của chúng ta. Việc ra quyếtđịnh của chúng ta sẽ ngày càng trở nên có ràng buộc với khí hậu; nhiều trong số cácquyết định đó sẽ gắn với các lĩnh vực chưa từng được xem xét tới trước sẽ là phụ thuộcvào khí hậu. Với thách thức chưa từng có này là nhu cầu cũng chưa từng có về thông tinthích hợp và được tùy biến thích nghi để thông báo cho các quyết định đó. Cùng lúc, lĩnh vực thông tin khí hậu có thể được xem như là lĩnh vực độc quyền của cácnhà khoa học về khí hậu, đưa ra các mô hình và các kế hoạch dự án không dự báo trướcđược. Ngày nay, lĩnh vực này đang mở rộng nhanh chóng, khi lượng khổng lồ các thôngtin và tri thức thích hợp với khí hậu được sản xuất để đáp ứng đòi hỏi xuyên khắp cáclĩnh vực khác nhau của xã hội. Thông tin này được sử dụng theo các cách thức khôngthể tưởng tượng nổi trước đó, với những người trước đó chưa bao giờ được xem là mộtphần của khán thính phòng này. Dù nhận thức về biến đổi khí hậu đã đều đặn gia tăng trong những năm gần đây, thì lĩnhvực thông tin khí hậu theo nhiều cách là tụt hậu, và chắc chắn ở đâu đó gần với thực tếhiện hành, các nhu cầu được kỳ vọng ít hơn nhiều. Hệ thống tri thức khí hậu đang tồntại sẽ không đủ để hỗ trợ giảm nhẹ và thích nghi khí hậu cho các hành động cần thiếtđối với các xã hội của chúng ta để sống sót và thịnh vượng.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 9/85

Page 10: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Phần lớn, vấn đề đó giải quyết xung quanh số lượng và sự sẵn sàng của, và truy cập tới,thông tin khí hậu. Nhiều người sử dụng thông tin khí hậu bị ngập lụt vì số lượng khổnglồ các báo cáo, các kịch bản, các tập hợp dữ liệu, các bộ công cụ và các sản phẩm thôngtin khác được tung ra mỗi năm; hệ quả là, họ rất thường không có khả năng để tìm rathông tin họ cần. Những người khác bị tụt hậu vì những khoảng cách khổng lồ về thôngtin - thường có liên quan tới khả năng ứng dụng ngôn ngữ hoặc khu vực. Vẫn còn một sốkhác chưa nhận thức được về vai trò mà khí hậu sẽ có trong các phân tích, trong việclên kế hoạch và ra quyết định của họ. Đây là nơi mà những người môi giới tri thức khíhậu (climate knowledge brokers) đi vào để đáp ứng nhu cầu như những người trunggian, những dịch giả và những người bảo vệ cho việc ra quyết định về khí hậu một cáchcó hiểu biết. Những người môi giới tri thức khí hậu làm việc giữa các nhà sản xuất thôngtin và những người sử dụng thông tin, rà soát và đánh giá cơn lũ các tài nguyên để cungcấp tri thức được tùy biến thích nghi tại các thời điểm sống còn. Những người môi giới tri thức có ở tất cả các hình thái và kích cỡ - họ có thể gồm cácnhà điều tiết radio, các giáo viên, các nhà lãnh đạo trong các hợp tác xã nông nghiệp,những người trình bày về thời tiết, những người bán giống, các trợ lý cho các lãnh đạovà các chính trị gia. Họ có vai trò quan trọng để thông báo các quyết định thích hợp vềkhí hậu dựa vào thực hành tốt nhất và dữ liệu có chất lượng, và sự thích hợp của chúngsẽ chỉ có tăng lên trong những năm tới.

Các nhà môi giới tri thức khí hậu hàng đầu cam kết với dữ liệu mở Nhóm các Nhà môi giới Tri thức Khí hậu – CKB (Climate Knowledge Brokers1) là liênminh đang gia tăng của các nhà môi giới tri thức toàn cầu, khu vực và quốc gia màchuyên tâm về khí hậu và thông tin phát triển. Nó mang tới cùng nhau tập hợp da dạngcác tay chơi về thông tin, từ các tổ chức quốc tế cho tới các viện nghiên cứu, các NGO vàcác mạng thực hành tốt, và bao trùm toàn bộ bề rộng các chủ đề có liên quan tới khíhậu. CKB sử dụng các khái niệm “thông tin khí hậu” và “tri thức khí hậu” một cách vắn

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 10/85

Page 11: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

tắt để bao quanh thông tin và tri thức không chỉ về khí hậu, mà còn về các hệ thống vàcác hoạt động của con người có ảnh hưởng lên, hoặc bị ảnh hưởng vì, biến đổi khí hậu.Như một tiêu chuẩn được đồng thuận về cách để cung cấp tri thức có sẵn tốt nhất vềkhí hậu này cho những ai cần nó, nhóm CKB đã áp dụng 7 nguyên tắc2: Một trong các nguyên tắc đó tuyên bố rõ ràng cam kết với Dữ liệu Mở (Liên kết): “Chúngtôi thúc đây tri thức mở; ngụ ý chúng tôi có tư duy mở, đang tích cực tìm cách để chia sẻtri thức của chúng tôi và muốn làm việc với những người khác có cùng thái độ như vậy.Chúng tôi cam kết áp dụng tri thức mở, chia sẻ và cộng tác như là các tiêu chuẩn làmviệc của chúng tôi”. Dữ liệu Mở và sự thích hợp của nó cho việc môi giới tri thức khí hậuthành công Đối với một vài người tiêu dùng thông tin khí hậu, sự tổng hợp thông tin sẽ là đủ để raquyết định. Những người khác cần đào sâu hơn sự hiểu biết của họ đối với các vấn đềđược cho là đặc biệt quan trọng. Họ có thể cảm thấy thông tin được chào chỉ một phầnbao phủ được các tình huống của họ và họ muốn nghiên cứu điều tra tiếp, hoặc tự thựchiện các phân tích khác. Hơn nữa, người tiêu dùng thông tin già dặn sẽ không lấy bất kỳđiều gì họ nghe hoặc đọc được và cho đó là chân lý cả. Khi thông tin được chào dựa vàosự giải thích hoặc phân tích của ai đó khác, họ sẽ muốn kiểm tra tính chính xác và sựthích hợp của nó cho tình huống của riêng họ. Để bám theo, họ cần truy cập tới dữ liệuvà thông tin đằng sau những gì được trình bày. Để có khả năng phán xét liệu họ có tinvào thông tin đó hay không, họ cần phải biết thông tin đó tới từ đâu. Điều này là đặcbiệt đúng đối với các nhà môi giới tri thức, những người phải tùy biến thích nghi thôngtin cho các nhu cầu khác nhau của các khán thính phòng đích khác nhau - sự tổng hợpđược chuẩn bị cho một nhóm các bên tham gia đóng góp sẽ không làm thỏa mãn chotất cả các nhu cầu của nhóm khác. Khả năng không có giới hạn để khai thác dữ liệu gốc,ban đầu và đúng lúc cho phép nhà môi giới tri thức thành công phân phối sản phẩm trithức có mục đích được thiết kế cho các nhu cầu chính xác của người ra quyết định. Cácví dụ về những người ra quyết định có nhu cầu thông tin về khí hậu gồm những người ra

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 11/85

Page 12: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

chính sách, những người lên kết hoạch của thành phố, các đội ứng cứu thảm họa, cácnhà đầu tư, các nhà sản xuất các sản phẩm nông nghiệp, các đại lý du lịch và nhiềungười khác. Tất nhiên, không phải tất cả những người sử dụng thông tin khí hậu đó cóthể được phục vụ với cùng một sản phẩm, và để tạo ra các bản chào hồ sơ thông tin cótính thích nghi và năng động, các nhà môi giới tri thức đòi hỏi sự truy cập tin cậy đượctới tất cả các dữ liệu thích hợp. Không phải tất cả các thông tin liên quan tới khí hậu hiện hành là sẵn sàng mở côngkhai. Trong một vài trường hợp, điều này là vì các lý do thương mại: mô hình kinh doanhcủa nhà cung cấp thông tin có thể phụ thuộc vào việc bán thông tin. Điều này đặt ra vấnđề cho những người sử dụng cần thông tin nhưng không thể kham được nó. Cùng lúc,nếu công ty không được trả tiền, thì thông tin sẽ không được thu thập và sản xuất ngaytừ đầu. Trong các trường hợp khác, ở những nơi dữ liệu và thông tin khí hậu được sản xuất bằngviệc sử dụng các nguồn vốn nhà nước, là khó khăn hơn để bảo vệ lý lẽ từ chối truy cập. Thậm chí khi thông tin được làm cho sẵn sàng, các tham chiếu đầy đủ không luôn đượccung cấp, các nguồn không luôn được trích dẫn và sự truy cập tới dữ liệu thô thườngkhông được cung cấp ổn định (ví dụ, chúng tôi đã được nói rằng các viện khí tượngquốc gia thường không thể hoặc đơn giản không chia sẻ các dữ liệu thô của họ). Khi dữliệu thô là có sẵn, thì nó thường không ở trong định dạng dữ liệu mở để có thể làm chonó dễ dàng đối với những người sử dụng để tự họ thực hiện các phân tích. Đây là nơi màCDB, và những người bảo vệ khác của Dữ liệu Mở, thấy tiềm năng khổng lồ, và là lý dogiải thích vì sao chúng tôi chuyên tâm cho việc làm gia tăng và tăng tốc việc mở ra dữliệu khí hậu.

Các liên kết (1) Climate Knowledge Brokers – www.climateknowledgebrokers.net/(2) The 7 CKB Principles – www.climateknowledgebrokers.net/whatis-ckb/the-7-ckb-principles/

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 12/85

Page 13: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Đọc thêm • Climate Change Knowledge Portal (CCKP), The World Bank –

http://sdwebx.worldbank.org/climateportal/• CKB Manifesto – manifesto.climateknowledgebrokers.net/

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 13/85

Page 14: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Câu đố - Chương 1Câu hỏi 1: Tuyên bố nào dưới đây mô tả các phần vai trò của nhà môigiới tri thức khí hậu ? (có thể có nhiều câu trả lời) ⃞ Để mua và bán dữ liệu về biến đổi khí hậu ⃞ Để sản xuất thông tin cho nhu cầu của những người ra quyết định về biến đổi khí hậu⃞ Để quét thông tin đang tồn tại về biến đổi khí hậu và tùy biến thích nghi nó cho cácnhu cầu của người sử dụng ⃞ Để làm cho những người ra quyết định nhận thức được thực tế là họ nên xem xét sựbiến đổi khí hậu

Câu hỏi 2: Đúng hoặc sai: ⃞ Chỉ những người được huấn luyện đặc biệt mới có thể tự gọi họ là các nhà môi giới trithức về khí hậu ⃞ Lý do chính giải thích vì sao thông tin biến đổi khí hậu được sử dụng không đủ trongviệc ra quyết định là do không đủ thông tin được sản xuất ra ⃞ Để trở thành nhà môi giới tri thức khí hậu thành công, cộng tác và chia sẻ là chìakhóa⃞ Nếu các giải thích chi tiết và sự tổng hợp dữ liệu khí hậu là sẵn sàng tự do, thì cũngvẫn là hữu dụng để làm cho dữ liệu thô truy cập được công khai ⃞ Các nhà môi giới tri thức khí hậu có thể có nhiều chức danh công việc chính thứckhác nhau - từ những người làm vườn cho tới các chính trị gia

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 14/85

Page 15: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Câu hỏi 3: Vì sao nhà môi giới tri thức khí hậu phải tùy biến thíchnghi thông tin của anh ta cho các khán thính phòng đích khác nhau?(nhiều câu trả lời là có thể) ⃞ Đây là mô hình kinh doanh của anh ta - anh ta cần bán “các hồ sơ” khác nhau ⃞ Những người nhận có nhu cầu thông tin khí hậu có thể gồm nhiều dạng người - ngoàimột và chỉ một tập hợp dữ liệu, họ có thể cần các phần rất khác nhau cho việc ra quyếtđịnh của họ ⃞ Một khi nhà môi giới tri thức khí hậu đã tạo ra sự tổng hợp từ các dữ liệu thô, anh tacó thể sử dụng điều này cho tất cả các mục đích⃞ Vì nhà môi giới tri thức khí hậu hành động như là một “người phiên dịch”, vai trò củaanh ta là để trình bày các sự việc theo cách thức chúng có ý nghĩa cho một nhóm cácbên tham gia đóng góp

Câu hỏi 4: Theo những cách thức nào (nếu có) Dữ liệu Mở là hữudụng cho việc môi giới tri thức khí hậu? (nhiều câu trả lời là có thể) ⃞ Nó cho phép nhà môi giới tri thức khí hậu thẩm định các khiếu nại bằng việc kiểm tracác sự việc thực tế (dữ liệu thô, nguồn) ⃞ Nó trao cho nhà môi giới tri thức khí hậu cơ hội để kết hợp thông tin từ các nguồnkhác nhau để trình bày “quan điểm” tươi mới về một chủ đề nhất định ⃞ Trên thực tế, không thực sự là vấn đề nếu dữ liệu là mở hay không - nhà môi giới trithức khí hậu tốt sẽ sử dụng những gì anh ta có thể tìm thấy trên Internet theo bất kỳcách gì anh ta cần nó ⃞ Chỉ truy cập tới tất cả dữ liệu thích hợp mới cho phép nhà môi giới tri thức khí hậu đisâu vào hiểu biết về các vấn đề mà chúng là đặc biệt quan trọng

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 15/85

Page 16: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

⃞ Thông tin dựa vào sự giải nghĩa hoặc phân tích của ai đó khác có thể được nhà môigiới tri thức khí hậu lấy và giải nghĩa - Dữ liệu Mở không thực sự quan trọng ở đây.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 16/85

Page 17: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

2. TỪ DỮ LIỆU MỞ TỚI DỮ LIỆU MỞ LIÊN KẾTLịch sử ngắn gọn của sách về các sự việc Chính phủ Mở, Dữ liệu(Chính phủ) Mở & Dữ liệu Mở Liên kết Chương giới thiệu này sẽ mô tả các nguyên tắc liên kết dữ liệu; xác định các khái niệmquan trọng như chính phủ mở, dữ liệu (chính phủ) mở và dữ liệu (chính phủ) mở liênkết; và giải thích các cơ chế thích hợp để đảm bảo nền tảng vững chắc trước khi đi sâuhơn. Từng chương tiếp sau giải thích chủ đề đặc thù và gợi ý các tài nguyên bổ sung,như các cuốn sách và các website, để giành được sự thấu hiểu chi tiết hơn về chủ đề đặcthù. Chúng tôi hy vọng rằng bằng việc giới thiệu bạn với các khả năng của Dữ liệu MởLiên kết (LOD), bạn sẽ có khả năng chia sẻ tầm nhìn của chúng tôi về web ngữ nghĩatrong tương lai.

Chính phủ Mở & Dữ liệu (Chính phủ) Mở Khi chúng tôi nói về chính phủ mở ngày nay, chúng tôi tham chiếu tới phong trào đãđược khởi xưởng bởi “Bản ghi nhớ về Minh bạch và Chính phủ Mở”1 (Chỉ thị về Minhbạch - The Transparency Directive), nó đã được Tổng thống Mỹ Barack Obama ký ngaysau khi ông nhậm chức vào tháng 1/2009. Ý tưởng cơ bản của chính phủ mở là để thiếtlập sự hợp tác giữa các chính trị gia, hành chính nhà nước, giới công nghiệp và các côngdân riêng rẽ bằng việc xúc tác cho sự minh bạch, dân chủ, sự tham gia và sự cộng tác. Ởcác nước châu Âu, chính phủ mở thường được coi như là sự đồng hành tự nhiên vớichính phủ điện tử2. Trích dẫn quan trọng từ bản ghi nhớ đó là: “Chính quyền của tôi cam kết tạo ra mức tínhmở chưa từng có trong Chính phủ. Chúng tôi sẽ làm việc cùng nhau để đảm bảo lòng tincủa công chúng và thiết lập hệ thống minh bạch, sự tham gia của công chúng, và sựcộng tác. Tính mở sẽ tăng cường cho nền dân chủ của chúng ta và nâng cao tính hiệuquả và hiệu lực trong Chính phủ”.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 17/85

Page 18: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Mối quan hệ đối tác3 chính phủ mở đã được khởi xướng vào ngày 20/09/2011, khi 8chính phủ sáng lập (Brazil, Indonesia, Mexico, Nauy, Philippines, Nam Phi, Vương quốcAnh và Mỹ) đã phê chuẩn tuyên ngôn chính phủ mở, đã công bố các kế hoạch hànhđộng của các quốc gia của họ, và đã chào đón sự cam kết của 38 chính phủ ra nhậpquan hệ đối tác đó. Kể từ năm 2011, thêm 62 chính phủ đã ra nhập Đối tác Chính phủMở (Open Government Partnership). Vài chất xúc tác quan trọng nhất cho chính phủ mở là truy cập tự do tới thông tin và khảnăng tự do sử dụng và sử dụng lại thông tin này (như dữ liệu, nội dung, …). Sau tất cả,không có thông tin thì không thể thiết lập được văn hóa cộng tác và tham gia giữa cácbên tham gia đóng góp thích hợp. Vì thế, dữ liệu chính phủ mở (OGD) thường được xemnhư là khía cạnh sống còn của chính phủ mở. OGD là phong trào toàn cầu để mở ra dữ liệu, thông tin và nội dung của hành chính nhànước/chính phủ ở cả các định dạng phi sở hữu độc quyền và máy đọc được để xã hộidân sự, nền kinh tế, giới truyền thông và giới hàn lâm cũng như các chính trị gia và cácnhà quản lý nhà nước sử dụng lại được. Trọng tâm của nó là chỉ về dữ liệu và thông tinđược các thực thể của chính phủ hoặc được chính phủ kiểm soát sản xuất hoặc ủyquyền và không liên quan tới các cá nhân. Là mở ngụ ý việc hạ thấp các rào cản để đảm bảo bất kỳ ai cũng sử dụng lại được rộngrãi nhất có thể. Với OGD, một hệ biến hóa mới đã tới cho việc xuất bản dữ liệu chính phủsao cho bất kỳ ai cũng có thể xem, lấy và chơi!Khái niệm thường được sử dụng “dữ liệu mở” (open data) tham chiếu tới dữ liệu vàthông tin được sản xuất không chỉ bởi các cơ quan chính phủ mà bao gồm cả nhữngngười từ, mà còn bởi các nhóm các bên tham gia đóng góp thích hợp khác như doanhnghiệp/giới công nghiệp, các công dân, các tổ chức không vì lợi nhuận (NPO) và các tổchức phi chính phủ (NGO), giới khoa học hoặc giáo dục. Một vài trong số các cơ quan nổi tiếng nhất hiện đang triển khai các hoạt động dữ liệumở gồm Ngân hàng Thế giới4, Liên hiệp quốc5, REEEP6, tờ New York Times7, tờ The

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 18/85

Page 19: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Guardian8, Tri thức Mở Quốc tế (Open Knowledge International) (trước kia là OKFN9) vàViện Dữ liệu Mở - ODI (Open Data Institute)10.

Ảnh Vào năm 2007, 30 người ủng hộ Chính phủ Mở đã cùng tớiSebastopol, California, Mỹ để phát triển một tập hợp các nguyên tắc11OGD nhấn mạnh vì sao OGD là cơ bản cho nền dân chủ. Vào năm 2010,Sunlight Foundation12 (Quỹ Tia nắng Mặt trời) đã mở rộng chúng thành

10 nguyên tắc. Thậm chí dù các nguyên tắc đó không là bất di bất dịch, cũng không córàng buộc pháp lý nào, thì chúng vẫn được cộng đồng dữ liệu (chính phủ) mở toàn cầucoi rộng rãi như là các chỉ dẫn chung cho dữ liệu mở. Dữ liệu Chính phủ sẽ được coi là “mở” nếu dữ liệu được làm cho công khai theo cáchtuân thủ với các nguyên tắc được liệt kê ở bên dưới đây: 1. Dữ liệu phải là hoàn chỉnh

Tất cả các dữ liệu công khai được làm cho sẵn sàng. Khái niệm “dữ liệu” thamchiếu tới thông tin và các bản ghi được lưu trữ điện tử, bao gồm nhưng không bịgiới hạn đối với các tài liệu, các cơ sở dữ liệu, các bản thảo, và các bản ghinghe/nhìn. Dữ liệu công khai không là dữ liệu bí mật hợp lệ, không là các giới hạnbảo mật hoặc đặc quyền, như được các luật khác điều chỉnh.

2. Dữ liệu phải là gốcDữ liệu được xuất bản như được thu thập ở nguồn, với mức độ chi tiết tốt nhất cóthể, và không ở các dạng tổng hợp hoặc được/bị sửa đổi.

3. Dữ liệu phải kịp thời Dữ liệu được làm cho sẵn sàng càng nhanh càng tốt để bảo tồn giá trị của dữ liệu.

4. Dữ liệu phải truy cập được.Dữ liệu là sẵn sàng cho dải rộng lớn nhất những người sử dụng cho dải rộng lớnnhất các mục đích.

5. Dữ liệu máy phải đọc được

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 19/85

Page 20: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Dữ liệu là có cấu trúc sao cho nó có thể được xử lý theo một cách thức tự động. 6. Truy cập phải không phân biệt đối xử

Dữ liệu là sẵn sàng cho bất kỳ ai, không có yêu cầu phải đăng ký7. Các định dạng dữ liệu phải không là sở hữu độc quyền

Dữ liệu là sẵn sàng ở định dạng mà không thực thể nào có được sự kiểm soát độcquyền đối với nó.

8. Dữ liệu phải không bị ràng buộc vì giấy phép (License-free)Dữ liệu không phải tuân theo bất kỳ quy định nào về bản quyền, bằng sáng chế,thương hiệu hoặc bí mật thương mại. Các hạn chế hợp lý về tính riêng tư, an toànvà đặc quyền có thể được phép khi được các luật khác điều chỉnh. Tuân thủ với các nguyên tắc đó phải có khả năng rà soát lại được qua các phươngtiện sau: ◦ Người liên hệ phải được chỉ định để trả lời cho những người cố gắng thử sử

dụng dữ liệu đó; hoặc ◦ Người liên hệ phải được chỉ định để trả lời cho các khiếu nại về sự vi phạm các

nguyên tắc đó; hoặc ◦ Tòa án hành chính hoặc pháp lý phải có quyền tài phán để rà soát lại liệu cơ

quan đó đã áp dụng các nguyên tắc đó đúng hay chưa. 2 nguyên tắc mà Quỹ Sunlight bổ sung thêm gồm: 9. Hiệu năng

Hiệu năng tham chiếu tới khả năng tìm kiếm thông tin theo thời gian. 10. Các chi phí sử dụng

Một trong những rào cản lớn nhất để truy cập tới thông tin mạo nhận sẵn sàngcông khai là chi phí áp lên công chúng vì sự truy cập - thậm chí khi chi phí đó làtối thiểu.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 20/85

Page 21: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Đã được thừa nhận rằng phong trào OGD khắp trên thế giới có nguồn gốc từ Úc, NewZealand, châu Âu và Bắc Mỹ, nhưng ngày nay chúng ta cũng thấy sự cam kết tham gia vàhoạt động OGD mạnh ở châu Á, Nam Mỹ và châu Phi. Ví dụ, Kenya đã khởi xướng cổngdữ liệu13 đầu tiên của châu Phi vào tháng 7/2011. Ủy ban châu Âu - EC (European Commission) cũng đã đặt cao vấn đề này trong chươngtrình nghị sự của mình và tích cực thúc đẩy OGD ở châu Âu. Neelie Krose, Phó Chủ tịchcủa EC có trách nhiệm về Chương trình nghị sự Số (Digital Agenda), đã đưa ra cam kếtmạnh mẽ với OGD thông qua tuyên bố của bà về cổng dữ liệu EC vào đầu năm 2012,cổng mà cho tới năm 2016 đã cung cấp gần 10.000 tập hợp dữ liệu14 và cổng dữ liệu Liênchâu Âu vận hành như là điểm truy cập duy nhất cho tất cả các cổng dữ liệu quốc giachâu Âu, nó đã được khởi xướng vào tháng 11/2015 và đã cung cấp 600.000 tập hợp dữliệu vào năm 201615. Dữ liệu Mở là một phần quan trọng của cả Chương trình nghị sự Sốcho châu Âu16 và Kế hoạch Hành động về chính phủ điện tử của châu Âu giai đoạn 2011-201517. Vào tháng 12/2011 EC đã công bố tiếp Chiến lược Dữ liệu Mở cho châu Âu củanó: Biến Dữ liệu Chính phủ thành Vàng18. Những người áp dụng sớm nhất các hoạt động và các sáng kiến dữ liệu mở quốc giachắc chắn là các chính phủ Mỹ19, Úc20, và các quốc gia bán đảo Scandinavi và chính phủVương quốc Anh21. Tất cả các quốc gia đó có cam kết chính trị cao về cả Dữ liệu Mở vàcác cổng Dữ liệu Mở trung ương, và tất cả họ đều có cộng đồng Dữ liệu Mở mạnh. Cácquốc gia có tính đổi mới đó và những người đứng đằng sau các quốc gia đó có thể đượccoi như là những người tiên phong của OGD. 2 tài nguyên rất tốt về phong trào OGD toàn cầu là:

• Bản đồ thế giới các sáng kiến, các hoạt động và các cổng Dữ liệu Mở của SWC:http://bit.ly/open-data-map

• Danh sách toàn diện các catalog dữ liệu của OKFN được các chuyên gia giámtuyển từ khắp nơi trên thế giới: http://datacatalogs.org/

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 21/85

Page 22: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 22/85

Page 23: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Các liên kết (1) Bản ghi nhớ về Minh bạch và Chính phủ Mở:http://www.whitehouse.gov/the_press_office/TransparencyandOpenGovernment/(2) Chính phủ điện tử, Wikipedia: http://en.wikipedia.org/wiki/EGovernment(3) Đối tác Chính phủ Mở: http://www.opengovpartnership.org/(4) Dữ liệu Mở của Ngân hàng Thế giới: http://data.un.org(5) Dữ liệu Mở của Liên hiệp quốc: http://data.worldbank.org/(6) Dữ liệu Mở của REEEP: data.reeep.org(7) Dữ liệu Mở của New York Times: http://www.nytimes.com/column/raw-data(8) Dữ liệu Mở của The Guardian: http://www.guardian.co.uk/worldgovernment-data(9) Quỹ Tri thức Mở - Open Knowledge Foundation: http://okfn.org/(10) Viện Dữ liệu Mở: http://theodi.org/(11) 8 Nguyên tắc của Dữ liệu Chính phủ Mở: https://opengovdata.org/hoặc https://public.resource.org/8_principles.html(12) Quỹ Tia nắng mặt trời - Sunlight Foundation: 10 nguyên tắc của Dữ liệu Chính phủMở: http://sunlightfoundation.com/policy/documents/ten-opendata-principles/(13) Cổng Dữ liệu Mở của EC: https://data.europa.eu/euodp/en/data(14) Cổng Dữ liệu Mở của châu Âu: https://www.europeandataportal.eu/(15) Cổng Dữ liệu Mở của Kenya: http://opendata.go.ke/(16) Chương trình nghị sự Số cho châu Âu:http://ec.europa.eu/information_society/digital-agenda(17) Kế hoạch Hành động Chính phủ điện tử châu Âu 2011 - 2015:ec.europa.eu/information_society/activities/egovernment/action_plan_2011_2015

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 23/85

Page 24: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

(18) Tuyên bố: Chiến lược Dữ liệu Mở cho châu Âu: http://bit.ly/s5FiQo(19) Catalog Dữ liệu Mở của Mỹ: http://data.gov(20) Catalog Dữ liệu Mở của Úc: http://data.gov.au(21) Catalog Dữ liệu Mở của Vương quốc Anh: http://data.gov.uk

Đọc thêm • Chính phủ Mở, Wikipedia: http://en.wikipedia.org/wiki/Open_government• Tri thức Mở Quốc tế - Open Knowledge International, website OGD:

http://opengovernmentdata.org/• Dữ liệu Mở, Wikipedia: http://en.wikipedia.org/wiki/Open_data• Blog của Quỹ Tri thức Mở: http://blog.okfn.org/• Viện Dữ liệu Mở: http://theodi.org/• Cổng Dữ liệu Mở châu Âu: https://www.europeandataportal.eu/• Chỉ số Dữ liệu Mở – theo dõi tình trạng dữ liệu mở chính phủ:

http://index.okfn.org/

Đặt ký tự L lên trước: Từ Dữ liệu Mở tới Dữ liệu Mở Liên kết Như được nêu ở trên, OGD tất cả là về việc mở thông tin và dữ liệu ra, cũng như việc làmcho nó có khả năng để sử dụng và sử dụng lại. Một phân tích các yêu cầu OGD đã đượctiến hành vào tháng 6/2011 ở Áo và nhấn mạnh tới 11 lĩnh vực sau để xem xét khi nghĩvề OGD:

1. Nhu cầu cho các định nghĩa 2. Chính phủ Mở: sự minh bạch, dân chủ, tham gia và cộng tác 3. Các vấn đề pháp lý

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 24/85

Page 25: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

4. Ảnh hưởng lên xã hội 5. Đổi mới và xã hội tri thức 6. Ảnh hưởng lên nền kinh tế và công nghiệp 7. Các giấy phép, các mô hình khai thác, các điều khoản sử dụng 8. Các khía cạnh dữ liệu thích hợp 9. Điều hành dữ liệu 10. Các ứng dụng và các trường hợp điển hình 11. Các khía cạnh công nghệ

Khi cân nhắc làm thế nào để hưởng lợi đầy đủ từ OGD trong các trường hợp cụ thể, là rõràng rằng tính tương hợp và các tiêu chuẩn là mấu chốt. Đây là nơi mà các nguyên tắccủa LOD đóng vai trò quan trọng. Để hưởng lợi đầy đủ từ dữ liệu mở, là sống còn để đặt thông tin và dữ liệu vào ngữ cảnhtạo ra tri thức mới và xúc tác cho các dịch vụ và ứng dụng mạnh. Vì LOD tạo thuận lợicho đổi mới và tạo ra tri thức từ các dữ liệu được liên kết với nhau, nó là cơ chế quantrọng để quản lý và tích hợp thông tin. Có 2 quan điểm quan trọng ngang nhau về LOD: việc xuất bản và việc tiêu dùng. Thôngqua chỉ dẫn này, chúng tôi sẽ luôn đề cập tới LOD từ cả các triển vọng của việc xuất bảnvà việc tiêu dùng. Con đường từ dữ liệu (chính phủ) mở tới dữ liệu (chính phủ) mở liên kết đã được ngàiTim Berners-Lee1 mô tả tốt nhất khi lần đầu tiên ông đã trình bày Mô hình 5 Sao (5 StarModel) tại Triển lãm Gov 2.0 ở Washington DC vào năm 2010. Kể từ đó, mô hình củaBerners-Lee đã được áp dụng và giải thích theo vài cách thức; sự tùy biến thích nghi sauđây Mô hình 5 Sao2 của Michael Hausenblas3 giải thích các chi phí và các lợi ích cho cáccác nhà xuất bản và những người tiêu dùng LOD.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 25/85

Page 26: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

★ Thông tin là sẵn sàng trên Web (bất kỳ định dạng nào) với một giấy phép mở ★★ Thông tin là sẵn sàng như là dữ liệu có cấu trúc (nghĩa là Excel thay vì quét ảnh của bảng)★★★ Các định dạng không sở hữu độc quyền được sử dụng (nghĩa là CSV thay vì Excel) ★★★★ Nhận diện URI được sử dụng sao cho mọi người có thể trỏ vào dữ liệu riêng rẽ ★★★★★ Dữ liệu được liên kết tới dữ liệu khác để đưa ra ngữ cảnh

Đâu là các chi phí và lợi ích của dữ liệu web ★? Là người tiêu dùng... Là nhà xuất bản..

✓ Bạn có thể xem nó.✓ Bạn có thể in nó. ✓ Bạn có thể lưu trữ nó cục bộ (trong ổ đĩa cứnghoặc trong đầu USB của bạn)✓ Bạn có thể đưa dữ liệu bằng tay vào hệ thốngkhác.

✓ Là dễ dàng xuất bản.

Đâu là các chi phí và lợi ích của dữ liệu web ★★?Là người tiêu dùng, bạn có thể làm bất kỳ điều

gì bạn có thể với dữ liệu web ★, cộng vớiLà nhà xuất bản..

✓ Bạn có thể trực tiếp xử lý nó bằng phần mềm sởhữu độc quyền để tổng hợp nó, thực hiện các tínhtoán, trực quan hóa nó, ....✓ Bạn có thể xuất khẩu nó sang định dạng (có cấutrúc) khác.

✓ Là dễ dàng xuất bản.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 26/85

Page 27: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Đâu là các chi phí và lợi ích của dữ liệu web ★★★?Là người tiêu dùng, bạn có thể làm bất kỳ điều

gì bạn có thể với dữ liệu web ★★, cộng vớiLà nhà xuất bản..

✓ Bạn không phải trả tiền cho định dạng mà mộtthực thể duy nhất có sự kiểm soát độc quyền đốivới định dạng đó.

✓ Là dễ dàng xuất bản.

Đâu là các chi phí và lợi ích của dữ liệu web ★★★★?Là người tiêu dùng, bạn có thể làm bất kỳ điềugì bạn có thể với dữ liệu web ★★★, cộng với

Là nhà xuất bản..

✓ Bạn có thể liên kết tới nó từ bất kỳ nơi nào khác,hoặc trên web hoặc cục bộ. ✓ Bạn có thể đánh dấu trang cho nó. ✓ Bạn có thể sử dụng lại các phần của dữ liệu đó.

✓ Bạn sẽ cần đầu tư một chút thời gian cắt lát vàxắt nhỏ dữ liệu của bạn.✓ Bạn sẽ cần chỉ định các URI cho các hạng mục dữliệu và nghĩ về cách trình bày dữ liệu đó. ✓ Bạn có sự kiểm soát chi tiết đối với các hạng mụcdữ liệu và có thể tối ưu hóa sự truy cập của chúng(như cân bằng tải, lưu giữ trong bộ nhớ tạm, ...)

Đâu là các chi phí và lợi ích của dữ liệu web ★★★★★?Là người tiêu dùng, bạn có thể làm bất kỳ điềugì bạn có thể với dữ liệu web ★★★★, cộng với

Là nhà xuất bản..

✓ Bạn có thể phát hiện dữ liệu mới bạn quan tâmtrong khi tiêu dùng thông tin khác. ✓ Bạn có sự truy cập tới lược đồ dữ liệu.

✓ Bạn sẽ cần đầu tư tài nguyên để liên kết dữ liệucủa bạn với dữ liệu khác trên web. ✓ Bạn làm cho dữ liệu của bạn có khả năng pháthiện được. ✓ Bạn làm gia tăng giá trị dữ liệu của bạn.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 27/85

Page 28: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Rất cảm ơn Andy Seaborne trong việc chỉ ra lỗi CSV, cảm ơn Kerstin Forsberg trong việcgợi ý “nhấn mạnh dữ liệu” trong các ví dụ 4 và 5 sao, và cảm ơn Vissilios trong việc đềxuất rằng chúng ta giải thích không chỉ “cái gì”, mà còn “vì sao”. LOD đang ngày càng trở nên quan trọng trong các lĩnh vực quản lý thông tin và dữ liệuhiện đại nhất. Nó đã và đang được nhiều tổ chức nổi tiếng, các sản phẩm và dịch vụ sửdụng để tạo ra các cổng, các nền tảng, các dịch vụ và ứng dụng dựa vào Internet. LOD là độc lập với các lĩnh vực và thâm nhập vào nhiều lĩnh vực và khu vực khác nhau,trao cho nó ưu thế hơn so với quản lý dữ liệu truyền thống. Ví dụ, dự án LOD2 4 Tạo Trithức Ngoài các Dữ liệu được Liên kết với nhau (LOD2 Creating Knowledge Out ofInterlinked Data), được Ủy ban châu Âu cấp vốn theo Chương trình Khung số 7 (7thFramework Programme), phát triển các cơ chế và các công cụ LOD mạnh dựa vào 3trường hợp điển hình thực tế: OGD, các dữ liệu doanh nghiệp được liên kết và LOD chogiới truyền thông và các nhà xuất bản. Để đọc thêm về dữ liệu (chính phủ) mở liên kết,xin hãy tham chiếu tới nhóm làm việc của W3C5 về dữ liệu liên kết chính phủ - GLD(Government Linked Data). Các chương sau đây thảo luận về những lợi ích của LOD, cũng như các nguyên tắc cơbản để tiêu dùng và xuất bản LOD để tạo ra các dịch vụ mạnh và có tính đổi mới đểquản lý tri thức, ra quyết định và quản lý dữ liệu nói chung. Các ví dụ thực hành tốt nhấtClimate Tagger6 (Gắn thẻ Khí hậu) và OpenEI7 đưa ra công cụ và nền tảng sử dụng LOD.Một ví dụ phổ biến khác về áp dụng Dữ liệu Mở trong ngữ cảnh năng lượng và khí hậu làSolarMedAtlas8.

Các liên kết (1) Sir Tim Berners-Lee (Wikipedia): http://en.wikipedia.org/wiki/Tim_Berners-Lee(2) Mô hình 5 Sao về Dữ liệu Chính phủ Mở của Michael Hausenblas:http://5stardata.info/en/(3) Michael Hausenblas: http://semanticweb.org/wiki/Michael_Hausenblas

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 28/85

Page 29: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

(4) LOD2 – Tạo Tri thức Ngoài các Dữ liệu được Liên kết với nhau: http://www.lod2.eu(5) Nhóm Làm việc về GLD của W3C: http://www.w3.org/2011/gld/charter(6) Climate Tagger – www.climatetagger.net(7) Thông tin Năng lượng Mở - Open Energy Info (OpenEI): http://en.openei.org(8) SolarmedAtlas – www.solar-med-atlas.org/

Đọc thêm• Dữ liệu Liên kết, Wikipedia: http://en.wikipedia.org/wiki/Linked_data• Dữ liệu Liên kết – Kết nối Dữ liệu Phân tán Khắp Web: http://linkeddata.org/• Dữ liệu Liên kết: Phát triển Web trong Không gian Dữ liệu Toàn cầu, Y tế và Kinh

doanh: http://linkeddatabook.com• Liên kết Dữ liệu Chính phủ, David Wood (Editor), Springer; 2011 edition

(November 12, 2011), ISBN-10: 146141766X, ISBN-13:978-1461417668• Dự án Liên kết Cộng đồng Dữ liệu Mở của W3C:

http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData

• BabelNet, mạng ngữ nghĩa các dữ liệu từ điển và ngôn ngữ: http://babelnet.org/• Dữ liệu Mở Liên kết -- Tạo Tri thức Ngoài các Dữ liệu được Liên kết với nhau, sách

điện tử tự do: http://link.springer.com/book/10.1007%2F978-3-319-09846-3

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 29/85

Page 30: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Câu đố - Chương 2Câu hỏi 1: Dữ liệu Chính phủ Mở được coi là để xúc tác cho: Hãy chọnnhững gì áp dụng được (nhiều câu trả lời là có thể) ⃞ Minh bạch ⃞ Dân chủ ⃞ Tham gia ⃞ Cộng tác

Câu hỏi 2: Xin hãy nêu tên một vài tổ chức đang xung kích trong Dữliệu Mở

Câu hỏi 3: Cái gì được coi là “OGD” - 8 nguyên tắc ban đầu: Hãy chọnnhững gì áp dụng được (nhiều câu trả lời là có thể) ⃞ Dữ liệu phải là hoàn chỉnh ⃞ Dữ liệu phải là gốc ⃞ Dữ liệu phải hợp thời ⃞ Dữ liệu phải truy cập được ⃞ Dữ liệu phải xử lý được bằng máy ⃞ Sự truy cập phải không phân biệt đối xử ⃞ Các định dạng dữ liệu phải không sở hữu độc quyền ⃞ Dữ liệu phải không bị ràng buộc vì giấy phép ⃞ Dữ liệu phải được rà soát lại ngang hàng

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 30/85

Page 31: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

⃞ Dữ liệu phải là độc nhất ⃞ Dữ liệu phải được tổng hợp

Câu hỏi 4: Theo Mô hình 5 Sao, dữ liệu là sẵn sàng theo một giấyphép mở, có cấu trúc ở định dạng không sở hữu độc quyền có thểđược xem là: (chọn những gì áp dụng được)⃞ Dữ liệu 2 sao ⃞ Dữ liệu 3 sao ⃞ Dữ liệu 4 sao

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 31/85

Page 32: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

3. SỨC MẠNH CỦA DỮ LIỆU MỞ LIÊN KẾTHiểu tầm nhìn của Nhóm Word Wide Web (W3C) về web dữ liệu mới Hãy tưởng tượng là web giống như cơ sở dữ liệu toàn cầu khổng lồ. Bạn muốn xây dựngứng dụng mới để chỉ ra sự tương quan giữa sự tăng trưởng kinh tế, tiêu dùng năng lượngtái tạo, tỷ lệ tử vong và chi tiêu nhà nước cho giáo dục. Bạn cũng muốn cải thiện kinhnghiệm của người sử dụng với các cơ chế như duyệt đa diện. Bạn có thể làm rồi hoặcchưa làm tất cả điều này ngày nay. Ngày nay những biện pháp để tích hợp thông tin từcác nguồn khác nhau, còn được biết như là việc pha trộn dữ liệu (mashing data),thường rất mất thời gian và tốn kém. 2 yếu tố dẫn dắt có thể gây ra tình huống không mong muốn này: Trước hết, các cơ sở dữ liệu vẫn còn được coi như là “các ống khép kín” (silos), và mọingười thường không muốn những người khác động tới cơ sở dữ liệu mà họ có tráchnhiệm với nó. Cách tư duy này dựa vào vài giả thiết từ những năm 1970: rằng chỉ mộtnhúm các chuyên gia có khả năng làm việc với các cơ sở dữ liệu và rằng chỉ trong nội bộcác phòng CNTT là có khả năng hiểu được lược đồ và ý nghĩa của dữ liệu. Điều này là lỗithời rồi. Trong kỷ nguyên Internet ngày nay, hàng triệu lập trình viên có khả năng xâydựng các ứng dụng có giá trị bất cứ khi nào họ có được các dữ liệu thú vị. Thứ 2, dữ liệu vẫn còn bị khóa trói vào các ứng dụng nhất định. Vấn đề kỹ thuật với kiếntrúc thông tin phổ biến nhất hiện nay là thông tin về siêu dữ liệu và lược đồ không táchrời khỏi các logic của ứng dụng. Dữ liệu không thể được sử dụng lại dễ dàng như nóđáng được. Nếu ai đó thiết kế cơ sở dữ liệu, anh/chị ta thường biết ứng dụng đặc thù sẽđược xây dựng trên đỉnh của nó. Nếu chúng ta dừng nhấn mạnh các ứng dụng nào sẽ sửdụng dữ liệu của chúng ta và thay vào đó tập trung vào mô tả ý nghĩa của bản thân dữliệu, thì chúng ta sẽ giành được nhiều xung lượng hơn về lâu dài. Dữ liệu mở, trong cốtlõi của nó, ngụ ý rằng dữ liệu là mở cho bất kỳ dạng ứng dụng nào và điều này có thểđạt được nếu chúng ta sử dụng các tiêu chuẩn mở như RDF1 để mô tả siêu dữ liệu.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 32/85

Page 33: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Dữ liệu Liên kết?Ngày nay, ý tưởng về việc liên kết các trang web bằng việc sử dụng các siêu liên kết(hyperlink) là rõ ràng, nhưng điều này từng là khái niệm đột phá 20 năm trước. Chúng tađang ở trong tình trạng tương tự ngày nay khi mà nhiều tổ chức không hiểu ý tưởng củaviệc xuất bản dữ liệu trên web, không hiểu vì sao dữ liệu trên web nên được liên kết vớinhau. Sự tiến hóa của web có thể được coi là như sau:

Dù ý tưởng của Dữ liệu Mở Liên kết (LOD) còn chưa được thừa nhận như là dòng chínhthống (như web mà tất cả chúng ta biết ngày nay), có nhiều LOD là sẵn sàng rồi. Cái gọilà đám mây LOD2 đã vượt quá 100 tỷ sự việc từ nhiều lĩnh vực khác nhau như địa lý,truyền thông, sinh học, hóa học, kinh tế, năng lượng, … Dữ liệu là khác nhau về chấtlượng và hầu hết nó cũng có thể được sử dụng lại cho các mục đích thương mại.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 33/85

Page 34: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Xin hãy xem phiên bản cập nhật nhất về lược đồ Đám mây LOD năm 2014 dưới đây:

Vì sao chúng ta nên liên kết các dữ liệu trên web và chúng ta có thểlàm điều đó thế nào?Tất cả các cách thức khác nhau để xuất bản thông tin lên web là dựa vào ý tưởng rằngcó khán thính phòng ngoài đó sẽ sử dụng thông tin được xuất bản thậm chí nếu chúngta không biết chính xác họ là ai và họ sẽ sử dụng nó như thế nào. Đây là một vài ví dụ:

• Hãy nghĩ về thông điệp trên twitter: bạn không chỉ không biết tất cả những ngườiđi theo bạn (followers), mà bạn thường thậm chí không biết vì sao họ đi theo bạnvà họ sẽ làm gì với các thông điệp trên twitter đó của bạn.

• Hãy nghĩ về các bài đăng trên blog của bạn: chúng giống như các thư điện tử gửicho ai đó bạn còn chưa biết.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 34/85

Page 35: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

• Hãy nghĩ về website của bạn: những người mới có thể liên hệ với bạn và chào cácdạng thông tin mới đầy thú vị.

• Hãy nghĩ về địa chỉ thư điện tử của bạn: bạn đã chia sẻ nó trên web và bây giờbạn nhận được rất nhiều spam.

Một ngày nào đó, tất cả chúng ta đều mở ra với web, nhưng không phải tất cả chúng tabiết làm việc như thế nào với điều này bằng lối tư duy mới. Thường là hầu hết nhữngngười “bẩm sinh số” và “những người nhập cư số”, những người đã học được cách làmviệc và sống với web xã hội đã phát triển các chiến lược tốt nhất để sử dụng dạng “tínhmở” này. Trong khi ý tưởng về dữ liệu mở được xây dựng dựa vào khái niệm về web xãhội, thì ý tưởng của dữ liệu liên kết là hậu duệ của web ngữ nghĩa. Ý tưởng cơ bản của web ngữ nghĩa là để cung cấp các cách thức xuất bản thông tintrong các môi trường phân tán có hiệu quả về chi phí. Để giảm các chi phí khi truyềnthông tin giữa các hệ thống, các tiêu chuẩn đóng vai trò sống còn nhất. Hoặc ngườitruyền hoặc người nhận phải chuyển đổi hoặc ánh xạ dữ liệu của họ thành cấu trúc saocho nó có thể được người nhận “hiểu”. Sự chuyển đổi hoặc ánh xạ này phải được thựchiện ít nhất ở 3 mức khác nhau: cú pháp, lược đồ và từ vựng được sử dụng để phân phốithông tin có nghĩa; điều thậm chí trở nên mất thời gian hơn khi thông tin được nhiều hệthống cung cấp. Kịch bản lý tưởng có lẽ là một Internet được hài hòa hóa đầy đủ, nơi màtất cả các lớp đó là dựa vào một tiêu chuẩn duy nhất, nhưng thực tế là chúng ta đangđối mặt với quá nhiều tiêu chuẩn hoặc “các tiêu chuẩn de facto” ngày nay. Làm thế nào chúng ta có thể vượt qua được vấn đề con gà - quả trứng này được? Có ítnhất 3 câu trả lời có khả năng:

• Cung cấp thông tin có giá trị, được đồng thuận theo tiêu chuẩn, định dạng mở. • Cung cấp các cơ chế để liên kết các lược đồ và các từ vựng riêng rẽ theo cách thức

sao cho mọi người có thể ghi chép các ý tưởng của họ là “tương tự” và có liênquan thậm chí nếu chúng không chính xác là y hệt nhau.

• Mang tất cả các thông tin này tới môi trường có thể được hầu hết chúng ta, nếukhông nói là tất cả chúng ta, sử dụng. Ví dụ: đừng để những người sử dụng cài đặt

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 35/85

Page 36: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

các phần mềm sở hữu độc quyền hoặc khóa trói họ vào mạng xã hội hoặc ứngdụng web duy nhất!

Lịch sử ngắn gọn của LOD Tương ứng với 3 điểm nêu trên, đây là các bước được cộng đồng LOD tiến hành rồi:

• W3C đã xuất bản loạt các tiêu chuẩn mở cho web ngữ nghĩa được xây dựng trênđỉnh của cái gọi là “Khung Mô tả Tài nguyên” - RDF (Resource DescriptionFramework). Đây là tiêu chuẩn được áp dụng rộng rãi cho việc mô tả siêu dữ liệucũng đã được sử dụng để xuất bản bách khoa toàn thư phổ biến nhất trên thếgiới: Wikipedia bây giờ có “người anh em ngữ nghĩa” của mình được gọi làDBpedia3, nó đã trở thành hạt nhân của đám mây LOD.

• Các tiêu chuẩn web ngữ nghĩa của W3C cũng nhìn thấy trước khả năng để liên kếtcác tập hợp dữ liệu. Ví dụ, bạn có thể trình bày ở định dạng máy đọc được rằngmột tài nguyên nhất định nào đó là chính xác (hoặc gần chính xác) y hệt như mộttài nguyên khác, và rằng cả 2 tài nguyên đó ở đâu đó trên web nhưng không nhấtthiết nằm trên cùng máy chủ hoặc được cùng một tác giả xuất bản. Điều này làrất tương tự với việc liên kết các tài nguyên với nhau bằng việc sử dụng các siêuliên kết trong tài liệu, và là đơn vị hạt nhân cho cơ sở dữ liệu toàn cầu khổng lồđược nhắc tới ở bên trên.

• Các tiêu chuẩn web ngữ nghĩa ngụ ý sẽ được sử dụng trong hạ tầng CNTT phổbiến nhất chúng ta biết ngày nay: World Wide Web (WWW). Hãy chỉ sử dụng trìnhduyệt của bạn và sử dụng HTTP! Hầu hết các tài nguyên của đám mây LOD vàthông tin ngữ cảnh xung quanh chúng có thể được truy xuất bằng việc sử dụngduy nhất trình duyệt và bằng việc gõ URL vào thanh địa chỉ. Điều này cũng ngụ ýrằng các ứng dụng web có thể sử dụng dữ liệu được các dịch vụ web tiêu chuẩnliên kết.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 36/85

Page 37: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Thực tế có rồi - ví dụ Hãy dán URL sau vào trình duyệt của bạn:http://dbpedia.org/resource/Renewable_Energy_and_Energy_Efficiency_Partnershipvà bạn sẽ nhận được nhiều thực tế có cấu trúc tốt của REEEP. Hãy đi theo thực tế làREEEP “là chủ sở hữu” của reegle (http://dbpedia.org/resource/Reegle) và hơn thế. Bạncó thể thấy rằng cơ sở dữ liệu toàn cầu khổng lồ thực tế là có rồi!

Các hệ thống phức tạp và dữ liệu liên kếtHầu hết các hệ thống ngày nay làm việc với lượng thông tin khổng lồ. Tất cả thông tinđược sản xuất hoặc bên trong các đường biên của hệ thống (và một phần được xuất bảnsang các hệ thống khác) hoặc nó được tiêu dùng “từ bên ngoài”, “được pha trộn” và“được tiêu hóa” bên trong các đường biên đó. Vài sự phức tạp đang gia tăng đã pháttriển theo “một cách thức tự nhiên” vì mức độ giáo dục cao hơn và các cải tiến kỹ thuậtđược khu vực CNTT-TT thực hiện trong vòng 30 năm qua. Nói đơn giản, nhân loại bâygiờ có khả năng điều khiển nhiều thông tin hơn nhiều so với từ trước tới nay, có lẽ vớichi phí thấp nhất từ trước tới nay (hãy nghĩ về các băng thông rộng lớn hơn và các chiphí lưu trữ dữ liệu thấp hơn). Tuy nhiên, hầu hết sự phức tạp mà chúng ta đang vật lộn với nó, trên hết tất cả, do thiếucấu trúc gây ra vì bản chất tự nhiên được kết nối của xã hội chúng ta. Bản chất tự nhiênvề chuyên môn của nhiều doanh nghiệp và chuyên gia còn chưa được phản ánh đủ tốttheo cách chúng ta quản lý thông tin và giao tiếp. Thay vì có khả năng tìm được và liênkết được tới các dữ liệu khác, nhiều thông tin vẫn còn bị ẩn dấu đi. Với trọng tâm rõ ràng của nó nhằm vào quản lý siêu dữ liệu chất lượng cao, dữ liệu liênkết là chìa khóa để vượt qua được vấn đề này. Giá trị của dữ liệu gia tăng mỗi lần nóđược sử dụng lại và được liên kết tới tài nguyên khác. Sử dụng lại có thể chỉ đượckhuyến khích bằng việc cung cấp thông tin về thông tin có sẵn. Để triển khai tác vụ nàytheo một cách thức bền vững, thông tin phải được thừa nhận như là tài nguyên quantrọng và nên được quản lý như bất kỳ tài nguyên nào khác.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 37/85

Page 38: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Các ví dụ về các ứng dụng LOD Dữ liệu mở liên kết là sẵn sàng rộng rãi rồi trong một vài nền công nghiệp, như trong 4 vídụ dưới đây:

• Dữ liệu liên kết trong các thư viện4: tập trung vào trao đổi dữ liệu thư viện và tiềmnăng tạo ra dữ liệu thư viện được kết nối với nhau trên toàn cầu; việc trao đổi vàsử dụng chung dữ liệu với các cơ sở không phải là thư viện; lòng tin gia tăng trongweb ngữ nghĩa đang gia tăng; và việc duy trì biểu đồ thông tin văn hóa toàn cầuvừa tin cậy vừa ổn định.

• Dữ liệu mở trong y sinh học5: thiết lập tập hợp các nguyên tắc về phát triển bảnthể học/từ vựng với mục tiêu tạo ra bộ các bản thể học tham chiếu tương hợpđược và trực giao trong lĩnh vực y sinh học; tôi rèn sự tăng trưởng bùng nổ dữ liệutrong lĩnh vực y sinh học; tạo ra họ các bản thể học có điều phối tương hợp đượcvà logic; và việc kết hợp các trình bày tỉ mỉ chính xác thực tế của y sinh học.

• Dữ liệu chính phủ liên kết6: việc sử dụng lại thông tin khu vực nhà nước (cùng vớiChỉ thị PSI7); cải thiện các quy trình hành chính nội bộ bằng việc tích hợp dữ liệudựa vào dữ liệu liên kết; và việc liên kết lẫn nhau thông tin của chính phủ và phichính phủ.

• Dữ liệu liên kết của Di sản Văn hóa8: vô số các cơ sở di sản văn hóa của EU (khuvực các phòng tranh, thư viện, kho lưu trữ và bảo tàng - GLAM (Galleries LibrariesArchives and Museums) bao gồm nhưng không bị giới hạn với: các phòng tranh,các thư viện, các kho lưu trữ và các viện bảo tàng) chia sẻ và liên kết với nhau cácsiêu dữ liệu và dữ liệu thông qua mạng Europeana.

Tương lai của LOD Động lực vốn có của dữ liệu mở được các nhóm các bên tham gia đóng góp thuộc “3ông lớn” sản xuất và tiêu dùng - truyền thông, công nghiệp, và các tổ chức chính

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 38/85

Page 39: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

phủ/phi chính phủ (NGO) - sẽ thúc đẩy phát triển ý tưởng, chất lượng và số lượng củadữ liệu liên kết - dù nó là mở hay không mở:

Trong khi hầu hết xung lượng hiện hành có thể được quan sát thấy trong khu vực các tổchức chính phủ (GO) & NGO, thì ngày càng nhiều các công ty truyền thông đang nhảyvào. Giả định của họ là ngày càng nhiều ngành công nghiệp hơn sẽ nhận thức được dữliệu liên kết như là cách thức có hiệu quả về chi phí để tích hợp dữ liệu. Việc liên kết thông tin từ các nguồn khác nhau cũng đóng vai trò quan trọng trong cácquá trình đổi mới mở9. Nếu dữ liệu có thể được đặt trong ngữ cảnh mới, thì ngày càngnhiều hơn các ứng dụng có giá trị - và vì thế cả tri thức nữa - sẽ được sinh ra.

Các liên kết (1) http://www.w3.org/RDF/(2) http://www.lod-cloud.net(3) http://dbpedia.org/(4) Jan Hannemann, Jürgen Kett (German National Library): “Linked Data for Libraries”(2010) http://www.ifla.org/past-wlic/2010/149-hannemann-en.pdf(5) http://obofoundry.org/(6) https://www.europeandataportal.eu/(7) https://en.wikipedia.org/wiki/Directive_on_the_re-use_of_public_sector_information

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 39/85

Page 40: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

(8) http://labs.europeana.eu/api/linked-open-data-introduction(9) https://en.wikipedia.org/wiki/Open_innovation

Câu đố - Chương 3 Câu hỏi 1: Hãy sắp xếp theo trật tự đúng sự tiến hóa của “tính có ngữnghĩa” của web:⃞ Dữ liệu trên web ⃞ Web của các tài liệu ⃞ Web của dữ liệu ⃞ Các tài liệu trên web

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 40/85

Page 41: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

4. CHỈ DẪN KHỞI ĐẦU VỚI DỮ LIỆU MỞ LIÊN KẾTChỉ dẫn nhanh cho chiến lược và sự hiện diện LOD của riêng bạn 2 phần sau đây rà soát lại sự xuất bản và tiêu dùng LOD và cung cấp thông tin cơ bản đểthiết lập chiến lược LOD mạnh mẽ cho tổ chức của bạn. Chúng tôi cũng đưa ra cáckhuyến cáo để đọc thêm cho bất kỳ ai đang tìm kiếm nhiều hơn các chi tiết kỹ thuật vềxuất bản và tiêu dùng LOD, cũng như danh sách các công cụ phần mềm quan trọngnhất để xuất bản và tiêu dùng LOD. Số liệu sau đây đưa ra tổng quan kỹ thuật về sự cần thiết xây dựng các khối cho chiếnlược của bạn để xuất bản và tiêu dùng LOD.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 41/85

Page 42: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

4.1. Xuất bản Dữ liệu Mở Liên kếtCác bước đầu xuất bản nội dung của bạn như là LOD Ý tưởng đằng sau những lợi ích của nỗ lực được yêu cầu để xuất bản LOD từng đượcthảo luận rồi trogn các chương trước của xuất bản phẩm này theo sau Mô hình 5 Saocủa OGD. Việc xuất bản LOD đưa ra cơ chế mạnh để chia sẻ dữ liệu và thông tin củariêng bạn cùng với siêu dữ liệu của bạn và các mô hình dữ liệu tương ứng để sử dụng lạicó hiệu quả. Việc đi với LOD sẽ giúp cho tổ chức của bạn trở thành trung tâm dữ liệuquan trọng trong lĩnh vực của bạn.

Chỉ dẫn nhanh để xuất bản LOD Chúng tôi đã chuẩn bị chỉ dẫn ngắn gọn cho hầu hết các vấn đề quan trọng nhất cầnphải được tính tới khi xuất bản LOD cũng như mô hình từng bước một để bắt đầu. Phân tích dữ liệu của bạn Trước khi bạn bắt đầu xuất bản dữ liệu của bạn, là sống còn để nhìn sâu vào các môhình dữ liệu của bạn, siêu dữ liệu và bản thân dữ liệu của bạn. Có tổng quan và chuẩn bịchọn dữ liệu và thông tin hữu ích để xuất bản. Làm sạch dữ liệu của bạn Dữ liệu và thông tin tới từ nhiều nguồn dữ liệu phân tán và ở vài định dạng khác nhau(như các cơ sở dữ liệu, XML, CSV, dữ liệu địa lý, …) đòi hỏi nỗ lực bổ sung để đảm bảocho việc mô hình hóa được dễ dàng và hiệu quả. Điều này bao gồm việc làm sạch dữliệu và thông tin của bạn bằng việc loại bỏ bất kỳ thông tin bổ sung nào mà sẽ khôngđược đưa vào trong các tập hợp dữ liệu được xuất bản của bạn.Mô hình hóa dữ liệu của bạn Hãy chọn các từ vựng và các mô hình bổ sung đã được thiết lập để đảm bảo sự biến đổidữ liệu trơn tru sang RDF. Bước tiếp sau là tạo ra các mã nhận diện tài nguyên thống

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 42/85

Page 43: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

nhất (URI1) như là tên cho từng dự án của bạn. Để đảm bảo tính bền vững, hãy nhớ pháttriển các mô hình dữ liệu cho dữ liệu mà thay đổi theo thời gian. Chọn các từ vựng thích hợp Có nhiều từ vựng RDF đang tồn tại để sử dụng lại; xin hãy đánh giá các từ vựng thíchhợp cho dữ liệu của bạn từ các từ vựng đang tồn tại. Nếu không có các từ vựng phù hợpvới các nhu cầu của bạn, hãy thoải mái tạo ra các từ vựng của riêng bạn. Chỉ định (các) giấy phép Để đảm bảo sử dụng lại rộng rãi và có hiệu quả dữ liệu của bạn, hãy đánh giá, chỉ địnhvà cung cấp giấy phép rõ ràng cho dữ liệu của bạn để tránh sử dụng lại trong tình trạngchân không về pháp lý. Nếu có thể, hãy chỉ định một giấy phép đang tồn tại mà mọingười biết rồi. Điều này xúc tác cho tính tương hợp với các tập hợp dữ liệu khác tronglĩnh vực cấp phép. Ví dụ, Creative Commons2 là giấy phép thường được sử dụng choOGD.Chuyển đổi dữ liệu sang RDFMột trong các bước cuối cùng là chuyển đổi dữ liệu của bạn sang RDF3, mô hình dữ liệurất mạnh cho LOD. RDF được W3C chính thức khuyến cáo cho các mô hình dữ liệu webngữ nghĩa. Hãy nhớ đưa (các) giấy phép được bạn chỉ định vào các tệp RDF của bạn.Liên kết dữ liệu của bạn tới các dữ liệu khác Trước khi bạn xuất bản, hãy chắc chắn dữ liệu của bạn được liên kết với các tập hợp dữliệu khác; các liên kết tới các tập hợp dữ liệu khác và tới các tập hợp dữ liệu của bên thứ3 là hữu dụng. Các liên kết đó đảm bản cho việc xử lý và tích hợp dữ liệu được tối ưu hóađể sử dụng (lại) dữ liệu và cho phép tạo ra tri thức mới từ các tập hợp dữ liệu của bạnbằng việc đặt chúng vào ngữ cảnh mới với các dữ liệu khác. Hãy đánh giá và chọn cẩnthận các tập hợp dữ liệu thích hợp nhất để được liên kết với các tập hợp dữ liệu củariêng bạn.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 43/85

Page 44: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Xuất bản và quảng bá LOD của bạn Hãy xuất bản dữ liệu của bạn lên web và quảng bá các tập hợp LOD mới để đảm bảo sửdụng lại rộng rãi - thậm chí LOD tốt nhất sẽ không được sử dụng nếu mọi người khôngtìm ra nó! Cùng với các cách thức quảng bá khác, là ý tưởng tuyệt vời để thêm các tậphợp LOD của bạn vào đám mây LOD4, một trình bày trực quan các tập hợp LOD, bằngviệc cung cấp và cập nhật siêu thông tin (meta-information) về các tập hợp dữ liệu củabạn trên trung tâm dữ liệu5 (data hub). Hãy nhớ luôn cung cấp các mô tả người đọcđược của các tập hợp dữ liệu của bạn để làm cho các tập hợp dữ liệu đó “tự mô tả” đểsử dụng lại dễ dàng và hiệu quả. Đối với tiếp cận tương tự, chúng tôi khuyến cáo “Các thành phần cho Dữ liệu (Mở) Liênkết chất lượng cao” từ W3C Linked Data Cookbook6. Các bước cơ bản để xuất bản LODcủa riêng bạn là:

1. Mô hình hóa và liên kết dữ liệu 2. Đặt tên cho mọi điều bằng các URI3. Sử dụng lại các từ vựng ở bất kỳ nơi nào có thể4. Xuất bản các mô tả sao cho người và máy đọc được 5. Chuyển đổi dữ liệu sang RDF 6. Chỉ thị một giấy phép thích hợp 7. Công bố (các) tập hợp dữ liệu liên kết

Vòng đời sau đây của Dữ liệu (Chính phủ) Mở Liên kết của Bernadette Hyland 7 trực quanhóa con đường xuất bản LOD:

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 44/85

Page 45: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

4 nguyên tắc của Dữ liệu Liên kết (Các vấn đề thiết kế của W3C cho Dữ liệu Liên kết8)cũng là nơi tốt để bắt đầu hiểu các nguyên tắc của LOD: Web ngữ nghĩa không chỉ là về việc đặt dữ liệu lên web - đó là “các trang web” xưa cũ.Nó là về việc tạo ra các liên kết, sao cho người hoặc máy có thể khai thác “web dữ liệu”được kết nối theo ngữ nghĩa. Với dữ liệu liên kết, bạn có thể tìm ra nhiều dữ liệu có liênquan hơn. Giống như web của siêu văn bản, web dữ liệu được xây dựng bằng các tài liệu trên web.Tuy nhiên, không giống như web của siêu văn bản, nơi mà các đường liên kết là các mốiquan hệ neo đậu trong các tài liệu siêu văn bản được viết bằng ngôn ngữ đánh dấu siêuvăn bản HTML, LOD hoạt động thông qua các đường liên kết giữa những điều tùy ý đượcRDF mô tả. Các URI nhận diện bất kỳ dạng đối tượng hoặc khái niệm nào, mà bất chấpliệu bạn đang sử dụng HTML hay RDF, các khuyến cáo y hệt áp dụng để làm cho webphát triển:

1. Sử dụng các URI như là các tên cho mọi điều 2. Sử dụng các HTTP URI sao cho mọi người có thể tra cứu các tên đó 3. Khi ai đó tra cứu một URI, hãy cung cấp thông tin hữu dụng, bằng việc sử dụng

các tiêu chuẩn đã thành danh (như RDF, SPARQL) 4. Đưa các đường liên kết tới các URI, sao cho nhiều điều hơn có thể được phát hiện

Hơn nữa, là sống còn để đưa ra thông tin chất lượng cao cho các lập trình viên và cáccông nhân dữ liệu (data worker) đối với dữ liệu của bạn. Hãy cung cấp thông tin về điềuhành dữ liệu cũng như thông tin về bộ sưu tập dữ liệu để đảm bảo làm việc trơn tru vàhiệu quả với các dữ liệu của bạn. Để đảm bảo sử dụng lại rộng rãi nhất có thể, hãy cung cấp một giao diện lập trình ứngdụng API9 (web) trên đỉnh của các tập hợp dữ liệu được xuất bản để cho phép nhữngngười sử dụng truy vấn dữ liệu của bạn và lấy dữ liệu và thông tin đó từ bộ sưu tập củabạn được tùy biến thích nghi cho các nhu cầu của họ.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 45/85

Page 46: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Một API web xúc tác cho các lập trình viên web dễ dàng làm việc với dữ liệu của bạn.Đây là vài ví dụ thực hành tốt nhất để xuất bản LOD:

• Pháp luật chính thức của Vương quốc Anh: http://www.legislation.gov.uk/• REEEP Climate Tagger API: http://www.climatetagger.net/climate-tagger-api/• Dự án của EU: LATC – LOD around the clock: http://latc-project.eu/• Global Buildings Performance Network (GBPN): http://www.gbpn.org/databases-

tools/mrv-tool/about• Dữ liệu thống kê được xuất bản như là dữ liệu mở liên kết: http://stats.lod2.eu/

Các liên kết: (1) Uniform Resource Identifier, URI on Wikipedia:http://en.wikipedia.org/wiki/Uniform_resource_identifier(2) Creative Commons: http://creativecommons.org/(3) Resource Description Framework (RDF): http://www.w3.org/RDF/ RDF on Wikipedia:http://en.wikipedia.org/wiki/Resource_Description_Framework(4) The LOD Cloud: http://richard.cyganiak.de/2007/10/lod/(5) The Data Hub (formerly CKAN): http://thedatahub.org/(6) W3C Linked (Open) Data Cookbook:http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook(7) Bernadette Hyland: http://3roundstones.com/home/bernadettehyland.html(8) W3C Design Issues for Linked Data:http://www.w3.org/DesignIssues/LinkedData.html(9) Web API: http://en.wikipedia.org/wiki/Web_API or Web Service:http://en.wikipedia.org/wiki/Web_service

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 46/85

Page 47: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Đọc thêm • How to publish Linked Data on the Web, Bizer et al: http://wifo5-

03.informatik.uni-mannheim.de/bizer/pub/LinkedDataTutorial/• Linked Data – Connect Distributed Data across the Web: http://linkeddata.org• Linked Data: Evolving the Web into a Global Data Space, Heath and Bizer:

http://linkeddatabook.com• Designing URI Sets for the UK Public Sector:

http://www.cabinetoffice.gov.uk/resource-library/designing-uri-sets-uk-public-sector

• Linked Data Patterns, Dodds & Davies:http://patterns.dataincubator.org/book/linked-data-patterns.pdf

• Linking Government Data, David Wood (Editor), Springer; 2011 edition(November 12, 2011), ISBN-10: 146141766X, ISBN-13:978-1461417668

• Collection of Linked Open Vocabularies: https://lov.okfn.org/dataset/lov/• Basel Register of Thesauri, Ontologies & Classifications: http://bartoc.org/

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 47/85

Page 48: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Câu đố - Chương 4.1 Câu hỏi 1: RDF là gì… Hãy chọn những gì áp dụng được (nhiều câutrả lời là có thể) ⃞ Khung Mô tả Tài nguyên (Resource Description Framework) ⃞ Khuyến cáo chính thức của W3C cho các mô hình dữ liệu web ngữ nghĩa ⃞ Tên từ vựng của LOD ⃞ Khung Dữ liệu được Phê chuẩn (Ratified Data Framework) ⃞ Mô hình dữ liệu mạnh cho LOD Câu hỏi 2: Điều gì là đúng/sai về các giấy phép… Hãy chọn những gìáp dụng được (nhiều câu trả lời là có thể)⃞ Dữ liệu Mở không cần giấy phép ⃞ Giấy phép mở như Creative Commons nên là một phần của siêu dữ liệu ⃞ Giấy phép là quan trọng sao cho dữ liệu của bạn không thể bị hiểu sai ⃞ Tất cả các giấy phép mở là y hệt nhau Câu hỏi 3: Khi nào xuất bản Dữ liệu Mở … Hãy chọn những gì áp dụngđược (nhiều câu trả lời là có thể)⃞ Tôi có thể lấy một phí nhỏ ⃞ Dữ liệu phải được rà soát lại (người liên hệ được chỉ định) ⃞ Dữ liệu sẽ sẵn sàng qua thời gian (vĩnh viễn) ⃞ Tôi phải tạo ra từ vựng được xây dựng tùy chỉnh

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 48/85

Page 49: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

4.2. Tiêu dùng Dữ liệu Mở Liên kếtCác bước đầu để tiêu dùng nội dung như là LOD Việc tiêu dùng LOD xúc tác cho bạn để tích hợp và cung cấp thông tin và các bộ sưu tậpdữ liệu chất lượng cao để pha trộn dữ liệu của riêng bạn và thông tin của các bên thứ 3.Các bộ sưu tập dữ liệu được làm giàu đó có thể hoạt động như là các điểm truy cập duynhất cho lĩnh vực đặc thù ở dạng cổng LOD và như là hệ thống kho dữ liệu mở hoặc nộibộ mà xúc tác để giải quyết tốt hơn các vấn đề như ra quyết định, quản lý thảm họa,quản lý tri thức và/hoặc các giải pháp tình báo thị trường. Các tổ chức có thể hưởng lợi và đạt được ưu thế cạnh tranh thông qua khả năng để: (1)tự sinh các hồ sơ và trộn thông tin từ các nguồn thông tin phân tán; (2) tạo các ứngdụng dựa vào dữ liệu thời gian thực với sự nhân bản ít hơn; và (3) tạo ra tri thức mớingoài các dữ liệu được liên kết với nhau này.

Chỉ dẫn nhanh để tiêu dùng LOD Đây là những vấn đề và những cột mốc quan trọng nhất để cân nhắc khi tiêu dùng LOD:Chỉ định các trường hợp sử dụng cụ thể Hãy luôn chỉ định các trường hợp sử dụng (kinh doanh) cụ thể cho dịch vụ hoặc ứngdụng mới của bạn. Đâu là vấn đề cụ thể bạn muốn phải giải quyết? Đâu là dữ liệu có sẵntrong nội bộ và bạn sẽ cần gì từ các nguồn của các bên thứ 3?Đánh giá các nguồn dữ liệu và các tập hợp dữ liệu thích hợp

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 49/85

Page 50: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Dựa vào (các) trường hợp sử dụng cụ thể của bạn, bước tiếp sau là đánh giá các nguồnLOD thích hợp để tích hợp dữ liệu. Hãy tìm ra các nguồn dữ liệu nào là sẵn sàng và chấtlượng dữ liệu ra sao được các nguồn của bên thứ 3 chào (chất lượng dữ liệu thường cóliên quan tới bản thân nguồn thông tin đó; các tổ chức nổi tiếng thường cung cấp dữliệu và thông tin chất lượng cao). Một tiếp cận rất tốt cho sự đánh giá này là sử dụngmột trong những catalog dữ liệu mở có sẵn như The Data Hub1 (Trung tâm Dữ liệu).Cũng nên cân nhắc các chu kỳ cập nhật các tập hợp dữ liệu và thời điểm dữ liệu đượccập nhật lần cuối. Kiểm tra các giấy phép tương ứng Hãy đánh giá các giấy phép để sử dụng và sử dụng lại do các chủ sở hữu dữ liệu cungcấp. Tránh sử dụng dữ liệu nơi mà giấy phép không rõ ràng và khó hiểu là có sẵn. Nếucó nghi ngờ, hãy liên hệ với người nắm giữ dữ liệu tương ứng và làm rõ các câu hỏi đó.Cũng là quan trọng để biết giấy phép nào các tập hợp dữ liệu đó cung cấp để pha trộncác tập hợp dữ liệu này với các tập hợp dữ liệu khác. Tạo ra các mẫu tiêu dùng Việc tạo ra các mẫu tiêu dùng chỉ ra chi tiết về dữ liệu chính xác nào được sử dụng lại từnguồn dữ liệu nhất định. Không phải tất cả các dữ liệu trong tập hợp sẽ là thích hợp với(các) trường hợp sử dụng được chỉ định, trong trường hợp đó bạn có thể phát triển cácmẫu giả thiết mà rõ ràng chỉ định chỉ các dữ liệu thích hợp trong tập hợp đó. Quản lý các cơ chế điều chỉnh, lưu trữ và cập nhật Khi LOD được tiêu dùng, nhu cầu chỉnh lý cho phù hợp các từ vựng khác nhau của cáctập hợp dữ liệu được tiêu dùng (cả nội bộ và bên ngoài) thường xảy ra. Điều này là thíchhợp để đảm bảo cho sự tích hợp dữ liệu trơn tru thông qua chỉnh lý từ vựng2. Một mối lokhác trong thực tế là các nguồn LOD hoàn toàn không ổn định và luôn sẵn sàng để tiêudùng dữ liệu theo thời gian thực. Để ngăn ngừa một tập hợp dữ liệu đặc thù khỏi việckhông sẵn sàng ở thời điểm nhất định, hãy tạo ra các cơ chế lưu trữ tạm (caching) chodữ liệu và thông tin đặc thù của các bên thứ 3. Một vấn đề quan trọng khác là tiêu dùngthông tin cập nhật; tiếp cận khả thi ở đây là triển khai các cơ chế cập nhật để tiêu dùng

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 50/85

Page 51: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

LOD. Xin hãy xem “Bộ sưu tập Hộp Công cụ Dữ liệu Mở Liên kết” (Linked Open Data ToolBox Collection) ở cuối của chương này để có thêm thông tin. Tạo ra những pha trộn, các GUI, các dịch vụ và ứng dụng trên đỉnh Để phục vụ cho những người sử dụng của bạn và tạo ra các ứng dụng hoặc dịch vụ LODmạnh trên đỉnh của LOD được pha trộn, là sống còn để cung cấp các giao diện đồ họathân thiện với người sử dụng và các dịch vụ mạnh cho những người sử dụng đầu cuối. Thiết lập các mối quan hệ đối tác mới bền vững Khi sử dụng dữ liệu và thông tin của các bên thứ 3, hãy liên hệ với các nhà cung cấp dữliệu để xây dựng các mối quan hệ đối tác mới và, đổi lại, chào dữ liệu của riêng bạn đểsử dụng. Để kết thúc, xin cân nhắc vài ví dụ thực hành tốt nhất để tiêu dùng LOD từ các tay chơiLOD như sau: Các liên kết(1) The Data Hub: http://thedatahub.org(2) Vocabulary / Ontology Alignment on Wikipedia:http://en.wikipedia.org/wiki/Ontology_alignmentĐọc thêm

• Tập huấn Quốc tế lần 2 về Tiêu dùng Dữ liệu Liên kết:http://km.aifb.kit.edu/ws/cold2011/

• Dữ liệu Liên kết: Tương lai của Tổ chức Tri thức trên Web:http://www.iskouk.org/events/linked_data_sep2010.htm

• Dữ liệu Liên kết: Tiến hóa Web thành Không gian Dữ liệu Toàn cầu, Heath & Bizer:http://linkeddatabook.com

• Bộ sưu tập các Từ vựng Mở Liên kết: https://lov.okfn.org/dataset/lov/• Basel Register of Thesauri, Ontologies & Classifications: http://bartoc.org/

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 51/85

Page 52: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Bộ sưu tập Hộp Công cụ Dữ liệu Mở Liên kết Bộ sưu tập Hộp Dữ liệu Mở Liên kết (Linked Open Data Tool Box Collection) đưa ra danhsách các công cụ phần mềm và các dịch vụ quan trọng để xuất bản và tiêu dùng LOD.

• PoolParty Semantic Suite: http://www.poolparty.biz Các dịch vụ và công cụ để quản lý siêu dữ liệu dự ào LOD, tìm kiếm doanhnghiệp, khai thác văn bản và tích hợp dữ liệu

• Unified Views: https://unifiedviews.eu/Tích hợp dữ liệu và Khung Kho Dữ liệu Liên kết (Linked Data WarehouseFramework)

• Silk: http://www4.wiwiss.fu-berlin.de/bizer/silk/Khung phát hiện liên kết cho web dữ liệu

• LIMES: http://aksw.org/Projects/LIMESKhung phát hiện liên kết để đo đếm không gian

• Virtuoso Universal Server: http://virtuoso.openlinksw.com/Máy chủ vạn năng để tiêu dùng, lưu trữ và truy xuất dữ liệu liên kết

• Stardog: http://stardog.com/Nền tảng thống nhất dữ liệu doanh nghiệp được xây dựng dựa trên công nghệ đồhọa thông minh

• GraphDB: http://graphdb.ontotext.com/graphdb/Cơ sở dữ liệu Đồ họa Ngữ nghĩa sẵn sàng của Doanh nghiệp

• Callimachus Project: http://callimachusproject.org/Khung cho các ứng dụng hướng dữ liệu có sử dụng dữ liệu liên kết

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 52/85

Page 53: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Câu đố - Chương 4.2 Câu hỏi 1: Các tổ chức hưởng lợi từ việc tiêu dùng Dữ liệu Mở Liên kếtnhư thế nào? Hãy chọn những gì áp dụng được (nhiều câu trả lời làcó thể)⃞ Tự động sinh ra các hồ sơ và pha trộn thông tin từ các nguồn thông tin phân tán⃞ Tạo ra các ứng dụng dựa vào dữ liệu thời gian thực ⃞ Tạo ra tri thức vượt ra ngoài các dữ liệu được liên kết với nhau này ⃞ Khi giấy phép chưa rõ ràng là sẵn sàng, họ có thể sử dụng nó để tăng cường các tậphợp dữ liệu của riêng họ mà không cần sự ghi công ⃞ Đặt các dữ liệu thô lên các website của họ như nó có và lôi kéo vài giao thông webkhỏi nguồn ban đầuCâu hỏi 2: Khi sử dụng lại dữ liệu, tôi phải … Hãy chọn những gì ápdụng được (nhiều câu trả lời là có thể)⃞ Thừa nhận ghi công nó tới các nguồn ⃞ Đảm bảo tất cả các thông tin là đúng ⃞ Đăng nhập vào cơ sở dữ liệu của nhà cung cấp

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 53/85

Page 54: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

5. THỰC HÀNH TỐT NHẤT VÀ CÁC VÍ DỤ5 ví dụ thực thành tốt nhất để chỉ ra sức mạnh của LOD LOD vẫn còn là lĩnh vực khá mới mẻ. Một trong những dự án đầu tiên khởi động web củacác tập hợp dữ liệu liên kết từng là Dự án Liên kết Dữ liệu Mở (Linking Open DataProject1), nó đã nhận diện các tập hợp dữ liệu đang tồn tại theo một giấy phép mở, đãchuyển đổi chúng sang RDF tuân theo các nguyên tắc của Dữ liệu Liên kết, và đã xuấtbản chúng trên web. Dự án Liên kết Dữ liệu Mở là nỗ lực của cộng đồng được thành lậpvào tháng 1/2007 và được Nhóm Giáo dục Web Ngữ nghĩa và Vươn xa hơn2 (SemanticWeb Education and Outreach Group) của W3C hỗ trợ. Kể từ năm 2007, web dữ liệu đã phát triển mạnh mẽ, và bây giờ nó gồm cả các tập hợpdữ liệu từ các tổ chức và các nhà cung cấp dữ liệu khác nhau, gồm giới truyền thông(như BBC, NYT), các chính phủ (như Mỹ, Vương quốc Anh) cũng như các nội dung donhững người sử dụng tạo ra. Để trực quan hóa các nhà cung cấp LOD chủ chốt và cácmối liên kết của họ, Richard Cyganiak (DER) và Anja Jentzsch (Freie Universität Berlin)thường xuyên biên dịch lược đồ liên kết đám mây dữ liệu mở3, ở đó mỗi nút đại diệncho tập hợp dữ liệu được xuất bản như là dữ liệu liên kết và các cung của các nút nội bộmô tả các kết nối giữa các tập hợp dữ liệu. Vào tháng 9/2011, các tập hợp dữ liệu trongđám mây LOD gồm hơn 31 tỷ bộ 3 (triples*) RDF và được liên kết với nhau bằng khoảng504 triệu liên kết. Sự chia nhỏ để thống kê chi tiết đã được xuất bản vào năm 20144.

* Một bộ 3 (triple) RDF là một trình bày xác định cách thức theo đó bạn có thể thể hiện mối quan hệ giữa các đối tượng trong một tập hợp dữ liệu. Thường có 3 thành phần đối với bộ 3 đó: Chủ ngữ, Vị ngữ và Bổ ngữ (Subject, Predicate and Object).

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 54/85

Page 55: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

“Lược đồ đám mây Liên kết Dữ liệu Mở, của Richard Cyganiak và Anja Jentzsch,http://lodcloud.net - tháng 8/2014”

Như bạn có thể thấy trong lược đồ đám mây, vài nhà cung cấp dữ liệu đã trở nên nổitiếng và nổi danh như là các trung tâm liên kết phổ biến trên web dữ liệu. Các ví dụ nổibật như “Dbpedia5“,một nỗ lực của cộng đồng để trích xuất thông tin có cấu trúc từWikipedia và “các tên địa lý” (geonames6) cung cấp các mô tả RDF của hàng triệu vị tríđịa lý trên thế giới. Các chương tiếp sau nhấn mạnh 5 ví dụ thành công của các website và các ứng dụngtiên phong sử dụng rồi LOD để làm giàu nội dung của riêng họ và xuất bản các tập hợpdữ liệu của họ ở định dạng RDF như là LOD để các bên ở ngoài sử dụng lại tự do:

• Climate Tagger - bộ các công cụ phần mềm giúp các tổ chức trong các lĩnh vựcphát triển và khí hậu hợp lý hóa và xây dựng các catalog các tài nguyên dữ liệu vàthông tin của họ

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 55/85

Page 56: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

• openEI - cổng cung cấp các tập hợp dữ liệu khác nhau về năng lượng theo wikingữ nghĩa

• Enipedia - khai thác tích cực trong các ứng dụng wiki và web ngữ nghĩa cho cácvấn đề về năng lượng và công nghiệp

• Công cụ GBPN để xây dựng các kịch bản hiệu suất năng lượng• Các sáng kiến phát triển - dự án các Tiêu chuẩn Dữ liệu tham gia chung (Joined-

up Data Standards project) Tất cả 5 thực hành tốt nhất đó đều là một phần của lược đồ đám mây LOD được nêu ởtrên, và các tập hợp dữ liệu của chúng được liên kết với nhau và với các nhà cung cấp dữliệu khác để tối đa hóa các lợi ích của việc sử dụng công nghệ LOD. Nhiều ví dụ hơn cóthể được thấy trong thư mục CKAN7 “Data Hub” (Trung tâm Dữ liệu), một đăng ký cáctập hợp và dự án dữ liệu tri thức mở.

Các liên kết: (1) Linking Open Data Project:http://esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/LinkingOpenData(2) W3C Semantic Web Education and Outreach Group:http://www.w3.org/2001/sw/sweo/(3) The Linked Open Data (LOD) Cloud: http://lod-cloud.net(4) State of the LOD Cloud 2014 http://linkeddatacatalog.dws.informatik.uni-mannheim.de/state/(5) DBpedia: http://wiki.dbpedia.org/about(6) Geonames: http://www.geonames.org/ontology/(7) The Data Hub: http://thedatahub.org/

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 56/85

Page 57: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Đọc thêm: • Dữ liệu Liên kết – Câu chuyện cho tới nay, Christian Bizer, Tom Heath, Tim

Berners-Lee, Tạp chí Quốc tế về Web Ngữ nghĩa và các Hệ thống thông tin(IJSWIS) (2009): http://tomheath.com/papers/bizerheath-berners-lee-ijswis-linked-data.pdf

• Liên kết Dữ liệu Chính phủ, David Wood (Editor), Springer; ấn bản năm 2011(12/11/2011), ISBN-10: 146141766X, ISBN-13: 978-1461417668

• Áp dụng các thực hành tốt nhất và Dữ liệu Liên kết trong các lĩnh vực chủ đề khácnhau, Max Schmachtenberg, Christian Bizer, và Heiko Paulheim, tài liệuISWC2014 http://dws.informatik.uni-mannheim.de/fileadmin/lehrstuehle/ki/pub/SchmachtenbergBizerPaulheim-AdoptionOfLinkedDataBestPractices.pdf

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 57/85

Page 58: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

5.1. Gắn thẻ Khí hậu - Climate Taggerhợp lý hóa và xây dựng catalog các tài nguyên dữ liệu và thông tin

Công cụ để phân tích nội dung trên trực tuyến dựa vào từ điển báchkhoa toàn thư LOD Climate Tagger1 của REEEP là bộ các công cụ để giúp các tổ chức hướng tri thức trongcác lĩnh vực phát triển và khí hậu để hợp lý hóa và xây dựng catalog cho các tài nguyêndữ liệu và thông tin của họ, và kết nối chúng tới cộng đồng tri thức khí hậu rộng lớnhơn. Climate Tagger sử dụng Dữ liệu Mở Liên kết, và dựa vào giao diện lập trình ứngdụng (API) gắn thẻ thử và đúng (tried-and-true) của reegle (bây giờ là Climate TaggerAPI). Nó đã được REEEP giới thiệu lần đầu vào năm 2011 để giúp cho mạng của nó tạocatalog và kết nối dữ liệu được tốt hơn, và được Từ điển bách khoa toàn thư ClimateSmart (khí hậu thông minh) mở rộng hỗ trợ, nó đã được phát triển trong sự cộng tác vớicác chuyên gia trong lĩnh vực này. Từ vựng có tính mở rộng này được tổ chức trong Từ điển bách khoa toàn thư khí hậuthông minh từng được biên soạn và phát triển tiếp trong một số năm, và vẫn thườngxuyên được mở rộng để đưa vào sự phong phú gia tăng chưa từng có các khái niệmthích hợp với các lĩnh vực khí hậu và năng lượng sạch. Từ đầu, từ điển bách khoa toànthư đó đã được xây dựng và duy trì như là Dữ liệu Mở Liên kết đầy đủ, sử dụng phầnmềm PoolParty2, và được định dạng như là tiêu chuẩn ngữ nghĩa bằng việc sử dụng Hệthống Tổ chức Tri thức Đơn giản – SKOS (Simple Knowledge Organization System3). Từđiển bách khoa toàn thư đó cung cấp các liên kết cả từ và tới các từ điển bách khoa toànthư LOD thích hợp khác và nội dung toàn bộ của nó có thể truy vấn được thông quađiểm đầu cuối4 SPARQL.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 58/85

Page 59: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Từ điển bách khoa toàn thư đó hiện được duy trì với 5 ngôn ngữ khác nhau, và từngkhoản mục (khái niệm – concept) đều có địa chỉ web vĩnh viễn - “Mã nhận diện Tàinguyên Thống nhất” - URI (Uniform Resource Identifier) - nên nó có thể được thamchiếu và được liên kết tới các nguồn LOD khác. Hiện các khái niệm của từ điển báchkhoa toàn thư này được liên kết ở mức khái niệm tới DBPedia5, GEMET6 và từ điển báchkhoa toàn thư AgroVoc7 của FAO. Điều này có nghĩa là định nghĩa, các bản dịch bổ sunghoặc các từ đồng nghĩa từ 3 bên như vậy là sẵn sàng rồi theo thời gian thực.

API của trình gắn thẻ khí hậu - giao diện máy với máy để gắn thẻ chấtlượng cao API của trình gắn thẻ khí hậu (Climate Tagger API8) sử dụng từ điển bách khoa toàn thưthông minh về khí hậu (Climate Smart Thesaurus) để phân tích bất kỳ thông tin văn bảnnào được xuất bản trên trực tuyến bằng việc so sánh nội dung của nó với tất cả các kháiniệm của từ điển đó. Thuật toán được sử dụng là gắn điểm thích hợp vào các khái niệmđược trích xuất và trả thông tin này ngược về cho người sử dụng. Các từ khóa được tríchxuất sẽ được kết nối tới thông tin bổ sung từ cuốn từ điển bách khoa toàn thư đó, chophép Climate Tagger không chỉ gắn thể cho nội dung, mà còn làm giàu cho trang webbằng các định nghĩa phù hợp. Các lập trình viên web có thể yêu cầu khóa API và chỉ định thông tin trích xuất họ muốnđược trả về cho nội dung của họ. Sử dụng API đó cho phép tự do về các trường hợp sửdụng, dù Climate Tagger được sử dụng để gắn thẻ cho các tài nguyên, đưa chúng vàocác chủng loại được định nghĩa trước hoặc yêu cầu các bản dịch các từ khóa để thamchiếu chéo tới các tài nguyên đa ngôn ngữ là hoàn toàn tùy thuộc vào người sử dụng. Một ưu điểm khác là khả năng thiết lập đồng hồ đo đếm cho các bản cập nhật tự độngđể chắc chắn bất kỳ nội dung web nào cũng luôn được gắn thẻ bằng phiên bản mớinhất của Climate Tagger. Vào năm 2016, toàn bộ phần về năng lượng tái tạo đã đượcxem xét lại kỹ lưỡng trong sự cộng tác với IRENA, và một phân tích có tính đối sánh giữaREEEP, Trung tâm Biến đổi Khí hậu Cộng đồng vùng Caribe – CCCCC (Caribbean

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 59/85

Page 60: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Community Climate Change Centre) và Thư ký Chương trình Môi trường Khu vực Tháibình dương - SPREP (Secretariat of the Pacific Regional Environment Programme) đãlàm gia tăng tiếp chiều sâu toàn bộ nội dung của từ điển bách khoa toàn thư đó. Thậm chí để làm cho sự tích hợp của Climate Tagger dễ dàng hơn, Climate Tagger cònlà sẵn sàng cho các ứng dụng trường hợp điển hình tiêu chuẩn như là một trình cài cắmcho Drupal và WordPress. Việc sử dụng Climate Tagger cho nền tảng trên trực tuyến làkhông mất tiền.

Vài trường hợp điển hình về Climate Tagger Trường hợp 1 - Tổ chức cơ sở dữ liệu các tài liệu trước đó không tìm kiếm được Tổ chức của bạn đã tích cóp một kho khổng lồ các tài liệu điện tử có giá trị. Không may,chúng đặc biệt không có được trật tự tốt hoặc không được phân loại tốt. Chúng cũngthiếu việc gắn thẻ để có khả năng tìm kiếm được trên trực tuyến, vì thế các khách tớithăm website của riêng bạn không có cách thức có hiệu quả nào để tìm ra và truy cậpđược tới sự giàu có thông tin đã tồn tại rồi ở đó. Bằng việc sử dụng Climate Tagger, có được cách thức nhanh chóng, dễ dàng và tin cậyđể làm cho kho các tài liệu đó của bạn có khả năng tìm kiếm được - và tìm ra được!Climate Tagger có thể tức thì gắn thẻ cho tất cả các báo cáo, các bài báo, và các tài liệukhoa học của bạn. Vì hệ thống này dựa vào một từ điển bách khoa toàn thư với cáckhoản mục và các mối quan hệ được định nghĩa rõ ràng, nó sẽ tự động sử dụng tập hợpcác từ khóa ổn định để mô tả nội dung. Điều này ngụ ý bạn có thể đặt các tài liệu vàocác bó hữu ích, làm cho chúng tất cả đều có khả năng truy cập được đối với nhữngngười khác và làm gia tăng ảnh hưởng công việc của bạn. Vài tổ chức trong lĩnh vực năng lượng sạch đang sử dụng rồi Climate Tagger để cải thiệnviệc gắn thẻ cho các tài liệu và nhiều người hơn đang xem xét cách tốt nhất để tích hợpnó vào trong các hệ thống của họ lúc này.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 60/85

Page 61: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Trường hợp 2 - Liên kết chéo các tài nguyên của riêng bạn Cổng web của bạn chào lượng khổng lồ các tài nguyên trên trực tuyến. Chúng thực sựđược tổ chức và được phân loại hoàn toàn tốt, nhưng không có 2 tài liệu nào được thamchiếu chéo với nhau cả. Climate Tagger sẽ tức thì đánh chỉ số cho tất cả các tài nguyên của bạn và có thể giúptạo ra ứng dụng đơn giản để tự động gợi ý các nội dung có liên quan từ kho các tài liệucủa riêng bạn. Ví dụ, OpenEI đã xây dựng rồi một widget (trình ứng dụng) để gợi ý các bài báo có liênquan với các độc giả của chúng, giúp cho họ tìm ra những gì họ đang tìm kiếm.

Trường hợp 3 - Chào các định nghĩa, các từ đồng nghĩa và các liên kết Công việc của bạn khó để chào cho những người sử dụng của bạn thông tin thích hợpđược cập nhật - nhưng cùng lúc bạn biết rằng sự hiểu lầm là không thường xuyên khi cốmô tả một chủ đề phức tạp nào đó. Bằng việc tích hợp Climate Tagger trong môi trường xuất bản của bạn, bạn có thể chàocho những người sử dụng của bạn một hệ thống đơn giản trích xuất các chủ đề đặc biệttừ các bài báo của bạn và chào các định nghĩa, các từ đồng nghĩa và các đường liên kếttới các tài nguyên mở như Wikipedia. Ví dụ, nền tảng phát triển tri thức Eldis đang sử dụng hệ thống này để chào cho nhữngngười sử dụng của họ hộp thông tin “chúng tôi ngụ ý gì” mà gồm các định nghĩa và cáctừ đồng nghĩa được lấy ra từ Climate Tagger.

Trường hợp 4 - Gắn thẻ đa ngôn ngữ Website của bạn được chào theo nhiều ngôn ngữ. Để gắn thẻ chính xác cho các tàinguyên của bạn, bạn có lẽ cần thuê những người bẩm sinh nói nhiều thứ tiếng với sự

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 61/85

Page 62: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

tinh thông về các chủ đề năng lượng sạch hoặc biến đổi khí hậu - một triển khai côngviệc tốn thời gian và chi phí!Climate Tagger có thể tự động trích xuất các từ khóa chất lượng đảm bảo từ các tài liệugốc với 5 thứ tiếng: Anh, Tây Ban Nha, Pháp, Bồ Đào Nha và Đức. Bạn có thể kết nối các tài nguyên có liên quan trong và xuyên khắp các ngôn ngữ đó, vàchào cho những người sử dụng của bạn cấu trúc có tính trực quan để trích xuất các tàiliệu. Climate Tagger giúp bạn bằng cách quét có hệ thống các tài nguyên của bạn vàtrích xuất các từ khóa và vị trí địa lý thích hợp nhất. Climate Tagger đã được REEEP phát triển trong sự cộng tác với chương trình Thông tinNăng lượng Mở của Phòng thí nghiệm Năng lượng Tái tạo Quốc gia của Mỹ (the USNational Renewable Energy Laboratory’s Open Energy Information program), chươngtrình weADAPT của Viện Môi trường Stockholm và chương trình Eldis của Viện về cácNghiên cứu Phát triển, như một phần của Nhóm các Nhà môi giới Tri thức Khí hậu(Climate Knowledge Brokers Group).Climate Tagger hiện diện được là nhờ vào sự hỗ trợ tài chính hào phóng của một số nhàtài trợ, gồm Mạng Tri thức Khí hậu và Phát triển, Chính phủ Liên bang Đức, IRENA vàTrung tâm Công nghệ Khí hậu và Mạng của Chương trình Môi trường Liên hiệp quốc.

Các liên kết: (1) Climate Tagger website: http://www.climatetagger.net/(2) PoolParty Thesaurus & Taxonomy Management Softwarehttps://www.poolparty.biz/taxonomy-thesaurus-management/(3) W3C – SKOS Simple Knowledge Organization System:https://www.w3.org/2004/02/skos/(4) W3C – SPARQL endpoints https://www.w3.org/wiki/SparqlEndpoints(5) DBpedia (LOD version of Wikipedia) http://wiki.dbpedia.org/

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 62/85

Page 63: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

(6) GEMET Thesaurus https://www.eionet.europa.eu/gemet/(7) FAO’s AGROVOC Thesaurus http://aims.fao.org/vest-registry/vocabularies/agrovoc-multilingual-agricultural-thesaurus(8) Climate Tagger API: http://www.climatetagger.net/climatetagger-api/

Đọc thêm:• Wikipedia – Application Programming Interface:

https://en.wikipedia.org/wiki/Application_programming_interface• Các từ vựng được kiểm tra: http://www.controlledvocabulary.com/• W3C – Resource Description Framework (RDF): https://www.w3.org/RDF/

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 63/85

Page 64: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

5.2. Các định nghĩa của OpenEIViệc xuất bản và tiêu dùng thông tin năng lượng mở của OpenEI OpenEI, viết tắt của thông tin năng lượng mở (Open Energy Information), là nền tảngchia sẻ tri thức có tính cộng tác1 với truy cập tự do và mở tới các dữ liệu, các mô hình,các công cụ, và thông tin có liên quan tới năng lượng. OpenEI đặc trưng với hơn 60.000trang nội dung, hơn 1.500 tập hợp dữ liệu có thể tải về được, các cổng khu vực với mộtloạt các chủ đề có liên quan tới năng lượng, và vô số các công cụ trên trực tuyến. Trongsố các công cụ đó có “Bảng chú giải về OpenEI” (OpenEI Glossary2), một bảng chú giảicác khái niệm về năng lượng, nó là mô hình để sản xuất và tiêu dùng dữ liệu liên kết.

Sứ mệnh chia sẻ dữ liệu của OpenEI Việc chia sẻ dữ liệu là thành phần chính trong sứ mệnh củaOpenEI. Các nguyên tắc dữ liệu liên kết đã được áp dụng để đảm

bảo rằng đa số lớn các thông tin được thấy trên OpenEI được làm cho sẵn sàng trongmột loạt các định dạng vạn năng, gồm cả những thứ thuận tiện như API, RDF vàSPARQL. Việc mở ra dữ liệu trong các định dạng máy đọc được đó làm gia tăng tính ứngdụng của thông tin, làm cho nó truy cập được và hữu dụng hơn cho những người khác.

Bất kỳ khi nào có thể, các đặc tính của OpenEI Glossary đều liên kết các khái niệm vàđịnh nghĩa được thu thập từ các nguồn khác. Điều này làm được là nhờ các dịch vụ dữ

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 64/85

Page 65: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

liệu liên kết được các cơ quan khác cung cấp như DBPedia và reegle. OpenEI có đượcthông tin này thông qua các điểm đầu cuối RDF và SPARQL theo thời gian thực, đảmbảo rằng thông tin được cung cấp cho người sử dụng luôn được cập nhật.

Tất cả đều nói về điều y hệt như nhau Việc cung cấp thông tin bổ sung này tăng cường cho sự hiểu biết của những người sửdụng các khái niệm được định nghĩa trong khi liên kết có hệ thống các tài nguyên đó vớikhái niệm trung tâm. Kết quả là mối quan hệ máy đọc được giữa nhiều nguồn dữ liệu.Mối quan hệ này cho phép các máy tự động xác định khái niệm có liên quan tới từngđịnh nghĩa và là cơ bản trong việc thu thập các định nghĩa thích hợp cho khái niệm cụthể nào đó. Trong trường hợp các Định nghĩa của OpenEI, điều này đạt được bằng việc sử dụng đặctính ngữ nghĩa được gọi là foaf:page. Vì OpenEI, DBPedia, và reegle tất cả đều thamchiếu tới cùng bài viết trên Wikipedia như một trang thảo luận cùng chủ đề y hệt,OpenEI có khả năng tự động sinh ra SPARQL cần thiết để lấy các định nghĩa từ từngtrong số các site khác đó. Ngắn gọn, bằng việc liên kết theo ngữ nghĩa định nghĩa củaOpenEI với khái niệm trung tâm (trang Wikipedia), các lập trình viên giành được sự truycập dễ dàng tới tất cả các thông tin khác được liên két tới khái niệm y hệt đó.

Trả về sự đồng thuận Dữ liệu liên kết trên OpenEI là nhiều hơn so với chỉ việc phát triển các trang thông tinmà tận dụng được nhiều nguồn để đưa ra kinh nghiệm cho người sử dụng toàn diện.Bằng việc quy về các định nghĩa với các thuộc tính ngữ nghĩa thích hợp, OpenEI có thểchắc chắn rằng từng mẩu nội dung được tận dụng trỏ ngược về nguồn ban đầu của nó.Hơn nữa, định nghĩa của OpenEI cho từng khái niệm cũng được xuất bản bằng việc chỉđịnh giá trị thuộc tính ngữ nghĩa foaf:page tới URI y hệt của Wikipedia. Trong trườnghợp của OpenEI, các thuộc tính được chỉ định tới các định nghĩa và các nội dung ngữ

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 65/85

Page 66: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

nghĩa khác được tự động xuất bản tới các điểm đầu cuối RDF và SPARQL của OpenEI.Điều này hoàn tất mối quan hệ ngữ nghĩa sao cho bất kỳ ai tìm cách khai thác ý nghĩađằng sau một khái niệm sẽ thấy được định nghĩa của OpenEI cùng với của Dbpedia vàcủa reegle trong đám mây LOD.

Lợi ích của việc sử dụng dữ liệu liên kết Việc liên kết nhiều định nghĩa tới cùng y hệt một khái niệm tăng cường sự hiểu biết vềkhái niệm đó và xúc tác cho cả con người và máy thẩm tra để khẳng định rằng, trongthực tế, chúng đang định nghĩa điều y hệt. Nhưng đâu là những lợi ích của doanhnghiệp nhỉ? Bằng việc liên kết dữ liệu của OpenEI với những dữ liệu khác, OpenEI có thểcơ bản thuê ngoài làm nội dung và thông tin lựa chọn, cho phép các phần đó của siteđược các chuyên gia theo vấn đề chủ đề thích hợp duy trì một cách tích cực. Điều nàycho phép đội của OpenEI tập trung vào những nỗ lực của họ trong các lĩnh vực tinhthông độc nhất. Hơn nữa, là tài nguyên cho các site khác, như reegle, đã dẫn tới sự giatăng đáng kể về giao thông web trên OpenEI. Vào tháng 10/2011, OpenEI đã thấy cóthêm 1.200 khách viếng thăm đã tham chiếu từ các site như reegle như là kết quả củaviệc chia sẻ dữ liệu liên kết. Văn bản của: Jon Weers, NREL ([email protected]) Công việc này đã được Bộ Năng lượng Mỹ hỗ trợ theo Hợp đồng số DE-AC 36-08-GO28308 với Phòng thí nghiệm Năng lượng Tái tạo Quốc gia.

Các liên kết (1) OpenEI Portal: http://en.openei.org(2) OpenEI Glossary: http://en.openei.org/wiki/GlossaryĐọc thêm:

• http://en.openei.org/lod/

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 66/85

Page 67: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

5.3. EnipediaCác cơ hội và thách thức trong sử dụng Dữ liệu Liên kết cho các nhàmáy điện Enipedia1 là dự án sử dụng Wiki Ngữ nghĩa và các nguyên tắc của Dữ liệu Liên kết đểgiúp tổ chức và điều hướng thông tin về các nhà máy điện khắp trên thế giới. Sử dụngDữ liệu Liên kết là phù hợp một cách tự nhiên khi các câu hỏi về lĩnh vực năng lượngthường trải rộng khắp các mạng khác nhau các sự việc. Như một ví dụ, Enipedia gồmthông tin về cả các công ty và các nhà máy điện có liên quan tới:

• Các công ty có thể có các đơn vị trực thuộc là các công ty khác (và các công ty đócó thể lại cũng có các đơn vị trực thuộc khác nữa)

• Nhà máy điện được một công ty sở hữu, có công suất phát điện, dạng nhiên liệu,các tọa độ, được đặt ở một quốc gia, …

Đưa ra các kết nối đó, bằng việc sử dụng các truy vấn SPARQL, chúng ta có thể tạo ra cáckiểu nhìn khác nhau như:

• Đâu là tổng công suất phát điện của công ty và tất cả các đơn vị trực thuộc quatoàn bộ chuỗi sở hữu?

• Có bao nhiêu điện được tạo ra bằng việc sử dụng các dạng nhiên liệu khác đối vớitừng quốc gia?

• Ở quốc gia nào một công ty sở hữu các dạng nhà máy điện nào?

Nhiều phiên bản “Đúng”Trong khi Dữ liệu Liên kết xúc tác cho việc tạo ra các kết luận đa dạng khác nhau từcùng y hệt các dữ liệu, thì thách thức chính trong làm việc với dữ liệu lĩnh vực nănglượng là không có một phiên bản duy nhất nào từ nhiều nguồn mô tả vị trí, công suấtđiện, và sự phát xạ của nhà máy. Các nguồn dữ liệu khác nhau được tư vấn không luônlà đồng thuận, điều có thể xảy ra vì vài lý do.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 67/85

Page 68: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Trước hết, nhiều dữ liệu các chính phủ sở hữu trong lĩnh vực điện được kết nối để tuânthủ với các bổn phận báo cáo theo quy định, và không nhất thiết được thu thập với mụcđích cung cấp cho các nhà nghiên cứu với tổng quan rộng rãi, dễ xử lý về lĩnh vực điện.Không phải là không phổ biến để thấy rằng các dữ liệu đó thiếu các mã nhận diện duynhất và rằng các cái tên chính xác được sử dụng để lắp đặt các hệ thống thay đổi theothời gian. Hơn nữa, các tập hợp dữ liệu khác nhau có lẽ chào các mức độ chi tiết khácnhau (như, dữ liệu cho các máy phát điện riêng rẽ so với dữ liệu được tổng hợp cho toànbộ nhà máy điện đó). Dữ liệu đó cũng có thể là nhạy cảm đối với những thay đổi theothời gian khi các nhà máy có thể được trang bị lại, được mở rộng hoặc bị đóng cửa.

Định vị các thực thể được mô tả trong nhiều tập hợp dữ liệu hỗn tạp Để làm việc với điều này, chúng ta cần hệ thống có thể tạo thuận lợi cho việc khớp nốivà loại bỏ sự mù mờ. Để làm được điều này, chúng ta đã tạo ra một API dựa vàoElasticsearch2, nó cho phép những người sử dụng tìm kiếm dữ liệu mà không nhất thiếtcó cấu trúc tốt. Chúng tôi sử dụng bộ sưu tập của cả các cơ sở dữ liệu chính thức vànguồn đám đông, sử dụng các lược đồ khớp với những lược đồ được sử dụng trong cácnguồn ban đầu, không cố điều chỉnh các lược đồ đó với lược đồ được sử dụng trênEnipedia. Sự sử dụng cả các cơ sở dữ liệu chính thức và của nguồn đám đông là quantrọng vì từng trong số chúng đều có những điểm mạnh và điểm yếu đặc thù. Các nguồnchính thức của chính phủ thường chào thông tin hoàn chỉnh được sinh ra thông qua dữliệu được thu thập “bên trong hàng rào” của các cơ sở tiện ích. Đây là thông tin mà đơngiản không khả thi với nguồn đám đông. Tập hợp dữ liệu nguồn đám đôngOpenStreetMap không cung cấp một cách ổn định nhất quán thông tin được chi tiếthóa về các thuộc tính của nhà máy điện, nhưng nó có các tọa độ chính xác về địa lý(thường thiếu trong các nguồn chính thống), khi các cơ sở tiện ích đó được lần vết bằngviệc sử dụng các ảnh chụp từ trên không. Wikipedia cũng là hữu dụng cho việc tìm cácliên kết tới các nguồn ban đầu có thể giúp thẩm định dữ liệu.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 68/85

Page 69: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Tính năng chính của Elasticsearch là nó cho phép chúng ta tìm kiếm mềm dẻo nhiềulĩnh vực dữ liệu. Điều này là quan trọng khi bạn không thể chỉ tìm các nhà máy điện dựavào tên của chúng, vì thực tế là trong các cơ sở dữ liệu khác nhau, tên nhà máy điệncũng có thể gồm các từ có liên quan tới chủ sở hữu, thành phố, khu vực hoặc thậm chídạng nhiên liệu của nó. Lựa chọn để tùy chỉnh dạng trùng khớp cũng là quan trọng.Trong số các lựa chọn truy vấn khác, Elasticsearch cho phép đối với những gì được gọilà “truy vấn các hạng mục phổ biến”, điều làm giảm thiểu tầm quan trọng của các từhiện diện thường xuyên trong tập hợp văn bản. Điều này là hữu dụng vì các trùng khớptrong các hạng mục hiếm hoi là có nhiều thông tin hơn so với các trùng khớp trong cáchạng mục phổ biến như “nhà máy điện”. Ưu điểm của điều này là vì công cụ chỉ cânnhắc hạng mục thường xuyên, nó là độc lập với ngôn ngữ, và bạn không phải có tri thứcvề các hạng mục ngôn ngữ đặc thù (như, kraftwerk, centrale thermique, …) để có khảnăng sử dụng nó có hiệu quả. Hơn nữa, Elasticsearch cũng cho phép các truy vấn địa lý,sao cho những người sử dụng có thể tìm kiếm tất cả các nhà máy khớp với truy vấn vănbản trong hộp ràng buộc, hoặc đơn giản để trống truy vấn văn bản đó để tìm tất cả cácnhà máy trong vùng được nhắc tới trong các cơ sở dữ liệu khác nhau.

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 69/85

Page 70: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Nắm bắt sự mù mờ trong Dữ liệu Liên kết Hiện nay, công cụ này cho phép chúng ta bổ sung dữ liệu hiện có bằng tay. Sự bổ sungdữ liệu này có thể thực hiện bước tiếp theo bằng việc sử dụng chiến lược có thể đượcgọi là Dữ liệu Liên kết “được kết hợp lỏng lẻo” (Loosely Coupled), nó ngụ ý rằng 2 thựcthể khác nhau không nhất thiết được liên kết bằng owl:sameAs, mà thay vào đó thôngqua các liên kết được SKOS3 định nghĩa như là skos:broadMatch, skos:narrowMatch vàskos:relatedMatch. Nói cách khác, Dữ liệu Liên kết “được kết hợp lỏng lẻo” cho phépchúng ta mô tả các tập cha, tập con và các thực thể (supersets, subsets and entities) vớisự chồng lấn (tiềm tàng mù mờ). Vấn đề chính phải xem xét là việc xác định bản chất tựnhiên chính xác của các liên kết giữa các thực thể, đặc biệt trong các tập hợp dữ liệulớn, có thể đắt tới mức cấm đoán. Cách tốt nhất để làm việc với điều này phụ thuộc vàoviệc liệu bạn có coi việc xuất bản tập hợp dữ liệu như là mục tiêu cuối cùng, hay nhưmột bước trong quy trình lặp đi lặp lại với những người sử dụng tiên tục rà soát lại, bìnhluận, sửa cho đúng và bổ sung sửa đổi nó. Nếu dữ liệu được xuất bản như một phần củaquy trình liên tục được lặp đi lặp lại, thì sẽ là hữu dụng để nắm được mức độ (không)chắc chắn, vì điều này giúp giảm thiểu không gian tìm kiếm đối với những ai sử dụng dữliệu sau này và có được tri thức thích hợp có thể sử dụng được để cải thiện nó. Tiếp cận khác để làm việc với nhiều phiên bản “đúng” được dự án Wikidata sử dụng, nósử dụng các bộ sưu tập “các tuyên bố” về các các thực thể4. Ví dụ, dân số chính xác củaBerlin có thể không bao giờ được biết đúng, nhưng có các ước tính về nó với các độchính xác khác nhau. Từng trong các ước lượng đó là một phần của tuyên bố chứathông tin về nguồn của nó. Tất cả các tuyên bố có thể được kiểm tra và so sánh, vàtuyên bố nào mà những người sử dụng đồng ý là chính xác nhất sẽ được đánh dấu nhưlà tuyên bố “được ưu tiên”. Chúng ta có thể kết luận từ thảo luận này rằng Dữ liệu Liên kết là khái niệm mạnh trongthực tế. Tuy nhiên, việc triển khai nó vẫn đặt ra nhiều thách thức, đặc biệt khi bạn cốgắn kết hợp nhiều nguồn dữ liệu mà không được biên soạn theo cách tạo thuận lợi chotính tương hợp. Ở mức độ nào đó, điều này có thể giải quyết được bằng việc cải thiện

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 70/85

Page 71: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

các thực hành xuất bản các dữ liệu gốc ban đầu, dù có các công cụ và các tiếp cận cósẵn có thể giúp tạo thuận lợi cho sự so sánh và tích hợp.

Các liên kết (1) http://enipedia.org(2) https://github.com/cbdavis/enipedia-search(3) W3C – SKOS Simple Knowledge Organization System:https://www.w3.org/2004/02/skos/(4) Wikidata: Claims and statementshttps://www.wikidata.org/wiki/Wikidata:Glossary#Claims_and_statementsVăn bản của: Dr. Chris Davis ([email protected])

5.4. GBPNMạng Hiệu năng Xây dựng Toàn cầu – GBPN (Global BuildingsPerformance Network)Mạng Hiệu năng Xây dựng Toàn cầu (GBPN1) là tổ chức được thiết lập toàn cầu và tậptrung vào khu vực với sứ mệnh để cung cấp sự trợ giúp kỹ thuật và sự tinh thông vềchính sách để nâng cao hiệu suất năng lượng xây dựng và hiện thực hóa các môi trườngxây dựng bền vững cho tất cả. Nó đã được thành lập vào năm 2010, và mục tiêu của nólà đóng góp cho khu vực xây dựng để đạt được sự tiết kiệm năng lượng đầy đủ và tiềmtàng giảm thiểu CO2 nhiều hơn 2,1 Gt tới năm 2030. GBPN được giao nhiệm vụ nâng caotri thức và sự tinh thông trong việc cải thiện hiệu năng về năng lượng xây dựng và cungcấp cấu trúc để đạt được điều này. Nó được một trung tâm toàn cầu có trụ sở ở Parisđiều phối, và một văn phòng ở Bắc Kinh và các tổ chức đối tác ở Brussels, WashingtonD.C. và Delhi đại diện cho các khu vực. GBPN làm việc để đạt được những thay đổi quá

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 71/85

Page 72: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

độ được yêu cầu trong lĩnh vực xây dựng để tìm cách giải quyết vấn đề biến đổi khí hậutrong khi thúc đẩy sự thịnh vượng về kinh tế và xã hội. Mạng đã phát triển các mối quanhệ đối tác rộng rãi với các tổ chức quốc tế, các chính phủ, giới công nghiệp, các việnnghiên cứu và các NGO. Các đối tác dự án của nó cũng mở rộng tầm với của mình tớiĐông Nam Á, trong khi các mạng chuyên gia của nó bao gồm cả sự tinh thông của MỹLatin và châu Phi.

Công cụ để xây dựng các kịch bản hiệu suất năng lượng Công cụ2 trên trực tuyến này xúc tác cho những người sử dụng tham gia tương tác vớidữ liệu được mô hình hóa cho 3 kịch bản giảm thiểu năng lượng có khả năng cho lĩnhvực xây dựng, trong phạm vi toàn cầu và khu vực, cho tới năm 2050. Để tạo thuận lợi cho sự biến đổi nhanh sang năng lượng bền vững trong lĩnh vực xâydựng, GBPN hỗ trợ đường lối các hành động chính sách đầy tham vọng, dựa vào kịchbản năng lượng ở đó công nghệ mới nhất về tính hiệu quả của năng lượng trở thành chỉtiêu theo cả các tòa nhà mới và đang tồn tại chỉ 10 năm kể từ bây giờ. Công cụ này chỉcho những người sử dụng nơi nào thế giới có thể trong việc sử dụng năng lượng các tòanhà tới năm 2050 theo vài kịch bản, phụ thuộc vào tham vọng của các quyết định chínhsách và lựa chọn công nghệ. Công cụ đã được phát triển bằng việc sử dụng mô hình các Tòa nhà Hiệu quả Cao -3CSEP-HEB (High Efficiency Buildings), nó nắm lấy tiếp cận hướng hiệu năng để phântích sử dụng năng lượng các tòa nhà. Thay vì các phương pháp hướng thành phần, côngcụ nắm lấy quan điểm hệ thống: Hiệu năng của toàn bộ các tòa nhà được nghiên cứu vàcác giá trị hiệu năng đó sẽ được sử dụng như là các đầu vào chính trong các kịch bản. Mô hình này sinh ra các kế hoạch cho toàn bộ thế giới. Các kết quả được cung cấp cho11 khu vực chính sau đây: Bắc Mỹ (NAM), Tây Âu (WEU), Đông Âu (EEU), Liên Xô cũ (FSU),Mỹ Latin, và vùng Caribe (LAC), các quốc gia OECD vùng Thái bình dương (PAO), Trung Áđược lên kế hoạch (CPA), Châu Á Thái bình dương (PAS), Nam Á (SAS), Trung Đông và

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 72/85

Page 73: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

châu Phi (MEA), và châu Phi (AFR). Công cụ cũng cung cấp các kết quả cho 4 vùng chính:Trung Quốc, châu Âu, Ấn Độ và Mỹ.

Dữ liệu Mở Liên kết: Cơ sở mạnh và ổn định của công cụ Dữ liệu Mở Liên kết được sử dụng để xuất bản dữ liệu cũng như phân tích, ở dạng truyvấn (phức tạp) dữ liệu cùng với mô hình dự đoán được xác định. Dữ liệu đã được thuthập và các kịch bản (dự báo trước) đã được tính toán trong cơ sở dữ liệu MicrosoftAccess3 và tất cả các dữ liệu đã được chuyển đổi sang RDF bằng việc sử dụng Từ vựngKhối dữ liệu RDF (RDF Datacube Vocabulary4) để phát triển bản thể học và mô hình dựbáo trước đó. Dữ liệu được thu thập có liên quan tới các dạng tòa nhà, các khu vực vàcác vùng khí hậu được liên kết tới DBPedia5 để chào thông tin toàn diện hơn về các chủđề đó. Sử dụng dữ liệu RDF này - được lưu trữ trong máy chủ vạn năng VirtuosoUniversal Server (Triple Store7) - xúc tác cho các truy vấn phức tạp. Người sử dụng côngcụ lựa chọn bộ lọc được yêu cầu từ tập hợp các bộ lọc có sẵn (chúng là phù hợp với cácchiều khối lập phương dữ liệu (data cube) và được chỉ dẫn thông qua quy trình đó bằnggiao diện người sử dụng rất trực quan. Sau khi lựa chọn các bộ lọc, người sử dụng nhậnđược sự trực quan hóa các kết quả có thể tải về được như các hình ảnh sẽ được sử dụngnhư trong các bài trình chiếu, và người sử dụng cũng có thể tải về dữ liệu nằm bên dướicác kết quả được trực quan hóa ở vài định dạng (RDF, CSV, Json). Thành phần trực quanhóa của công cụ đó được hiện thực hóa bằng việc sử dụng các đồ thị High-Charts 8 vàtoàn bộ công cụ được nhúng trong suốt vào Nền tảng Tri thức GBPN (GPBP KnowledgePlatform), nó sử dụng CMS9 Nguồn Mở Drupal.Tính năng rất đặc biệt của công cụ là đối với bất kỳ sự lựa chọn được lọc nào được ngườisử dụng quản lý trong giao diện đồ họa của người sử dụng, thì người sử dụng có khảnăng nhận và thấy được (hoặc sử dụng được) truy vấn SPARQL nằm bên dưới. Điều nàycho phép những người sử dụng học ngôn ngữ truy vấn SPARQL cũng như hiểu tốt hơnvề dữ liệu sẵn sàng qua API được cung cấp ở dạng điểm cuối10 SPARQL. Dữ liệu là sẵnsàng với một giấy phép mở (Creative Commons Attribution 3.011), nó ngụ ý tất cả dữ liệu

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 73/85

Page 74: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

có thể được sử dụng vì bất kỳ mục đích nào, miễn là sự ghi công được thêm vào nguồndữ liệu đó. Các liên kết và đọc thêm (1) GBPN, Global Buildings Performance Network: http://www.gbpn.org/(2) Tool for Building Energy Performance Scenarios: http://www.gbpn.org/databases-tools/mrv-tool/about(3) Microsoft Access Database: https://en.wikipedia.org/wiki/Microsoft_Access(4) The RDF Datacube Vocabulary: https://www.w3.org/TR/vocabdata-cube/(5) Details on the Methodology: http://www.gbpn.org/databasestools/mrv-tool/methodology(6) DBpedia: http://wiki.dbpedia.org/(7) Virtuoso Universal Server: https://virtuoso.openlinksw.com/(8) Highcharts JavaScript Library: http://www.highcharts.com/(9) Drupal Open Source CMS: https://www.drupal.org/(10) SPARQL query language: https://en.wikipedia.org/wiki/SPARQL(11) Creative Commons 3.0: https://creativecommons.org/licenses/by/3.0/

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 74/85

Page 75: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

5.5. DEVINITCác tiêu chuẩn dữ liệu tham gia chung (Joined-up Data Standards)

Các sáng kiến phát triển Sứ mệnh của các sáng kiến1 phát triển là để đảm bảo rằng các quyết định về phân bổ tàichính và các tài nguyên sẽ chấm dứt sự nghèo nàn, gia tăng sự phục hồi của nhữngngười bị tổn thương nhất thế giới, và không bỏ sót lại ai. Để làm được điều này, các tổchức làm việc trong 3 lĩnh vực chủ đề chính: Chủ đề 1: Nghèo nàn - Đo đếm sự tiến bộ của những người thoát nghèo Dữ liệu có sức mạnh mang lại sự hiểu biết cảnh nghèo tốt hơn và xúc tác để đo đếmchính xác sự tiến bộ của mọi người. Với dữ liệu đúng, bạn có thể nhìn vượt ra khỏi các sốliệu thống kê thường được sử dụng về sự nghèo tổng “thu nhập” hoặc “tiêu dùng” vàxem xét thực tế cuộc sống của những người nghèo. Công việc của Sáng kiến Phát triển tìm cách để:

• Dẫn dắt các cam kết và đầu tư cần thiết hơn nhiều hướng tới cải thiện dữ liệunghèo, dành ưu tiên cho dữ liệu không được tổng hợp và các hệ thống hànhchính dân sự.

• Mở các dữ liệu nghèo đang tồn tại, mang tới dữ liệu mới toàn cầu và dữ liệu địaphương để bắt đầu xây dựng bức tranh nghèo rõ ràng hơn và chính xác hơn.

Chủ đề 2: Tài nguyên - Các đầu tư để chấm dứt nghèo và xây dựng sự phục hồi Dữ liệu là cơ bản cho việc nhận diện, liên kết và nhằm đích một cách có hiệu quả các tàinguyên để dẫn dắt xóa bỏ nghèo và phát triển bền vững. Công việc của Sáng kiến Phát triển tìm cách:

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 75/85

Page 76: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

• Cải thiện việc ra quyết định trong phân bổ các tài nguyên qua phân tích “tất cảcác tài nguyên” và các công cụ như Trung tâm Dữ liệu Phát triển (DevelopmentData Hub) của chúng tôi.

• Gia tăng sự minh bạch của các dòng tài nguyên để cải thiện sự hiểu biết về phânbổ tài nguyên và tính hiệu quả của chúng, một phần qua vai trò kỹ thuật cốt lõicủa chúng tôi trong Sáng kiến Quốc tế về Trợ giúp Minh bạch - IATI (InternationalAid Transparency Initative).

Chủ đề 3: Sử dụng dữ liệu - Cải thiện sử dụng dữ liệu để phát triển bền vững Các Sáng kiến Phát triển tin tưởng rằng những người ra quyết định và những người bảovệ sẽ hiểu tốt hơn sự nghèo và các tài nguyên có sẵn để giải quyết nó, họ cần các dữ liệutốt hơn. Công việc của các Sáng kiến Phát triển tìm cách để:

• Hiểu và loại bỏ các rào cản về sử dụng dữ liệu bằng việc tạo ra và kiểm thử cácgiải pháp, và bằng việc dẫn dắt sự thay đổi hành vi.

• Cộng tác với cộng đồng dữ liệu mở và nuôi dưỡng các động lực sử dụng dữ liệu,như Cách mạng Dữ liệu vì sự Phát triển Bền vững (Data Revolution forSustainable Development).

Sáng kiến Tiêu chuẩn Dữ liệu Tham gia chung vì Thông tin Tốt hơn Các tiêu chuẩn Dữ liệu Tham gia chung (Joined-up Data Standards2) là dự án được cácSáng kiến Phát triển - DI (Development Initatives) và Xuất bản Những gì Bạn Cấp vốn(Publish What You Fund) cùng triển khai. Dự án đã khởi xướng quy trình nhiều bên thamgia đóng góp để phát triển các giải pháp kỹ thuật và quy trình để hài hòa hóa các tiêuchuẩn dữ liệu toàn cầu trong các giao điểm sống còn như thời gian, địa điểm và các tổchức. Trong ngữ cảnh của cuộc cách mạng dữ liệu đang nổi lên vì sự phát triển bền

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 76/85

Page 77: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

vững, công việc này là sống còn cho những người sử dụng dữ liệu từ mức địa phươngcho tới toàn cầu, những người cần thông tin tốt hơn để cải thiện việc ra quyết định.Cho tới nay, 4 dự án đang làm việc để ánh xạ và liên kết các tiêu chuẩn quốc tế với nhauvà dự án các Tiêu chuẩn Dữ liệu Tham gia chung - sử dụng các công nghệ Dữ liệu MởLiên kết VÀ làm cho tất cả dữ liệu sẵn sàng như là dữ liệu mở để sử dụng và sử dụng lại.Các tiêu chuẩn đó đã được nhập khẩu và/hoặc được tạo ra (được mô hình hóa) bằngviệc sử dụng trình mô hình hóa PoolParty Semantic Suite (Bộ Ngữ nghĩa PoolParty3) vàcó sẵn để người sử dụng xem ở dạng một website (giao diện dữ liệu liên kết) cũng nhưthông qua API ở dạng điểm đầu cuối SPARQL.

Các dự án tiêu chuẩn dữ liệu tham gia chung sẵn sàng đó là: INDICATORS4: Dự án này quản lý các tiêu chuẩn dữ liệu giám sát (các chỉ số) như cácMục tiêu Phát triển Bền vững, các Mục tiêu Phát triển Thiên niên kỷ - MDGs (MillenniumDevelopment Goals) và các Chỉ số Phát triển Thế giới - WDI (World DevelopmentIndicators). Các chỉ số được ánh xạ ở định dạng máy đọc được và người đọc được vàđược liên kết với nhau và xuyên khắp các dự án được duy trì trong từ điển bách khoatoàn thư như là “các lĩnh vực”, “các khu vực và nhóm siêu quốc gia” và “khảo sát các hộigia đình”. Việc ánh xạ chéo các tiêu chuẩn là quy trình liên tục và danh sách các tiêuchuẩn dữ liệu trong dự án này sẽ gia tăng khi công việc của chúng tôi tiến triển. SECTORS5: Dự án này liên kết các tiêu chuẩn dữ liệu quốc tế được sử dụng để phân loạicác hoạt động kinh tế - xã hội. Dự án chào sự đi chéo qua (ánh xạ) máy đọc được giữacác tiêu chuẩn chính được Liên hiệp quốc, Ngân hàng Thế giới và Tổ chức Hợp tác vàPhát triển Kinh tế - OECD (Economic Cooperation and Development) phát triển. Cáctiêu chuẩn dữ liệu trong dự án này cũng được ánh xạ theo cách thức máy đọc được theocùng cách thức như các dự án trong từ điển bách khoa toàn thư này, như: các chỉ số, cáckhảo sát, các vùng và nhóm siêu quốc gia, cũng như Viện Điều hành Tài nguyên Thiênnhiên - NRGI (Natural Resource Governance Institute).

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 77/85

Page 78: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

SUPRANATIONAL REGIONS AND GROUPINGS 6: Dự án này gồm việc ánh xạ máy đọcđược và người đọc được các phân loại quốc tế các quốc gia về các khía cạnh kinh tế, địalý, y tế hoặc nhóm an toàn. Các phân loại bao gồm các phân loại của Liên hiệp quốc,OECD, Ngân hàng Thế giới, Tổ chức Y tế Thế giới, và Quỹ Tiền tệ Quốc tế, cùng với các tổchức khác. Dự án này được liên kết chéo tới các tiêu chuẩn dữ liệu khác được quản lýtrong từ điển bách khoa toàn thư này. SURVEYS7: Dự án này đưa ra sự đi chéo qua máy đọc được giữa các bảng câu hỏi tiêuchuẩn được sử dụng trong các khảo sát các hộ gia đình quốc tế. Hiện hành, dự án nàyđưa ra ánh xạ Chương trình của DHS về các Khảo sát Y tế và Nhân khẩu học - DHS (DHSProgram Demographic and Health Surveys) cho tới các Khảo sát Bó Nhiều Chỉ số củaUNICEF - MICS (Multiple Indicator Cluster Surveys). Các khảo sát đó sẽ sớm được ánh xạchéo tới các dự án khác trong từ điển bách khoa toàn thư này, như “các vùng và nhómsiêu quốc gia”, ngụ ý nơi các khảo sát diễn ra, “các chỉ số”, ánh xạ các chỉ số quốc tế tớicâu hỏi nguồn gốc và cuối cùng “các lĩnh vực”, để chỉ ra sự điều chỉnh phù hợp giữa cáckhu vực kinh tế - xã hội quốc gia và quốc tế.

Các liên kết & đọc thêm (1) Development Initiatives: http://devinit.org/(2) Joined-up Data Standards: http://joinedupdata.org/(3) PoolParty Semantic Suite: http://www.poolparty.biz(4) Indicators Project: http://joinedupdata.org/Indicators.html(5) Sectors Project: http://joinedupdata.org/Sectors.html(6) Supranational Regions and Groupings Project: http://joinedupdata.org/geo-pol.html(7) Surveys Project: http://joinedupdata.org/Surveys.html

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 78/85

Page 79: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

6. PHỤ LỤC6.1. Các tác giả

Martin Kaltenböck, CMC Martin Kaltenböck đã nghiên cứu về truyền thông, tâm lý họcvà tiếp thị tại Đại học Viên. Ông là đồng sáng lập, Đối tácQuản lý và CFO tại Công ty Web Ngữ nghĩa - SWC (SemanticWeb Company), nơi ông có trách nhiệm về tài chính và cáchoạt động. Hơn nữa, ông lãnh đạo vô số các dự án nghiêncứu quốc gia và quốc tế, công nghiệp và hành chính nhànước. Các bài nói chuyện thường xuyên và những tham giavà xuất bản phẩm của ông bao trùm các lĩnh vực quản lý

thông tin ngữ nghĩa, dữ liệu (mở) liên kết và dữ liệu (chính phủ) mở. Ông là nhà tư vấnquản lý có chứng chỉ và chuyên gia được chào mời tại W3C, và là thành viên của Ban Chỉđạo Diễn đàn Dữ liệu châu Âu, là diễn đàn mà ông từng là chủ tọa ở Athens, Hy Lạp vàonăm 2014. Vào năm 2015 ông đã đồng sáng lập ra ODI Node Viena cùng với 3 đối tác đạihọc của Áo. Các xuất bản phẩm

• Enterprise 2.0 - Introduction, Principles, Use Cases and Tools• Open Government Data (OGD) White Book Austria 2011• Linked Open Data -- Creating Knowledge Out of Interlinked Data

Liên hệ Phone: +43 (0)1 402 123 50E-Mail: [email protected]: http://www.slideshare.net/MartinKaltenboeckLinkedIn: http://www.linkedin.com/in/martinkaltenboeck

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 79/85

Page 80: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Thạc sỹ Florian BauerFlorian Bauer đã có bằng Thạc sỹ về Quản lý CNTT và Cửnhân về Kỹ thuật Phần mềm từ Đại học Công nghệ Viên. Từ2007, ông đã làm việc tại Đối tác Hiệu quả về Năng lượng vàNăng lượng Tái tạo (REEEP), một tác nhân thay đổi chuyêngia, phi lợi nhuận có mục tiêu xúc tác cho thị trường nănglượng tái tạo và hiệu quả về năng lượng, với trọng tâm banđầu nhằm vào các thị trường đang nổi lên và các nước đangphát triển. Là Giám đốc Điều hành (COO) tại REEEP, Florian

giám sát các công cụ tri thức của REEEp như reegle.info (cổng thông tin năng lượngsạch dữ liệu mở liên kết) và Climate Tagger (công cụ tự động gắn thẻ nội dung phi cấutrúc và kết nối nó với các nội dung tương tự trên các website khác). Florian là đồng tácgiả của “Climate Knowledge Brokers Manifesto” (Tuyên ngôn của các Nhà môi giới Trithức Khí hậu) và đóng vai trò dẫn dắt và tư vấn về Dữ liệu Mở và Dữ liệu Mở Liên kếttrong cộng đồng biến đổi khí hậu và phát triển quốc tế. Trước khi ra nhập REEEP,Florian đã làm việc như là nhà quản lý dự án và nhà tư vấn cho Siemens Áo, nơi ông đãquản lý các dự án liên văn hóa, và ông cũng đã sáng lập ra hãng thiết kế web năm 2003. Các xuất bản phẩm

• Environmental Software Systems. Frameworks of eEnvironment -data.reegle.info – A New Key Portal for Open Energy Data

• Information Technology Safety-Concepts in Europe• Climate Knowledge Brokers Manifesto

Liên hệ Phone: +43 (0)1 260 26 37 14E-Mail: [email protected]: reeep_f.bauerLinkedIn: https://www.linkedin.com/in/florianbauer

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 80/85

Page 81: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Thạc sỹ Andreas Blumauer Andreas Blumauer có bằng Thạc sỹ về kinh doanh, chuyênvề thông tin kinh doanh, tại Đại học Viên về Kinh tế và Kinhdoanh và tại Đại học Công nghệ Viên. Ông đã bắt đầu sựnghiệp của mình vào năm 1996 như là lập trình viên phầnmềm cho các tổ chức các dịch vụ tài chính. Vào năm 2000,ông đã đồng sáng lập ra punkt.netServices, nhà cung cấpchuyên về các giải pháp Doanh nghiệp 2.0. Andreas là Đốitác Quản lý ở Công ty Web Ngữ nghĩa (SWC), nơi ông có trách

nhiệm về các dự án tư vấn khác nhau cũng như quản lý sản phẩm của PoolParty, mộtnền tảng quản lý dữ liệu liên kết. Ông thường giảng bài ở các trường đại học khắp nướcÁo trong các lĩnh vực các hệ thống quản lý tri thức, các công nghệ ngữ nghĩa và phầnmềm xã hội. Andreas từng là người tiên phong trong lĩnh vực web ngữ nghĩa và dữ liệuliên két từ năm 2002, và là đồng biên tập viên và biên tập viên của một trong nhữngcuốn sách toàn diện đầu tiên bằng tiếng Đức về web ngữ nghĩa. Các xuất bản phẩm

• Social Semantic Web - Web 2.0, was nun?• Using Linked Data in Thesaurus Management

Liên hệPhone: +43 (0)1 402 12 35-27E-Mail: [email protected]: http://www.slideshare.net/ABLViennaLinkedIn: http://at.linkedin.com/pub/andreas-blumauer/6/46/b

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 81/85

Page 82: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Denise Recheis Denise Recheis đã học tập nghiên cứu truyền thông ở Vươngquốc Anh. Bà sau này đã phát hiện ra mối quan tâm của bàvề công nghệ và đã học tập nghiên cứu về kỹ thuật về nănglượng tái tạo ở Viên, Áo. Bà đã ra nhập REEEP vào năm 2010và đã phát triển các kỹ năng của bà trong quản lý nguyên tắcphân loại, và đã trở thành người bảo vệ sâu sắc cho Dữ liệuMở Liên kết. Là Giám đốc Sản phẩm của Climate Tagger, bàthể hiện các lợi ích của việc sử dụng dữ liệu mở (Liên kết)

trong các lĩnh vực năng lượng sạch, biến đổi khí hậu và tính bền vững. Bà quản lý từvựng về Dữ liệu Mở Liên kết toàn diện nhất của lĩnh vực này, mô tả năng lượng sạch vàkhí hậu và là mở cho việc khai thác sự đồng vận vì mục đích cộng tác và học tập lẫnnhau. Các xuất bản phẩm

• The Open Book Liên hệ Phone: +43 (0) 1 260 263 495E-Mail: [email protected]

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 82/85

Page 83: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

6.2. Ghi công & thừa nhậnThừa nhận ghi công và bản quyền của các hình ảnh Các hình ảnh được sử dụng trong cuốn sách này đã có được từ các thư viện ảnh chụp.

Các đối tác tài trợ

CDKN - Mạng Tri thức Phát triển Khí hậu http://cdkn.orgCKB - các Nhà môi giới Tri thức Khí hậuwww.climateknowledgebrokers.net/Bộ Môi trường, Bảo tồn Tự nhiên và An toàn Hạt nhân (BMU)Liên bang Đức http://www.bmu.de

Đối tác Năng lượng Tái tạo & Hiệu quả Năng lượnghttp://www.reeep.orgCông ty Web Ngữ nghĩa (SWC), Viên, Áo http://www.semantic-web.atLOD2 - Tạo ra Tri thức vượt ra khỏi các Dữ liệu được liên kết vớinhau http://lod2.eu

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 83/85

Page 84: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Các đối tác/Các nhà tài trợ sự kiện Ấn bản mới của cuốn sách này đã được tạo ra như một sách chỉ dẫn xây dựng năng lựccho các Nhà môi giới Tri thức Khí hậu được CDKN hỗ trợ và cấp tiền; nó dựa vào ấn bảnđầu tiên từng được hỗ trợ hào phóng bởi:

Bộ Môi trường, Bảo tồn Tự nhiên và An toàn Hạt nhân (BMU)Liên bang Đức http://www.bmu.de

Cơ quan Năng lượng Tái tạo Quốc tế (IRENA)http://www.irena.org

Phòng thí nghiệm Năng lượng Tái tạo Quốc gia (NREL)http://www.nrel.govViện Masdar http://www.masdar.ac.ae

Thừa nhận Cuốn sách này có lẽ đã không thể hình thành nếu không có sự giúp đỡ của những ngườiđã đóng góp cho các ý tưởng, các cuộc thảo luận, các demo và các văn bản. Chúng tôimuốn cảm ơn từng người đã giúp đỡ chúng tôi (liệt kê tên theo trật tự ngẫu nhiên):Martin Schöpe, Geoff Barnard, Marianne Osterkorn, Martin Hiller, Anna Florowski, JohnSheridan, José Manuel Alonso, Bitange Ndemo, Jon Weers, Thomas Thurner, VinceReardon, Jena Wuu, Günther Friesinger, Sigmund Kluckner, John Tkacik, Maria vanVeldhuizen, Quinn Reifmesser, Chris Davis

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 84/85

Page 85: Dữ liệu Mở Liên kết: Những điều cơ bản · 2020-06-21 · Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn

Dữ liệu Mở Liên kết: Những điều cơ bản, của Florian Bauer và Martin Kaltenböck. Ấn bản lần 2 năm 2016

Sau sự thành công của chỉ dẫn ban đầu “Dữ liệu Mở Liên kết - Những điều cơ bản” (Linked Open Data -The Essentials) từ 2012, chúng tôi tự hào và hạnh phúc để bây giờ có khả năng trình bày ấn bản mới nàyvới tiêu đề “Dữ liệu Mở Liên kết - Ấn bản Môi giới Tri thức Khí hậu” (Linked Open Data - The ClimateKnowledge Brokering Edition). Cuốn sách này là chỉ dẫn khởi đầu nhanh cho những người ra quyết định và các nhà môi giới tri thức khíhậu tìm cách để bắt kịp tốc độ với khái niệm Dữ liệu Mở Liên kết - LOD (Linked Open Data), và đang xemxét để làm cho tổ chức của họ trở thành một phần của phong trào đó. Cuốn sách đưa ra tổng quan ngắn gọn về LOD và sự thích hợp của nó cho việc môi giới tri thức thànhcông, cũng như các câu trả lời thực tế cho nhiều câu hỏi nổi bật, gồm:

• Các khái niệm Dữ liệu Mở, Dữ liệu Chính phủ Mở và Dữ liệu Mở Liên kết thực sự ngụ ý điều gì, vànhững khác biệt giữa chúng là gì?

• Các nhà môi giới tri thức khí hậu là gì, và Dữ liệu Mở thích hợp với họ như thế nào?• Dữ liệu Mở có thể giúp thế nào cho tổ chức của tôi để giao tiếp hiệu quả hơn?• Tôi cần tính tới điều gì khi phát triển chiến lược LOD cho tổ chức của tôi, và điều gì cần phải hoàn

thành về kỹ thuật để mở ra và xuất bản các tập hợp dữ liệu?• Làm thế nào tôi có thể bổ sung thêm giá trị cho các tập hợp dữ liệu của riêng tôi bằng việc tiêu

dùng LOD từ các nguồn khác và làm thế nào điều đó có thể hỗ trợ cho vai trò của tôi như là ngườitrung gian về tri thức?

• Điều gì có thể học được từ 5 trường hợp điển hình thực hành tốt nhất về LOD?◦ Climate Tagger của REEEP www.climatetagger.net

◦ Cổng Thông tin Năng lượng Mở của NREL http://en.openei.org

◦ Enipedia http://enipedia.tudelft.nl/wiki/Main_Page ◦ Công cụ GBPN để xây dựng các kịch bản Hiệu năng Năng lượng◦ Các Tiêu chuẩn Dữ liệu Tham gia chung của các Sáng kiến Phát triển

Ấn bản mono ISBN: 978-3-902796-54-7

Văn phòng Phối hợp Phát triển Môi trường Khoa học & Công nghệ, Bộ Khoa học & Công nghệ Trang 85/85