关联数据
词条百科 1
目录
关联数据
在计算中,关联数据是结构化数据,它与其他数据相互关联,因此通过语义查询变得更加有用。 它以 HTTP、RDF 和 URI 等标准 Web 技术为基础,但不是使用它们来仅为人类读者提供网页,而是将它们扩展为以计算机可以自动读取的方式共享信息。 链接数据的部分愿景是让 Internet 成为一个全球数据库。
关联数据也可能是开放数据,在这种情况下,它通常被描述为链接开放数据。
原则
在他 2006 年的关联数据笔记中,Tim Berners-Lee 概述了关联数据的四项原则,解释如下:
- 应该使用统一资源标识符 (URI) 来命名和标识单个事物。
- 应该使用 HTTP URI 来查找、解释和随后取消引用这些内容。
- 应通过开放标准(如 RDF、SPARQL 等)提供有关名称标识内容的有用信息。
- 在 Web 上发布数据时,应使用基于 HTTP URI 的名称引用其他内容。
蒂姆·伯纳斯-李后来在 2009 年的 TED 会议上重申了这些原则,再次沿以下行解释:
- 所有概念性事物的名称都应以 HTTP 开头。
- 查找 HTTP 名称应该以标准格式返回有关所讨论事物的有用数据。
- 通过其数据与同一事物相关的任何其他事物也应被赋予以 HTTP 开头的名称。
组件
- URI
- HTTP
- 使用资源描述框架序列化格式(例如 RDFa、RDF/XML、N3、Turtle 或 JSON-LD)表达的受控词汇术语和数据集定义的结构化数据
- 关联数据平台
关联开放数据
关联开放数据是属于开放数据的关联数据。 Tim Berners-Lee 在与链接数据的区分中给出了链接开放数据最清晰的定义。
关联开放数据(LOD)是在开放许可下发布的关联数据,不妨碍其免费重用。
5 星链接开放数据
Tim Berners-Lee 提出了一个 5 星方案来对网络上开放数据的质量进行分级,其中排名最高的是关联开放数据:
- 1 星:数据以某种格式公开可用。
- 2 星:数据以结构化格式提供,例如 Microsoft Excel 文件格式 (.xls)。
- 3 星:数据以非专有结构化格式提供,例如逗号分隔值 (.csv)。
- 4 星:数据遵循 W3C 标准,例如使用 RDF 和采用 URI。
- 5 星:所有其他,加上指向其他关联开放数据源的链接。
历史
链接开放数据一词至少从 2007 年 2 月开始使用,当时创建了链接开放数据邮件列表。 邮件列表最初由麻省理工学院的 SIMILE 项目主办。
欧盟项目
有许多欧盟项目涉及链接数据。 其中包括全天候链接开放数据 (LATC) 项目、PlanetData 项目、DaPaaS(数据和平台即服务)项目和链接开放数据 2 (LOD2) 项目。 数据链接是欧盟开放数据门户的主要目标之一,它为任何人提供数以千计的数据集以供重用和链接。

本体是数据结构的正式描述。 一些比较知名的本体是:
- FOAF – 一种描述人、他们的属性和关系的本体
- UMBEL – 一个包含 20,000 个主题概念类及其从 OpenCyc 派生的关系的轻量级参考结构,可以充当外部数据的绑定类; 还链接到来自 DBpedia 和 YAGO 的 150 万个命名实体
数据集
- DBpedia – 包含从维基百科提取的数据的数据集; 它包含大约 340 万二氧化碳
内容来源于网络,本内容不代表16map.com立场,内容投诉举报请联系16map.com客服。如若转载,请注明出处:https://16map.com/wiki/nmjeiiwlnizi