互联网知识共享

利用开放共享的互联网,知识可以通过网络以近乎为零的成本进行无限分发,使得世界进入了一个信息爆炸和知识广泛传播的时代,极大地推动了人类社会的发展。知识共享让人在科研、教育、文化等领域变得更加平等和自由,让社会各界可以广泛利用这些知识财富。人们不仅仅去获取这些共享的知识,也广泛参与到知识共享之中。知识共享和版权保护并不冲突,版权保护鼓励创新,知识共享鼓励利用,完善的商业授权保护和活跃的开放共享社区可以同时存在并相互促进。知识共享并不代表作者要完全放弃版权和商业利益,健康有序的知识共享环境,反而更需要明确的版权协议去保护作者的权益,需要相关公益组织和企业去推动知识共享的发展。

早在 2001 年,美国学者劳伦斯·莱斯格就成立了名为 Creative Commons 的非盈利基金会,并推出了一种介于完全公有和保留所有权益之间,具有相当弹性的,名为 Creative Commons License( 知识共享协议,以下简称 CC)的协议,逐渐成为最常见的知识共享授权协议。目前你可以在国际互联网上,找到大量使用 CC 协议进行知识共享的内容。著名的《中国历代人物传记资料库(CBDB)》即采用 CC BY-NC-SA 4.0 协议(署名 - 非商业性 - 相同方式共享)进行知识共享,为国内诸多人文研究提供了极大便利。Harvard Dataverse网站上还能找到CHGIS在内的各学科共享数据,它们通常以标准的知识共享协议或者单独指定的授权进行共享,以文件的形式开放下载。

计划简介

人文社科项目种类繁多、需求各异、经费少、数据量小。除部分重点项目拥有相对宽裕的经费可以单独开发信息系统外,不管是科研机构、民间团体还是个人研究者,常常因为缺乏项目经费和技术经验,导致难以进行有效的信息化管理和在线共享;或者以文件形式进行共享,无法进行在线预览、协作和可视化。即便一些单位有能力单独开发系统,也存在周期长、成本高、效果差、难运维、不更新等各式各样的问题。此外还有大量已经完成多年的课题、著作已经失去了数字化的可能。

地图书知识库是一个以人文知识开放共享为运营理念的人文知识库协作共享平台。我们希望用自己的一份力量,推动我国数字人文领域的开放共享,特别是解决中小规模人文课题的在线协作和共享问题。地图书知识库在设计上,参考了 GitHub、Gitee、OSM、维基百科等开放平台,希望去学习借鉴他们的优秀理念。比如在平台共享的知识库以“作者名/项目名”的形式作为标题,以此感谢作者的贡献。我们继承“左图右史”理念的三栏式设计,非常适合在线分享含有地理信息、富文本、高清图片、知识库图谱的多媒体数据。我们还将开发更多功能,开放知识库 API 接口,便于使用者利用这些数据。

从 2020 年起,我们组织志愿者开展了《中国古旧地图》知识库的在线协作计划;联合多家单位共同发起了《蜀都河图:成都自然历史文化数据库》公益知识库的建设;参与了成都本地的文化展览和地方文化著作的编撰等工作。在我们的努力推荐下,地图书平台的作者逐渐了解并认可知识共享协议。地图书平台公开发布的知识库中,如《清代进士科举文献地理分布数据库》、《大运河遗产》、《明代的灾荒》、《东汉州郡沿革》、《大连树木地图》、《辽宁观鸟地图》,均采用 CC 协议发布。《唐宋文学编年地图》等知识库则以单独的授权共享。2022 年 11 月,地图书知识库荣获 2022 中国数字人文年会最佳设计奖,获得了国内数字人文领域诸多专家学者的肯定。

2023 年,我们决定正式发布“人文数据知识共享计划”,向我国各界学者发出诚挚邀请,共同参与此项计划,以个人或者单位实名的形式在地图书平台共享人文数据。同时在授权允许的范围内,使用统一账号重新发布中国大陆以外国家和地区的人文知识共享数据。邀请热爱开源软件和知识共享的程序员志愿者,参与相关人文知识库的数据库设计、开源数据转换脚本开发、原始数据的转换等工作。邀请有志于人文知识共享的美术设计志愿者,参与知识库封面设计。我们已经建立一个名为《人文数据知识共享计划》的知识库,建立多个单独的数据表,供发布者直接在表中填写发布意愿;供分享可用于重新发布的人文数据信息。如果您愿意在地图书平台在线发布你的数字人文成果,我们将为您提供终身免费的技术服务,包括但不限于知识库配额、数据转换和导入、封面设计、成果宣传等。

发布条件

知识共享协议允许第三方平台根据协议授权重新发布作品,我们欢迎用户向我们推荐国内外优秀的人文社科共享数据信息。来自中国大陆以外国家或地区的 CC 授权知识库将由地图书团队统一挑选,在充分说明数据来源和版权信息的情况下,使用名为“观沧海”的账号统一发布。如果作者愿意在地图书平台实名发布,我们将在核实身份后,立即将知识库转移到作者个人账号或者机构账号名下。来自我国大陆的已有 CC 授权数据我们将尝试联系作者,尽可能在作者知情并同意的情况下发布到地图书平台。

对于准备在地图书平台首次公开发布的数据,我们的基本要求如下:

  1. 共享内容为人文社科类结构化数据,或能为人文社科研究提供基础服务的其他结构化数据;

  2. 数据必须完整可信,发布者拥有合法著作权或授权,不侵犯他人权益,可公开发布;

  3. 以单位名称、品牌名称或者个人姓名命名的实名账号发布,文责自负;

  4. 提供数据库情况介绍,如单位介绍、作者介绍、课题介绍、研究方法、内容简介、注意事项、未来进展等信息;

  5. 不违反我国法律法规,不包含敏感或者涉密内容。

选择协议

我们建议发布者优先选择 CC 协议发布知识库,但没有任何强制性要求。使用 CC 授权发布的知识库可以在具体的协议授权范围内自由使用,无需联系平台和作者,允许直接下载数据。为了感谢作者的贡献,我们也欢迎使用者在讨论区反馈使用情况。如果不选择CC协议且未在介绍中进行单独说明,则默认为保留所有权益,只允许在地图书平台在线使用。此时将不开放下载数据,其他用途需要联系发布者单独授权。作者也可以在知识库介绍中指定单独的使用协议和条款,分享数据的其它下载方式。

知识共享的理念与 Copyleft 紧密相连。传统的著作权中有两种极端,一端是“保留所有权利”(All Rights Reserved),另一端则是“不保留任何权利”(即公有领域,public domain)。Creative Commons 试图在两者中间广大的灰色地带保有弹性,使得创作者可以“保留部分权利”(Some Rights Reserved),思考并探索知识产权在信息时代的意义。知识共享可以提供多种可供选择的许可形式以及条款组合,创作者可与大众分享其创作,授予其他人一定条件下再散布的权利,却又可能保留其他权利。另外还有一种则是“撤回所有权利”(All Rights Reversed),与著佐权(Copyleft)相关。[1]

CC 协议允许作者选择不同的许可证和根据不同国家的著作权法制定的著作权协议,著作权持有人可以指定以下的条件:(以下条件均不适用于原始创作者)

英文

缩写

全称

说明

Attribution

BY

署名

您(用户)允许他人对自己享有著作权的作品及演绎作品进行复制、发行、展览、表演、放映、广播或通过信息网络向公众传播,但在这些过程中对方必须保留您对原作品的署名。

NonCommercial

NC

非商业性使用

您(用户)允许他人对您享有著作权的作品及演绎作品进行复制、发行、展览、表演、放映、广播或通过信息网络向公众传播,但仅限于非商业性目的。

NoDerivs

ND

禁止演绎

您(用户)允许他人对您的作品原封不动地进行复制、发行、展览、表演、放映、广播或通过信息网络向公众传播,但不得进行演绎创作。

ShareAlike

SA

相同方式共享

只有在他人对演绎作品使用与您的原作品相同的许可协议的情况下,您才允许他人发行其演绎作品。

在没有指定“NC”的情况下,允许对作品进行商业利用;在没有指定“ND”的情况下,允许在原作品基础上进行派生创作。混合搭配这些条件,产生了 16 种可能的组合,其中 11 种是有效的创作共享许可,5 个是无效组合。无效组合中,有 4 种是同时包括“ND”和“SA”的条款的组合,因为这两种条款相互排斥;还有一种为没有要求任何条款的组合,称为“CC0”。11 种有效组合中,五种缺乏“BY”的条款已经失效了,因为 98% 的特许人要求署名。剩下的 6 种常用的许可为:

许可协议

缩写

署名

CC BY

署名 - 相同方式共享

CC BY-SA

署名 - 禁止演绎

CC BY-ND

署名 - 非商业性

CC BY-NC

署名 - 非商业性 - 相同方式共享

CC BY-NC-SA

署名 - 非商业性 - 禁止演绎

CC BY-NC-ND

目前 CC 协议的最新版本为4.0,所以在实际使用时,我们还需要加上它最新的版本号,如CC BY 4.0、CC BY-NC-SA 4.0

志愿者协作

考虑到人文领域的实际情况,使用非文件形式发布人文共享数据往往需要进行数据处理工作;为了让数据库更个性化,我们还允许发布者上传封面,这又涉及到封面设计工作。根据地图书团队之前的实践经验,如果要发布大量数据这将是一个制约发布进度的严重问题。由于准备公开发布或者重新发布的共享数据并不存在保密问题,为此我们提出了一个方案,通过公开征募有志于此的志愿者,共同完成这一工作。如果是待发布的知识库需要志愿者提供协作,我们会提前告知发布者这一情况,在征得同意后,在正式发布前组织一个内部交流群进行沟通协作。志愿者的地图书账号将加入到知识库协作成员中,并在项目介绍中进行介绍。转换程序的代码可以根据志愿者意愿发布到 GitHub、Gitee 等开源代码托管平台;志愿者设计的封面将采用和共享知识库同样的授权协议。正式发布后,我们会在地图书相关自媒体账号发送推文,向潜在的使用者推荐知识库,感谢作者和志愿者的贡献。我们也希望有兴趣的科研单位一起合作,组织学生成为志愿者,共同参与这一计划。希望参与计划的志愿者和单位可以通过文末的联系方式联系我们。

我们对开发志愿者的要求如下:

  1. 热爱开源软件和知识共享,拥有足够的业余时间;

  2. 拥有一定的人文社科基础知识,便于沟通交流;

  3. 掌握 Python\JavaScript 这两种动态开发语言中的至少一种,能编写数据转换脚本;

  4. 具有 SQL 和 NoSQL 数据库使用和数据处理经验,了解常用的数据文件格式。

  5. 能够根据地图书知识库使用文档,自学知识库数据结构设计方法,根据发布者的数据和要求,设计知识库数据结构;

  6. 能够根据知识库导入文件示例,将 SQL\Excel\Shapefile\JSON\XML 等可能但不限于以上的数据格式转换为地图书知识库所支持的 JSON 格式数据。

我们对封面设计志愿者的要求如下:

  1. 有志于人文知识共享,拥有足够的业余时间;

  2. 拥有一定的人文社科基础知识,便于沟通交流,可以设计出符合发布数据文化特色的设计作品;

  3. 拥有书籍封面、宣传海报等设计经验,能够提供相关设计作品案例;

  4. 可以根据数据主题和发布者要求设计多个备选封面,并根据反馈进行修改。

发布流程

符合以上条件,并选择了适合的授权,就可以在地图书知识库共享人文数据了。如果你能够自主完成知识库的创建、结构设计、数据创建、批量导入、封面设计等工作,可以在完成这些工作后直接联系我们进行审核(因发布往往需要单独沟通和审核,目前暂未设计公开发布功能,未来会推出)。如果你无法独立完成以上步骤,或者已经没有足够的知识库配额创建新知识库,可以通过文末的联系方式直接联系我们,或者通过提交功能,在《人文数据知识共享计划》提交共享意向。除整理录入数据外的工作,如果你无法完成,我们都可提供一定帮助。

具体的发布流程如下:

  1. 以单位名称、团队名称、品牌名称或者个人实名注册账号,并填写一句话介绍;

  2. 以明确的标题名称建立一个用于共享的私有知识库;

  3. 根据项目需求或者已有数据完成知识库结构设计;

  4. 由发布者组织协作者手动录入数据,或者将已有数据进行格式转换后批量导入到知识库中;

  5. 撰写知识库的基本介绍;

  6. 设计并上传知识库封面;

  7. 邀请地图书工作人员加入协作组,或者分享临时访问链接便于审核,并根据审核要求修改完善;

  8. 审核完毕后确认无误,正式发布。

    我们欢迎科研机构和团队长期合作,在地图书知识库发布知识库,共享书籍、论文、作业中涉及的成套数据。 科研机构和团队可以注册机构账号,统一管理所有加入机构的个人账号和个人知识库。知识库可以选择以机构账号的名义直接发布共享,也可以选择以加入机构的个人账号发布共享。知识库支持在账号间转移,可以根据实际情况灵活处理。

地图书知识库提供的服务有利于人文科研领域的发展,人文科研数据在地图书知识库共享有助于平台的发展壮大。地图书知识库和人文科研相辅相成,人文数据知识共享计划期待您的参与。

提交信息

《人文数据知识共享计划》知识库:https://www.ditushu.com/book/487/

联系方式

邮箱:author@ditushu.com

微信号:ditushu

讨论区:https://www.ditushu.com/book/487/forum

参考资料

知识共享官方网站:https://creativecommons.org/

知识共享中国大陆:https://creativecommons.net.cn/

[1] 参见中文维基百科知识共享词条(https://zh.wikipedia.org/wiki/知识共享)

本计划未来会根据实际情况不断调整,若有变动,请以地图书知识库线上帮助文档为准,可访问原文链接或者扫码阅读。

https://www.ditushu.com/help/guide/82500315

地图书知识库的具体使用方法,请参见往期文章: