オープンデータとは

政府CIOポータルのオープンデータのページに「オープンデータ基本指針(平成29年5月30日 IT本部・官民データ活用推進戦略会議決定 令和元年6月7日改正)」という文書がPDF/DOCX形式で公開されている。このp.2「オープンデータの定義」には次のように書かれている:

国、地方公共団体及び事業者が保有する官民データのうち、国民誰もがインターネット等を通じて容易に利用(加工、編集、再配布等)できるよう、次のいずれの項目にも該当する形で公開されたデータをオープンデータと定義する。

①営利目的、非営利目的を問わず二次利用可能なルールが適用されたもの
②機械判読に適したもの
③無償で利用できるもの

この定義に従えば,オープンデータは「国、地方公共団体及び事業者が保有する官民データ」の部分集合である。大学の研究室や個人が収集して公開したオープンなデータは,オープンデータにはならないことになる。

しかし,以下に見るように,この定義は狭すぎる。この「オープンデータ基本指針」という文書が扱うオープンデータの範囲をこのように限定しているという意味にとるほうがよさそうである。

実際,Open Data Handbook にある What is Open Data?(日本語版: オープンデータとは何か?)では,Open Definition の定義に従うデータをオープンデータと呼ぶとされ,

オープンデータとは、自由に使えて再利用もでき、かつ誰でも再配布できるようなデータのことだ。従うべき決まりは、せいぜい「作者のクレジットを残す」あるいは「同じ条件で配布する」程度である。

と書かれている。これであれば,個人が公開するオープンデータもありうる。ちなみに,Creative Commons のライセンスにあてはめれば,たかだか CC BY か CC BY-SA までで,NC や ND はオープンではない。

「オープンデータ基本指針」の上に挙げた定義の前文,「機械判読」,「無償」には脚注がある。このうち前文の脚注は,「但し、セキュリティの理由により、利用者に対し、事前登録を求めたり、データへのアクセス方法に制限を設けたりといった措置が講じられることがあり得る。」となっており,Open Definition に合致しそうにない。また,「無償」の脚注には「オープンデータとは言えないものの、データ提供システムの維持管理に要するコストを限定された利用者からの料金徴収でまかなうケースもある。」とあり,有償のものはオープンデータとは言えないという立場である。一方,Open Definition の詳細版 Open Definition 2.1 には

The work must be provided as a whole and at no more than a reasonable one-time reproduction cost, and should be downloadable via the Internet without charge.

とあり,無償は絶対的な条件ではなさそうである(これはオープンソースソフトウェアも同様で,かつては磁気テープなどに収めて有償で配布していたこともある)。

ちなみに,同じ政府CIOポータルのオープンデータのページにある「政府標準利用規約(第2.0版)」は,CC BY 4.0 と互換性のあるライセンスである。

ソフトウェア
ライセンス
GNU GPLBSD-likeパブリック
ドメイン
CCライセンスBY-NC-NDBY-NC-SABY-NDBY-NCBY-SABYCC0
オープンデータ××××