データセットについて

データセットとは、単にデータの集まりのことです。公開さrているデータセットの最も単純で最も一般的な形式は、スプレッドシートやCSV形式です 。しかし、データセットの中には他の形式で保存されているものもあり、1つのファイルであるとは限りません。そのためデータセットによっては、関連する複数のデータを含むデータテーブルをZIPファイルになっていることもあります。

データセット検索エンジン

**Google Dataset Serach**

無料のデータセットを検索するために作られた検索エンジンです。Google Dataset Searchは、通常のGoogle検索と同じように、提供されたキーワードをもとに検索を行います。キーワードは、データセットの内容ではなく、その説明文にマッチします。

Microsoft Research Open Data

Microsoftのオープンデータの検索とダウンロードでき、Azureと連携することができる。

Yahoo Webscope

Yahoo Research が公開している、興味深く科学的に有用なデータセット。非商用で利用できる。

データセットポータルサイト

DataPortal

DataPortalsは、その名前からわかるように世界中の588のデータポータルへのリンクを持っています。 データソースは、都市や地域をベースにアルファベット順にリストアップされています。各ポータルは、タグ(レベル地域/地方、国、EU公式、ベルリン、OSM、金融など)で簡単に説明されています。

Google Cloud Public Datasets

Googleのクラウド上でアクセスできる多くの公開データセットで、100以上のデータセットがあり、そのすべてがBigQueryとCloud Storageによってホストされています。

Amazon Web Services Open Data Registry

多くのデータセットを保持していて、それらをダウンロードして自分のシステムで使用することができます。また、Amazon Elastic Compute Cloud (Amazon EC2)上でデータを分析することもできます。