データセットとは、単にデータの集まりのことです。公開さrているデータセットの最も単純で最も一般的な形式は、スプレッドシートやCSV形式です 。しかし、データセットの中には他の形式で保存されているものもあり、1つのファイルであるとは限りません。そのためデータセットによっては、関連する複数のデータを含むデータテーブルをZIPファイルになっていることもあります。
無料のデータセットを検索するために作られた検索エンジンです。Google Dataset Searchは、通常のGoogle検索と同じように、提供されたキーワードをもとに検索を行います。キーワードは、データセットの内容ではなく、その説明文にマッチします。
Microsoftのオープンデータの検索とダウンロードでき、Azureと連携することができる。
Yahoo Research が公開している、興味深く科学的に有用なデータセット。非商用で利用できる。
DataPortalsは、その名前からわかるように世界中の588のデータポータルへのリンクを持っています。 データソースは、都市や地域をベースにアルファベット順にリストアップされています。各ポータルは、タグ(レベル地域/地方、国、EU公式、ベルリン、OSM、金融など)で簡単に説明されています。
Googleのクラウド上でアクセスできる多くの公開データセットで、100以上のデータセットがあり、そのすべてがBigQueryとCloud Storageによってホストされています。
多くのデータセットを保持していて、それらをダウンロードして自分のシステムで使用することができます。また、Amazon Elastic Compute Cloud (Amazon EC2)上でデータを分析することもできます。