はじめに

この資料は、Python で探索的データ分析を行うときに便利に使用できる支援ツールにつ>いてまとめたものです。

探査的データ分析

Pythonによる探査的データ分析:入門編

探査的データ分析の支援ツール

pandasのデータフレームを使ったデータ探索は、一つ一つの分析をゼロからコーディングする必要があるため、非常に手間がかかるものでした。データをより良く理解するためには多くの時間が必要になり、デバッグなどの気力を奪う作業が必要なこともあります。幸いにも、Python には多くの自動可視化を行うことができる支援ツールがあり、それらを使用することでEDAを行うための時間を大幅に削減することができます。 ここでは、次のパッケージについて紹介します。

これらのツールは簡単な操作でデータを可視化することができる機能を持っていて、ローコードツール(Low Code Tool)と呼ばれたりもします。

skimpy

skimpyは、データの要約を表示する .describe()の拡張版を提供する軽量なPythonパッケージです。データレポートは非常にシンプルですが、必要な情報はほぼすべて含まれています。このライブラリのレポートは他のツールほど完全ではありませんが、要約として時々使うには十分なものです。

インストール

skimpy は次のようにインストールします。

 $ python -m pip install skimpy

使用方法