こんにちは。ひとりで.comです。
Googleスプレッドシートで大量のデータから集計を行う際に、ピボットテーブルという便利機能を使うと簡単に集計をすることができます。今回は、そのピボットテーブルについて紹介したいと思います。
※この機能はExcel(エクセル)でも使える機能です。
Googleスプレッドシートにて、ピボットテーブルでデータ集計を行う
ピボットテーブルとは?
ピボットテーブルとは、Wikipediaで以下のように説明されています。
ピボットテーブルは表計算ソフトまたはビジネスインテリジェンスソフトウェアにて利用されるデータ可視化要約機能である。対象集計データは(“ピボットテーブル”と呼ばれる)第2のテーブルに表示され、自動的に表内格納データの並替、合計値、平均値、総数、標準偏差が出力できるほか、クロス集計が利用できる。任意に表内の表示項目をドラッグアンドドロップを用いて変更できる。
「ピボットテーブル」は複数の開発会社が使用する一般的な名称であるが、米国ではマイクロソフト社が商標登録している。[1] OLAPの簡易機能と位置づけられることも多い。Excelの場合OLAPサーバからスプレッドシートにデータを直接照会する機能が含まれている。
【出典:Wikipedia】
※一般名称として利用されていますが、ピボットテーブルはマイクロソフトの商標となっています。ただし、Googleスプレッドシートにおいても、ピボットテーブルという名称が使われています。
ピボットテーブルでデータをクロス集計
例えば、大量の人事データから、男女の人数を調べたいだったり、年齢の分布を調べたい、だったり、データの中から、特定の条件に従ってクロス集計をすることができる機能です。ピボットテーブルは、GoogleスプレッドシートやExcel(エクセル)では、最低限覚えておきたい機能のひとつですので、以下から実際の説明を見て、ぜひ使い方を覚えてしまいましょう。
まずは、以下のような人事データを用意しました。
※データの中身はダミーデータです。
この表において、D列の性別のところを集計したいと思います。ここでピボットテーブルを用いてクロス集計を行いたいと思います。
ピボットテーブルを用いてクロス集計するためには、まず、集計したいデータの範囲を選択した上で、[データ]より[ピボットテーブル]を選択します。
すると、別シートに[ピボットテーブル]というシートが作られ、以下のような画面になります。左側に集計した結果が表示され、右側にある[レポートエディタ]の部分でどういったクロス集計を行いたいのか条件を指定します。
[レポートエディタ]内ではクロス集計するための行列の項目の指定と集計対象とする値の設定、そして必要に応じて[フィルタ]を設定します。
まず、今回、性別でクロス集計を行いたいので、行の部分に「性別」を入れます。
次に、「列」を指定するのですが、今回の集計では、性別のみが対象なので、列は指定しません。例えば、性別×年代のような集計を行う場合は、行列の両方を指定することになります。
そして、その後は「値」を指定します。値は、行列で指定したものが入っていれば良いので、今回は「名前」を選択したいと思います。
「値」を指定した後は、それをどのように集計するのか(数値であれば合計値を表示したいのか平均値を表示したいのか、文字列であれば、個数を指定したいのか…など)を指定します。今回は、文字列の数を集計したいので[COUNTA]を指定します。
ピボットテーブルによる集計が完了すると、以下の画像のように、男女の性別毎に何人いるのか、という数値を表すことができるようになります。
クロス集計を行う条件は、右側の[レポートエディタ]で常に表示されているので、条件を変更したい場合はいつでも変更することができます。
これが、ピボットテーブルを用いたクロス集計のやり方の一連の作業となります。ピボットテーブルはGoogleスプレッドシートだけでなく、Excel(エクセル)においても使える基本的な機能のひとつですので、ぜひともやり方を覚えておきましょう。