散布図とは2つの項目において該当する値を点として表し、点の位置に関係性があるかを見るグラフの1種です。分布図などとも呼ばれています。今回は散布図の作り方と使い方を見てみましょう。
散布図の作り方
ただ点を入れるのでは意味がない
グラフ範囲を追加していく
データ分析は様々な分野で使用されますが、きちんと理解して使わないとみる人に伝わりませんので使いこなしていきましょう。



散布図の作り方
今回はA~Vという名の商品の単価と販売金額の関係性を調べてみます。
①単価が高いとやはり売上が高いのか?
②単価が高いと売れず、単価の低いものを売るほうがいいのか?
こういった視点で見ていきます。
キーボードの左下にあるCtrlキーを押しながら範囲を選択すれば、B2:B23とD2:D23といった形で任意の範囲を選択できます。
散布図は[挿入]タブからグラフツールの中の散布図を選択します。
以下のように散布図が出来ます。
ただ点を入れるのでは意味がない
確かに散布図自体は作れましたが、知りたいことは単価と販売金額の相関関係です。ちなみに相関関係とは一方の増減に併せて、もう一方も増減することを指します。
散布図を選択して、ツールバーにある[グラフ要素を追加]を選択して近似曲線から「線形」を選択してみましょう。
相関関係を表す線が表示されます。ただ、このままではただの点線なだけでは意味がないので相関になっていると見えるように近似曲線に加工をしていきましょう。
散布図の近似曲線を右クリックして「近似曲線の書式設定」を選んだら「終点矢印の種類」からお好みの矢印の形を選択します。
相関関係を表す線形が矢印や色を変えれば見やすくなり、相関関係があることが一目瞭然となります。
なお、未来の数値予測をするTREND関数でもこの近似曲線は使えますのでテクニックとして使いこなせると便利です。

グラフ範囲を追加していく
グラフの値を示す部分を「系列」と呼びます(散布図で言えばグラフ内の点)が、系列をクリックすると数式バーに以下のような数式が表示されます。
数式バーのところに入っている数式も当然変更することができます。要はこれを利用して、データが追加された時に自動でグラフに反映されるようにします。
名前の定義を使って範囲を可変にしていきます。名前の定義に関してはこちらの中の『祝日一覧表を作る』の部分で説明しているのでご覧ください。

B1セルにあわせて、名前を『単価』として
=OFFSET(Sheet1!$B$1,1,0,COUNTA(Sheet1!$B:$B)-1,1)
とすれば、B2セルから下のセルが列ごとデータ参照範囲に出来ます。
同様にD1セルに対しても『販売金額』と名前を付けて
=OFFSET(Sheet1!$D$1,1,0,COUNTA(Sheet1!$D:$D)-1,1)
OFFSET関数に関してはこちらをご覧ください。

これで名前の定義は完了です。
あとはグラフの数式を数式バーから変更していきます。
元の数式:
=SERIES(,Sheet1!$B$2:$B$23,Sheet1!$D$2:$D$23,1)
変更後:
=SERIES(,Sheet1!単価,Sheet1!販売金額,1)
範囲の部分を「名前の定義」で設定した名前にすれば完了です。グラフは範囲設定さえ乗り越えてしまえば楽なので「名前の定義」+OFFSET関数は使えると大幅に効率化できるようになります。