前回はQC7つ道具で扱うデータの
種類について解説しました
【参考情報】QC7つ道具ツールを構成するデータとは何か?
一方でそのデータを表現する時の
数字のまとめ方、つまり表現方法は
とっても重要な意味があります
そのため数字のまとめ方の基本として
今回は数字の持つ意味合いを
解説していきます
数字の持っている意味について
集めたデータをどう表現するのか?
それを知っていくことは
共通言語を増やすことに繋がります
例えば、平均値、中央値といった
統計的な表現をしたとしても
それがいったいどういった意味を
持っているのかを知らなければ
あまり意味を持たないことになります
しかし知っているだけで
メンバー間での品質の状態の
共有スピードがかなり早まるため
ぜひとも覚えて頂きたいと思います
数字のまとめ方の基本
データで集めてきた数字の集まりは
中心:データの中心を表す値
ばらつき:データの散らばり
を把握することが必要です
中心を示す数値としては
平均値や中央値、最頻値があります
ばらつきを示す数値としては
範囲、偏差平方和、分差、標準偏差が
あります
これらの数値はデータに基づいて
計算して得ることができます
早速、それらの計算方法について
明らかにしていきましょう
平均値の計算方法
たくさんのデータを集めたとします
そしてそれらのデータをすべて合計し
データの個数で割った値を
平均値と呼びます
こうすることでデータのばらつきを
なくした場合のレベルが把握できます
中央値
いくつかのデータを小さい順に
並べ替えたときに真ん中に一する値を
中央値=Me:メディアンと言います
平均値の算出に比べて
計算が必要ないので
平均値の代替えとして用いられます
また、データに異常な値が入ると
平均値は影響を受けてしまいますが
中央値はそういった問題がおきない
特徴をもっています
ただし奇数の場合はわかり易いですが
偶数の場合は真ん中の2つの平均値を
中央値とします
最頻値
もっとも頻繁に現れる数値を
最頻値=M:モードと言います
これはもちろんデータの中から
同じ数字をカウントしていって
もっとも多い数値を最頻値とします
これをグラフ化したものが
ヒストグラム(度数分布図)となります
【参考情報】ヒストグラムの作り方(エクセルも含む)
範囲
データの中の最大値と最小値の間を
範囲=Rと言います
範囲はばらつきの大きさを
把握するための数値です
ヒストグラムでいう幅にあたります
偏差平方和
次はデータのばらつきを数値的に
まとめる方法です
最初に個々の数値が
中心(平均値)から
どれだけ離れているのかを
計算していきます
まずデータ全体から平均値を求めます
次に数値それぞれと平均値の差を
計算します
この差を『偏差』と呼びます
この『偏差』を単純に足すと
平均値との差ですから
プラスもマイナスも等しくあって
”0”になってしまいます
そのためこの偏差を2乗したデータを
合計していってばらつきを表現します
それを偏差平方和=S:ラージエスと
言います
分散
偏差平方和は偏差の2乗の合計値です
そのためデータが多くなってくると
そのばらつきの大きさに関係なく
大きくなっていきます
これではデータの数の違う
ばらつきの比較がしにくいですよね
そこで偏差平方和をデータの数で
調整することを考えていきます
具体的には偏差平方和を
(データの数-1)で割ることで
調整します
こうやって得られる値を
分散=V:ラージブイと言います
なぜデータの数でなく
(データの数-1)なのかというと
数学的にデータの数の誤差を
少なくするためです
標準偏差
平均値の単位は元のデータと同じです
しかし偏差平方和は計算の過程で
プラス・マイナスを取るために
2乗しています
それを元にしている分散も同じなので
この単位を2乗する前のものと
合わせるために分散の平方根を
とることにした数値を
標準偏差=s:スモールエス
と言います
数字のまとめ方の基本~QC7つ道具の基礎知識~まとめ
さて、いろいろなまとめ方が
出てきましたがまとめてみますと
データの特色をあらわす値として
平均値、中央値、最頻値
データのばらつきをあらわす値として
範囲、偏差平方和、分散、標準偏差
を紹介しました
これらの数字のまとめ方は
QC7つ道具を使いこなすうえで
基本となるものなので
しっかり把握しておきましょう
それでは今日はここまでです
今後とも宜しくお付き合いください☆
長文・乱文を最後まで読んでくださり
いつもありがとうございます♪
すべては御社の発展のために
すべてはあなたの笑顔のために