日本には「平均病」がまん延しています。
学生時代は、平均点より上か下かで一喜一憂し、社会人になれば、平均年収より上か下かでモテ度が変わり、老後は、平均寿命を超えるべく健康食品にこだわり始める。
こんな感じで「平均値を気にすることにあまり意味はない」と分かっていながらも、どうしても平均より上か下かを気にしてしまう。
これはもう日本人の気質なのかもしれませんね。
他にも『消費税が8%から10%に上がるとなれば、平均的な家庭では○○円支出が増える』なんていうニュースを目にした方も多いはず。
こうしたニュースを見て、「ほうほう、消費税が上がると年間○○円も支出が上がるのか。よし、節約しよう!」なんて感じで、節約に精を出し始める家庭が多いのではないでしょうか。
そこで、ここでは日本人が愛してやまない「平均値」について、あれこれと思うことを書いてみることにしました。
意味のある平均値と意味のない平均値
平均値には意味のあるものと意味のないものがあることをご存じでしょうか。
平均値に関する概念を知るためによく用いられる質問があるので紹介します。
血液型を調査して、「A型」を1、「B型」を2、「O型」を3、「AB型」を4としてデータ入力を行った。この数値データの平均値を計算したところ2.1となった。この平均値にどのような意味があるか。
さて、この質問1.で問われた血液型の平均値「2.1」にはどのような意味があるのでしょうか。
続いて、もう一つ平均値の意味に関する質問をします。
ある調査の質問に「はい」、「いいえ」で回答してもらい、「はい」を 1、「いいえ」を 0 として データ入力を行った。この数値データの平均値を計算したところ 0.35 となった。この平均値にどのような意味があるか。
さてさて、この質問2. で問われた回答を平均値で表した「0.35」にはどのような意味があるのでしょうか。
正解は…
- 質問1.の平均値には意味がない。
- 質問2.の平均値には意味がある。
というものです。
以下で、もう少ししっかりと解説してみます。
平均値に意味があるかないかの見分け方
まずこちらの2つの質問は、京都大学大学院医学研究科臨床統計家育成コースの入試問題から引用してきた問題になります。
そして、質問1.の血液型の平均値が意味のない根拠ですが、次の通りです。
続いて、質問2.のアンケート結果に対する平均値が意味を持つ根拠を示します。
さて、この質問とその回答から分かるように、私たちが日常的に目にする平均値というデータは、すべて意味があるわけではありません。
そして、意味を持つ平均値であったとしても、その数字にどんな意味があるのかをしっかりと考える必要がありそうです。
続いて、もっと身近にある平均値の問題点を具体的な事例を踏まえて紹介してみたいと思います。
日常に潜む平均値の罠
平均年収や平均寿命という数値を参考にすることは危険だったりします。
その辺りの話は別記事で書いているので、読んでみてください。
参考:平均的な年収で、平均的な暮らしを目指した夫婦の末路 -レポログ
ここでは平均値を使ったレビュー(口コミ)を参考にするうえで知っておくべきことについて紹介したいと思います。
食べログの評価に潜む問題点
食べログの評価については、大きな話題となりました。
年会費を払えば評価を上げるとか上げないとか。
この年会費問題については多くの方が検証されているので、ここでの言及はしません。
ここで伝えたいことは、そもそもの食べログの評価方法に潜む問題についてです。
食べログでは以下のような星の数で店の評価を行っており、利用者はこの数字を見て店の良し悪しを判断しようとしています。
画像引用:https://tabelog.com/
だからこそ年会費の有無でこの星評価が変わることを指摘したツイートが大きな波紋を呼んだわけですが、それ以前にこの評価方法には問題が潜んでいます。
食べログの評価点に関しては、HP内で確認でき、明確な計算アルゴリズムについては「非公開」としながらも、次のような評価をしていることを示しています。
画像引用:https://tabelog.com/
つまり、食べログでは
- ユーザーの影響度=食べログで投稿を多くするユーザーの評価
を重視しているというわけです。
これは、食べログによく書き込んでいるユーザーの評価点は重く受け止め、大きく評価点に反映させていくけど、食べログにあまり書き込みしないユーザーの評価点はあまり評価しません、という仕組みになっているわけです。
このようなにデータに対して重みを付け、平均値を提示することは食べログ側の意図が少なからずく結果に反映されていると考えるべきなのです。
同様の問題は他のサイトでも起こっています。
Amazonの評価に潜む問題点
食べログと同じように、レビュー評価を平均値で示していないことをAmazonも認めています。
Amazonについては、カスタマーレビューを8000万件以上も解析したデータが公開され、ユーザーがどのように星をつけているのか、その傾向が明らかになっています。
ジャンル別の星の数の平均値も同記事内で解析・公表されています。
星の数が1~5つで評価をすることから評価の平均値は「3」であるように錯覚してしまいますが、この解析結果を見る限り「Digital Music(デジタルミュージック)」では評価平均が「4.6」に迫る値であることが分かります。
また、最も評価平均が低い「Cell Phone and Accessories(携帯電話とアクセサリー)」では「3.8」となっていることにも注意が必要で、仮に同じ評価「4.0」であったとしてもジャンルによってその評価が分かれることになります。
映画.comや価格.comの評価
こうした視点で映画.comや価格.comのレビューを見てみると、各個人の記した星の数の平均値が全体の評価値になっていないことが分かります。
こちらは、映画.com(https://eiga.com/)内で確認された"とある映画"の評価です。
実際9人のユーザーが出している星評価を平均すると「2.0」になるのに対し、表示されている全体の評価平均は「2.6」となっています。
このようにウェブ上で利用できるほとんどすべてのサイトでは、そのレビューが一見そのサービスを利用した人すべての評価のような表記をしていますが、実際はその一部の評価に重みを付けられた結果となっています。
その平均値、信用できますか?
平均値の求め方は小学生でも知っている公式なわけですが、その使い方や扱い方はなかなか難しいものがあります。
一口に平均値といっても、実は他にも沢山の計算方法で導く平均値が存在しており、場面場面で使う平均値の種類を使い分ける必要があります。
ここでは一番よく用いられる「算術平均」という平均値についてあれこれ思ったことを書いてきました。
日常的に用いられる平均値ですが、その意味を正しく理解し、行動につなげられるようになれば 「平均大好き国日本」でこれからの時代も楽しく生きていけるかもしれません。