テレビと平均寿命

疑似相関

菊池誠ほか『もうダマされないための「科学」講義』(光文社新書,2011年)p. 17 に,100世帯当たりのテレビ保有台数と平均寿命をそれぞれ横軸と縦軸にプロットした図がある。両者は非常に強い相関があるが,テレビを見れば寿命は延びるわけではない。

このような疑似相関はたくさんあり,Spurious Correlationsというサイトにたくさんのおもしろい例が集められている。

テレビと平均寿命のプロット

テレビの普及率・保有数量の推移は内閣府の消費動向調査のページからリンクされている「主要耐久消費財等の普及率(二人以上の世帯)」「主要耐久消費財等の保有数量(二人以上の世帯)」というExcelファイルにある(現時点でのファイル名:201603fukyuritsu.xls201603hoyusuryou.xls)。

この中にあるのはカラーテレビだけである。少し下にある「主要耐久消費財等の普及率(平成16年(2004年)3月で調査終了した品目)」(ファイル名:0403fukyuritsu.xls),「主要耐久消費財等の保有数量(平成16年(2004年)3月で調査終了した品目)」(ファイル名:0403hoyusuryou.xls)には白黒テレビも載っている。

これらのExcelファイルからテレビに関する列を抜き出したものを TV.csv として置いておく。「調査時期」は注釈に月末とあるので「2月」を2月28日,「3月」を3月31日とした。「薄型(液晶・プラズマ等)」は「薄型」とした。

これを手抜きプロットしたものが次の図である:

TV = read.csv("http://oku.edu.mie-u.ac.jp/~okumura/stat/data/TV.csv", fileEncoding="SJIS")
matplot(TV[,1], TV[,3:6], xlab="", ylab="保有数量(100世帯あたり)", pch=c("白","カ","ブ","薄"))
matplot(TV[,1], TV[,7:12], xlab="", ylab="普及率(%)", pch=c("白","カ","大","小","ブ","薄"))
テレビ台数の推移
テレビ普及率の推移

2009年をピークとして保有数量は減少している。数量・普及率とも2014年に急減しているが,この年から「ブラウン管テレビ」が調査対象から外されたためである。アナログ放送終了は2011年7月24日(岩手・宮城・福島は2012年3月31日)である。

一方,平均寿命は厚労省の平成26年簡易生命表の概況参考資料2 平均余命の年次推移(PDF)から得られる。平均寿命は0歳の平均余命として求められる。念のためCSVにしてlife2014.csvとして置いておく。

これも手抜きプロットしておく:

life = read.csv("http://oku.edu.mie-u.ac.jp/~okumura/stat/data/life2014.csv", fileEncoding="SJIS")
matplot(life[,1], life[,c(2,8)], xlab="", ylab="平均寿命", pch=c("男","女"))
平均寿命の推移

さて,テレビと平均寿命の関係である。まずテレビのデータと平均余命のデータをマージする(共通の列「年」で揃える)。欠測値は0とする。テレビ普及率はカラーテレビ普及率と白黒テレビ普及率の和(ただし100を超えれば100にする)とした。

a = merge(TV, life)
f = function(x) ifelse(is.na(x), 0, x)  # 欠測値を0で置き換える関数
plot(f(a$カラーテレビ)+f(a$白黒テレビ), (a$男0+a$女0)/2, xlab="保有数量(100世帯あたり)", ylab="平均寿命")
plot(pmin(100,f(a$普及率カラーテレビ)+f(a$普及率白黒テレビ)), (a$男0+a$女0)/2, xlab="テレビ普及率", ylab="平均寿命")
テレビ保有数量と平均寿命
テレビ普及率と平均寿命

カラーテレビだけでやってみる:

plot(f(a$カラーテレビ), (a$男0+a$女0)/2, xlab="カラーテレビ保有数量(100世帯あたり)", ylab="平均寿命")
plot(f(a$普及率カラーテレビ), (a$男0+a$女0)/2, xlab="カラーテレビ普及率", ylab="平均寿命")
カラーテレビ保有数量と平均寿命
カラーテレビ普及率と平均寿命