第10回:「人間工学研究で用いる統計解析tips:統計検定の基礎を学び直そう」
■開催日時 2017年1月13日(金) 16:30~19:00
■開催場所 オフィスパーク名駅プレミアホール会議室
■参加者 16名
講師プロフィール
榎原 毅
名古屋市立大学大学院医学研究科 講師
博士(医学)。名古屋市立大学大学院医学研究科満期退学。
専門は産業人間工学・作業関連疾患予防策、産業疫学統計ほか。
(一社)日本人間工学会副理事長・「人間工学」誌副編集委員長。
概要
受講生からの要望にお応えし、人間工学研究でよく用いられる統計解析について、基礎から分かりやすく解説する講座を開講しました。近年では無料で使える統計解析プログラムも普及し、誰でも簡単に統計検定を行うことができますが、その概念や仕組みを理解することで、解析の誤用も防ぐことができます。平均値、標準偏差と標準誤差などの基本統計量から、t検定、分散分析など頻繁に用いられる仮説検定の仕組みを体験的に理解するための基礎講座です。
講義の前半は、人間工学誌で不採択となった論文の特徴の集計を紹介し、研究のデザイン・統計解析・結果の解釈など客観性に関連する部分に不備があると不採択となっている状況を紹介しました。それらはいずれも統計解析の基本的な考え方の理解に依拠するところであり、本講座を通じて統計学の考え方を学ぶ意義を解説しました。
基本統計量の代表格である平均値と標準偏差について、歴史的な背景に立ち返り概説しました。平均値の概念はベルギーの数学者であるアドルフ・ケトレ-が生み出したものであること、また、フローレンス・ナイチンゲールもケトレ-を師事し、円グラフの一種である「とさかグラフ」はナイチンゲールが考案したものであるなど、データを要約して特徴や傾向を示す技術として記述統計が生み出されてきた経緯を紹介しました。その後、身体寸法測定の架空の事例を用いて平均値だけではなく、標準偏差という分布のばらつき度合いを示す指標が何故必要なのか、を分かりやすく紹介しました。標準偏差の概念を理解するために、平均偏差や分散の事例を視覚的なイメージで解説し、また、標準偏差の特徴と解釈について講義を行いました。
次に、スチューデントのt検定を事例として、統計的仮説検定の概念を解説しました。一般的には仮説検定の概念を理解する部分は多くの方が躓きやすいところですが、「引き算」の理論的誤差分布と照合して、t値の発生確率を検証しているという仕組みについて、視覚的なイメージで分かりやすく説明しました。また、仮説の正しさを背理法で判断しているp値について、誤解されている点についても解説を行いました。特にp値が小さい方が差が大きいと考えてしまいがちですが、p値はサンプルサイズ依存の指標であることなど、t値の計算式やt値の臨界値表を参照しながら説明しました。
講義の後半では、分散分析を取り上げ、t検定と同様に、今度は「比」の理論的誤差分布と照合して有意差を判断していることを説明し、p値が持つ性質と限界について総括的に解説を行いました。
最後に、人間工学領域でも頻繁に用いられる相関分析についても概説しました。相関係数rはシュワルツの不等式を基に算出されており、計算式の構造を視覚的なイメージで理解することで、相関係数の限界についても説明しました(x, yの値の偏差積和と偏差平方和の大小で判断しているに過ぎないため、外れ値なおデータの分布の特徴でrの値は大きく変化することなど、イメージ的に理解できるように解説しました)。
当初の予定時間を15分ほどオーバーしてしまいましたが、受講生の皆様からは「適切なサンプルサイズの算出方法について」「p値以外にも効果量を併記することについて」「測定データが反復測定の場合のデータ処理について」など、活発なご質問を頂き、受講生の皆様と共有することができました。次回は実際に統計解析ソフトを用いた実習形式の講義を開講予定であることを紹介し、講座を終えました。
受講者アンケート結果
統計学の基礎は一般的に理解が困難にもかかわらず、講座内容の満足度および理解度について高く評価頂きました。
本日の講座に関するご質問・ご意見など(一部抜粋)
・前回の統計の講座にも参加させて頂きました。前回はついて行けない部分が多かったのですが、今回は良く理解できました。自分がつまづいていた部分がよく分かりました。前回のアンケートで「基本的なところを・・・」とお願いしたのですが、それを実現して頂いて嬉しいです。
・(講義最初に提示された)本講義の到達目標を見ると、既に知っている内容が多そうに見えましたが、講座を実際に聞くと、分かっていたようで良く分かっていなかった部分が理解できたり、あやふやだったところが良く理解できるようになりました。
・具体的な例で説明頂き、分かりやすかった。
・分かりやすかったです。サンプル数や効果量についてのお話も、とても分かりやすく良かったです。
・p値だけを安易に使わない・・・結構それだけを使っていました。そのp値が信頼性があることを証明するためには、自由度を示すことも必要であることが理解できました。また、サンプル数が多ければ良いというものでもないことが分かりました。
・分かりやすい内容でした。具体的に事例をあげて説明していただいたのが良かったです。今まで学んできた内容(昔正しいとされてきたこと)が変わりつつある、変わっていることが学べて良かった。
・とても分かりやすく、大変勉強になりました。今後に活かしたいと思います。
<今後の講座企画に対する要望など>
・東京でも実施してほしい
・回帰分析(重回帰分析、ロジスティック回帰分析)も勉強したい
・エクセルを使いながら実習形式で学習したい
・統計解析ソフトRを用いた講座、楽しみにしています
・定期的に勉強会があるといいです
・東京の統計講座にも参加したいので、Rを使った講座は土曜日または日曜日の開催を希望しまし。よろしくご検討ください。