土屋つかさの技術ブログは今か無しか

土屋つかさが主にプログラミングについて語るブログです。

統計検定2級合格記(前編:統計を勉強する気になった3つの理由編)

 先日統計検定2級試験に合格しました。記録の意味も兼ねてまとめ記事を書きたいと思います。

統計検定とはなにか?

統計検定
www.toukei-kentei.jp

 統計検定は、日本統計学会が公式認定している統計に関する知識や活用力を評価する全国統一試験です。一般財団法人統計質保証推進協会が実施していて、「総務省支援、文部科学省&経済産業省&内閣府&厚生労働省後援」というやたら豪華なバックボーンを持っています。

 統計検定は日本国内の統計教育の充実のために2011年に発足した検定で、その意味ではまだ歴史の浅い資格と言えます。

 試験には以下の種別があります(括弧内は目安)

統計検定1級 (大学専門課程レベル)
統計検定準1級 (大学基礎課程レベルの発展)
統計検定2級 (大学基礎課程レベル)
統計検定3級 (高校卒業レベル)
統計検定4級 (中学卒業レベル)

 2級まではマークシート試験で、準1級からは筆記が加わります。また、この他に、統計調査士/専門統計調査士/データサイエンス基礎(2020年新設)など職業(?)に特化した試験もあります。

 統計検定は年に2回(6月/11月)に全国各地で実施される筆記試験か、CBTと言われるコンピュータ試験で受けることが出来ます。CBT試験は、Odysseyと提携している各地のパソコン教室等で予約して受験します。

Odyssey
cbt.odyssey-com.co.jp

 土屋は、2019年11月の筆記試験で4級と3級、2020年3月14日にCBT試験で2級に合格しました。筆記では試験の1ヶ月後にネットで合否が判明し、さらに1ヶ月後に合格証が送付されます。CBT試験では試験が終わった直後に合否が判明します。これはちょっと心臓に悪かったですw

なぜ統計試験を受けようと思ったのか。

 統計検定を受けようと思ったのには3つ理由があります。

統計不正問題を見て統計に興味を持った

 2019年に起きた「統計不正問題」は、まだ記憶に新しいかと思います。

ja.wikipedia.org

 個人的に日本は統計に強いという勝手な思い込みがあり、重要な統計が適切に計算されておらず、かつ必要なデータが消失していて再集計もできない(つまり、日本の統計データに回復不能な欠落が生じた)事態に陥ったというのが衝撃的でした。
 それと同時に「自分はそもそも統計という物がどういう作業なのかよく分かってないな?」と感じ、これを機会にちょっと勉強してみるかとネットで検索していて出てきたのが統計検定でした。

ゲームクリエイターとして確率・統計を理解しておきたかった

 意外に思われるかもしれませんが土屋は数学が苦手でして、特に確率の計算が昔から苦手です。

(余談。プログラマーがみんな数学が得意だと思うなよ!? どちらかというとプログラムは論理学だ! シェーダープログラミングにコミットしなければ、ベクトル演算(内積&外積&線形変換)だって人生から無縁のままでいられたはずなんだ! まあ面白いけどねシェーダープログラミング! みんなもやろう!)

 ゲーム開発と確率計算は切っても切り離せない要素です。これはゲームシステムに乱数要素がある場合の話だけではなく、ゲームのデバッグをする際のプレイヤーの意思決定や勝率を予測するためにも必要なのです。

 統計学というのはデータと確率に基づいて予測を立てる学問なので、確率とがっつり結びついています(というか確率そのものと言えるかも)。なので、統計学を学ぶことでゲームクリエイターに必要なスキルを獲得できるのではと考えました。

AI技術開発にコミットしたい

 現代のプログラミングパラダイムの一つにAIが台頭しています。いやAIは昔からあったんですが、ディープラーニング技術の発展によって、AIの性能はこの数年間で飛躍的(という言葉では表現できないほど)に向上しました。

 ディープラーニング技術というのは突然生まれた物ではなく、30年前から存在したニューロネットワークと呼ばれる方式がベースになっています。当時はハードウェア性能の限界から実用的ではなかった物が、現代になって日の目を見たわけです(もちろん30年前の物がそのまま使われてるわけではなく、日々改良が続けられています)。

 ディープラーニングによるAI処理は、乱暴に言えば「指定されたサンプルを、膨大なデータと比較し、類似する物を見つけだす」という物です。簡単に「膨大なデータと比較」と書いてますが、これを実用的な性能でかつ瞬時に処理することがこれまでは出来なかった(ディープラーニングの導入によって可能になった)わけです。

 でまあ、この「類似する物を見つけ出す」はまさに統計処理でして、実際ディープラーニングの教科書を開けばどれも微積の方程式が延々書かれていますし、研究者にはデータサイエンティスト(プログラミングに特化した統計学者くらいの意味かな?)が多くいます。

 個人的にAIプログラミングはずっとやりたいと思っていた分野で、統計の知識があれば他の人と違うアプローチが出来るのではないかと考えたのでした。

後編に続く

 長くなったのでここまで。後編では2級の勉強に使った教材を紹介します。