2019年6月16日に実施された統計検定の準1級に合格したので、合格までにやったことを書いておく。
試験の結果
統計検定はただの合格の他に評価S(極めて優秀な成績)と評価A(特に優秀な成績)がある。
今回は合格したものの、評価Aには及んでおらず、自己採点の結果では多肢選択が7割、記述・論述が3割くらいの感覚だったので、良い成績での合格ではない。今のまま再度受験して合格できるかは怪しい。
前提知識
2018年11月25日の統計検定で、2級を受験して評価Aを得ており、2級の範囲についてある程度の自信をもって解ける程度の知識はあった。2級のレベル感は簡単すぎず難しすぎずで手頃なので、統計検定を受けたことがなければまずは2級を目標にすると良いと思う。
2級は試験会場と日程にある程度融通のきくCBT方式(コンピュータを使って受験するもの)に対応しているので、好きなタイミングで受験することもできる。
2級については過去問を数度周回し、わからない部分を軽く調べる、という程度の勉強だった。多肢選択なので問題に慣れておけばそれだけでもある程度の点数は取れる。
やったこと
期間
2級に合格した時点(2018年末)で受けてみようかと思い過去問を買ってきたりしたがあまり捗らず、紙とペンで真面目に勉強をし始めたのは5月の連休あたりからだった。
勉強方法
例の赤い本を流し読みしたりはしていたが、ある程度腰を据えて勉強を始めたのは5月の連休頃からだった。
まずは「心理統計学ワークブック」を8割くらいやった。わからないところは「心理統計学の基礎」に書いてあるので、分からなかった部分に遭遇したらノートに転記していた。8割でやめたのは特に範囲がどうこうということではなくて、単に飽きたためである。2週間くらいやった。
その後は公式問題集の過去問を解き、
- 自信をもって解けた → 次の問題へ
- 解けなかった
- 解説を読んで理解できた → 次の問題へ
- 解説を理解できなかった → 理解できるまで調べてノートにまとめ、再度挑戦
ということを試験当日まで繰り返した。
公式問題集の解説は紙面の都合もあるのか非常にあっさりしているので、ある程度内容をわかっていなければ理解することもままならない。逆に言えば、解説を読んで理解できるのであれば、過去問の練習だけで類似の問題は解けるようになると思う。
やらなかった/やれなかったこと
用語の確認
はじめ、出題範囲に記載されている用語を洗い出して分からない部分を潰していこうと考えていた。しかしこれは2日で挫折した。統計検定準1級は範囲がクソ広いので、出題範囲に含まれる用語もクソ多い。したがって用語を書き出すだけでも一苦労で、それを一つ一つ洗っていくなどということはとてもやれなかった。評価A以上を狙うのであれば、ある程度勉強した段階でやる必要があっただろうとは思う。
手法の実践
ありがちな問題として「このデータセットに○○という手法を適用したときの結果はどれか(グラフを選ぶ)」というものがある。これはほぼボーナス問題みたいなもので、その手法をRやPythonでやったことがあればかなりの割合で正解できる。たいてい、そのような問題が出る手法というだけあって、グラフには手法の特徴が明瞭に現れるから判断がしやすいのだ。
しかし、やったことがなければ解けない。理屈を知って結果を想像するのは、結果そのものを見て覚えてしまうのよりもずっと労力がかかる。
今回は主に紙とペンで勉強していたので、手法を実際にやってみるというのは不足していたと思う。今回は問8にFused Lassoの結果のグラフを選べという問題が出たが、正答できなかった。
参考書
アフィ置き場コーナー。
- 心理統計学ワークブック―理解の確認と深化のために: まずはこれをやった。
- 心理統計学の基礎―統合的理解のために (有斐閣アルマ): ワークブックをやる前にも軽く読んではいた。ただ、ワークブックをやりつつ、分からなかった事項に遭遇した時点で読む、という手順の方が理解は良かった気がする。
- 日本統計学会公式認定 統計検定 1級・準1級 公式問題集[2016〜2017年]: 次にこれをやった。前述の通り解説が雑なのでこれだけではキツイ。これだけで分かるなら受かる。
- 統計学入門 (基礎統計学Ⅰ): 例の赤い本。通読はキツイのだが(飽きる)、分からないことを調べると書いてあることがしばしばあったのでやはり手元にはあったほうがよい。
- 自然科学の統計学 (基礎統計学): 正直これはあまり読まなかった。
- 人文・社会科学の統計学 (基礎統計学): DW統計量の説明が欲しくて買ったのだが、若干誤植がある気がしている。
「人文・社会科学の統計学」のDW統計量の近似式の変形間違ってるよなこれ
— かつどん (@nozma) 2019年6月13日
これなんだけど pic.twitter.com/a8CHqGRw2L
— かつどん (@nozma) 2019年6月13日
- 図解入門 よくわかる 最新 実験計画法の基本と仕組み: 問題集の実験計画法の説明がよく分からなかったので買った。おかげでよくわかった。
- 現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~: 結構昔に買っていたが、時系列分析をさっぱり忘れていたので再読した。
- Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎: 以前に一通り読んでいた。基礎的な部分中心に浅くカバーされているので、何もわからん状態からでもある程度問題が解けるようになるはず。
- Rで学ぶクラスタ解析: クラスタ解析の問題が怪しかったので再読。
- 統計的学習の基礎 ―データマイニング・推論・予測―: 全然読んではいないのだが、EMアルゴリズムが良く分からなくて色々な本の記述を比べた結果、この本に書かれているものが一番理解しやすかった。
- 日本統計学会公式認定 統計検定1級対応 統計学: 一応手元には置いておいた。この本の解説も問題集の解説と同じで「これだけで分かるなら分かっているとみなせる」レベルという印象。そもそも対象が1級なので、準1級とは若干違う。テンションとか。
後のものほどあまり真面目に読んでいない。あまり馴染みのない概念を調べる場合、私は複数の情報源の説明を比べないと理解の効率が悪いので、内容的に重複しているようなものでもなるべく手元に置いて勉強するようにしていた。
試験前後の動き
※この先は何の参考にもなりません。
全体スケジュール
会場は北海道だったので、前日に移動して翌日帰るという2泊3日のスケジュールであった。ただの北海道旅行である。
前日
行きの移動はフェリーにした。昼に新潟港を出発して翌朝小樽港に付く航路であった。最初飛行機で行くつもりだったので、差額で良い部屋をとってみたが非常に快適であった。でかい風呂があったりビンゴ大会が開催されていたりエンターテイメント性が高い。
船内では主に真面目に勉強していた。
コインロッカー使うための百円玉が無くてやむを得なかったんです本当です pic.twitter.com/y454ruoAkS
— かつどん (@nozma) 2019年6月15日
ちなみに何もしないと下船は4:30だが、そんな時間に降りてもやることがない。これは事前にカウンターで申し出ておくことで6:00まで延長できる。
当日
当日は雨だった。寒かった。薄着で行ってしまったので、完全に軽装で山に登ってしまった人の気持であった。6:00に小樽に居てもやることがないので、さっさと札幌に移動して駅のドトールで朝食をとりながら時間を潰した。
その後は事前に調べておいた札幌市中央図書館へ向かった。ここは自習室があるので自習がしやすい。また、経路上に時計台がある。
図書館で2時間程度勉強してから札幌駅に戻り、適当に昼食を済ませてから会場の北海道大学へ向かった。
北大は構内の手入れがかなり行き届いていて、どう見てもただの観光客みたいな人や犬の散歩してる人が多いのが印象的だった。
試験結果はさんざんでまさか合格はしていまい…、という感覚だったので、試験後は完全に北海道旅行モードであった。
試験後に付近を散策していたらホクレンのビルがあった。異様にでかかったのと入り口で水稲品種の展示をしていたのがホクレン感があってよかった。
翌日
マッサンは全く見ていないが色々と見るものがあって面白かった。
稼働しているので工場内のいたるところでウイスキーの香りが立ち込めており、歩いているだけで酔いそうになる。
そしてウイスキーの試飲ができる。シングルモルト余市は最&高であった。若干高かった気がしたけど気づいたら買っていた。
これは帰宅してからもう1本買った。
見学と試飲とお買い物済ませたあたりで丁度工場内のレストランが開店したので、うまいものやうまいものを食べたり飲んだりした。
また行きたい。何なら住みたい。
n日後
(試験駄目だったし来年も北海道だなー仕方ないなー)と思ってたら合格してたのでびっくりした。
とはいえギリ合格で準1級相当の知識・能力が本当にあるかというと微妙なので、来年も受験しようと思う。やむを得ない。
あと某所で話をした(このときは結果発表前なので完全に落ちてるテンションだった)。