Project Namiki

Twitter→@sol2_CTF

統計検定1級に4か月で合格した話【医薬生物学】

初めに

2023年度の統計検定1級に4か月、かつ独学で合格したのでその記録を残します。
統計検定1級に挑戦する誰かの参考になれば嬉しいです。

TL;DR

  • 計算力はあればあるほど良い。
  • 統計数理はやればやるほど良い。
  • 『ラスベガスをぶっつぶせ』はいいぞ。

統計検定1級とは

統計に関する国内最上級の試験であり、確率分布の性質から検定手法まで、幅広い出題範囲を扱っています。
統計検定1級はほかの級と異なり、すべて論述形式の試験です。
統計数理と統計応用の2つに分かれており、その両方に合格する必要があります。合格率は数理と応用でどちらも毎年20%くらいで推移しています。
統計検定1級の立ち位置を全体でみるとこんな感じです。

(統計数理研究所『データサイエンティスト育成事業』から引用)
棟梁レベルというと何か強そうな感じがしてかっこいいのでこの画像を引用しました。
ちなみに日本ではこの棟梁レベルが不足しており、統計数理研究所は人材育成に力を入れているらしいです。
余談ですが、試験当日会場に来てるのは見るからに理系という人と、見るからにベテランという人の2択で、明らかに雰囲気が違ったのを覚えています。
周りに圧倒されないように理系のベテランぶることでなんとか耐えました。

バックグラウンド

  • 実習期間中の医学部5年生
  • 強化学習の実装のなかで確率分布に触れることはあったが、雰囲気で理解していた。
  • 微積は受験数学(数学III)まで、線形代数は初めから。
  • 統計検定の受験自体初めてで、2級や準1級は未受験。

きっかけ

統計学自体への関心があることに加え、統計学はセキュリティ、強化学習、医学など私の関心のある/関与する分野でも多く使われており、今後の需要も高まりそうなので勉強しようと思いました。
また、挑戦する壁は高ければ高いほど良いので、最初から1級を受験することにしました。

試験対策

共通

統計数理と統計応用の両方において、数学の知識と過去問演習が必須です。   

数学

統計検定1級には理系大学の基礎課程で学ぶような微積分と線形代数の知識が前提とされています。
私の大学も理系ではありますが、学部の性質上狭く浅くしかやってないので初めから勉強しました。

使用した参考書は以下の2冊です。

www.chart.co.jp

www.chart.co.jp

上記の参考書の問題全てを解いたわけではありませんが、問題を解いたり証明の理解に必要な基本的な事はこれらの参考書の演習を通して勉強しました。

過去問

jitsumu.hondana.jp

数理と応用に共通して、過去問を繰り返し解きました。
値段は張りますが揃えた方が良いと思います。私は2014~2022年の問題を入手しましたが、傾向が変化しているので2015年以前の過去問は必要ないと思います。(ちなみに2015,2014年はかなり異常な難易度で、その意味でもやる必要はそこまで無いと思います。)

時間制限も考慮して、問題ごとに解いた日付とかかった時間、正答率を記録しました。

統計数理

ここで大事なのは、問題パターンに対する解答を網羅的に理解したり覚えることではなく、初見の問題に対しても方針を立てて解くことが出来る力をつけることです。
試験時間が短いため典型的な問題はその場で考えなくても解けるように演習量を積みましょう。

使用したのは以下の書籍です。

2級公式本

www.tokyo-tosho.co.jp

統計に関する基本的な知識もなかったので、2級公式本は一通り読んで理解しました。問題を解いていく中で抜け落ちている箇所はその都度確認しました。

現代数理統計学の基礎

www.kyoritsu-pub.co.jp

他の多くの統計検定1級合格者が使用している参考書です。私の場合、統計数理の対策はほぼこの一冊で完結しました。
内容は統計検定1級の範囲を超えているので、必須ではありませんが、章末問題が豊富にあり、公式の解説も丁寧に書かれているので進めやすいです。
初学者からしたら初めは公式の解説も意味わからんので、有志で解答を作成して下さっている記事を参考にすることをお勧めします。
(参考:『現代数理統計学の基礎』章末演習問題解答 (答案) #統計学 - Qiita)
ただ先述の通り、私は個人的に重要なのは「問題に対する捉え方」だと考えています。そして、公式の解答は難しい内容ではありますが、問題テーマに沿った考え方で解説がなされています。
従って、平易な形でも一度解答を理解したなら、なるべく早く公式の解答を理解できるようにした方が良いと思います。
公式の解答を参考にするにあたっては、問題ごとに「この問題でテーマとされていることは何か」ということを意識しながら問題を解いたり解答を読み込むといいです。
それから多くで言われている通り、この書籍だけでは線形回帰や統計的検定の対策が不十分です。それらの部分は、2級公式本や次の項で説明する1級公式本や過去問で勉強しましょう。

統計応用【医薬生物学】

統計応用の医薬生物学は理工学や人文社会学など他の分野と比較して対策しにくいというのが印象です。加えて、インターネット上に合格者によるリソースが少ないため、ここでは医薬生物学の対策について少し詳しく書こうと思います。
対策が難しいとは言ったものの、やはり「過去問を解く」という基本的な方針に変わりはありません。統計数理と同様、「解法の方針を立てることができる」ようになるのが重要です。
その上で次のような書籍で勉強しました。

1級公式本

www.tokyo-tosho.co.jp

日本統計学会が出版している公式の参考書です。統計数理と、統計応用の各分野について一通りのことが書かれています。
私は主に統計応用の対策として用いました。
ただし注意点としては2つあって、1つ目は古い書籍であるということです。初版は2013年で現在出版されてるのはそれの増訂版です。手法が古いためか一般的でなくなったのか、問題ではあまり見ない手法について書かれていることもあります。
ちなみに試験問題ではこの書籍に書いてないことでも全然出題されます。公式本とは…?
2つ目は、過程や導出が結構省略されているということです。問題で出ないようなことまで書いてある割に、書いてあることについては内容が不十分な感じです。導出が省略されていたり、結果だけ書かれていたりと、初学者がこの一冊だけで十分に理解するのは難しいと思います。 なのでざっと読んでおいて、過去問を解くにあたり参考になる(かもしれない) 資料の一つとして持っておくといいと思います。

統計学実践ワークブック

www.gakujutsu.co.jp

同じく日本統計学会が出版している公式の参考書です。内容としては準1級向けですが、実際に手を動かして理解出来るという点で役に立ちます。初版は2020年と新しく、上の1級公式本よりも親切な解説です。
ノンパラメトリックの章の説明が素晴らしいので、特に医薬生物学選択の受験者にとってはそれだけでも価値がある一冊だと思います。今すぐに買いましょう。

その他リンク

DataArts

www.data-arts.jp 2014-2017年の統計数理と統計応用(理工学)の問題と解答が記載されているサイトです。
解説が公式のものよりわかりやすかったりします。医薬生物学の解説はないですが、共通問題として被ることがあります。

脳内ライブラリアン

nounai-librarian.com 医薬生物学の問題を解説して下さっている個人ブログ。医薬生物学の過去問解説って本当にインターネットに存在しないのでそれだけでもありがたい。
神経内科医として活躍されており、医療統計の現場での扱いなど、試験とは直接関係はないものの読み物として興味深いです。

東京大学 院試

www.iii.u-tokyo.ac.jp
東京大学大学院 情報学環・学際情報学府の院試です。
生物統計情報学コースの問題を医薬生物学の対策に解きました。問題数は少ないですし解答解説が無いので優先順位は低いですが、余裕がある人は解いてみるといいと思います。

医薬生物学に関する雑リンク

統計応用では以上の基本的な対策に加え確実に得点出来る自分の得意な分野を作りました。 私の場合は生存時間解析、分割表、ノンパラメトリックの3つの単元を重点的に勉強しました。
(後述しますが、結局どの分野も出題されなかったです…)
基本的にインターネット上の資料を用いての学習になると思います。
私が使用したいくつかのサイトのリンクを以下に載せておきます。適当に参考にしてください。

qiita.com 医薬生物学の一大コンテンツ、生存時間解析の入門的な解説記事です。
生存時間解析は医療以外にも経済、理工学などにも用いられている分野で、この記事は理工学を例にした説明ですが、生存時間解析自体の理解に問題はありません。

en.wikipedia.org

医療統計の検定方法については英語のリソースが多く、英語版wikiは結構参考になります。例えば上記のwiki記事の下のほうに検定手法が表でまとまっており、概観の整理にも役立ちます。

学習記録

4か月間の学習記録

(7月)

実習のスケジュールも考慮して、統計検定1級の受験を決意します。この段階で情報を集め、合格に必要な知識ややるべきことを整理しました。

8月 [70時間]

  • 【数理】
    『現代数理統計学の基礎』を始めます。
    すべてが初見だったので1問に対して理解するのに時間がかかり、この月は全体の半分くらいの問題を解きました。(と言うよりかは解説を読み進めました。)

  • 【応用】
    この月はやっとりません。

9月 [80時間]

  • 【数理】
    引き続き『現代数理統計学の基礎』を、8月と合わせて2周くらい読み進めました。この時点でなんとなく分かってきたので、解けそうな数理の過去問少しずつ解いてみたりしました。
  • 【応用】
    この月はやっとりません。

10月 [280時間]

この月の実習はほとんど自由時間だったため多くの時間を確保することが出来ました。

  • 【数理】
    『現代数理統計学の基礎』が解けるようになってきたので、この月だけで3周くらいしました。
    これに加えて、過去問を繰り返し解くようにしました。過去問は間隔をある程度空けて、5周くらいしたと思います。
  • 【応用】
    この月の中旬頃から統計応用の対策を始めました。
    統計応用の対策が後手になりがちとのことで早くに着手したつもりですが、もっと早く始めていてもよかったと思います。

11月(18日まで) [75時間]

実習が通常程度の忙しさに戻り、休憩時間や通学時間も利用して勉強しました。
基本的にはこれまで学習したことを確実に得点できるように練習をしました。 それから、本番に合わせて論述形式の解答制作をしました。実際にやってみて痛感しましたが、日本語で説明する部分を最小限にしないと時間が足りないです。
問題集の解説のような詳細な解答を書く時間はあまりないので、どこを言葉で説明してどこを式で説明するのかを考えながら書く練習をしました。

本番

自己採点

統計数理

[問1] (1)〇 (2)〇 (3)〇 (4)〇 (5)〇 (6)×
[問2] (1)× (2)〇 (3)〇 (4)×
[問3] (1)〇 (2)〇 (3)〇 (4)△

問題選択は解けそうな問1,2,3を選択しました。
統計数理は問1に30分かけてしまいましたが、他は特に困ることもなく解答できました。
終了時点ではかなり自信があり、成績優秀賞も狙えるくらいかな…?と思いましたが、後日発表された略解を確認すると問2の(1),(4)でしょうもないミスをしており以上のような結果となりました。

統計応用

[問1] (1)〇 (2)× (3)× (4)× (5)× [問2] (1)〇 (2)〇 (3)〇 (4)〇 (5)〇
[問5] (1)〇 (2)〇 (3)× (4)×(or△?)

午後の統計応用は、入念に対策をした分割表、ノンパラメトリック、生存時間解析のうちどの分野も出題が無く、その時点でかなり焦りました。
出来る問題から冷静にやってみて、問2→問5→問1の順番で解答しました。
問5は有名なモンティホール問題を扱った問題でしたが、感覚的にしか理解しておらず、いざ記述するとなると手が止まり、かなりの時間をここで消費しました。
話は変わりますが私の好きな映画の1つに『ラスベガスをぶっ潰せ』という映画があります。
作中で主人公のベン・キャンベルが数学教授にまさに問5と同じ問題設定のモンティホール問題を出題され、ベンはこの問題に対して余事象と全確率1の性質を用いて見事正解し教授から才能を買われる、というシーンがあります。
(2)では、この場面でベンが言っていたことを思い出して(今思えばかなり泥臭いやり方ではありますが)、なんとか解答を絞り出すことが出来ました。サンキューベン。  

『ラスベガスをぶっつぶせ』2008年
息抜きにいかが?

そうこうして解き進めますが、最後に解いた問1に移る頃には残り20分程度しか残っておらず、問1の(1)だけ答えた段階で、(2)以降を解き続けるか、これまで解いた問題の確認をするか、それとも問2ではなく問3を選択し直すか迷ってるうちに時間切れになってしまい、結局のところ問2は(2)以降白紙で提出することになりました。正直落ちたと思って試験終了後の帰り道にラーメンと油そばを連続で食べてみたりしましたが、結果としては合格していました。
問2が完答できていたのがかなりデカく、他のミスをギリギリ補えた、といった感じでしょうか。

所感

試験を振り返ってまず思うことは、統計数理の基礎的な知識と計算力が前提になるということです。
簡単な問題を早く正確に解答し、残りの時間で難しい問題を考える、というのが数理と応用で共通して言える試験だと思います。より多く手を動かしましょう。特に私のように数学をやっていない人の場合、感覚を身に着けるには量が大事です。今回の対策ではかなりの演習量を積んだので計算力に自信がつきました。
医薬生物学について言えば、過去問と同じ問題はもちろん出ませんし、対策していても知らないような問題が当たり前のように出てきます。まあそういうもんと割り切って、それでも面食らわず諦めないで1点でも多く得点するように頑張りましょう。

感想・今後の方針

合格自体も嬉しいことですが、それ以上に、これまでなんとなくで理解して通りすぎていた、技術書や技術的な論文の統計数理を用いた説明部分をしっかり理解できるようになったことがガチで嬉しいです。
資格は持ってるだけではアピール以外の何の意味もないです。統計検定1級の名に恥じぬよう、今回を始点に自分の実装や成果物に役立てていきたいと考えています。

これから統計検定1級に挑戦される全ての方の健闘を祈ります。

おまけ

合格発表の時は訳あって横浜でおいしいピザを食べてました。  

𝑾𝒊𝒏𝒏𝒊𝒏𝒈・𝑷𝒊𝒛𝒛𝒂
この後埠頭で缶ビールを飲むとかいう最強ムーブをしました。
むしろ寒ければ寒いほどいい

10月中に行ったTDL

本番はシンデレラ城が離散分布の確率密度関数に見えてから。

ポケセンで買ったウパー。

ウパー。特記事項なし。