前回の続き。
スモールデータ解析読書会
ProGit読書会が終わったあと、業務(データ分析)ともっと関係ある本も読んでいきたいということで、『スモールデータ解析と機械学習』を読んでいく読書会を他の方が企画してくださった。
進め方はProGit読書会をある程度踏襲しつつ、ふりかえりで得た知見を反映して次のようになった:
- 司会は持ち回りで担当
- 読む範囲は企画した方が決め前週の水曜までにSlackで伝える(※読書会は毎週月曜)
- 途中のふりかえり以降、読む範囲を決めるのも司会がやることになった
- あらかじめ読んでおき、「分かったこと」「質問したいこと」「その他」をメモする
- 「質問したいこと」は記名で書く
- 途中のふりかえり以降、「その他」も記名で書くことになった
- ある程度読み進めたら一度ふりかえりをやる
- メモで式番号だけ書いてあるのだと本を見返す必要があって大変だったので、式もメモに残すようにした
この本はProGitとは違って数式が出てくるので、メモに数式をどう書くかというのも少し課題としてあった感じ。 スクショ撮って貼ったり、数式エディタや外部ツールで書いたり。 ただまぁやっぱり大変で、こういうのはやっぱり板書が最強よね。
実績としては、この読書会を始めたのが2023年の4月初めとかで、ふりかえり抜きで24回かかり、2回のふりかえりを入れて2023年の11月末に読み終わった感じ。 実に8ヶ月。 いやー、長かった。 毎週30分しかなかったので、細かいところまで議論しているとなかなか思うように進まない。
でも、数式の書いてある本を1冊最後までじっくり読むというのは、数学科とかでないとなかなかやらない経験だと思うので、いい経験を積んでもらえたんじゃないかなと思う。
ふりかえりで出てきた感想などは以下:
- 司会を持ち回りにしたのでみんなで進めている感じがあった
- 質問を記名にしたので意図を確認したり答えたりがしやすかった
- みんなで読むことで違う視点での解釈や経験を聞くことができて理解がより深まった
- 数式をどう読んでいったらいいのか雰囲気を知れた
- 実務のデータで試したりもしてみたかった
- 紹介されてる手法が実際にいいのか、試してみないと分からない
- やろうとすると準備も大変だし、進め方に工夫が必要そう
- 筆者の経験談とか異常検知の話が面白かった
- 30分は短かった
- 時間を気にして質問を躊躇することもあった
- 読み終わるまでに時間がとてもかかった
- 誤植がとても多かった
- しかも正誤表がない(※公式ページの正誤表の内容が空)
- 正誤表がちゃんとある本を選んだ方がよかったかも
- 本に直接コメントできるような仕組みがほしい
- 数式とかメモするのが大変
- 議論している場所が本のどこか共有するのが意外と大変だった
- 著作権とかで難しい?(本を買わずに見れてしまうので)
- 他の進め方を試してもいいかもしれない
- まとめ担当を持ち回りにしてみる(数学のセミナーみたいな)
- まとめから質問や補足などが離れていると分かりにくいので、分けずに「質問:xxx」「補足:xxx」のように、まとめの中に書いてもよさそう
- 同じ本を2周するのもよさそう
- 1周目はざっと読んで試したいことや疑問を洗い出す
- 2周目で手を動かしながらそれらを確認していく
- オープンなデータを持ってきてコンペする勉強会とかも面白そう
個人的にはGoogleドキュメントを書くときに「Articul8」というChrome拡張がけっこう使えると分かったのが大きかった。
数式をの記法で書けて、さらに画像化された数式を再び書き直すこともできたのがとてもよかった。 画像化するツールはいろいろあるんだけど、式を直したり、使いまわしたりしようとすると、逆変換の機能が必須なんよね。 しかも無料だし。
ちなみに、この本では線形的な手法を中心に、基本的なデータ分析の手法を数式を交えながら広く学べたので、そのあたりは悪くなかった。 この本で異常検知に興味が出て『異常検知と変化検知』を読むきっかけにもなったし。
ただ、工学系の本ということもあってか、数式の扱いがとにかく雑。 議論の内容もかなり怪しい部分があって、「それホント?」ってなることが少なくなかった。 「試してみないと分からなそう」という感想が出たのはそのあたりが原因。
また、1冊を一人の著者で書いているはずなのに、参考文献をコピペしてきてるのか、1冊の中での数式の書き方に統一感がなかったりと、本当に雑。 学生のコピペレポートじゃないんだから、もうちょっとちゃんと著者の頭の中を内容を咀嚼して、自身が理解したものを統一感持って書いてほしかったなぁ・・・
さらには、数式に誤植があったり、サンプルコードにも誤植があったり、そして正誤表は更新されてないとで、編集さん仕事してる?みたいなデキなのがかなり残念。 記法が統一されてないのもあって、誤植なのか記法の揺れのせいなのかを考えないといけない場面もあったり、地味に読むのに手間取った。
そんな感じなので、スモールデータでどうデータ分析を進めるべきかみたいなところは参考になると思いつつ、純粋にデータ分析を学ぶ本としては最低限のレベルに到達してない感じはあった。 なので、編集さんの力不足をすごく感じるんだけど、こういった数学的な内容をちゃんとレビューして本としての仕上がりをよくできる人材なんてそうそういないだろうし、やっぱり専門書の編集や校正って難しいよねぇ。
長くなったのでデザパタ読書会についてはまた次で。
今日はここまで!