データサイエンスのおすすめオンライン記事(9月21日付)

連休真っ只中である。行楽地には客が戻りつつあるが、コロナ禍前の状況に戻るにはまだまだ時間がかかりそうである。
日本では新たに発足した菅政権がDXの推進を前面に打ち出していることもあり、デジタル化の重要な役割を担うデータサイエンティストにも活躍の場が増えていくであろう。
今回は、現場で問題を解決する際に「索引」としてすぐに役立ちそうな記事が集まった。是非活用していただきたい。

問題別にどの機械学習アルゴリズムを用いるべきか
「商品購入の決め手となっている属性を理解したい」といった現場の具体的な問題から出発して、用いるべき機械学習アルゴリズムを探し出すことができる。

SQLite対Pandas: 処理速度ベンチマーキング
どういう処理をする場合にSQLとPythonのどちらのほうがどれだけ速いかをまとめたもの。

初心者のためのPythonダッシュボード
データを可視化して直観的に分析できるダッシュボードをPythonで開発する。

最初のデータサイエンスプロジェクトを始める際に知っておくべき10の事項
「仮説の生成は貴方が考えているよりはるかに重要」といった、戦略面の要点がまとめられている。

データサイエンス虎の巻
昨年の記事だが、リンクから入手できるPDF版の”Data Science Cheet Sheet”はデータサイエンスの全貌を把握するのに有用と思われる。

機械学習アルゴリズムの最新技術ポータル
機械学習の分野毎にレポートとコードへのリンクが整備されている。