データサイエンスのおすすめオンライン記事(8月20日付)

猛烈な暑さが続いている。普段の夏ならまとまった休みをとって旅行やバカンスに行くはずが、今年はコロナの影響で自宅・職場や近場の涼しいところにひたすら籠っている方も多いであろう。また、この際に新しいことにチャレンジするために勉強するという人もかなりいると思われる。今回紹介するオンライン記事にはそのような勉強の教材になりうるものもいくつかある。是非取り組んでみていただきたい。

あなたが知っておくべきPyTorchの最も重要な基礎知識
ディープラーニング(DL)に必要な「テンソル」についての基礎的解説と、PythonのDLライブラリPyTorchでのテンソルの扱い方のチュートリアル。

Data Science Centralのオンデマンド・ウェビナー集
Data Science Centralサイトから利用できる英語のオンデマンド型オンラインセミナーの一覧。

一変量分布の関係図
一変量の確率分布をどのように変数変換したらどのような分布になるかを示した関係図。

kaggleチュートリアル「SQL入門」
GoogleのBigQueryを利用した、PythonユーザのためのSQLチュートリアル。

データサイエンス・プロセス
原データが与えられてから、有益な洞察を導き出すまでの「データサイエンス・プロセス」を図式化したもの。実務で何をすべきかのヒントになる。

学習前のデータ準備のためのPythonライブラリDataPrep入門
DataPrepは機械学習を行う前に探索的データ解析等を簡単に行えるPythonライブラリである。これと以下に紹介するDtaleはデータ解析をするPythonユーザは一度使ってみる価値がある。

Pandasデータ構造を視覚化するDtale入門
DtaleはPythonのPandasデータフレームの構造を視覚化して把握しやすくするためのライブラリである。