データサイエンスのおすすめオンライン記事(2月17日付)

コロナの波は明確にピークを過ぎてきており、日本でワクチン接種も始まった。今後は何が元に戻り、何がニューノーマルのままになるのかを見極めていくことが重要になるだろう。
今回のパンデミックは全世界でDXの推進要因になったわけだが、今回紹介する記事のいくつかにもそれが如実に現れている。海外の動向を常に注視していく一助にしていただきたい。

2021年のデータサイエンスの7大予想
「パンデミックは企業に投資を増やすよう促し続ける」「パンデミックはモデル監視ソリューションの開発を加速する」「アルゴリズムと予測モデルの使用における透明性を確保するためのプレッシャーが高まる」など2021年のデータサイエンスに関わるトレンドの解説。

勾配ブースティング機械学習のチュートリアル
勾配ブースティングアルゴリズムは、いくつかの「弱い」モデルを組み合わせて精度向上を図るものである。本記事では数式や数値例を交えた丁寧な解説をしている。

データエンジニアとデータサイエンティストの主な相違
データエンジニアとデータサイエンティストの役割・使用するツール・給料などの違いをまとめたエッセイ。

リモート(ソフトウェア)開発チームの7つのベストプラクティス
コロナで重要性が増してくるリモート開発の良好事例。「継続的なアジャイル計画を使用して、ロードマップとバックログを維持する」「ホワイトボードツールを使用して、ソリューションのブレインストーミングと文書化を行う」など。

クラウドセキュリティの基盤:貴社の戦略を構築する3 つのステップ
Google、Azure、AWSなどの一般的なクラウドでデータを保護するための基本ステップの解説。

データサイエンスのおすすめオンライン記事(2月2日付)

コロナ新規感染者は減少傾向にあるが、緊急事態宣言は主要地域で延長される見通しである。今日の昼はアメリカンのバーガーレストランで昼食を取ったが、そこの店も昼飲み客を取り込んで何とかやっていこうという雰囲気だった。立春とともに気分も明るくなるような状況の到来を期待したい。
今回紹介する記事はエッセイ的なものと2021年トレンド予測記事の積み残しからなっている。是非Google翻訳で読んでいただきたい。

人工知能はいかにマーケティングの将来を変えるか
豪州の女性マーケターによるエッセイ。強力な予測能力によるマーケター支援, ハイパーパーソナライズされた戦略, ARとVRの活用, チャットボットによるカスタマーサービス, Eメールマーケティングの革新など。

スケーラビリティとコストを最適化する3つのクラウドアーキテクチャパターン
あなたの会社もクラウドサービスに無駄な費用を払っていないか?企業でクラウドシステムを効率的に利用するために留意すべき点に関するエッセイ。

2021年のAIと機械学習の先駆的研究トレンド
自然言語処理、会話型AI、コンピュータービジョン、強化学習などの最新動向についての解説。

Neuralの2021年のAI予測
昨年末の記事。2021年のAI開発に関する4名の専門家による見通し。

データサイエンスのおすすめオンライン記事(1月18日付)

年が明けて寒くなってきたのに伴いコロナが勢いを増してきて、再び緊急事態宣言となってしまった。ランチで飲食店に入ると帰るまで他の客がゼロということもあり、一体どれだけの店が生き残れるのかと陰鬱な気分になる。
さて、本年も米国データサイエンスのインフルエンサーをフォローして重要な記事を紹介していきたい。今回は昨年末に紹介した記事と同様に、2021年のデータサイエンスのトレンドに関する記事も含まれている。

処方的アナリティクスはどのようにすべての業界の顔を変えているか?
データアナリティクスのソリューションは、Descriptive analytics(記述的アナリティクス)、Diagnostic analytics(診断的アナリティクス)、Predictive analytics(予測的アナリティクス)、Prescriptive analytics(処方的アナリティクス)と進化してきている。ここでは主要な産業毎にデータアナリティクスがどのような影響を及ぼしてきたかを解説している。

ソフトウェア開発動向2021
「エクスペリエンス経済のためのアウトソーシング」「Progressiveウェブアプリ」「クロスプラットフォーム開発」など、2021年のソフトウェア開発のトレンドの展望を各キーワード別に解説している。

Pythonを使用した最も一般的なテキストから画像への合成方法の要約
昨年8月の記事。コンピュータ支援デザインやビジョンと言語の関連づけに用いられる「テキストからの画像合成」の解説。

2021年にフォローすべき機械学習関連のブログ
機械学習の最先端をフォローするのに適したブログの紹介(medium.comは無料購読回数制限があるので注意)

データサイエンスのおすすめオンライン記事(12月30日付)

いよいよ2020年も残りわずか1日というところまで来た。当方も例年ならこの一年を振り返るテレビ番組を見るのだが、今年は内容がわかりきっていて見る気も起こらない。
一方でデータサイエンスのオンライン記事では例年の如く今年の総括と来年の展望に関する記事がいくつか出ている。例によってGoogle翻訳で読んでいただきたい。この分野のトレンドを把握するためにもチェックしておいた方がいいであろう。コロナで加速したDXの波に取り残されないようにしたいものである。

2021年の職場における5つのAIとMLのトレンド
PlanfulのCTOであるSanjay Vyas氏が語る人工知能と機械学習のトレンド。

AI、分析、機械学習、データサイエンス、ディープラーニング研究における2020年の主な進展と2021年の主な傾向
この方面9名の専門家による2020年の総括と2021年の展望。

AI、データサイエンス、機械学習技術における2020年の主な進展と2021年の主要なトレンド
上の記事と同様にKirk Borne氏など12名の専門家による2020年の総括と2021年の展望。

Pythonコーディングにおいて「いかに」「なぜ」明示的であるべきか
Pythonコーディングのベストプラクティスについての一連の記事(他記事リンクあり)。

2021年のビッグデータ業界の予測
これも来年の業界トレンド予測の記事。

データサイエンスのおすすめオンライン記事(12月24日付)

年の瀬で、繁華街は昼間は例年通り多くの人が行き交っている。しかし夜になると例年の人混みが見られない。自分も今月仕事関連のオンラインイベントが2度あったがリアル忘年会はゼロである。ニューノーマルへ誰もが模索しているといったところだろう。

今回の記事紹介ではデータサイエンスの学習教材と学習コースに関するものが目に付く。年末年始の空き時間に取り組むのにいいかもしれない。

AIは退屈になってくる?そして将来のAIについての考察
AIや機械学習の経済やビジネスへの影響を、1990年代のコンピュータリゼーションのケースと比較して考察している。

機械学習とその応用を一つの図で表す
機械学習の全体像を把握するのにとてもわかりやすい記事。

データサイエンティストが知っておくべき5つのグラフアルゴリズム
2019年の記事だが本ブログでは紹介していなかった。今後は表形式データでない構造のデータが重要になる。

貴方の2021年のデータサイエンス・ポートフォリオを築くための50以上のリソース
データサイエンス・スキルを身につけるためのオンラインセミナー、書籍、コミュニティなどのまとめ。

データサイエンティストになるための学習パス
データサイエンティストになるために学ぶべき内容の道筋。Version Controlといったことも含まれている。

データサイエンスのおすすめオンライン記事(12月6日付)

コロナで3分の2の企業が業績を落としているにも関わらず、株価は上昇を続けている。日銀やGPIFが作り出した「官製相場」に金融緩和で生じたあぶく銭が集まっている結果と言われているが、バブルが弾ける瞬間が迫っているようで不気味である。
ところで、また更新が一ヶ月ぶりになってしまったが、この間に目についた記事を紹介する。Google翻訳を活用して読んでいただきたい。

ディープラーニングのための数学のロードマップ
機械学習の基礎となっている数学を初歩から解説している。

全てのデータサイエンティスト及びビッグデータエンジニアが知っておくべきアーキテクチャ
IT主要企業などが構築しているフィーチャーストアのアーキテクチャの紹介。

全てのデータサイエンティストのためのディープラーニング用データセット
昨年6月の記事だがこの手の記事は重宝するので今回掲載した。

エッジコンピューティングは2021年に新たなクラウドになるか?
IoTの普及にともない末端で処理を行うエッジコンピューティングの市場はますます巨大なものとなる。

レジリエンスと活気:2020年のデータとAIの展望
コロナ渦でもデータエコシステム企業群はかつてない繁栄を示している。

データサイエンスのおすすめオンライン記事(11月3日付)

晩秋になり、欧州などでは新型コロナの感染者が再び増加傾向になっている。紅白や箱根駅伝など年末年始の恒例行事が無観客開催となる一方で、クルーズ船の再開といった明るい話題もある。当方は今年は例年行っていた海外はおろか国内旅行もゼロで1年を終えそうである。その代わり先週大画面テレビを買ったので家で旅行番組をみて旅行気分を味わおうと思う。
前回投稿からかなり空いてしまったが、この間に気になったオンライン記事を紹介する。

10個のプロジェクトで貴方のPyhtonスキルをテストする
Pythonプログラミングのスキルアップに役立つ楽しくて挑戦的なプロジェクトのリスト。

スタートアップ企業による4つのデータサイエンスの革新技術
スタートアップ企業により開発された、データサイエンスとアナリティクスのツールの紹介。

いかに人工知能は小規模ビジネスを変革するか
小規模事業者が勝ち残るために活用すべき人工知能の応用について述べている。

Pythonによる統計的機械学習(Jupyter Notebook版)
Pythonによる機械学習のチュートリアルがJupyter Notebookの形式でまとめられている。

機械学習を始めるのに必要な5つの基本スキル
基本スキルとして、(1)プログラミング知識, (2)応用数学, (3)モデル構築と評価, (4)機械学習アルゴリズム, (5)ニューラルネットワークのアーキテクチャを挙げている。

データサイエンスとアナリティクスの「決定的な」ガイド集
Kirk Borne氏がまとめた32項目の英文ガイドのリンク集。

データサイエンスのおすすめオンライン記事(9月21日付)

連休真っ只中である。行楽地には客が戻りつつあるが、コロナ禍前の状況に戻るにはまだまだ時間がかかりそうである。
日本では新たに発足した菅政権がDXの推進を前面に打ち出していることもあり、デジタル化の重要な役割を担うデータサイエンティストにも活躍の場が増えていくであろう。
今回は、現場で問題を解決する際に「索引」としてすぐに役立ちそうな記事が集まった。是非活用していただきたい。

問題別にどの機械学習アルゴリズムを用いるべきか
「商品購入の決め手となっている属性を理解したい」といった現場の具体的な問題から出発して、用いるべき機械学習アルゴリズムを探し出すことができる。

SQLite対Pandas: 処理速度ベンチマーキング
どういう処理をする場合にSQLとPythonのどちらのほうがどれだけ速いかをまとめたもの。

初心者のためのPythonダッシュボード
データを可視化して直観的に分析できるダッシュボードをPythonで開発する。

最初のデータサイエンスプロジェクトを始める際に知っておくべき10の事項
「仮説の生成は貴方が考えているよりはるかに重要」といった、戦略面の要点がまとめられている。

データサイエンス虎の巻
昨年の記事だが、リンクから入手できるPDF版の”Data Science Cheet Sheet”はデータサイエンスの全貌を把握するのに有用と思われる。

機械学習アルゴリズムの最新技術ポータル
機械学習の分野毎にレポートとコードへのリンクが整備されている。

データサイエンスのおすすめオンライン記事(8月20日付)

猛烈な暑さが続いている。普段の夏ならまとまった休みをとって旅行やバカンスに行くはずが、今年はコロナの影響で自宅・職場や近場の涼しいところにひたすら籠っている方も多いであろう。また、この際に新しいことにチャレンジするために勉強するという人もかなりいると思われる。今回紹介するオンライン記事にはそのような勉強の教材になりうるものもいくつかある。是非取り組んでみていただきたい。

あなたが知っておくべきPyTorchの最も重要な基礎知識
ディープラーニング(DL)に必要な「テンソル」についての基礎的解説と、PythonのDLライブラリPyTorchでのテンソルの扱い方のチュートリアル。

Data Science Centralのオンデマンド・ウェビナー集
Data Science Centralサイトから利用できる英語のオンデマンド型オンラインセミナーの一覧。

一変量分布の関係図
一変量の確率分布をどのように変数変換したらどのような分布になるかを示した関係図。

kaggleチュートリアル「SQL入門」
GoogleのBigQueryを利用した、PythonユーザのためのSQLチュートリアル。

データサイエンス・プロセス
原データが与えられてから、有益な洞察を導き出すまでの「データサイエンス・プロセス」を図式化したもの。実務で何をすべきかのヒントになる。

学習前のデータ準備のためのPythonライブラリDataPrep入門
DataPrepは機械学習を行う前に探索的データ解析等を簡単に行えるPythonライブラリである。これと以下に紹介するDtaleはデータ解析をするPythonユーザは一度使ってみる価値がある。

Pandasデータ構造を視覚化するDtale入門
DtaleはPythonのPandasデータフレームの構造を視覚化して把握しやすくするためのライブラリである。

データサイエンスのおすすめオンライン記事(7月20日付)

ようやくコロナから開放されて自由に動き回れるかと思ったら再び感染者数の増加の波が押し寄せており、いったいどうすればいいのかと戸惑っている方も多いであろう。しかし何ヶ月も巣ごもりしている間に当方の近所にも新たなショッピングやエンタメ施設がオープンしており、感染に気をつけつつ再び外へという流れになっているようである。

ビッグデータの上位インフルエンサーとブランド
本年3月の記事。直近1年間のtwitterのオンライン対話の分析から得られたインフルエンサーとブランドの一覧。

統計学の無料英語書籍:All of Statistics
統計学の本は一冊ですべて間に合うということはない。本書は洋書だが無料なのでダウンロードしておく価値はある。

IoT異常検知:アルゴリズム、手法、オープンソース実施例
IoTの異常検知についての情報源が包括的にまとめられている。

Python非同期オーバーホールの3つのステップ
asyncを使用して同時に実行するようにプログラムを変更して既存のPythonプログラムを高速化する方法。尚、本記事と次の記事のサイトは(無料)ユーザ登録しないとアクセス回数に制限がある。

Pythonデータクラスの使用方法
Pythonデータクラスを利用して、Pythonクラスの冗長性を減らし、同時に強力にする。

あなたが(おそらく)知らなかった7つのクールなPythonのトリック
YouTube動画のダウンロードなど、汎用的だがあまり知られていないようなPythonのテクニックを紹介している。