こんにちは!データ分析担当の堅田です。
4/17に技術評論社から「Pythonエンジニア養成読本」という本が発売されました。その中で、PyData.Tokyoのオーガナイザーの1人であるALBERT池内さんが「PyData入門」を書いており、「これからPythonでデータ分析をしよう!」と考えている人に最良の指南書となっています。そこで、読みどころを紹介したいと思います!
Pythonでデータ分析?
Pythonはソフトウェアやウェブアプリ開発などでよく使われているプログラミング言語ですが、実はデータ分析の分野でも人気があります。Pythonでデータ分析をするメリットはなんでしょう。それは、なんといってもソフトウェア開発やウェブアプリ開発とデータ分析がシームレスをつなげることができるということです。データサイエンティストが作った予測モデルを、サーバーに組み込みといったことができるわけです。
データ分析には「インタラクティブさ」が重要
データ分析におけるプログラミング言語として大事なことは、打ったらすぐ答えが返ってくる「インタラクティブさ」です。というのも、データ分析の一連の流れは、「データを読み込んで、いろいろなグラフを作りながらデータを理解し、集計や予測モデルをつくる・・・」といったステップを「あーでもない、こーでもない」と試行錯誤しながら行うことになります。試行錯誤を素早く繰り返すためには、打ったら響く「インタラクティブさ」が必要不可欠なのです。
Pythonで実現する「インタラクティブさ」
Pythonにはオリジナルのインタラクティブシェルが用意されていますが、データ分析でガンガン使うには機能が乏しいところがあります。「PyData入門」では、強力なインタラクティブモードであるIPythonのインストール方法から補完機能の使い方、さらにはデバッグの方法といったかなり詳細な解説がされています。また、最近人気のIPython notebook(ウェブブラウザ上で動くインタラクティブシェルで、データの中身を確認できたり、グラフを書いたりできるパッケージ)のインストールからグラフ描画まで懇切丁寧に書かれています。これにより、データ分析に必要な環境が簡単に構築できます。
「実践編」でデータと戯れる方法がわかる
「PyData入門」の最大の読みどころである「実践編」では、オープンデータの取得から可視化までの一連のステップについてコード付きの解説があります。私見ですが、コード付きで実際のデータの扱い方について書かれた本は少ないように思います。「実践編」を読むことで、構築した分析環境で、実際にデータと戯れることができるようになります。PyDataに初めて触れる人にとってPyDataの価値が伝わると思いますし、「各機能をどう使うの?」という疑問もクリアになると思います。
実践編の次は、PyData.Tokyoへ
PyData.Tokyoという<Python+Data>という領域でのコミュニティがあり、私も参加させていただいています。ディープラーニングや機械学習など上級者向けの勉強会もあれば、「PyData入門」のような分析チュートリアルといった初級者向けのセッションもあります。「PyData入門」を読んで<Python + Data>という領域に興味を持たれた方は、ぜひご参加ください。一緒にPyDataを盛り上げていきましょう!