ランダムフォレストを使った初期分析例
読了時間15分
白ヤギコーポレーションのデータ分析担当 堅田です。 今回は、時間がない中でデータをさくっと分析したいという人向けに、RのrandomForestパッケージを使った分析方法を紹介したいと思います。 データの前処理 まずデータの前処理では、難なくRのrandomForestに突っ込むための加工を施します。主なステップは以下の4つです。 1. データのサンプリング […]
読了時間15分
白ヤギコーポレーションのデータ分析担当 堅田です。 今回は、時間がない中でデータをさくっと分析したいという人向けに、RのrandomForestパッケージを使った分析方法を紹介したいと思います。 データの前処理 まずデータの前処理では、難なくRのrandomForestに突っ込むための加工を施します。主なステップは以下の4つです。 1. データのサンプリング […]
読了時間5分
こんにちは。白ヤギのデータ分析担当の堅田です。 少し前になりますが、8月23日から1週間、京都大学で行われた機械学習サマースクール(Machine Learning Summer School, 通称MLSS)に行ってきました! (写真はFacebook Machine Learning Summer School’15 – Kyot […]
読了時間3分
4/17に技術評論社から「Pythonエンジニア養成読本」という本が発売されました。その中で、PyData.Tokyoのオーガナイザーの1人であるALBERT池内さんが「PyData入門」を書いており、「これからPythonでデータ分析をしよう!」と考えている人に最良の指南書となっています。そこで、読みどころを紹介したいと思います!