ランダムフォレストを使った初期分析例
読了時間15分
白ヤギコーポレーションのデータ分析担当 堅田です。 今回は、時間がない中でデータをさくっと分析したいという人向けに、RのrandomForestパッケージを使った分析方法を紹介したいと思います。 データの前処理 まずデータの前処理では、難なくRのrandomForestに突っ込むための加工を施します。主なステップは以下の4つです。 1. データのサンプリング […]
分析
読了時間15分
白ヤギコーポレーションのデータ分析担当 堅田です。 今回は、時間がない中でデータをさくっと分析したいという人向けに、RのrandomForestパッケージを使った分析方法を紹介したいと思います。 データの前処理 まずデータの前処理では、難なくRのrandomForestに突っ込むための加工を施します。主なステップは以下の4つです。 1. データのサンプリング […]
読了時間5分
こんにちは。白ヤギのデータ分析担当の堅田です。 少し前になりますが、8月23日から1週間、京都大学で行われた機械学習サマースクール(Machine Learning Summer School, 通称MLSS)に行ってきました! (写真はFacebook Machine Learning Summer School’15 – Kyot […]
読了時間15分
Nikkei BPさんとの連動分析。記事数に基づく話題性の高さと、多様性の観点から今年話題に登ったテクノロジーを、検証しました。今回の分析では既に業界IDでタグ付けされている過去記事を用い、ナイーブベイズという手法で単語レベルでのトピックモデルを機械学習した。
読了時間4分
NikkeiBPさんと強力でテキストマイニングのビジュアライゼーション作成のための分析を行いましたので、ご紹介します。ごく基本的な手法にWord2Vecという最新の手法を加えることで、一段興味深い分析結果を出すことが出来ました。