2014-12-16

トピックモデルに基づく多様性の定量化

読了時間15分

Nikkei BPさんとの連動分析。記事数に基づく話題性の高さと、多様性の観点から今年話題に登ったテクノロジーを、検証しました。今回の分析では既に業界IDでタグ付けされている過去記事を用い、ナイーブベイズという手法で単語レベルでのトピックモデルを機械学習した。

2014-12-08

ディープラーニングを使ったイメージの切り抜き

読了時間15分

ディープラーニングの物体認識技術(Caffe)と、セグメンテーションを使った画像切り出し技術(Selective Search)を使ってニュースアプリ「カメリオ」の見出しに使われるサムネイル生成の精度向上への応用を検討しました。

2014-11-20

第17回情報論的学習理論ワークショップ (IBIS2014) に参加しました

読了時間8分

金子です。11月17日から19日まで名古屋大学で開催された IBIS2014 のワークショップに行ってきました。 各発表の内容については神嶌先生のまとめページなどを読んでいただくとして、以下では個人的に特に面白かった発表について簡単に感想を書きたいと思います。 多腕バンディット問題の理論とアルゴリズム 最近は広告や検索結果の最適化などにも使われているバンディ […]

2014-11-20

小さなサーバーで大きなサービスをつくる

読了時間10分

カメリオを支えるシステムの裏側をお話しています。ミドルウェアの組み合わせ方やサーバーレベルでのプログラムを書くときの注意点などを紹介します。特に今回は二段構成になっている白ヤギのバックエンドにおける「バックエンドにあるフロントエンド」について。

2014-11-12

日経ビッグデータに新しい記事が掲載されました

読了時間1分

シバタです。今回で連載は最終回ですが、Word2Vecという新しい自然言語処理技術に関する記事を日経ビッグデータに寄稿いたしました。

2014-10-20

PyData Tokyo始まりました

読了時間2分

このたび「Python+Dataを通じて、世界のPyDataエクスパートと繋がれるコミュニティーを作る」を目標にして、PyData Tokyoコミュニティーを立ち上げました。

2014-10-09

インターンシップでの小プロジェクト

読了時間4分

インターンとして白ヤギでお世話になっていた安川です.この小プロジェクトは勉強会,ハッカソン,音楽のコンサート,花火など
のあらゆるイベントの情報を取得することを目的として作成しました.これによって最終的にカメリオ無いでのイベント情報からのメタデータ抽出に役立てて頂く狙いがありました

2014-09-30

Word2Vecを使ったトピックトレンドの抽出

読了時間4分

NikkeiBPさんと強力でテキストマイニングのビジュアライゼーション作成のための分析を行いましたので、ご紹介します。ごく基本的な手法にWord2Vecという最新の手法を加えることで、一段興味深い分析結果を出すことが出来ました。

2014-01-14

私達が「フォローメディア」を必要としている理由

読了時間15分

新サービスカメリオのリリースが来週に迫りました。なぜ私達がこのサービスを開発しているのか、どういう価値を生み出そうとしているのか、情報吸収ニーズの分析を元にお話します。

2013-09-17

パイソンで日本語を可視化してみた

読了時間13分

「日本語を可視化する」というテーマで、Python Apacの最終日のハッカソンでミニプロジェクトを行いました。グラフデータベースを使って、単語同士のネットワークを見える化することでどんな発見があるんだろう・・・。今回はNeo4jというグラフデータベースとPy2NeoというパイソンAPIを使って実装を行いました。結果ドキドキとビリビリにあふれた数時間でした。