2014-09-30

Word2Vecを使ったトピックトレンドの抽出

読了時間4分

NikkeiBPさんと強力でテキストマイニングのビジュアライゼーション作成のための分析を行いましたので、ご紹介します。ごく基本的な手法にWord2Vecという最新の手法を加えることで、一段興味深い分析結果を出すことが出来ました。

2014-01-14

私達が「フォローメディア」を必要としている理由

読了時間15分

新サービスカメリオのリリースが来週に迫りました。なぜ私達がこのサービスを開発しているのか、どういう価値を生み出そうとしているのか、情報吸収ニーズの分析を元にお話します。

2013-09-17

パイソンで日本語を可視化してみた

読了時間13分

「日本語を可視化する」というテーマで、Python Apacの最終日のハッカソンでミニプロジェクトを行いました。グラフデータベースを使って、単語同士のネットワークを見える化することでどんな発見があるんだろう・・・。今回はNeo4jというグラフデータベースとPy2NeoというパイソンAPIを使って実装を行いました。結果ドキドキとビリビリにあふれた数時間でした。

2013-08-15

自動要約アルゴリズムを公開しました!

読了時間5分

忙しい時に余計なことを聞かされると、イラっとクルものです。アルゴリズムによる自動要約の研究は最近始まったものではなく、最先端分野での挑戦は複数のドキュメントから非常に短い要約を作ることにシフトしています。一方である程度のクオリティーの要約は比較的シンプルなルールをもとに作り出すことが出来ます。

2013-07-19

一目見ただけで通じる表現方法

読了時間10分

数年前、海外で仕事をしていた時にWordleというサービスを知り、タイポグラフィーの新しい面白さに見とれてしまいました。ワードクラウドと一般的に呼ばれている手法で、長文から重要な単語を抜き出し、各単語の大きさがその重要さを表す、という単純な仕組みですが、非常に美しく、インパクトの強い表現をすることができます。日本語版ワードクラウドを作ってみようと試みたところ、そこそこ面白いものができました。

2013-07-15

情報過多の時代のペース

読了時間7分

大量な情報の中から必要な物を収集し、それを理解することで、情報に流されることなく、アクションにつなげることができるようになるにはどのようなイノベーションが必要なのでしょうか。