Word2Vecを使ったトピックトレンドの抽出
読了時間4分
NikkeiBPさんと強力でテキストマイニングのビジュアライゼーション作成のための分析を行いましたので、ご紹介します。ごく基本的な手法にWord2Vecという最新の手法を加えることで、一段興味深い分析結果を出すことが出来ました。
読了時間4分
NikkeiBPさんと強力でテキストマイニングのビジュアライゼーション作成のための分析を行いましたので、ご紹介します。ごく基本的な手法にWord2Vecという最新の手法を加えることで、一段興味深い分析結果を出すことが出来ました。
読了時間15分
新サービスカメリオのリリースが来週に迫りました。なぜ私達がこのサービスを開発しているのか、どういう価値を生み出そうとしているのか、情報吸収ニーズの分析を元にお話します。
読了時間13分
「日本語を可視化する」というテーマで、Python Apacの最終日のハッカソンでミニプロジェクトを行いました。グラフデータベースを使って、単語同士のネットワークを見える化することでどんな発見があるんだろう・・・。今回はNeo4jというグラフデータベースとPy2NeoというパイソンAPIを使って実装を行いました。結果ドキドキとビリビリにあふれた数時間でした。
読了時間5分
忙しい時に余計なことを聞かされると、イラっとクルものです。アルゴリズムによる自動要約の研究は最近始まったものではなく、最先端分野での挑戦は複数のドキュメントから非常に短い要約を作ることにシフトしています。一方である程度のクオリティーの要約は比較的シンプルなルールをもとに作り出すことが出来ます。
読了時間10分
数年前、海外で仕事をしていた時にWordleというサービスを知り、タイポグラフィーの新しい面白さに見とれてしまいました。ワードクラウドと一般的に呼ばれている手法で、長文から重要な単語を抜き出し、各単語の大きさがその重要さを表す、という単純な仕組みですが、非常に美しく、インパクトの強い表現をすることができます。日本語版ワードクラウドを作ってみようと試みたところ、そこそこ面白いものができました。
読了時間7分
大量な情報の中から必要な物を収集し、それを理解することで、情報に流されることなく、アクションにつなげることができるようになるにはどのようなイノベーションが必要なのでしょうか。