メディアライフの日記

メディアを活用したライフスタイルの研究・提案に向けて

あるテーマに関する世間の反応をTwitterからテキストマイニングする

1.テーマ設定

(1)組織・ブランド全般への評判、期待、イメージ、感想、不満etc.

(2)個別のサービス・商品・テレビ番組への...

 

2.対象データ

(1)新聞記事

2017年09月: テキストマイニングで日経新聞を斜め読み

 

(2)検索キーワード

大学職員のサジェストキーワード分析から見る転職系ワードの多さ - 大学アドミニストレーターを目指す大学職員のブログ

 

(3)Twitterからエクセルでざっくり取得

【無料でソーシャルメディア分析】Twitterからユーザーの興味関心を調査 | Core Marketing Blog

 

(4)Twitter APIからPythonコードで取得

Twitter APIを使ってツイートを取得(Python) 

でキーワードと、ツイートの数を設定。

 

トークンの取得は以下を参照。 

【2018年】TwitterのAPIに登録し、アクセスキー・トークンを取得する具体的な方法|さぎのみや家の分析録

 

キーワードを日本語にすると上手くいかなかったので、以下を参考にコード修正。 

PEP 263 -- Defining Python Source Code Encodings | Python.org

いるかのボックス: KH Coderでツイートを分類する

「import codecs」

 

キーワード設定以外に、ハッシュタグを指定、アカウントを指定など、より詳細な設定は以下を参照か

TwitterのAPIについて

 

3.テキストマイニングツール

(1)Webサービスを利用

テキストマイニング 無料ツール by ユーザーローカル 

キーワードクラウド、共起ネットワークなど

 

(2)専用ソフトをインストール 

http://khcoder.net

※共起ネットワークなど 。キーワードクラウドも工夫すれば可。

 

4.メモ

・意味ある結果を見出せるか、何らかの施策につなげられるか、統計的処理の限界?あくまできっかけでしかないのか ?対象データの問題?複数データや手法を試してみる?、仮説なしの探索、仮説ありきで検証、、、

Twitterの偏り、ゴミツイートが多い、辞書登録が面倒、ボットの影響を除去、対象期間、ツイート数はどの程度が適切か。

・テレビ番組放送日時との前後関係、視聴行動との関係を明確に区別するのは難しそう。感想なのか、期待なのか、他者の感想への感想なのか

Twitter APIの仕様変更への対応、ユーザインタフェースを汎用化できないか