あるテーマに関する世間の反応をTwitterからテキストマイニングする
1.テーマ設定
(1)組織・ブランド全般への評判、期待、イメージ、感想、不満etc.
(2)個別のサービス・商品・テレビ番組への...
2.対象データ
(1)新聞記事
(2)検索キーワード
大学職員のサジェストキーワード分析から見る転職系ワードの多さ - 大学アドミニストレーターを目指す大学職員のブログ
(3)Twitterからエクセルでざっくり取得
【無料でソーシャルメディア分析】Twitterからユーザーの興味関心を調査 | Core Marketing Blog
Twitter APIを使ってツイートを取得(Python)
でキーワードと、ツイートの数を設定。
トークンの取得は以下を参照。
【2018年】TwitterのAPIに登録し、アクセスキー・トークンを取得する具体的な方法|さぎのみや家の分析録
キーワードを日本語にすると上手くいかなかったので、以下を参考にコード修正。
PEP 263 -- Defining Python Source Code Encodings | Python.org
「import
codecs」
キーワード設定以外に、ハッシュタグを指定、アカウントを指定など、より詳細な設定は以下を参照か
3.テキストマイニングツール
(1)Webサービスを利用
※キーワードクラウド、共起ネットワークなど
(2)専用ソフトをインストール
※共起ネットワークなど 。キーワードクラウドも工夫すれば可。
4.メモ
・意味ある結果を見出せるか、何らかの施策につなげられるか、統計的処理の限界?あくまできっかけでしかないのか ?対象データの問題?複数データや手法を試してみる?、仮説なしの探索、仮説ありきで検証、、、
・Twitterの偏り、ゴミツイートが多い、辞書登録が面倒、ボットの影響を除去、対象期間、ツイート数はどの程度が適切か。
・テレビ番組放送日時との前後関係、視聴行動との関係を明確に区別するのは難しそう。感想なのか、期待なのか、他者の感想への感想なのか
・Twitter APIの仕様変更への対応、ユーザインタフェースを汎用化できないか