作業時間:0時間
内容:Pythonのインストールして感情分析ができないかと少し模索していました。(この時期にすることじゃありませんが)
ただPythonいじってみたかっただけっていうのもあります。
あとはOculusRiftの設定等をしてVRに感動していたのがほとんどです。
なので今日は作業してません。
明日も来る予定なので許してください。
作業時間:0時間
内容:Pythonのインストールして感情分析ができないかと少し模索していました。(この時期にすることじゃありませんが)
ただPythonいじってみたかっただけっていうのもあります。
あとはOculusRiftの設定等をしてVRに感動していたのがほとんどです。
なので今日は作業してません。
明日も来る予定なので許してください。
作業時間:4時間半くらい
内容:スケジュールの発表用資料作成、アンケート作成のための頻出語抽出
ネットスラングを集める前に今あるツイートの中にどんなネットスラングが使われているのかを調べるため、今ある8人分のツイートデータと自分のデータ、研究室の仲間一人の合計10人、10000ツイートに対し、形態素解析を行った。
さらにその中から頻度の少ない語と記号等を自分の感覚ではあるが削除し、残った1450単語が感情辞書に登録されているのかを知るために感情値算出を行った。
だが登録されている単語でも正しい値が出てこないという問題が発生したのでまた明日検証する。
作業時間:8時間?
内容:グループゼミ、予定の変更、WordPressの編集、ツイート取得
時間の割にいまいちなにやってたかわかりません。
ツイート取得の際に1000ツイート取得のはずが中身を見てみると998ツイートや750ツイートのように取得漏れがあり何度か試すと1000ツイート取得できたり変わらず取得漏れがあったりしました。原因は謎です。
ということで一旦1ページ多く取得してから手動で1000ツイートにしました(結局2度手間)
今週は移動平均のグラフを作成するのが目標でしたが、ツイート取得に問題が発生してしまったのでまだ時間がかかりそうです。
次週の目標は感情値算出ツールの拡張のためアンケートを作成します。
合間合間にツイート取得も行う予定です。
研究スケジュール
予定通りに行くよう頑張ります…
今回移動平均を出すのにExcel内の「移動平均分析ツール」を使用した。
サイト見てもよくわからず時間がかかってしまったのでここにメモしておく。
まずExcelのファイル>オプションを開く。
その中にアドインというタブがあるのでそこを開くとこの画面となる。
一番下にある管理の中の設定を開くと
この画面となるのでその中の「分析ツール」にチェックを入れてOKを押す。
(私はどっちに移動平均が入っているのか知らずどっちにもチェックを入れている)
すると通常の画面のデータタブの一番右にデータ分析が現れるのでそこを押す。
あとは範囲や区間を指定するだけで移動平均の値が出る。
前後の値を取りたい場合はあとでセルを広げる必要がある。
作業時間:5時間半
内容:ツイート移動平均グラフの作成、WordPressの編集
Excelの移動平均では前10ずつの平均しか計算できなかった
前後10ずつになるようにするため分析ツールを作ったあとに自分で範囲を広げる必要あり
今回は形態素解析の方法としてRMeCabを使用した。
Rは統計解析フリーソフト、MeCabは形態素解析ソフトである。
形態素解析は文章を品詞で分解し頻度を調べるための手法、RMeCabはR内でMeCabを使用するためのオープンソースである。
Rのインストール:https://cran.r-project.org/
MeCabのインストール:http://taku910.github.io/mecab/
RMeCabの手順:http://blog.ecoteki.com/webservice/post-2499/
参考サイト:形態素の頻度分析
RとMeCabをインストールした後、R内で
install.packages("RMeCab",repos = "http://rmecab.jp/R")
を実行することでRMeCabをインスト-ルできる。
RMeCabを使用するときは
library(RMeCab)
を最初に挟む必要がある。
形態素解析
library(RMeCab)//ライブラリ ans<-RMeCabFreq("形態素解析したい文章の場所") ans//出力
解析結果をCSVで書き出したい場合
library(RMeCab)//ライブラリ write.csv(ans,".csv",row.names=TRUE,fileEncoding="CP932",eol="\r\n") ans//出力
ソート
ans[rev(order(ans$Freq)),]//ソート ans//出力
を実行することで解析できる。
書き出したCSVファイル等はドキュメントに保存される。
作業時間:5時間
内容:感情値を移動平均を反映してグラフ化したものの作成と今後の計画の作成
Excelの移動平均分析ツールを使用、それに伴ってツイートを取得しなおした。
他大学との合同で可視化合宿に参加しました。
自分の研究について東大やお茶の水、慶応といった大学の先生方から有益なアドバイスをもらうことができ、さらに他大学の学生の研究についても聞くことができいい刺激になった。
テスト
このページはある大学生が自分の研究内容をまとめるために立ち上げたページです。