9月30日(金)

作業時間:0時間

内容:Pythonのインストールして感情分析ができないかと少し模索していました。(この時期にすることじゃありませんが)

ただPythonいじってみたかっただけっていうのもあります。

あとはOculusRiftの設定等をしてVRに感動していたのがほとんどです。

なので今日は作業してません。

明日も来る予定なので許してください。

9月29日(木)

作業時間:4時間半くらい

内容:スケジュールの発表用資料作成、アンケート作成のための頻出語抽出

ネットスラングを集める前に今あるツイートの中にどんなネットスラングが使われているのかを調べるため、今ある8人分のツイートデータと自分のデータ、研究室の仲間一人の合計10人、10000ツイートに対し、形態素解析を行った。

さらにその中から頻度の少ない語と記号等を自分の感覚ではあるが削除し、残った1450単語が感情辞書に登録されているのかを知るために感情値算出を行った。

だが登録されている単語でも正しい値が出てこないという問題が発生したのでまた明日検証する。

 

9月28日(水)

作業時間:8時間?
内容:グループゼミ、予定の変更、WordPressの編集、ツイート取得
時間の割にいまいちなにやってたかわかりません。
ツイート取得の際に1000ツイート取得のはずが中身を見てみると998ツイートや750ツイートのように取得漏れがあり何度か試すと1000ツイート取得できたり変わらず取得漏れがあったりしました。原因は謎です。
ということで一旦1ページ多く取得してから手動で1000ツイートにしました(結局2度手間)

今週は移動平均のグラフを作成するのが目標でしたが、ツイート取得に問題が発生してしまったのでまだ時間がかかりそうです。

次週の目標は感情値算出ツールの拡張のためアンケートを作成します。
合間合間にツイート取得も行う予定です。

移動平均分析

今回移動平均を出すのにExcel内の「移動平均分析ツール」を使用した。

サイト見てもよくわからず時間がかかってしまったのでここにメモしておく。

まずExcelのファイル>オプションを開く。

2016y09m28d_105624232

その中にアドインというタブがあるのでそこを開くとこの画面となる。

一番下にある管理の中の設定を開くと

2016y09m28d_105653494

この画面となるのでその中の「分析ツール」にチェックを入れてOKを押す。

(私はどっちに移動平均が入っているのか知らずどっちにもチェックを入れている)

2016y09m28d_105727263

すると通常の画面のデータタブの一番右にデータ分析が現れるのでそこを押す。

あとは範囲や区間を指定するだけで移動平均の値が出る。

前後の値を取りたい場合はあとでセルを広げる必要がある。

形態素解析

今回は形態素解析の方法としてRMeCabを使用した。

Rは統計解析フリーソフト、MeCabは形態素解析ソフトである。

形態素解析は文章を品詞で分解し頻度を調べるための手法、RMeCabはR内でMeCabを使用するためのオープンソースである。

Rのインストール:https://cran.r-project.org/

MeCabのインストール:http://taku910.github.io/mecab/

RMeCabの手順:http://blog.ecoteki.com/webservice/post-2499/

参考サイト:形態素の頻度分析

RとMeCabをインストールした後、R内で

install.packages("RMeCab",repos = "http://rmecab.jp/R")

を実行することでRMeCabをインスト-ルできる。
RMeCabを使用するときは

library(RMeCab)

を最初に挟む必要がある。

形態素解析

library(RMeCab)//ライブラリ
ans<-RMeCabFreq("形態素解析したい文章の場所")
ans//出力

解析結果をCSVで書き出したい場合

library(RMeCab)//ライブラリ
write.csv(ans,".csv",row.names=TRUE,fileEncoding="CP932",eol="\r\n")
ans//出力

ソート

ans[rev(order(ans$Freq)),]//ソート
ans//出力

を実行することで解析できる。

書き出したCSVファイル等はドキュメントに保存される。