y-matsui::weblog

電子楽器、音楽、コンピュータ、プログラミング、雑感。面倒くさいオヤジの独り言

ツチヤ先生本の目次をテキストマイニング?

自分が所有している土屋賢二先生の文庫本全11冊の目次をテキスト化し、テキストマイニング(単語の出現頻度)を行ってみる。
本来であれば、全テキストを読み込ませて、土屋先生の頭の中を覗いてみるところまでやるべきなのだろうが、残念ながらそのような非生産的なパワーを持ち合わせていない。
従って、せいぜい目次でも眺めて、先生の頭の偏りを発見してやろうと・・そういった魂胆なのである。
結果
「方法、理由、人間、哲学、論理、法則・・・など、”やはり”非常に哲学的な・堅そうな言葉遣いが多い」

「へ?たったそれだけかよ!」
「そう、それだけ」
テキストマイニング的な結果をちょっとだけ記すとすれば、全575ワード中、上位20位で、全体の20%。
その他80%は、一度だけ出現する単語であり、重なりが非常に少ないと言える。つまり、同じ語を使っている可能性が非常に低く、ボキャブラリの豊富さが垣間見える・・・といったところか。
もう少し分析を加えると面白そうなのは、「語をネガティブとポジティブで振り分けた場合に、ネガティブがほとんどなのではないか?」ということ。
残念ながら、それすらも追求するパワーがない。

方法 ( 19 )
理由 ( 13 )
人間 ( 8 )
哲学 ( 6 )
論理 ( 5 )
法則 ( 5 )
助手 ( 5 )
女性 ( 4 )
効果 ( 4 )
失敗 ( 4 )
危険 ( 4 )
論証 ( 4 )
不可解 ( 4 )
ダイエット ( 4 )
大学 ( 4 )
中年男 ( 4 )
無駄 ( 4 )
学部長 ( 4 )
プロ ( 3 )
今日 ( 3 )

抽出された全単語数:575