文体のグラフィック
銀河鉄道の夜
走れメロス
文体のグラフィック
目次
研究について
研究内容
文体を可視化するグラフィックの生成
研究対象
文体の意味 文体の定義
文体という単語は多岐にわたる要素を含んでいる。
本研究ではその中でも文章構造に着目し、読点配置や
係り受けといった構造的特徴の視覚化を試みた。
読点 タイトル画像
読点
touten2
一、文の分割
touten3
二、円に沿った配置
 読点配置による文体解析は計量文体学の分野で行われてきた。望月ら(2007)は、文学作品の文章を句読点で分割し、読みの文字数を計測することで、その分布特性を調査した。本研究では読点により1文あたりの分割を行う。そして、グラフィック上にはセグメントの文字数に対応した大きさで不可視の円を配置し、それらに沿ったテキスト配置を行う。これらのロジックで描画されたグラフィックを観察することで読点配置における作家の文体の発見を試みる。
係り受け
一、主述の分類
係り受け 図1
係り受け 図2
文節の主述の判定にはGinZaと言う
形態素解析ライブラリを用いて行って
いる。日本語の文章を読み込むことに
よって単語の品詞と係り受けの関係性
の判定が出力される。
GinZaから得られた情報をもとに各単
語を主語、述語、修飾語のいずれかに
振り分けるルールを設定することに
よって主述の分類を可能にしている。
二、修飾に基づく配置
kakariuke3
kakariuke4
kakariuke5
kakariuke6
係り受けとは、主語、述語、修飾語と単語同士の繋がっている関係のことを指す言葉である。金川・岡留(2017)は、係り受け構造の解析に単語の出現確率に基づいた重みを考慮する情報木というモデルを作成し係り受けにおける作家間の違いを探求した。係り受けのグラフィックではその関係性を図形同士の重ね合わせの視覚表現に置き換えることで文節同士の修飾関係や、その偏りなどを観察することができる。