ことばを数える

特徴的なことばや言い回しの頻度から,文書の作者や成立年代の手がかりを得るという手法がある.
以下は,本音と冗談が半々のように聞こえたが,
……僕らは誰も頻度なんて信じちゃいない.しかし唯一,プラトンの著作の成立年代だけは頻度ベースの結果が受け入れられている.なぜだと思う? そうでもしないとみんなが好き勝手に言って収拾つかないからだ.
とは,情報技術にも詳しい史料学の先生の話.

プラトンがどうだかはともかく頻度を信じないという背景について,他にゲストがいたのでその場で深くは尋ねなかった.日頃の研究内容から推し量ると,文脈から切り離されたことばの数を積み上げても仕方ないという気持ちがあるのだろう.史料にあたるというのは文脈から言葉を発見する作業になる.欠落やページの前後,解読できない書き文字も少なくないので,それを時代や人や前後の文脈から推測する仕事になるから,あることばの持つ意味や重みが文書ごとに異なってることに対して敏感なんだろう.

ことばを数え上げるっていうのは今だとだいたい計算機にやらしがちだけど,やはり乱暴なところがあって.それは人間ですら難しいと思うことだらけで,同じ表記でもこれってぜんぶ同じ意味なのかと延々悩む.いま,ことばの正解をたくさん作らなくてはならないとき,およそどのへんで妥協するかってのは,リテラシの充分に高い人2,3人でそれぞれに作った答えを突き合わせて,最後に専門家がチェックしている.

コメントを残す