はてブ注目記事と逆接、夜の大逆接、逆接は論理的ではない
「しかし」「だが」など逆接の接続詞は、論理的な文章に多く出現するとされます。では、はてなの一般記事と比べて「注目記事」では、逆接が出現する確率は変化するのでしょうか? 今日は、はてなにおける逆接の出現率を実際に数え、その意外に結果についてとりとめなく考えます。
長塚節の代表歌でしょう。咽頭結核による闘病生活、許婚との別れなど、さまざまな悩みをかかえて帰郷した自分を故郷はあたたかく迎えてくれます。母親がつってくれた蚊帳はたるんでいたけれども、それだけに年老いた母親の愛情が伝わってきて、すがすがしさを感じています。最後の逆接が実にきいています。
井上ひさしは、『私家版 日本語文法』の中で、幼児が最初に獲得するのは感動詞であり、最後に獲得するのは接続詞であると述べています。井上によれば、接続詞、特に逆接の接続詞を用いることは「論を立てる」ことと同値です。なるほど、確かに、2歳ぐらいのガキに「にもかかわらじゅ」とか言われるたら、かなりビビりそうです。
論を軽んじ情が先ばしる文章では特に接続詞が減少します。その傍証として井上があげているのは、1980年に自殺したKDD前社長付参与、保田重貞さんの遺書と、スワッピング月刊誌「スウィンガー」の相手募集欄というのですから、この作家の知的貪婪さというのは常人の及ぶところではないですね。
ともかく、逆接の接続詞が多い文章は論理的である、というのは確かにそうなりそうな気がします。逆接の量で、「論」と「情」のどちらにウェイトがかかっているかが分かるというのは、調べてみる価値がありそうです。
そこで、ちょっとした観察をしてみました。はてなダイアリー内で、なんのバイアスもない「一般的な記事」と、多くのブックマークを集めた「注目記事」で、逆接の接続詞の出現率に違いが出るでしょうか。
まず、「一般的な記事」ですが、完全なランダムサンプリングの方法を思いつかなかったので、新着記事をただざくっと取ってきます。更新時間帯による影響を除くために、およそ16時、20時、24時の3回の新着記事を各100件ずつ取得しました。次に、はてなブックマークの「http://d.hatena.ne.jp/ の注目エントリー」から、上位500件を取得しました。しきい値は5usersです。これ以上データを増やすのは、もはやDoS攻撃なので、量としてはこんなものでしょう。これらの粗データから、サイドバーの中、HTMLタグ、改行だけの行を除去し、テキスト化します。
次に「逆接」ですが、独断でもって「しかし」「ところが」「だけど」「ですけど」「だが」「ですが」「でも」「けれど」「なのに」の9個をチョイスしました。他の逆接もいつか調べてみたいと思います。「ばってん」とか。
さて、これらの逆接の出現率はいかほどになるでしょうか? 10000字あたりの出現回数を表にしてみます。出現頻度の高い順にソートしてあります。
16時更新 | 20時更新 | 24時更新 | 一般平均 | 注目記事 | |
---|---|---|---|---|---|
(文字数) | (624673) | (494746) | (545726) | (1665145) | (1636307) |
でも | 10.05 | 12.18 | 13.85 | 11.93 | 10.65 |
ですが | 4.51 | 5.67 | 6.94 | 5.65 | 5.34 |
だが | 2.28 | 1.85 | 5.77 | 3.3 | 2.39 |
だけど | 4.37 | 3.96 | 4.21 | 4.19 | 2.2 |
しかし | 2.68 | 3.29 | 3.09 | 3.0 | 2.79 |
けれど | 1.4 | 0.8 | 0.95 | 1.08 | 1.47 |
ですけど | 1.13 | 1.43 | 1.97 | 1.5 | 0.99 |
なのに | 0.84 | 1.03 | 0.97 | 0.94 | 0.55 |
ところが | 0.46 | 0.34 | 0.49 | 0.43 | 0.56 |
合計 | 27.72 | 30.55 | 38.24 | 32.02 | 26.94 |
なんとびっくり、想像以上に大差がついています。「はてなの注目記事は、一般記事に比べて逆接が少ない」ということが分かりました。時間帯によって、逆接率が大きく違い、特に深夜にかけて逆接率が急増するのも謎です。ともかく、合計で見ると、今回データを取ったすべての時間帯で、注目記事の逆接は、一般記事より少ないです。
この結果をどう解釈すればいいのでしょうか? 注目記事というのは、やはり「論より情け」ということでしょうか。やはり、我々は日本人は、論理性が欠けており、情感を思んずる民族なのでしょうか。
即断する前に、別の接続語のデータも見てます。
16時更新 | 20時更新 | 24時更新 | 一般平均 | 注目記事 | |
---|---|---|---|---|---|
だから | 3.87 | 3.92 | 3.07 | 3.62 | 4.65 |
ということは | 0.32 | 0.22 | 0.14 | 0.23 | 0.45 |
一方 | 0.3 | 0.18 | 0.23 | 0.24 | 0.61 |
それに対し | 0.01 | 0.0 | 0.0 | 0.0 | 0.08 |
「だから」と「ということは」は、理由を表す接続語です。この2つの言葉の出現率は注目記事のほうが高く、この結果を見る限り、注目記事は論理性に欠けた文章であるとは簡単に言えないようです。
そして、「一方」と「それに対し」は対比を表す接続語。全体の出現率は高くありませんが、圧倒的な差がついています。「それに対し」などは、一般記事にはほとんど出現しません。逆接の「しかし」などにも対比を表す用法があることを考えると、これほど差がつくのは、実に不思議です。
ここで、冒頭の長塚節の歌に戻ってみます。結句の「たるみたれども」は逆接ですが、この逆接は「論理的」なんでしょうか? この逆接は、単純な対立関係を表しているわけではないですね。「たるみ」はある。しかし、むしろ、そのことによって「すがし」が強く感じられる、ということでしょう。ためしに「たるみたれども すがしといねつ」と倒置法を解除してみると、母親の愛情に対するしみじみとした感謝が消えてしまうことが分かります。
要するに、この逆接が表現しているものは、解釈です。事実としては、たるんでいる蚊帳と、自身のすがすがしさがあるのみですが、それを逆接でつなぐことによって、母親への思いを表現している。
よくよく考えてみると、逆接が表現しているのは、解釈とか判断です。野矢茂樹『論理トレーニング』にある例ですが、「この店は高いが、うまい」とも「この店は安いが、うまい」とも、どちらとも言える。前者は「高い」という事実に対して、「値段が高いのはよくないけど」という解釈を、後者は「安い」という事実に対して、「値段が安いとふつうは不味いけど」という解釈を隠しています。
数学の公式集に逆接はいらない。ファクト(客観的事実)をずらずら並べるのに、逆接は不要です。例外は、逆接の接続詞を対比の用法で使うときだけです。これは注目記事に対比の用法が多かったことと符合します。
どうも、もう少し考える必要がありそうです。
ぐだぐだ書いてきましたが、私には、結局これらの結果の意味がなんだかよく分かりません。どっちにしろ、このエントリみたいに「あれかなあ、でも、これかもなあ」と長文をこねくりまわすのがよろしいことでないのは間違いなさそうです。