アルザスのこちら側

一般言語学を専攻し、学位はとったはいいがあとが続かず、ドイツの片隅の大学のさらに片隅でヒステリーを起こしているヘタレ非常勤講師が人を食ったような記事を無責任にガーガー書きなぐっています。それで「人食いアヒルの子」と名のっております。 どうぞよろしくお願いします。

本を出しました。詳しくは右の「カテゴリー」にある「ブログ主からのお知らせ」をご覧下さい。
メッセージをくださる際にメルアドを記していただくとこちらから返信できます!

機種によってレイアウトが崩れまくるので前に書いた記事の図表を画像に変更しました。ついでに鬼のように誤植があったので直しました。この調子だとまだありそうです誤植…

元の記事はこちら
内容はこの記事と同じです。

 私と誕生日が一日違いの(『26.その一日が死を招く』参照)言語学者フェルディナン・ド・ソシュールの名は言語学外でも広く知られている。その「代表作」Cours de linguistique générale『一般言語学講義』以来、氏が記号学の祖となったからでもあろう。ラング、パロール、シニフィアン、シニフィエ云々の用語を得意げに(失礼)使っている人も多い。オシャレに響くからだろう。私も得意げに使っているので、大きな事はいえないが。
 が、これもよく知られていることだがその『一般言語学講義』はド・ソシュール自身が書いたものではない。ド・ソシュールの講義を受けたセシュエやバイイなどの学生が自分たちのノートを基にしてまとめたものである。あまり知られていないのが Cours de linguistique générale が世界で最初に外国語に翻訳されたのは日本語が最初であることだ。1928年小林英夫氏の訳である。私はこれを聞いた当時日本人の言語学への先見の明・関心が高かったためかと思って「さすが日本人」と言いそうになったが、これは完全に私の思慮が浅かった。Cours が他の国でそんなにすぐ翻訳されなかったのは、当時のヨーロッパではその必要がなかったからである。つまりフランス語などまともな教養を持っている者なら誰でも読めたからだ。現に当時の言語学の論文の相当数がフランス語で書かれている(下に述べる Kuryłowicz クリウォヴィチの論文もフランス語である)。これは今でもそうで、例えば大学で論文を書くときドイツ語・英語・フランス語の引用文は訳さなくていい、という暗黙の了解がある。論文ではないがトーマス・マンの『魔の山』(『71.トーマス・マンとポラーブ語』参照)にも何ページもベッタリフランス語で書いてある部分がある。つまり Cours が真っ先に日本語に訳されたのは日本人が言語学に熱心だったからではなくて単に日本人の一般的語学力が低かったからに過ぎない。ずっと遅れはしたが日本語の次に Cours が翻訳された言語が英語だったことを考えるとさらに納得がいく。現在のヨーロッパの国ではイギリスがダントツに「外国語が最もできない国民」である、というアンケートの結果を見たことがあるのだ。

 その、ド・ソシュールの手によるものでない『一般言語学講義』が言語学外でもやたらと知られている一方、まぎれもなく氏本人の手による『インド・ヨーロッパ諸語における母音の原初体系に関する覚書』Mémoire sur le système primitif des voyelles dans les langues indo-européennes という論文はあまり騒がれてもらえていない。言語学者としてのド・ソシュールの名前を不動のものとしたのはむしろ Mémoire のほう、俗に印欧語のソナント理論、後に喉音理論と呼ばれるようになった理論の方ではないかと思うのだが。ド・ソシュールが1879年に21歳で発表した印欧比較言語学の論文である。

 印欧語はご存知のように俗に言う屈折語で、語中音、特に母音が交代して語の意味や品詞、またシンタクス上の機能を変える。例えば「死ぬ」というドイツ語動詞の不定形は sterben で e という母音が来るが、現在形3人称単数は stirbt と i になり、過去形3人称単数は starb で a、接続法2式は stürbe で ü 分詞で gestorben と母音は o になる。子音は変わらない。祖語の時代からそうだったことは明らかで、19世紀の後半からメラー Møller など何人もの言語学者がセム語族と印欧語族とのつながりを主張していたのもなるほど確かにと思う。
 さてその印欧比較言語学の最も重要な課題の一つが印欧祖語の再建であったことは『92.君子エスペラントに近寄らず』の項でも書いたとおりである。基本的には印欧祖語の母音はa, e, i, o, u の5母音とその長音形 ā、ī、ō、ē、ū と「印欧語のシュワー」と呼ばれる ə というあいまい母音と見なされている。最初から研究が進んでいた印欧語族、現在の印欧語や古典ギリシャ語、サンスクリットなどのデータを詳細に調べて導き出されたのだが、印欧祖語の母音組織についてはいまだに諸説あり最終的な結論は出ていない。i と u はむしろ半母音、つまりソナント(下記参照)、そして ī と ū は ei、oi、eu、ou などの二重母音の弱まった形だとされることもあるが、ā、ō、ē の3つの長母音は印欧祖語本来のものとみなすのが普通であった。これらの母音が上述のように語中で交代して意味や文法機能を変える。その母音交代現象(Ablaut、アプラウト)は祖語時点ですでに共時的に行なっていたのが、祖語がバラけるにつれて通時的にも母音が変化したから、交代のパターンをきっちり確定するのが難しくなっているわけである。
 様々な母音交代パターンがあるが、大きく分けると量的母音交代(quantitativer Ablaut、またはAbstufung)と質的母音交代(qualitativer Ablaut または Abtönung)の2群に分けられる。後者については印欧祖語には e 対 o または ō 対 ē の交代があったと思われ、例えば古典ギリシア語の patera (「父」、単数対格)対 apatora(「父のいない」、単数対格)、patēr(「父」、単数主格)対 apatōr(「父のいない」、単数主格)がこれを引き継いでいる。クラーエ Krahe という人はさらに a と o の交代現象に言及しているがこちらのほうは「非常にまれにしか見出せない」と述べているし、私の調べた限りではその他の学者は全員「印欧祖語の qualitativer Ablaut」として e 対 o しか挙げていなかった。母音交代ではゼロ(ø)形も存在する。サンスクリットの as-mi(「~である」、一人称単数現在)、s-anti(同三人称複数現在)はそれぞれ *es-mi 、*s-enti という形に遡ると考えられるが、ここの語頭で e と ø が交代しているのがわかる。
 前者の quantitativer Ablaut は短母音とそれに対応する長母音、または短母音と二重母音間の交代である。e 対 ē のようなわかりやすい対応ばかりでなく、ā、ō、ē 対 ə、ei 対 i、 eu 対 u のような複雑なものまでいろいろな形で現れる。ラテン語 tegō(「覆う」、一人称単数現在)対 tēxī(一人称単数完了)に見られるわかりやすい e・ē 交代の他、古典ギリシア語の leipō(「そのままにする、去る」、一人称単数現在)対 elipon(同一人称単数アオリスト)もまたこの quantitativer Ablaut である。この動詞の一人称単数完了形は leloipa だから、母音交代は ei 対 oi 対 i かと思うとこれは実は e~o~ø。つまり一見様々な量的母音交代は割と簡単な規則に還元できるんじゃないかと思わせるのである。ド・ソシュールがつついたのはここであった。

 このゼロ交代現象で重要な意味を持ってくるのが音韻環境によって母音にもなり子音にもなるソナントと呼ばれる一連の音で、この観念を確立したのがブルクマン Brugmann という印欧語学者である。例えば、英語の sing~sang~sung、ドイツ語の werden~ward(古語、現在の wurde)~ geworden は祖語では *sengh-~*songh-~*sn̩gh-、*wert-~*wort-~*wr̩t-という形、つまり e~o~ø に還元できるが、そのゼロ形語幹ではそれぞれ n、r が母音化してシラブルの核となっている。こういう、母音機能もになえる子音をソナントと呼ぶが、印欧祖語には r̩、l̩、m̩、n̩(とその長母音形)、w、y(半母音)というソナントが存在したと思われる。「母音の r̩ や l̩」はサンスクリットに実際に現れるが m̩ と n̩ についてはまだ実例が見つかっていないそうだ。ここで私が変な口を出して悪いがクロアチア語も「母音の r」を持っている。言い換えるとクロアチア語には母音の r と子音の r の、二つの r がある。rad (「作品」)の r は子音、trg(「市場」)の r は母音である。
 さらに上述の古典ギリシャ語 leipō~elipon の語根だが、祖語では *lejkw-~*likw- となり前者では i が子音、半母音の j (英語式表記だと y )だったのが後者では母音化し、i となってシラブルを支えているのがわかる。同様に u についても、半母音・ソナントの w が母音化したものとみることができる。円唇の k が p に変わっているのは p ケルトと同様だ(『39.専門家に脱帽』参照)。

 さて、話を上述の印欧祖語のシュワーに戻すが、ブルグマン学派ではこの ə をれっきとした(?)母音の一つと認め、ā、ō、ē と交代するとした。サンスクリットではこの印欧語のシュワーが i、古典ギリシャ語とラテン語では a で現れる。だから次のようなデータを印欧祖語に還元すると様々なアプラウトのパターンが現れる。それぞれ一番下が再現形(太字):
Tabelle1-115
3番目の例は松本克己氏からの引用だが、氏はサンスクリットの「与える」反射態として a-di-ta という形を挙げていた。その形の確認ができなかったので私の勝手な自己判断で adiṣṭa にしておいた。とにかくサンスクリットでは原母音の ā、ō、ē が全て ā で現れているのがわかる。最後の二つは2音節語幹だが、とにかく母音交代のパターンも語幹の構造もバラバラだ。ド・ソシュールはこれらを一本化したのである。
 ブルグマンらによれば印欧祖語のソナント r̩、l̩、m̩、n̩ はサンスクリットでは a となるから、サンスクリットの語幹が tan- 対 ta- と母音交代していたらそれは印欧祖語の *ten-~*tn̩- に帰するはずである。ド・ソシュールは上のような長母音対短母音の交代もシュワーでなくこのソナントの観念を使って説明できると考えた。
 そこでまず印欧祖語に coéfficient sonantique「ソナント的機能音」という音を設定し、それには二つのものがあるとしてそれぞれ A、O(本来 O の下にˇという印のついた字だが、活字にないので単なるOで代用)で表した。その際ド・ソシュール自身はそれらはどういう音であったかについては一切言及せず、あくまで架空の音として仮にこういう記号で表すという姿勢を貫いた。
 この二つの「ソナント的機能音」が短母音を長母音化し、さらにその色合いを変化させるため、e+A=ē または ā、e+O=ō, o+A=ō, o+O=ō の式が成り立つ、いや成り立たせることにする。いわゆるゼロ形ではA、Oは単独で立っているわけである。例えば上のラテン語 stā-re~sta-tus は *stā-~*stə でなく *steA-~*stA-、古典ギリシャ語 di-dō-mi~do-tos は *dō-~*də- でなく *deO-~*dO となる。これはブルクマンが元々唱えていた *sengh-~*sn gh-(上述)、さらに leipō~elipon の *lejkw-~*likw-(これも上記)と基本的なパターンが全く同じ、CeC- の e~ø 交代となる。最終的にはド・ソシュールは母音としては e のみを印欧祖語に認めた。
 このド・ソシュールの「式」のほうがブルグマンより説明力が高い例として松本克己氏は bhavi-tum~bhū-tas(上述)の取り扱い方を挙げている。ド・ソシュールの説ではこれも *bhewA-~*bhwA- という単純な e~ø 交代に還元でき、*bhewA- ではソナントAが w と t に挟まれた子音間という環境で母音化して祖語の ə つまりサンスクリットの i (上述)となり、*bhwA- ではソナント(半母音)w が bh と Aに挟まれた、これも子音間という環境で母音化して u になる。さらにこれがソナントAの影響によって長母音化して最終的にはūになるのである。見事につじつまが取れている。それに対してシュワーの ə を使うときれいな CeC- 解釈ができない。この交代は *bhewə-~*bhwə- と見なさざるを得ず、後者の *bhwə- が「印欧祖語の ə はサンスクリットの i」という公式に従って bhvi- で現れるはずであり、bhū- という実際の形の説明がつかない。といって ū- をそのまま印欧祖語の母音とみるやり方には異論がなくないことは上でも述べた。

 しかしド・ソシュールのこのアプローチは言語学で広く認められることとはならなかった。このような優れた点はあってもまだ説明できない点や欠点を残していたことと、当時のデータ集積段階ではブルグマンの母音方式で大半の説明がついてしまったからである。もっとも数は少なかったがド・ソシュールと同じような考え方をする言語学者もいた。例えば上述のメラー Møller は既に1879年に印欧祖語の ā、ō、ē は実は e+x から発生したものだと考えていたし、フランスのキュニー Cuny もこの、「印欧祖語には記録に残る以前に消えてしまった何らかの音があったに違いない」というド・ソシュール、メラーの説を踏襲して、それらの音をド・ソシュールの A、Oでなく、代わりに ə1、 ə2、 ə3 という記号で表した。その際これらの音は一種の喉音であると考えた。キュニーはこれを1912年の論文で発表したが、基本的な考えそのものはそれ以前、1906年ごろから抱いていたらしい。さらにド・ソシュール本人も1890年代にはAを一種の h 音と考えていたそうである。

 情勢がはっきり変わり、この「喉音理論」が言語学一般に認められるようになったのは1917年にフロズニー Hrozný によってヒッタイト語が解読され、印欧語の一つだと判明してからである。
 ヒッタイト語には ḫ または ḫḫ で表される音があるが、これを印欧祖語の子音が二次的に変化して生じたものと解釈したのでは説明がつかなかった。結局「この音は印欧祖語に元からあった音」とする以外になくなったのだが、この説を確立したのが上でも名前を出したポーランドの Kuryłowicz クリウォヴィチである。1927年のことだ。その時クリウォヴィチはこの ḫ がまさにド・ソシュールの仮定した Aであることを実証してみせたのである。ただし彼もキュニーと同じく ə1、 ə2、 ə3 の3つの記号の方を使い、e+ ə1= ē、 e+ə2= ā、 e+ə3=ō という式を立てた。つまり ə2 がド・ソシュールのAに対応する。
 例えば次のようなヒッタイト語の単語とその対応関係をみてほしい。左がヒッタイト語、右が他の印欧語。「ラ」とあるのはラテン語、「サ」がサンスクリット、「ギ」が古典ギリシャ語、右下に出したのがシュワーを用いた印欧祖語再建形である:
Tabelle2-15
最初の3例では a+ḫ=ā という式が成り立つことがわかる。そしてヒッタイト語の a を印欧祖語の e と見なせば、この a+ḫ=ā はまさにド・ソシュールの e+A=ā 、クリウォヴィチの e+ə2= ā、つまりド・ソシュールが音価を特定せずに計算式(違)で導き出した「ソナント」または「ある種の喉音」が本当に存在したことが示されているのである。一番下の例ではこのソナントが子音の後という音韻環境で母音化してブルクマンらのいうシュワーとなり、サンスクリットで公式どおり i で現れているのだ。
 さらにクリウォヴィチはすべての印欧祖語の単語はもともと語頭に喉音があった、つまり CV- だったが、後の印欧語ではほとんど消滅して母音だけが残ったとした。ただ、アルバニア語にはこの異常に古い語頭の喉音の痕跡がまだ残っている、と泉井久之助氏の本で読んだことがある。

 もちろんこの喉音理論もクリウォヴィチが一発で完璧に理論化したわけではなく、議論はまだ続いている。同じ頃に発表されたバンヴニストの研究など、他の優れた業績も無視するわけにはいかない。そもそもその喉音とやらが何種類あったのかについても1つだったという人あり、10個くらい設定する説ありで決定的な解決は出ていない。それでもこういう音の存在を60年も前に看破していたド・ソシュールの慧眼には驚かざるを得ない。私はオシャレなラング・パロールなんかよりむしろこちらの方が「ソシュールの言語学」なのだと思っている。高津春繁氏は1939年に発表した喉音理論に関する論文を次の文章で終えている。

F.de Saussureの数学的頭脳によって帰結された天才的発見が六十年後の今日に到って漸く認められるに到った事は、彼の叡智を證して余りあるものであって、私は未だ壮年にして逝った彼に今二三十年の生を与へて、ヒッタイト語の発見・解読を経験せしめ、若き日の理論の確証と発展とを自らなすを得さしめたかったと思ふのである。彼の恐るべき推理力はCours de linguistique généraleにも明らかであるが、その本領はMémoireに於ける母音研究にあり、彼の此の問題に対する画期的貢献を顧りみて、今更の様に此の偉大なる印欧比較文法学者への追悼の念の切なるを覚える。

なるほど、あくまで「Cours de linguistique générale にも」なのであって「Cours de linguistique générale」や「Mémoire にも」ではないのだ。

この記事は身の程知らずにもランキングに参加しています(汗)。
このエントリーをはてなブックマークに追加 mixiチェック

レイアウトが機種やブラウザによって、特にスマホではグチャグチャになるようなので前に書いた記事の図表を画像に変更しました。ついでに文章も一部直しました。その間にもこの言語はもう消滅したかもしれません。

元の記事はこちら
内容はこの記事と同じです。

 インドの遥か東、というよりミャンマーのすぐ南にあるアンダマン・ニコバル諸島は第二次世界大戦中に2年間ほど日本領だったところである。特に占領期の後半に地元の住民をイギリスのスパイ嫌疑で拘束拷問し、しばしば死に至らせたり、食料調達と称して住民から一切合財強奪して餓死させたりした罪に問われてシンガポール裁判で何人も刑を受けた。私がちょっと見てみたのはインドで発行された報告だが、しっかり日本兵向けの Comfort Home についての記述もあった。日本軍はやってきたとき支配目的でさっそく地元の住民の人口調査なども行なっているが、問題はこの「地元の住民」、インド側でいうlocal poepleというのがどういう人たちかである。
 ニコバル諸島はちょっと置いておいてここではアンダマン諸島に限って話をするが、ここは主要島として北アンダマン島、中アンダマン島、南アンダマン島の3島があり、これらから少し離れてさらに南に小アンダマン島がある。もちろんこのほかにバラバラと無数の離島が存在する。

アンダマン諸島はここ。ウィキペディアから。
By edited by M.Minderhoud - own work based on PD map, Public Domain, https://commons.wikimedia.org/w/index.php?curid=1012051

Andaman_Islands
ビルマ寄りの北・中・南アンダマン島は昔からビルマやインド、果てはイギリスなどから人々が移住してきた。インド各地から来た住民は出身地ごとにかたまってコミュニティーを造り、ビルマ人はビルマ人、イギリス人はイギリス人でコミュニティーを作ったが、これらコミュニティー間では争いもあまりなく、まあ平和に暮らしていたそうである。アンダマン島生まれのインド人など本国よりアンダマン人としてのアイデンティティーの方が強いそうだ。現在人口役20万人強。この多民族な住民が日本軍が来た時の local poeple だろうが、問題はアンダマン島にはオーストラリアやアメリカ、さらに日本の北海道のようにもともとそこに住んでいた原住民がいたということである。それらの人々はもちろん固有の言語を持っていた。アンダマン諸語である。そのアンダマン諸語はまず大きく分けて東アンダマン諸語と西アンダマン諸語に分けられるが、東アンダマングループに属する言語はもともと10あり、1800年時点では北・中・南アンダマン島全体にわたって話されていた。

アンダマン諸語。残念ながら話されている地域は激減してしまった。これもウィキペディアから。
CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=330184

Andamanese_comparative_distribution
 その後上述のように外からの移住があり、原住民もヒンディー語に言語転換したり、10あった部族間での婚姻が進み、現在残っているアンダマン語は2言語のみ、しかもその二言語も純粋な形では残っておらず、人々の話しているのは事実上元のアンダマン諸語の混交形で、「大アンダマン語」という一言語と言った方が適切だそうだ。Abbi というインドの言語学者はこれを Present-day Great Andamanese、現代大アンダマン語と呼んでいる。しかもその話者というのが2013年時点で56人(!!)。アンダマン島本島ではなく、その周りの小さな小さな離島の一つ Strait Island というところにコミュニティを作って暮らしている。
 イギリス人は19世紀からこのアンダマン諸語の研究を開始しており、結構文献や研究書なども出てはいる。現在もインドの学者が言語調査をし記録に残そうと必死の努力をしている。が、そもそもイギリス人やインド人など文明国の人が入ってきさえしなければ記録しようという努力そのものが無用だったろう。アンダマン諸語は孤立した島でそのまま話され続けていたはずだからである。自分たちが侵入してきたおかげで消えそうになっている言語を今度は必死に記録して残そうとする、ある意味ではマッチポンプである。しかし一方では外から人が来なかったせいで記録されることもなく自然消滅してしまった言語や、逆に人間の移住により新たに生じた言語だってある。後から来たほうが常に一方的に悪いとも言い切れまい。まさに歴史の悲劇としかいいようがない。

 その壊滅状態の東アンダマン諸語と比べて西アンダマングループはまだ100人単位の話者が存在する。西グループを別名アンガン(またはオンガン)グループといい、さらに二つの下位グループに分類される。中央アンガンと南アンガングループで、前者にはジャラワ語、後者にはオンゲ語とセンティネル語が属す。ジャラワ語は元々南アンダマン島で話されていたが、現在では中および南アンダマン島西部がその地域である。話者はタップリいて(?)300人。オンゲ語は小アンダマン語で100人によって使われている。センティネル語は南アンダマン島の西方にあるやはり離島のセンティネル島で話されている。話者数は全くの未知である。というのは、ここの島の住民は外から人が来ると無差別に攻撃し、時として死に至らせるので言語調査ができないからである。それで現代大アンダマン語、ジャラワ語、オンゲ語には文法書があるがセンティネル語文法はまだない。

 上述のように日本軍は侵略して来たときアンダマン島で「国勢調査」をしているが、そこで1945年7月現在の南アンダマン島の人口は17349人、そのうち女性5638人、男性が11713となっている。男性が女性の倍もいるのは多分当時そこにインド解放軍というか英国からの独立を目指す兵士らがたくさんいたからだろうが、そこにさらに注がついていて、この統計は「受刑者と aboriginal race (Jarawa )は除く」となっている。受刑者が多いのはアンダマン島がイギリスに対するオーストラリアのごとく流刑地として使われていたからであるが、ジャラワが人口勘定に入れてもらえていないのは、人間扱いされていなかったというより、ジャラワ人がいったい何人くらいいるのかわからなかったからだと思う。センティネル人ほどではないにしろ、ジャラワ人もいまだに外部との接触を嫌っているそうだ。日本軍が来る前のインド政府というかイギリス政府というか、とにかく現地の政府にも統計が取れていなかったのではないだろうか。
 大アンダマン語を壊滅させてしまった反省からか、下手に「文明」を教示しようとしてアボリジニやネイティブ・アメリカンの文化を破壊しアイデンティティを奪って精神的にも民族を壊滅させ2級市民に転落させたオーストラリアやアメリカ、ついでにアイヌを崩壊させた日本の例を見ていたためか、インド政府は生き残ったアンダマン民族をできるだけそっとしておき、同化政策などは取らない方針をとっているそうだ。それでも島にはインド人などが住んでいるのだから時々ニアミスが起こるらしい。最近新聞でちょっと読んだ話では、ジャラワ族の女性が外部の者に強姦される事件が何件かあったそうだ。その場合は犯人はこちら、というかインド側の者なのだから捕まえて罰すればいい。だが逆にジャラワ族が、強姦された結果生まれた子供の皮膚の色が白かったというので子供を殺す儀式を行なっていたことが報告されたりしている事件もある。これは立派な殺人行為だ。放って置かれているとはいえそこはインド領である。こういう殺人行為を見て見ぬ振りをしていていいのか、という問題提起もあり、いろいろ難しいらしい。

 さて、その「現代大アンダマン語」であるが、そり舌音があり、帯気と無気に弁別機能があるあたり、孤立言語とはいえヒンディー語始めインドの言語と何気なく共通項がある。もちろん文法構造は全く違い、能格言語だそうだ。以下は上述の Abbi 氏が挙げている例。絶というのが絶対格、能が能格である。

billi-bi bitʰ-om
ship- + sink-非過去
The ship is sinking.


tʰire-bi bas kʰuttral beno-k-o
child- + bus + inside + sleep-遠過去
The child slept in the bus.


a-∫yam-e bas kuttar-al kona-bi it-beliŋo.
CL1-Shayam- + bus + indide-処 + tendu(果物の名前)- + 3目的語-cut-遠過去
Shyam cut the tendu fruit in the bus.

tʰire-bi ŋol-om
child- + cry-非過去
The child cries.

つまり-e というのが能格マーカー、-biが絶対格マーカーである。 これが基本だが動作主が代名詞だったり複数だったりすると能格マーカーがつかないこともある。上の4番目の例と比べてみてほしい。

tʰire-nu-ø ŋol-om
child-複 + cry-非過去
The children cry.

絶対格マーカーも時として現れないことがあるそうだ。またどういうわけか他動詞の主語と目的語の双方が絶対格になっている例も Abbi は報告し、正直に理由はわからないと述べている。
 能格言語であるという事自体ですでにアンダマン語は十分面白いのだが、その能格性をさえ背景に押しやってしまうくらいさらに面白い現象がこの言語にはある。上の3番目の例のCL1という記号がそれだ。これは a- という形態素(Abbi はこれらは clitic である、としている)が Class 1を表すマーカーであるという意味だが、アンダマン語では名詞にも動詞にも形容詞にも副詞にもマーカーがついてそれらの単語の意味がどのクラスに属するかはっきりとさせ、微妙なニュアンスの差を表現するのだ。その「クラス」は7つあるのだが、それらは何を基準にしてクラス分けされているのか? 当該観念あるいは事象の inalienability(譲渡不可能性、移動不可能性)の度合いと種類を基準にしてクラス分けしているのだ。クラス1、クラス2、クラス3、クラス4、クラス5、クラス6、クラス7のマーカーはそれぞれ a-、εr-、oŋ-、ut-、e-、ara-、o-(あるいは ɔ-)だが、これらは元々人体の一部を示すものであったらしい。a- は口およびそこから拡張された意味、εr- は主だった外部の人体部分、 oŋ- は指先やつま先など最も先端にある人体部分, ut- は人体から作り出されたものあるいは全体と部分という関係を表し, e- は内臓器官、ara- が生殖器や丸い人体器官 、o- が足や足と関連する器官である。

 え、何を言っているのかさっぱりわからない?私もだ。文法執筆者の Abbi 氏はそりゃ大アンダマン語が出来るからいいが、氏がひとりで面白がっているのを見て私だって「ちょっと待ってくれ、何なんだよその inalienability ってのは?!」とヒステリーを起こしてしまった。

 大雑把に言うと大アンダマン人は言語で表現されている事象が自分と、あるいは「AのB」という所有表現などの場合BがAとどれくらい分離しがたいかを常に言語化するのである。これが inalienabilityである。何まだわからない?では例を示そう。「血」は大アンダマン語で tei だが、この単語が裸でつかわれることはほとんどなくクラスマーカーが付加されるのが普通だが、その際どの「不可分性クラス」に分けられるかによって名詞の意味が変わってくる。
108-Tabelle1
名詞ばかりでなく、動詞もクラスわけされる。
108-Tabelle2
同じセンテンス内の文要素がそれぞれ別のクラスに分けられることもある。

a-kɔbo εr-tɔlɔbɔŋ (be)
CL1-Kobo + CL2-背が高い + コピュラ
コボ(人の名)は背が高い


a-loka er-biŋoi be ara-kata
CL1-Loka + CL2-太っている + コピュラ + CL6-背が低い
ロカ(人の名)は太っていて(太っているが)背が低い。


「デブ」と「チビ」では不可分性のクラスが違っているのが面白い。

副詞もこの調子でクラス分けされるが、その際微妙にダイクシス関係などが変わってくるそうだ。
 これらの例を見てもわかるようにこのクラス分け形態素は確かに元々は体の部分と意味がつながっていたものが、やがて抽象化され文法化されて本来の身体的意味はほとんど感じ取れなくなって来ているということである。Abbi はその辺を親切にわかりやすい表にして説明してくれている(「関係する身体部分」の項は上述)。
108-Tabelle3
挙げてある単語の例は別の文献(下記参照)からとったが、そこでは(多分編集者の横やりによって)発音表記が不正確だったので Abbi 氏の主著にあたって確認して発音を直してある。下線を引いてあるのは主著で確認できなかった語だが、それらでは o と ɔ、e と ε などの違いが反映されていない虞があってすみません。またさらに引用した「別の文献」で誤植なんじゃないかと思ったものあったので主著からそれにあたると思われる語を挙げておいた(太字)。
 ɸ はpʰ(帯気の p)のアロフォン。また amu(「唖の」)については Abbi 氏は主著で akamu という異形態素を使った形を報告している。そこでは akamu は「食いしん坊」という意味とあるが同時にakamu を「唖の」の意味に使うネイティブスピーカーの例も報告していて、言語調査の一筋縄ではいかないことがわかる。
 他のクラスも見て行こう。
108-Tabelle4
c は英語の ch(無声軟口蓋閉鎖音)。
108-Tabelle5
「縫う」についてはここで出したように c に帯気のマークがつけてあったが、アンダマン語は軟口蓋閉鎖音では帯気無気を音韻的に区別しないはずだから、音素としては単なる c のことかもしれない。また主著には「たった一人の」という意味の ontoplo  という語が載ってがこれは oŋtoplo と同じ語なのではないだろうか。とすると意味が合わない。
108-Tabelle6
108-Tabelle7
「考える」については主著には ebiŋe、進行形で etabiŋe とあるが、さらにもう一つの別文献には eʈabi:ɲe という形で出ている(ʈ はそり舌)。どうも皆微妙に形が違っていてどれが本当なのかわからないのだがとにかくこの動詞がクラス5に属することだけは間違いない。また「親切な」は上に挙げたクラス2の「美しい」と形が酷似していて引っかかるが、語幹が同じでもクラスによって意味が違ってくるという例なのかもしれない。
108-Tabelle8
108-Tabelle9
 言語環境によっては別にこれらの意味を付加するわけでもないのにとにかくクラスマーカーをつけること、例えばこういう文法構造の文では形容詞、あるいは動詞をしかじかのクラスでマークしなければいけないという規則になっている場合もあるそうだ。つまりこのクラス分けというのは一部文法化しているのである。
 Abbi 氏はこのアンダマン語の調査結果を2023年にも Spektrum der Wissenshaft という科学雑誌で発表している。これは米国の Scientific American 誌のドイツ語版で自然科学の記事が中心なのだが、この号では天文物理や生物学の記事を押しのけて Abbi の言語学の記事が表紙を飾った。ただ主な読者層が言語学者ではないからか、それともドイツ語訳の際そうさせられたのか、発音表記が安直なローマ字表記になっているのが残念だ(上述)。また詳しい文法書が出版された2013年のからこの記事までの10年の間にも何人もインフォーマントが亡くなっている。
 大アンダマン語の西方で話されているセンティネル語はまだ調査記述が全く出来ていないそうだが(上述)、この言語もこんなに難しいものなのだろうか。私など矢を射掛けられるまでもなく、言語を見せられただけで心臓麻痺を起こして即死しそうだ。
   
大アンダマン語インフォーマントと言語学者のAbbiさん(中央)。その後亡くなったインフォーマントも多い。
Abbi, Anvita.2013. A grammar of the Great Andamanese Languege. Leidenから。下の写真も。

Strait Island 2005

その他のストレイト島アンダマン語コミュニティのメンバー。何人か上の写真と同じ顔が見える。
Some members of the community

2023年に Spektrum der Wissenschaft 誌の表紙を飾ったアンダマン語の記事。
spektrum23-11


この記事は身の程知らずにもランキングに参加しています(汗)。
人気ブログランキングへ





このエントリーをはてなブックマークに追加 mixiチェック

前回の続きです。

巷に広く流布している噂に反して「全リンク」という情報構造パターンの文が実は存在する、と前回書いた。そこで疑問文を例にだしたが、疑問文でなくても全リンクと解釈できる場合がある。次の文を比べてみて欲しい。

もうやったよ、宿題。
もうやったよ、宿題は。

英文法でいう Right Dislocation という構造で、I have done it, the homework というふうに文成分が文の外に出て右に移動するものだ。ドイツ語の例では

Diei spinnen, die Römeri.
these + be crazy + the + Romans

などがある。脇についている小さな i は die と die Römer が同一の指示対象であることを示す。ドイツ語では形の上で区別できないがこれを日本語に訳すると

頭おかしいよ、ローマ人。
頭おかしいよ、ローマ人は。

の二通りの訳ができる。上の宿題云々の文と同じパターンだ。日本語では「は」がつくかつかないかを見ればいいからこの二つの文は構造が違うということが馬鹿でもわかるが、ドイツ語だとちょっと手間取るようだ。例えば Janina Kalbertodt と Stefan Baumann という音声学者が、イントネーションのパターンや間の長さなどを機械で詳細に測り、Die spinnen, die Römer という一見同じ構造の文には実は二種類ある、つまり Right Dislocation には二種類あると結論している。 Kalbertodt と Baumann はその二つをそれぞれ Right Dislocation と Afterthought と名付けているが、この区別こそ上の二つの日本語の文の違いに他ならない。
 これらの文の情報構造を前回紹介した Vallduví の図式に従って分析してみよう。最初の文、「ローマ人」に「は」がついていない文は3.アップデート・テールだろう。前回のように色分けすると

頭おかしいよ、ローマ人

となる。しかし Kalbertodt とBaumann の測定結果を見ると、もう一つの解釈が成り立つことがわかる。この文を一つの情報構造単位でなく、二つの単位、2.全アップデートが二つ重なっていると言う解釈だ。

頭おかしいよ、 ローマ人

この二つは発音上明らかに違いがある。言い換えると Kalbertodt と Baumann のいう Right Dislocation には Afterthought とはまた別に二種類あるということだ。ではその Afterthought 文の情報構造はどうなっているのか。これをアップデート・テールと解釈することはできない。そんなことをしたら「は」のない文と同じになってしまうからだ。情報構造が二重になっているという解釈しかあり得ない。ただし全アップデートのダブルではなく、「ローマ人は」の部分はリンクである。言い換えると「2.全アップデート」と「5.全リンク」の二重構造になっているということだ。

頭おかしいよ、 ローマ人は

 「全リンク構造」を認めること、2つの情報構造単位から成り立っている文の存在を認めること、私が Vallduví に提案したい修正点はこの2点である。
 なお、徹底的にどうでもいい話だが、この Die spinnen, die Römer という文は日本での鉄腕アトム級に独仏では誰でも知っている漫画『アステリクス』に出てくるセリフである。幾度となく映画化もされているのでこのセリフを見れば皆ピーンと来る。西欧でこの漫画を知らないとか言ったらドイツでゲーテを知らないと言ったと同じくらいドン引きされることは確実だ。

 それにしても「は」というトピックマーカーなしで Die spinnen, die Römer という文の情報構造が3種あると見破った音声学者は大したものだ。さらに告白すると実は私が前回だした Van Valin の「Виктор」という部分を全アップデートでなく全リンクだと見破ったのは例文がロシア語だったからなのである。一度日本語に訳してみて、ここには「は」がつくと気づいたのではない。思わぬところからの飛び火だが、以前に読んでいた Yokoyama 氏(『181.フォルダの作り方使い方』参照)のロシア語のイントネーションについての論文を思い出して「あれ」と思った。そこで日本語に訳して確かめてみたら常に「は」がついたので、「やっぱり」と確信するに至ったのだ。
 その Yokoyama 氏の論文はロシア語学者が必ずやらされるソ連御用達のイントネーション理論への批判であった。御用達文法によるとロシア語の文のイントネーション Интонационная конструкция にはИК-1からИК-7まで7つあり、文のパターンによってイントネーションの型が決まっている。私たちは「イエスノー疑問文ならИК何番」「普通の叙述文なら何番」「感嘆文なら何番」と丸暗記させられて試験まであり、これができないと本来の語学の授業に進めなかった。このИК何番という言葉を「聞いたことがない」という人がいたらモグリである。Yokoyama 氏はこれを批判し、「7つものパターンを設定する必要はない。文のイントネーションのパターンは突き詰めれば2種に収まる」と主張した。ニュートラルと非ニュートラルなイントネーション、いわば(スラブ語学者らしく)無標パターンと有標パターンの二種で、前者は声調が周期的な上下を繰り返しつつ、最終的に低音調に収束して文末にいたるパターン、後者は上下の途中で強勢が入り、その後はもう声調が上下運動を繰り返さずにまっすぐ文末の低音調に進むものだ。図にするとそれぞれ次のようになる。×印が強勢部分。
Schema1-210
繰り返すが、Yokoyama 氏は別に情報構造理論を展開しようとしてこのイントネーションパターンを主張したわけではない。なのにというかだからこそというか、これが Vallduví の「あり得る文の情報構造」と妙に一致しているのに驚かざるを得ない。Yokoyama 氏があげている文例を検討していくと、Vallduví などが情報構造の典型例としてあげている文とよく一致する。例えば強勢後の平坦部分はVallduví のいうテールであることがわかる。つまり非ニュートラル型の文の情報構造は3.アップデート・テール、4.リンク・アップデート・テールのどちらかだ。ニュートラル型は1.リンク・アップデート、2.全アップデートのどちらかとなり、Vallduví の4パターンを網羅していてテールは(登場するとしたら)必ず文末に来るという主張とも重なる。全アプとリンク・アプが同じイントネーションパターンになってしまう点だが、Yokoyama 氏は(やはり別にそういう意図でなく)ニュートラル型の文に2種みられることを報告している。声調が一度下がってまた上がる際少し手間取ることがある。つまり文の流れに境目ができることがあるという。図で書くとこうなる。
Schema2-210
私は a が全アプ、 b がリン・アプ構造のイントネーションパターンだと思っている。 矢印部がリンクとアップデートの境目だ。Yokoyama 氏の例文で見るとそれぞれ次のようになる。

a. Мирослава уехала в Ялту.
  Miroskava + went away + to + Yalta
ミロスラヴァヤルタに行った

a. Мирослава уехала в Ялту.
ミロスラヴァヤルタに行った

また、非ニュートラル型で、強勢部が文の最後の最後に来た場合はテールの入る隙がない。言い換えると強勢が入っても全アプやリン・アプであり得ることになる。図で書くとこうなる。
Schema3NEU-210

つまり非ニュートラル型では3つの情報構造パターンが可能だが、どれにせよ強勢部分がアップデートに属するという原則は変わらない。
 さてもう一度ニュートラル型に戻ろう。文によっては声調が下がって収束せず、声調が高いまま文が終わるものがある。上の b 図の矢印のところで文が終わるパターンだ。御用文法でいう ИК4で、まさに前回述べた Van Valin のあげている質問が典型的なパターンである。ネットには Я иду. А Вы?(「私は行くよ。で、君は?」)という例が載っていた。つまりこの А Вы? または А Виктра? という語はイントネーションから言ってリンク、そしてそのリンクで文が終わっているのだからこれは全リンク文なのだ。

А: Максим убивает Алексея.
В: А Виктра?
А: Виктра Максим защищает.

A: Maksim kills Aleksey.
B: And Victor?
A: Victor, Maksim protects (him).


上でも述べたように、私はそれで思いついて「そういえば日本語ではここでどう言うだろう」と思って訳してみたら「は」がついたのでこれが全リンク文であることを確信した。
 一方仮に会話の流れが

A:マキシムはアレクセイを殺す。
B:えっ、ヴィクトルが?
A:いや、マキシムが殺すんだ。

というのであれば

А: Максим убивает Алексея.
В: Что, Виктр?
А: Нет, Максим убивает его.

となり、 Виктр? の部分は上のc 図のテールがないパターン、つまり全アプのイントネーション、ИК でいうと3で発話されるはずだ。Yokoyama 氏の理論に従えば  Виктр? に強勢(×印)が来るパターンである。言い換えると Виктр? はアップデートである。

 というわけで私が全リンク文の存在に気づいたのはロシア語の助けがあったからだが、確認は日本語で行った。文が全リンク構造をとるのは限られた場合だがまさに「限られた場合」だからこそ、印欧語では見落とされがちで、不変化詞で明確にリンクマークできる日本語が威力を発揮できる絶好のチャンスとなる。
 逆に日本語だけ見ていたのでは気付きにくい点をロシア語のイントネーション分析で補うことができる。日本語だけでなく独英語の情報構造議論でもそうなのだが、平叙文だけが分析対象になりやすく、疑問文の情報構造についてはあまり話題にならない。ロシア語で観察する限りではイエスノー疑問文と疑問代名詞の入る質問では情報構造が本質的に異なるようだ。例えば

Кто пришёл?
who + came

はニュートラル型であり、全アップデートと解釈できるが、

Виктор пришёл?
Viktor + came

だと Виктор に強勢が置かれるからアップデート・テールだ。日本語にするとそれぞれこうなる。

誰が来たの

ヴィクトルが来たの

さらに「来たのはヴィクトルなのか?」ではなくヴィクトルが来たのかどうか聞く場合は動詞の пришёл に強勢が来るからリンク・アップデートと考えなければいけない。

Виктор пришёл?

ヴィクトルは来たの

 文の情報構造コンポの分析のためにロシア語と日本語はまだまだたくさんコラボの余地がありそうだ。


この記事は身の程知らずにもランキングに参加しています(汗)。
人気ブログランキングへ






このエントリーをはてなブックマークに追加 mixiチェック

 センテンスのトピック、不変化詞の「は」のついた名詞は格については中立で、指示のステータスとも本来無関係ということを『175.私は猫です』で強調した。その際印欧語が母語の奴はそこんとこがわかってないからトピックと見ると主格だと自動解釈しやがってと暗に罵ってしまったが、そんなことしやがるのは日本人にも結構いる。それが証拠に「ハとガの違い」などと平気で言う。この二つの不変化詞は機能の点でもシンタクス上の振舞いの点でも全く別物で本来比べるべきものではない。格の中立性ということがわかっていないのである。
 指示のステータスとトピックを混同するのも困る。そういう人は文を見ると自動的にその文のトピックはどれかいなと探しはじめてしまう。例えば次の二番目の文を見てほしい。

私アメリカに行ってた友だちがいるのよ。その友だち昨日うちに遊びに来たの

ここで、「その友だち」が二番目の文のトピックだとチョンボ解釈する人は少なくない。「友だち」という指示対象のステータスが高いからだ(『181.フォルダの作り方使い方』参照)。日本語ならまだ「その友だち」に「は」がついていないからチョンボから踏みとどまれるが、これに対応する英語・ドイツ語の文では言語学者でさえ自動的に「その友だち」をトピックだと言い出す人がいる。下の文との違いをどう説明してくれるのか。

私アメリカに行ってた友だちがいるのよ。その友だち昨日うちに遊びに来たの

ここでは「その友だち」はトピックマークされているから本当にトピックだ。それに対して上の文はトピックを持たないのである。Kuroda という学者がこの区別を明確に指摘している。
 まずトピック持ちの文から見て行こう。この文はトピックとトピックでない部分との二つに分けることができる。トピックでない部分とはつまりトピックに関連して伝えたい情報だ。この情報部は「コメント部」と名前でよく呼ばれているが、ちょっと色分けしてみよう。黄色がトピック、水色がコメントである。

その友だち昨日うちに遊びに来たの

トピックマークされていない上の文は、文全体がコメント部となる。

その友だちが昨日うちに遊びに来たの

Kurodaはトピック付きで二部構成の文を categorical judgment、全コメント文を thetic judgment と呼んでいるが、この言葉自体はギリシャ哲学の時代から存在している。次のような文も定型的な「全コメ文」「トピなし文」である。

あっ、アヒルがいる

 では二部構成になっている文の構成要素は必ずトピックとコメントなのかというとそうではない。「誰が来たんですか?」という問いへの答えとして「田中さんが来ました」と発話した場合、「田中さん」は変数(疑問代名詞)「誰が」に代入されるべき定数、つまり求められた情報だが、「来ました」の方はそれがないと答えの文がブッキラボウな省略文になってしまうため、言い換えると答えの文のシンタクス構造を整えるために当該情報にくっ付けられたいわばシッポというか包み紙みたいなものである。文字を色分けしてみよう。

田中さんが来ました

この赤い部分、核心情報の部分を「フォーカス」あるいは「焦点」、緑色の包み紙を「バックグラウンド」あるいは「背景」と呼んでいる。もし同じ質問に対して「田中さん!」と答えたらその文は背景部のない前フォーカス文ということになる。

田中さん

疑問代名詞の代入ばかりでなく、元の文の一部を訂正する場合もこのフォー・バク構造(長すぎるので縮めてしまいました)となる。

A:山田さん、来ましたね!
B;いや、田中さんが来たんですよ

この場合は包み紙たるバックグランドがないと通じにくい。

 さらに見ていくとこのフォーカス・バックグランド文も全フォーカス文も同時に全コメ構造である。どちらもトピックがないからだ。色を上乗せして図示してみよう。

田中さんが来ました
田中さん

次に「昨日は誰が来ましたか?」という質問に対して「昨日は山田さんが来ました」と答えた場合だが、これはトピ・コメとフォー・バクの二重の二部構成になる。

昨日は山田さんが来ました

これらトピック、コメント、フォーカス、バックグラウンドは「文の情報コンポーネント」と呼ばれるが、そのコンポ分けの仕方に2通りある。第一は今まで見てきたようにトピ・コメとフォー・バクという二種の二項分けをそれぞれ独立に適用するやり方だ。もう一つはこの二つを統合してしまって、文の情報構造を3つのコンポーネントに分けるものである。カタロニアの Vallduví という言語学者がこの立場だったが、文をリンク link、フォーカス focus、テール tail という3つの情報部に分けていた。リンクはトピックのことで、これがいわばフォルダの働きをすることを考えれば(『181.フォルダの作り方使い方』参照)、むしろ「トピック」という名称より適切かもしれない。フォーカスは上のフォーカスと同じ意味で、文のしかるべき部分に代入すべき情報部である。テールはまさに尻尾、上の用語でいうとコメントかつバックグラウンドの部分だ。つまりトピック(リンク)に関してはフォー・バク二分割を不問にするわけである。このやり方だと非常に情報構造がすっきりと現せる。上の「昨日は山田さんが来ました」をこの3分割で現してみよう。せっかく旧来の用語をリンク、テールと上手い用語で言い換えたのだからこの際「フォーカス」も言い換えて「アップデート」と命名しようと思う。リンクが黄色、アップデートが空色、テールが薄赤。

昨日は山田さんが来ました

文字そのものの色を変えずに背景色だけですっきりと表せる。今までの他の例文もこれで表してみよう。

その友だちは昨日うちに遊びに来たの

その友だちが昨日うちに遊びに来たの

あっ、アヒルがいる

田中さんが来たんですよ

田中さんが来ました

田中さん

Vallduví はさらにそこで、あり得る文の情報構造は1.リンク・アップデート(フォーカス)、2.全アップデート、3.アップデート・テール、4.リンク・アップデート・テールの4つしかないと主張した。上でその全パターンが出そろっているが、言い換えると、1.アップデートのない文はあり得ない、2.リンクは(登場するとしたら)必ず文頭に、テールは文末に来る、の2点に絞られる。この結論は英語とカタロニア語を詳細に検討して出したものだが、アメリカの Van Valin という学者もこの原則を踏襲している。ちょっとこれを引き続き日本語で検討してみよう。「山田さんは昨日どこへ行きましたか?」という質問に対して「山田さんは昨日東京へ行きました」と答えた場合情報構造はどうなるのか。ダブル二重構造方式でなら:

山田さんは昨日東京へ行きました

統合方式だと次のようにならざるを得ない。

山田さんは昨日東京へ行きました

「行きました」はテールだからきちんと(?)素通りしてもらえるが、改めて書き換える必要のない「昨日」は「東京へ」と共にアプデ部だから上乗せで書き換えられるという解釈になる。統合方式では情報コンポがバラけて配置されることを許さないので、以下のような情報構造は認められないからだ。

山田さんは昨日東京へ行きました

ある意味では「昨日」と「東京へ」の違いを昨日東京へという風に文字の色を違えて表せる上のダブル二重方式のほうが便利とも言えるが、一方でダブル方式だと「昨日」も「行きました」もそれぞれ昨日行きましたと全く同じ色合いになってしまう。しかしこれらは省略されたときの違和感の程度が全く異なる。「山田さんは東京へ行きました」なら上の質問の答えとして完全にOKだが、「山田さんは昨日東京へ」と言って「行きました」を省略すると日本語の文としての許容度が一気に下がる。やはりこの二つは異なる情報コンポと見たほうがいい。テールは単に文脈から再建可能なだけでなく、何らかのシンタクス機能を背負っているのだ。言い換えると文の情報構造は指示のステータスとは独立ということで、『181.フォルダの作り方使い方』で議論した結論とも整合する。
 さて次に同じ問いに「昨日山田さん東京へ行きました」と答えた場合と「昨日山田さん東京へ行きました」と回答した場合との違いは何か。一見双方同じ情報構造になる。

昨日山田さんは東京へ行きました

昨日は山田さんは東京へ行きました

だが、二番目の文はVallduvíが「リンク・チェーン」、リンクの鎖と呼んでいる、リンクが複数ある構造である。次のように表すとわかりやすい。

昨日は 山田さんは 東京へ 行きました

最初の文はリンクが一つである。

昨日山田さんは 東京へ 行きました

このリンクの鎖は生成文法でマルチトピックと呼ばれているもので、英語学者にすら(?)存在を確認されている極めてありふれた情報構造である。ああそれなのに、ある時私が日本語でものを書いているとき一つの文に「は」を二回入れたら文法チェックの下線が入った。つまりこれは「要注意」の構造と言うわけか。誰だ、こんなチェック機構をプログラムに組んだのは。多分規範文法意識過多(『170.自動詞か他動詞か』参照)の国語の先生か語学教師の入れ知恵か。道理で「トピックは既知の情報」とかこの21世紀に未だに大ウソの説明をしだす人が散見されるはずだ(まあまあそう怒るなよ)。以前に「トピックは格や指示のステータスとは理論的に無関係」と描いたが、数に関しても原則的にはセンテンス内の制限はないのだ。次の文なんかには「は」が三回出てくるが、私の言語感覚では完全にOKである。

昨日東京でコンサートなかった。

 情報構造というテーマについては構造主義言語学の創成期、プラーグ学派ですでに議論され、チョムスキーに代表される生成文法にも引き継がれた。そこでワーワー議論されているところに登場したのが日本語で、この言語は英語なんかと違ってイチコロでトピックが見分けられる。「昨日山田さんは」と「昨日は山田さんは」の違い、つまりシングルリンクとマルチリンクの違いなんかも英語だと当該単語のシンタクス上の位置や発音など学者が一生懸命に議論検討しないといけないが、日本語だとネイティブスピーカーならどんな馬鹿でも一発で区別できる。「は」がついているいないでわかるからだ。このメリットのため当時の情報構造ネタの論文では必ずと言っていいほど日本語に言及されていた。私はこの「トピック」というテーマは日本語が世界の言語学に大きく貢献した部分だと思っている。日本人がその足を引っ張ってどうするんだ。

 トピックが馬鹿でも見分けられることばかりではない、もう一つ日本語母語者が情報構造論者にできる貢献がある。致命的な彼らの誤謬を指摘できるのだ。実は私は15年以上前から至る所でこれをギャーギャー叫んでいるのだが悲しい哉、叫ぶ場所があまりにも閉じた空間過ぎて誰の耳にも届かず「すみません、私が間違っていました」とこちらに謝ってきた言語学者はまだいない。いないが彼らの「アップデート部のない文はあり得ない」という主張は間違いだ。全リンク文は存在するんですなふふん。
 まず Van Valin は次のロシア語会話での Виктра?という部分を「全アップデート」、Kuroda の言葉で言えば Tethic と解釈している。なんだこれはという変な会話だが、Van Valin がアップデート(フォーカス)と解釈した部分を空色で表してみよう。

А: Максим убивает Алексея.
В: А Виктра?
А: Виктра Максим защищает.

A: Maksim kills Aleksey.
B: And Victor?
A: Victor, Maksim protects (him).

Виктра? は本当に全アプだろうか?これに対応する日本語の会話は以下のようになる。

A:マキシムはアレクセイを殺す。
B:じゃあヴィクトル
A:ヴィクトルは守るよ。

どうだ、見たか。「は」が付くんだっての。つまりこの文はまさに全リンクなのだ。
A: Maksim kills Aleksey.
B: And Victor?
A: Victor, Maksim protects (him).

統合方式、ダブル二重方式に関わらず、欧米系の情報構造論者が全員「ない」と言っている構造が日本語だとラクチンに見つかるのである。確か奥津敬一郎教授が出していた例だったと記憶しているが、自分の机の上に見知らぬ小包を発見したとき、日本人なら誰でも「これは?」とトピックマーカーをつけて聞く。「あれ、山田さんは?」など全リンク文なんて枚挙にいとまがない。
 それに対して次のような文脈で発話された Victor? は全アップデートである。英語だと上の文と非常に区別が付きにくいが日本語にしてみると一発だ。

A: Maksim kills Aleksey.
B: Victor?
A: No, It’s Maksim kills Aleksey.

A:マキシムはアレクセイを殺す
B:えっ、ヴィクトルが
A:いや、マキシムが殺すんだ。

あまり英語になっていない酷い文で恐縮だが、とにかく日本語ではここで「ヴィクトルが?」を「ヴィクトルは」にすることはできない。上の Victor?とここの Victor?は全く別の情報コンポーネントであることが、日本語にしてみると本当に馬鹿でもわかる

 「全リンク」という構造を上で述べた「あり得る文の情報構造パターン」の5として付け加えるべきだと私は思っている。


この項続きます


この記事は身の程知らずにもランキングに参加しています(汗)。
人気ブログランキングへ


このエントリーをはてなブックマークに追加 mixiチェック

10年くらい前の記事ですが足りない部分があったので(私の頭のことか?)大幅に書き加えました。表も画像にしました。

元の記事はこちら
内容はこの記事と同じです。

 少し前まではコーカサスやシベリア諸民族の言語をやるにはロシア語が不可欠だった。文献がロシア語で書いてあったからだ。今はもう論文なども英語になってきてしまっているのでロシア語が読めなくても大丈夫だろう。残念といえば残念である。別に英語が嫌いというわけではないのだが、何語であれ一言語ヘゲモニー状態には私は「便利だから」などと手放しでは喜べない。どうしても思考の幅が狭まるからだ。
 そのコーカサス地方の言語、タバサラン語についてちょっと面白い話を小耳にはさんだことがある。

 タバサラン語では「本」のことを kitab と言うそうだ。アラビア語起源なのが明らかではないか。よりによってこの kitab、あるいは子音連続 K-T-B は、私が馬鹿の一つ覚えで知っている唯一のアラビア語なのである。イスラム教とともにこの言語に借用されたのだろう。
 そこで気になったので、現在イスラム教の民族の言語で「本」を何というのかちょっと調べてみた。家に落ちていた辞書だのネットの(無料)オンライン辞書だのをめくら滅法引きまくっただけなので、ハズしているところがあるかも知れない。専門家の方がいたらご指摘いただけるとありがたい。その言語の文字で表記したほうがいいのかもしれないが、それだと不統一だし読めないものもあるのでローマ字表記にした。言語名のあとに所属語族、または語群を記した。何も記していない言語は所属語族や語群が不明のものである。「語族」と「語群」はどう違うのかというのが実は一筋縄ではいかない問題なのだが、「語族」というのは異なる言語の単語間に例外なしの音韻対応が見いだせる場合、その言語はどちらも一つの共通な祖語から発展してきたものとみなし、同一語族とするもの。この音韻対応というのは比較言語学の厳密な規則に従って導き出されるもので、単に単語が(ちょっと)似ているだけですぐ「同族言語ダー」と言い出すことは現に慎まなければいけない。時々そういうことをすぐ言い出す人がいるのは困ったものだ。現在同一語族ということが科学的に証明されているのは事実上印欧語族とセム語族だけだといっていい。そこまで厳密な証明ができていない言語は「語群」としてまとめる。もちろんまとめるからにはまとめるだけの理由があるのでこれもちょっと似た点が見つかったからと言ってフィーリングで「語群」を想定することはできない。「テュルク語」については「語族」でいいじゃないかとも思うのだが、逆に似すぎていて語族と言うより一言語じゃないかよこれ、とでも思われたのか「テュルク語族」とは言わずに「テュルク諸語」と呼んでいる。
 話が飛んで失礼。さて「本」をイスラム教国の言葉でなんというか。基本的に男性単数形を示す。
NEU07-Tabelle1
 このようにアラビア語の単語が実に幅広い語族・地域の言語に取り入れられていることがわかる。アラビア語から直接でなく一旦ペルシャ語を経由して取り入れた場合も少なくないようだが。例外はアルバニア語とボスニア語。前者は明らかにロマンス語からの借用、後者はこの言語本来の、つまりスラブ語本来の語だ。ここの民族がイスラム化したのが新しいので、言語までは影響されなかったのではないだろうか。ンドネシア語の buku は英語からの借用だと思うが、kitab という言葉もちゃんと使われている。pustaka は下で述べるように明らかにサンスクリットからの借用。インドネシア語はイスラム教が普及する(ずっと)以前にサンスクリットの波をかぶったのでその名残り。つまり pustaka は「本」を表わす3語のうちで最も古い層だろう。単語が三つ巴構造になっている。しかも調べてみるとインドネシア語には kitab と別に Alkitab という語が存在する。これは Al-kitab と分析でき、Al はアラビア語の冠詞だからいわば The-Book という泥つきというか The つきのままで借用したものだ。その Alkitab とは「聖書」という意味である。クルド語の pertuk は古アルメニア語 prtu(「紙」「葦」)からの借用だそうだがそれ以上の語源はわからない。とにかくサンスクリットの pustaka ではない。

 面白いからもっと見てみよう。「アフロ・アジア語群」というのは昔「セム・ハム語族」と呼ばれていたグループだ。アラビア語を擁するセム語の方は上でも述べたように「語族」といっていいだろうが、ハム語のほうは「族」という言葉を使っていいのかどうか個人的にちょっと「?」がつくので、現在の名称「アフロ・アジア語」のほうも「族」でなく「群」扱いしておいた。
NEU07-Tabelle2
イスラム教徒が乗り出していった地域で話されていたアフリカのスワヒリ語は「イスラム教の民族の言語」とは言いきれないのだが、「本」という文化語をアラビア語から取り入れているのがわかる。ハウサ語の「本」は形がかけ離れているので最初関係ないのかと思ったが、教えてくれた人がいて、これも「ごく早い時期に」アラビア語から借用したものなのだそうだ。ハウサ語の f は英語やドイツ語の f とは違って、日本語の「ふ」と同じく両唇摩擦音だそうだから、アラビア語bが f になったのかもしれないが、それにしても形が違いすぎる。「ごく早い時期」がいつなのかちょっとわからないのだが、ひょっとしたらイスラム教以前にすでにアラビア語と接触でもしていたのか、第三の言語を仲介したかもしれない。ソマリ語にはもう一つ buug という「本」があるが、インドネシア語の buku と同様英語からの借用である。

 インドの他の言語は次のようになる。
NEU07-Tabelle3
最後に挙げたインド南部のタミル語以外は印欧語族・インド・イラン語派で、冒頭にあげたペルシア語、ウルドゥ語、パシュトー語と言語的に非常に近い(印欧語族、インド・イラン語派)がサンスクリット形の「本」が主流だ。ベンガル語 pustok もヒンディー語 pustak もサンスクリットの pustaka 起源。ただ両言語の地域北インドは現在ではヒンドゥ―教だが、ムガル帝国の支配下にあった時期が長いのでアラビア語系の「本」も使われているのはうなづける。これは直接アラビア語から借用したのではなく、ペルシャ語を通したもの。またベンガル語の boi は英語からの借用かと思ったらサンスクリットの vahikā (「日記、帳簿」)から来ている古い語だそうだ。
 インドも南に下るとイスラム教の影響が薄れるらしく、アラビア語形が出てこなくなる。シンハラ語は仏教地域。これら印欧語はサンスクリットから「本」という語を「取り入れた」のではなく、本来の語を引き続き使っているに過ぎない。それに対してタミル語、テルグ語、マラヤラム語は印欧語ではないから、印欧語族のサンスクリットから借用したのだ。これらの言語はヒンドゥー教あるいは仏教地域である。
 とにかく言語の語彙と言うのは階層構造をなしていることがわかる。上のインドネシア語の pustaka も後にイスラム教を受け入れたのでアラビア語系の語に取って代わられたが消滅はしていない。もっともバリ島など、今もヒンドゥー教地域は残っている。そういうヒンドゥー地域では kitab は使わないのかもしれない。
 「本」を直接アラビア語からでなくペルシャ語を通して受け入れた言語も多いようだが、ではイスラム以前のペルシャ語では「本」を何といっていたのか。中期ペルシャ語(パフラヴィー語)を見ると「本」を表す語が3つあったらしい。mādayān、nāmag、nibēg の3語で、なるほどアラビア語とは関係ないようだ。本来のイラニアン語派の語だろう。 mādayān は古アルメニア語に借用され(matean、「本」)、そこからまた古ジョージア語に輸出(?)されている(maṭiane、「本、物語」)。nāmag も namak (「字」)としてやっぱり古アルメニア語に引き継がれたし、そもそも現代ペルシャ語にもnāme として残っている。「字」という意味の他に合成語に使われて「本」を表す: filmnâme(「脚本」)。最後の nibēg も nebiという形で現代ペルシャ語に細々と残っており「廃れた形」ではあるが「経典」「本」。昔はこの語でコーランを表していたそうだ。

 ではそのアルメニア語やジョージア語では現在どうなっているのか。これらの言語はタバサラン語のすぐ隣、つまりコーカサスで話されているが、キリスト教民族である。アラビア語とは見事に無関係だ。
NEU07-Tabelle4
アルメニア語の matyan は上述の古ペルシャ語 mādayān の子孫で、主流ではなくなったようだが、「雑誌」「原稿」「本」など意味が多様化してまだ存命(?)だ。ジョージア語でも maṭiane(「聖人伝」)として意味を変えたが単語としては生き残っている。girk、cigni がアルメニア語、ジョージア語本来の言葉。オセチア語の činyg は古い東スラブ語の kŭniga からの借用だそうだ。道理で現在のスラブ諸語と形がそっくりだ(下記)。オセチア語と上にあげたイスラム教のタジク語は同じ印欧語のイラニアン語派だし話されている地域も互いにごく近いのに語彙が明確に違っているのが非常に面白い。しかしそのタジク語にも上記中世ペルシャ語の nāmag に対応する noma(「字」)という言葉が存在する。

 また次の言語はセム語族で、言語的には本家アラビア語と近いのに「本」を kitab と言わない。アムハラ・エチオピア民族はキリスト教国だったし、ヘブライ語はもちろんユダヤ教。
NEU07-Tabelle5
 アムハラ語はもちろんゲエズ語からの引継ぎだが、後者はヨーロッパのラテン語と同じく死語なので、本当の音価はわからない。ゲエズ文字をアムハラ語で読んでいるわけだから音形が全く同じになるのは当然と言えば当然だ。アムハラ語もゲエズ語もさすがセム語族だけあって「語幹は3子音からなる」という原則を保持している。これもアラビア語と同様 m- の部分は語幹には属さない接頭辞だから差し引くと、この語の語幹は ṣ-h-f となる。その語幹の動詞 ṣäḥäfä は「書く」。このゲエズ語の「本」はアラビア語に maṣḥaf という形で借用され、「本」「写本」という意味で使われている。アラビア語の方が借用したとはまた凄いが、それどころではなく、ヘブライ語までこのゲエズ語を輸入している。ヘブライ語には「聖書の写本」を表す mitskháf  という単語があるが、これは mäṣḥäf の借用だそうだ。なおゲエズ語の動詞の ṣäḥäfä は古典アラビア語の ṣaḵafa に対応していると考えられるが、後者は「書く」でなく「地面を掘る」という意味だそうだ。は? 
 ヘブライ語の sefer(語根はs-f-r、f は本来帯気の p だそうだ)はアッカド語の時代から続く古い古いセム語の単語で、アラビア語にもその親戚語 sifr という「本」を表す語が存在する。ただ使用範囲が限定されているようだ。
 逆にヘブライ語には katáv(「書く」)あるいは ktivá(「書くこと」)という語もある。一目瞭然、アラビア語の k-t-b と対応する形だ。「本」という意味はないようだが、とにかく単語自体はアラビア語、ヘブライ語どちらにも存在し、そのどちらがメインで「本」という意味を担っているかの程度に違いがあるだけだ。
 
 それにしても「本」などという文化語は時代が相当下ってからでないと生じないはずだ。本が存在するためにはまず文字が発明されていなければいけないからだ。当該言語が文字を持っていなかったら(文字のない言語など特に昔はゴロゴロあった)本もへったくれもない。だから当時の「先進国」から本という実体が入ってきたのと同時にそれを表す言葉も取り入れたことが多かったのだろう。普通「その国にないもの」が導入される時は外来語をそのまま使う。日本語の「パン」「ガラス」などいい例だ。
 言い換えると「本」という語は宗教と共にということもあるが文字文化と共に輸入されたという側面も大きいに違いない。イスラム教が来る以前にすでにローマ文化やラテン語と接していたアルバニア、グラゴール文字、キリル文字、ラテン文字など、文字文化にふれていたボスニアで、「本」がアラビア語にとって変わられなかったのもそれで説明できる。そういえばバルカン半島に文字が広まったのはキリスト教宣教と共にで、9世紀のことだ。イスラム教はすでに世界を席捲していたが、バルカン半島にイスラム教が入ってきたのはトルコ経由で14世紀になってからだ。当地にはとっくに書き言葉の文化が確立されていた。
 アルメニア語、ジョージア語、アムハラ語(ゲーズ語)も古い文字の伝統があって、独自の文字を発達させていた。ヘブライ語やサンスクリット、タミル語は言わずもがな、イスラム教どころかキリスト教が発生する何百年も前から文字が存在した。外来語に対する抵抗力があったのだろう。

 まとめてみるとこうなる。イスラムの台頭とともにアラビア語の「本」という語が当地の言語に語族の如何を問わずブワーッと広まった。特にそれまで文字文化を持っていなかった民族言語は何の抵抗もなく受け入れた。
 すでに文字文化を持っていた言語はちょっと様子が違い、イスラム以前からの語が引き続き使われたか、アラビア語の「本」を取り入れたのしても昔からの語は生き残った。ただその際意味変化するか、使用範囲が狭くなった。
 イスラム教の波を被らなかった民族の言語はアラビア語系の語を取り入れなかった。
 その一方、初期イスラム教のインパクトがどれほど強かったのか改めて見せつけられる思いだ。千年にわたる文字文化を誇っていたペルシャ語、サンスクリットという二大印欧語を敵に回して(?)一歩も引かず、本来の語、mādayān などを四散させてしまった。その際ペルシャ語は文字までアラビア文字に転換した。もっともそれまで使っていたパフラヴィ―文字はアラム文字系統だったからアラビア文字への転換は別に画期的と言えるほどではなかっただろうが、その侵略された(?)ペルシャ語は外来のアラビア語をさらに増幅して広める助けまでしたのだ。ペルシャ語のこのアンプ作用がなかったら中央アジアにまではアラビア語形は浸透しなかったかもしれない。
 ボスニア、アルバニアはずっと時代が下ってからだったから語が転換せずに済んだのだろう。

 実はなんとベラルーシ語にもこのアラビア語起源の кітаб (kitab)言う語が存在する。「本」一般ではなくイスラム教の宗教書のことだが、これはベラルーシ語がリプカ・タタール人によってアラビア文字で表記されていた時代の名残である。このアラビア語表記は16世紀ごろから20世紀に入るまで使われていた。そのころはトルコ語もアラビア文字表記されていて、現在のラテン語表記になったのはやはり20世紀初頭だ。
 このリプカ・タタール人というのはベラルーシばかりでなく、ポーランドやリトアニアにもいる。私がヨーロッパ系のポーランド人から自国内のリプカ・タタール人(国籍としてはポーランド人)と間違われたことは以前にも書いた通りだ。自慢にもならないが。

この記事は身の程知らずにもランキングに参加しています(汗)。
人気ブログランキングへ
このエントリーをはてなブックマークに追加 mixiチェック

↑このページのトップヘ