アルザスのこちら側

一般言語学を専攻し、学位はとったはいいがあとが続かず、ドイツの片隅の大学のさらに片隅でヒステリーを起こしているヘタレ非常勤講師が人を食ったような記事を無責任にガーガー書きなぐっています。それで「人食いアヒルの子」と名のっております。 どうぞよろしくお願いします。

タグ:トルコ語

 少し前まではコーカサスやシベリア諸民族の言語をやるにはロシア語が不可欠だった。文献がロシア語で書いてあったからだ。今はもう論文なども英語になってきてしまっているのでロシア語が読めなくても大丈夫だろう。残念といえば残念である。別に英語が嫌いというわけではないのだが、何語であれ一言語ヘゲモニー状態には私は「便利だから」などと手放しでは喜べない。どうしても思考の幅が狭まるからだ。
 そのコーカサス地方の言語、タバサラン語についてちょっと面白い話を小耳にはさんだことがある。

 タバサラン語では「本」のことを kitab と言うそうだ。アラビア語起源なのが明らかではないか。よりによってこの kitab、あるいは子音連続 K-T-B は、私が馬鹿の一つ覚えで知っている唯一のアラビア語なのである。イスラム教とともにこの言語に借用されたのだろう。
 そこで気になったので、現在イスラム教の民族の言語で「本」を何というのかちょっと調べてみた。家に落ちていた辞書だのネットの(無料)オンライン辞書だのをめくら滅法引きまくっただけなので、ハズしているところがあるかも知れない。専門家の方がいたらご指摘いただけるとありがたい。その言語の文字で表記したほうがいいのかもしれないが、それだと不統一だし読めないものもあるのでローマ字表記にした。言語名のあとに所属語族、または語群を記した。何も記していない言語は所属語族や語群が不明のものである。「語族」と「語群」はどう違うのかというのが実は一筋縄ではいかない問題なのだが、「語族」というのは異なる言語の単語間に例外なしの音韻対応が見いだせる場合、その言語はどちらも一つの共通な祖語から発展してきたものとみなし、同一語族とするもの。この音韻対応というのは比較言語学の厳密な規則に従って導き出されるもので、単に単語が(ちょっと)似ているだけですぐ「同族言語ダー」と言い出すことは現に慎まなければいけない。時々そういうことをすぐ言い出す人がいるのは困ったものだ。現在同一語族ということが科学的に証明されているのは事実上印欧語族とセム語族だけだといっていい。そこまで厳密な証明ができていない言語は「語群」としてまとめる。もちろんまとめるからにはまとめるだけの理由があるのでこれもちょっと似た点が見つかったからと言ってフィーリングで「語群」を想定することはできない。「テュルク語」については「語族」でいいじゃないかとも思うのだが、逆に似すぎていて語族と言うより一言語じゃないかよこれ、とでも思われたのか「テュルク語族」とは言わずに「テュルク諸語」と呼んでいる。
 話が飛んで失礼。さて「本」をイスラム教国の言葉でなんというか。基本的に男性単数形を示す。
NEU07-Tabelle1
 このようにアラビア語の単語が実に幅広い語族・地域の言語に取り入れられていることがわかる。アラビア語から直接でなく一旦ペルシャ語を経由して取り入れた場合も少なくないようだが。例外はアルバニア語とボスニア語。前者は明らかにロマンス語からの借用、後者はこの言語本来の、つまりスラブ語本来の語だ。ここの民族がイスラム化したのが新しいので、言語までは影響されなかったのではないだろうか。ンドネシア語の buku は英語からの借用だと思うが、kitab という言葉もちゃんと使われている。pustaka は下で述べるように明らかにサンスクリットからの借用。インドネシア語はイスラム教が普及する(ずっと)以前にサンスクリットの波をかぶったのでその名残り。つまり pustaka は「本」を表わす3語のうちで最も古い層だろう。単語が三つ巴構造になっている。しかも調べてみるとインドネシア語には kitab と別に Alkitab という語が存在する。これは Al-kitab と分析でき、Al はアラビア語の冠詞だからいわば The-Book という泥つきというか The つきのままで借用したものだ。その Alkitab とは「聖書」という意味である。クルド語の pertuk は古アルメニア語 prtu(「紙」「葦」)からの借用だそうだがそれ以上の語源はわからない。とにかくサンスクリットの pustaka ではない。

 面白いからもっと見てみよう。「アフロ・アジア語群」というのは昔「セム・ハム語族」と呼ばれていたグループだ。アラビア語を擁するセム語の方は上でも述べたように「語族」といっていいだろうが、ハム語のほうは「族」という言葉を使っていいのかどうか個人的にちょっと「?」がつくので、現在の名称「アフロ・アジア語」のほうも「族」でなく「群」扱いしておいた。
NEU07-Tabelle2
イスラム教徒が乗り出していった地域で話されていたアフリカのスワヒリ語は「イスラム教の民族の言語」とは言いきれないのだが、「本」という文化語をアラビア語から取り入れているのがわかる。ハウサ語の「本」は形がかけ離れているので最初関係ないのかと思ったが、教えてくれた人がいて、これも「ごく早い時期に」アラビア語から借用したものなのだそうだ。ハウサ語の f は英語やドイツ語の f とは違って、日本語の「ふ」と同じく両唇摩擦音だそうだから、アラビア語bが f になったのかもしれないが、それにしても形が違いすぎる。「ごく早い時期」がいつなのかちょっとわからないのだが、ひょっとしたらイスラム教以前にすでにアラビア語と接触でもしていたのか、第三の言語を仲介したかもしれない。ソマリ語にはもう一つ buug という「本」があるが、インドネシア語の buku と同様英語からの借用である。

 インドの他の言語は次のようになる。
NEU07-Tabelle3
最後に挙げたインド南部のタミル語以外は印欧語族・インド・イラン語派で、冒頭にあげたペルシア語、ウルドゥ語、パシュトー語と言語的に非常に近い(印欧語族、インド・イラン語派)がサンスクリット形の「本」が主流だ。ベンガル語 pustok もヒンディー語 pustak もサンスクリットの pustaka 起源。ただ両言語の地域北インドは現在ではヒンドゥ―教だが、ムガル帝国の支配下にあった時期が長いのでアラビア語系の「本」も使われているのはうなづける。これは直接アラビア語から借用したのではなく、ペルシャ語を通したもの。またベンガル語の boi は英語からの借用かと思ったらサンスクリットの vahikā (「日記、帳簿」)から来ている古い語だそうだ。
 インドも南に下るとイスラム教の影響が薄れるらしく、アラビア語形が出てこなくなる。シンハラ語は仏教地域。これら印欧語はサンスクリットから「本」という語を「取り入れた」のではなく、本来の語を引き続き使っているに過ぎない。それに対してタミル語、テルグ語、マラヤラム語は印欧語ではないから、印欧語族のサンスクリットから借用したのだ。これらの言語はヒンドゥー教あるいは仏教地域である。
 とにかく言語の語彙と言うのは階層構造をなしていることがわかる。上のインドネシア語の pustaka も後にイスラム教を受け入れたのでアラビア語系の語に取って代わられたが消滅はしていない。もっともバリ島など、今もヒンドゥー教地域は残っている。そういうヒンドゥー地域では kitab は使わないのかもしれない。
 「本」を直接アラビア語からでなくペルシャ語を通して受け入れた言語も多いようだが、ではイスラム以前のペルシャ語では「本」を何といっていたのか。中期ペルシャ語(パフラヴィー語)を見ると「本」を表す語が3つあったらしい。mādayān、nāmag、nibēg の3語で、なるほどアラビア語とは関係ないようだ。本来のイラニアン語派の語だろう。 mādayān は古アルメニア語に借用され(matean、「本」)、そこからまた古ジョージア語に輸出(?)されている(maṭiane、「本、物語」)。nāmag も namak (「字」)としてやっぱり古アルメニア語に引き継がれたし、そもそも現代ペルシャ語にもnāme として残っている。「字」という意味の他に合成語に使われて「本」を表す: filmnâme(「脚本」)。最後の nibēg も nebiという形で現代ペルシャ語に細々と残っており「廃れた形」ではあるが「経典」「本」。昔はこの語でコーランを表していたそうだ。

 ではそのアルメニア語やジョージア語では現在どうなっているのか。これらの言語はタバサラン語のすぐ隣、つまりコーカサスで話されているが、キリスト教民族である。アラビア語とは見事に無関係だ。
NEU07-Tabelle4
アルメニア語の matyan は上述の古ペルシャ語 mādayān の子孫で、主流ではなくなったようだが、「雑誌」「原稿」「本」など意味が多様化してまだ存命(?)だ。ジョージア語でも maṭiane(「聖人伝」)として意味を変えたが単語としては生き残っている。girk、cigni がアルメニア語、ジョージア語本来の言葉。オセチア語の činyg は古い東スラブ語の kŭniga からの借用だそうだ。道理で現在のスラブ諸語と形がそっくりだ(下記)。オセチア語と上にあげたイスラム教のタジク語は同じ印欧語のイラニアン語派だし話されている地域も互いにごく近いのに語彙が明確に違っているのが非常に面白い。しかしそのタジク語にも上記中世ペルシャ語の nāmag に対応する noma(「字」)という言葉が存在する。

 また次の言語はセム語族で、言語的には本家アラビア語と近いのに「本」を kitab と言わない。アムハラ・エチオピア民族はキリスト教国だったし、ヘブライ語はもちろんユダヤ教。
NEU07-Tabelle5
 アムハラ語はもちろんゲエズ語からの引継ぎだが、後者はヨーロッパのラテン語と同じく死語なので、本当の音価はわからない。ゲエズ文字をアムハラ語で読んでいるわけだから音形が全く同じになるのは当然と言えば当然だ。アムハラ語もゲエズ語もさすがセム語族だけあって「語幹は3子音からなる」という原則を保持している。これもアラビア語と同様 m- の部分は語幹には属さない接頭辞だから差し引くと、この語の語幹は ṣ-h-f となる。その語幹の動詞 ṣäḥäfä は「書く」。このゲエズ語の「本」はアラビア語に maṣḥaf という形で借用され、「本」「写本」という意味で使われている。アラビア語の方が借用したとはまた凄いが、それどころではなく、ヘブライ語までこのゲエズ語を輸入している。ヘブライ語には「聖書の写本」を表す mitskháf  という単語があるが、これは mäṣḥäf の借用だそうだ。なおゲエズ語の動詞の ṣäḥäfä は古典アラビア語の ṣaḵafa に対応していると考えられるが、後者は「書く」でなく「地面を掘る」という意味だそうだ。は? 
 ヘブライ語の sefer(語根はs-f-r、f は本来帯気の p だそうだ)はアッカド語の時代から続く古い古いセム語の単語で、アラビア語にもその親戚語 sifr という「本」を表す語が存在する。ただ使用範囲が限定されているようだ。
 逆にヘブライ語には katáv(「書く」)あるいは ktivá(「書くこと」)という語もある。一目瞭然、アラビア語の k-t-b と対応する形だ。「本」という意味はないようだが、とにかく単語自体はアラビア語、ヘブライ語どちらにも存在し、そのどちらがメインで「本」という意味を担っているかの程度に違いがあるだけだ。
 
 それにしても「本」などという文化語は時代が相当下ってからでないと生じないはずだ。本が存在するためにはまず文字が発明されていなければいけないからだ。当該言語が文字を持っていなかったら(文字のない言語など特に昔はゴロゴロあった)本もへったくれもない。だから当時の「先進国」から本という実体が入ってきたのと同時にそれを表す言葉も取り入れたことが多かったのだろう。普通「その国にないもの」が導入される時は外来語をそのまま使う。日本語の「パン」「ガラス」などいい例だ。
 言い換えると「本」という語は宗教と共にということもあるが文字文化と共に輸入されたという側面も大きいに違いない。イスラム教が来る以前にすでにローマ文化やラテン語と接していたアルバニア、グラゴール文字、キリル文字、ラテン文字など、文字文化にふれていたボスニアで、「本」がアラビア語にとって変わられなかったのもそれで説明できる。そういえばバルカン半島に文字が広まったのはキリスト教宣教と共にで、9世紀のことだ。イスラム教はすでに世界を席捲していたが、バルカン半島にイスラム教が入ってきたのはトルコ経由で14世紀になってからだ。当地にはとっくに書き言葉の文化が確立されていた。
 アルメニア語、ジョージア語、アムハラ語(ゲーズ語)も古い文字の伝統があって、独自の文字を発達させていた。ヘブライ語やサンスクリット、タミル語は言わずもがな、イスラム教どころかキリスト教が発生する何百年も前から文字が存在した。外来語に対する抵抗力があったのだろう。

 まとめてみるとこうなる。イスラムの台頭とともにアラビア語の「本」という語が当地の言語に語族の如何を問わずブワーッと広まった。特にそれまで文字文化を持っていなかった民族言語は何の抵抗もなく受け入れた。
 すでに文字文化を持っていた言語はちょっと様子が違い、イスラム以前からの語が引き続き使われたか、アラビア語の「本」を取り入れたのしても昔からの語は生き残った。ただその際意味変化するか、使用範囲が狭くなった。
 イスラム教の波を被らなかった民族の言語はアラビア語系の語を取り入れなかった。
 その一方、初期イスラム教のインパクトがどれほど強かったのか改めて見せつけられる思いだ。千年にわたる文字文化を誇っていたペルシャ語、サンスクリットという二大印欧語を敵に回して(?)一歩も引かず、本来の語、mādayān などを四散させてしまった。その際ペルシャ語は文字までアラビア文字に転換した。もっともそれまで使っていたパフラヴィ―文字はアラム文字系統だったからアラビア文字への転換は別に画期的と言えるほどではなかっただろうが、その侵略された(?)ペルシャ語は外来のアラビア語をさらに増幅して広める助けまでしたのだ。ペルシャ語のこのアンプ作用がなかったら中央アジアにまではアラビア語形は浸透しなかったかもしれない。
 ボスニア、アルバニアはずっと時代が下ってからだったから語が転換せずに済んだのだろう。

 実はなんとベラルーシ語にもこのアラビア語起源の кітаб (kitab)言う語が存在する。「本」一般ではなくイスラム教の宗教書のことだが、これはベラルーシ語がリプカ・タタール人によってアラビア文字で表記されていた時代の名残である。このアラビア語表記は16世紀ごろから20世紀に入るまで使われていた。そのころはトルコ語もアラビア文字表記されていて、現在のラテン語表記になったのはやはり20世紀初頭だ。
 このリプカ・タタール人というのはベラルーシばかりでなく、ポーランドやリトアニアにもいる。私がヨーロッパ系のポーランド人から自国内のリプカ・タタール人(国籍としてはポーランド人)と間違われたことは以前にも書いた通りだ。自慢にもならないが。

この記事は身の程知らずにもランキングに参加しています(汗)。
人気ブログランキングへ
このエントリーをはてなブックマークに追加 mixiチェック

 子供の頃、英語で「私には姉がいる」をI have a sisterというと聞いて驚愕したことをまだ覚えている。まず「姉」と「妹」を区別しないのに驚いたが、この文脈で「持つ」という動詞を使うのがまた意外だった。日本語ならここで英語のbe、ドイツ語のseinにあたる「ある・いる」という動詞で表現する。
この、「ある」か「持つ」か、つまりbeかhaveかという区別はよく議論されるテーマだそうで、そもそもの言いだしっぺはA・メイエとその弟子のE・バンヴェニストあたりらしい。「be言語」「have言語」という言葉も聞くが、実は私はいままであまり深く考えもせずにテキトーに(またかよ)これらの言葉を使っていた。私が理解していたのはだいたい次のようなことだ。
 大まかにいって現在のヨーロッパにおける印欧諸語がhave言語なのに対し、ヨーロッパでも非印欧語は、フィンランド語やハンガリー語などはbe言語である。 さらにロシア語を含む東スラブ諸語は日本語と同じくbeを使う、つまり「私には姉がいる」タイプだが、南スラブ諸語・西スラブ諸語は「私は姉を持っている」である。

 ところが実際はどうもそう単純に片付けられる問題ではないらしい。まず第一にヨーロッパ外の印欧語でもhaveを使うものや逆にヨーロッパの印欧語でもbeを使う例があるし、第二にそもそもhaveもbeも両方使う言語が多いので、これはhave言語、あれはbe言語とギッチリきれいに線引きすることはできない。ちょっと調べてみた。

 まずヨーロッパの非印欧語トルコ語は図式通りにbe言語で、そもそもhaveにあたる動詞がないそうだ。「ある」または「ない」にあたるvarとyokを使う。

bir ev-im var
一軒の + 家が-私の + ある
→ 私には家が一軒ある。(= 私は家を一軒持っている)

 
telefon-um yok
電話-私の + ない
→ 私には電話がない。(= 私は電話を持っていない)

ちなみにhaveをトルコ語辞書で引くとsahip olmakと出てくる。sahipが「所有者」(しかもアラビア語からの外来語)、olmakが「ある」だから、「○○の所有者である」と表現するしかないらしい。日本語ではここで「トルコ語にはhaveにあたる動詞がない」と「トルコ語はhaveにあたる動詞を持たない」の両方の表現が可能だから、それに比べてもトルコ語は相当ハードなbe言語だ。

 古モンゴル語もbe言語だったそうだが、トルコ語と違って「私」は属格でなく与格(処格)になる。

nadur morin buy
私に + 一匹の馬が + いる・ある
→ 私には馬が一匹いる。(= 私は馬を一匹持っている)


 古グルジア語もbe。

ara ars čuen tana uprojs xut xueza puri
ある +(否定)+ 我々に + と共に + より多い + より + 5 + パンが
→ 我々には5個以上のパンがない。
(= 我々は5個以上のパンを持っていない)


 ところがこれと平行した構造は印欧語の古典ギリシア語でも成り立つそうだ。つまり古典ギリシア語はヨーロッパの印欧語のくせにbeも許すのだ。

ούχ εισίν ημιν πλειον ή πέντε άρτοι
(否定) + ある + 我々に + より + 多い + より + 5 +  パンが(複数主格)
→ 我々には5個以上のパンがない。

しかし古典ギリシャ語はその一方でhave構造も使うから油断できない。

Οὐκ ἔχω ἄνδρα
(否定) + 持つ(一人称単数)+ 夫を
→ 私は夫を持っていない (= 「私には夫がいない」)

 胸焼けがして来そうだが、ついでにヒッタイト語もbeを使ったそうだ。

tuqqa UL kuitki ešzi

このULというのは何なのかよくわからないのだが、とにかくtuqqaが「君に」、kuitkiがnothing、ešziが「ある・いる」で、全体としては「君には何もない」。ちなみにこのヒッタイト語というのはこれでも一応印欧語である。俄かには信じられないがそれでもešziというコピュラにちょっと印欧語らしさがのぞく。
 現代モンゴル語、現代グルジア語、現代ギリシャ語がどうなっているのか気にはなったのだが調べるのがメンド臭かったので(またかよ)先を続ける。

 さらなるヨーロッパ外の印欧語クルド語もbeを使うそうで、

min hespek heye
私に + 一匹の馬が + いる
→ 私には馬が一匹いる。(= 私は馬を一匹持っている)

これに対してお隣の印欧語ペルシャ語はhaveを使うそうだ。人から聞いたところでは
man khahar daram
私(主格)+ 妹または姉 + 持つ(一人称・単数)
→ 私は姉(妹)を持っている (=私には姉(妹)がいる)

  
 もっとも、特に古典語はhaveを使った例があるからといって他方のbe(あるいはその逆)を使わなかったという証明にはならないところが辛い。構造としては許されているが、たまたま使用例が残っていなかっただけかもしれないのだ。言語問題と言うのは結局ネイティブスピーカーを捕まえて聞いてみるしかないのだが、古典語はそれができない。クルド語・ペルシャ語もちょっとネイティブスピーカーがつかまらなかったのでもう一方のバージョンが完全にNGなのかどうか確認はしていない。

「ヨーロッパの印欧語」ではロシア語が結構キッパリbe言語だと名付けられるので有名だ。「私には子供がいます」という時ロシア語でも「いる」を使うと聞いて「おお、日本語と同じじゃないか」と感動したのは私だけではないはずだ。

У меня есть ребёнок
のところに + 私の + いる・ある + 子供が
→ 私には子供がいる。

(日本語で「私は子供を持っている」は成り立たない)

南スラブ語のクロアチア語はhaveだ。ロシア語の「子供がいる形構造」に狂喜していた私はクロアチア語がhave言語ときいてガッカリしたものだ。

imam kuću
持つ(一人称単数) + 家を
→ 私は家を持っている。

(日本語では「私には家がある」も可能)

クロアチア語にはさらにhaveが非人称表現を作り、英語で言えばthere is Xをit has Xと表現するのだ。ima Xで、「Xがない、いない」だが、このimaというのは動詞「持つ」(不定形はimati)の3人称単数形である。ドイツ語もここで非人称表現を使ってes gibt X(it gives X)というから動詞は違っているが(geben=give)発想はそっくり。例えば授業の始めに出席を取るとき、「Aさんはいますか?」と聞くとき「ima li A?」といい、いるかどうか聞かれた学生は「ima!」(「いますよ!」)と言って手を挙げる。
 このように南スラブ諸語、あと基本的に西スラブ諸語もhave言語と言っていいが、ポーランド語は例外で両方OKらしい。

mam samochód
持つ(一人称単数)+ 自動車を
→ 私は自動車を持っている。

u jednego był długi muszkiet
~のところに + 一人の人の + あった + 長い + マスケットが
→ ある人のところに長いマスケット銃があった。


どうしてここで突然マスケット銃が出てくるのか面食らう例文だが、これは日本語では「持つ」を使って「ある人が長いマスケット銃を持っていた」と言ったほうが自然ではないか。(「長いマスケット銃」とわざわざ言っている、ということは「短いマスケット銃」というのもあるのか?)
 
 ウクライナ語も両方許されるそうで、

Я маю машину.
私 が + 持つ + 車を
→ 私は車を持っている。

У мене є машина.
~のところに + 私 + ある + 車が
→ 私には車がある。


はどちらもOK。ベラルーシ語も同じだそうだ。

 遡って古教会スラブ語ではhave構造が散見されるだが、面白いことにギリシア語のhave(έχειν)は必ずといっていいほど古教会スラブ語でもhave(imĕti)を使って訳してあるとのことだ。古教会スラブ語は南スラブ語だから、その子孫が現在を使っているのもうなずける。さらに実際はbe言語の(はずの)ロシア語も古いテキストではhaveを使っているのが見られるという。

 フランス語にも実は一見「~に~がある」に対応する構造est à moiがあるが、意味と言うか機能に少し差があるから注意を要する。ラテン語のest mihi liber(私には本がある)とhabeō librum(私は本を持っている)が同じ意味になるのとは違うのだ。be (être à)は定冠詞を取らないといけないし、have (avoir)は不定冠詞と使ったほうがずっと許容度が高いそうだ。

Ce livre est à moi.
* Un livre est à moi.

J’ai un livre.
? J’ai ce livre

 バンヴェニストは一般的に所有関係の表現はbeからhaveへ移行していくのであって、その逆ではない、という見解を述べている。古教会スラブ語とロシア語を比べて見るとちょっと待ったと言いたくなるが、長い目で見るとやっぱり全体的にはhaveへ移行中なのだろうか。日本語も昔は「会議がありました」以外考えられなかったのに最近は「会議が持たれました」という言い回しも聞くし、そのうち「私は子供を持っています」のほうが普通になるかもしれない。


この記事は身の程知らずにもランキングに参加しています(汗)。
 人気ブログランキング
人気ブログランキングへ
このエントリーをはてなブックマークに追加 mixiチェック

 2013年にボストンマラソンに爆弾が仕掛けられたことがあった。犯人はツァルナエフという兄弟だったが、兄は射殺され弟は捕まった。
 この事件で真っ先に気になったのが「ジョハル」という弟の名前の出所だ。当時の新聞を見ると犯人はチェチェン人、とあり、キルギスタンやカザフスタン、ロシアなどを転々とした後、現在両親はダゲスタンにいる、ということだった。するとこの名前はチェチェン語なのか。チェチェン語はいわゆるコーカサス言語で『51.無視された大発見』で述べたような能格構造を持っている。私の見た新聞ではこの名前がローマ字でしか発表されていなかったので、こちらで勝手にロシア語綴りを想定してджохарとして検索したところ本当に説明が見つかった。

Джохар (араб. جوهر‎ чеч. ДжовхIар):мужское имя персидско-арабского происхождения, часто встречаемое в Чечне, изредка в Дагестане, Азербайджане и Иране.

「「ジョハル」(アラビア語جوهر、チェチェン語でДжовхIар「ジョフヒアル」):ペルシア語・アラビア語起源の男性の名前で、チェチェンに多く見られるが、ダゲスタン、アゼルバイジャン、イランにも時々ある。」
 
 さらにТ. А. Шумовский (T.A.シュモフスキー)という学者が次のように書いているそうだ。

«На бытовом уровне обращает на себя внимание персидское гавхар — „драгоценный камень“, которое, перейдя в арабское джавхар с тем же значением, создало помимо нарицательных на русской и английской почве собственные имена: индийское Джавахарлал, чеченское Джохар, армянское Гоар»

「ペルシャ語の単語гавхар「ガヴハル」がよく使われているのが注目される。これは「宝石」という意味で、アラビア語にも「ジャヴハル」として借用され同義に使われているが、普通名詞以外でもロシア語や英語圏で固有名詞のもとになった:ヒンディー語の名前「ジャヴァハルラル」、チェチェン語「ジョハル」、アルメニア語「ゴアル」など。」

この「英語圏」английской почвеというのは「印欧語圏」の間違いではないのか?また文脈から判断すると「ロシア」にはチェチェン語やダゲスタン語域などロシア語をリングア・フランカとして話す地域も勘定されているようだ。
 
 しかしそれより気になったのはその上の説明で「ペルシア語・アラビア語起源」とあって、ペルシャ語とアラビア語がハイフンでつながっていることだ。これらの言語は全然語族が違うからこの二つをくっつけるのは無理があるのではないか。この語はペルシャ語かアラビア語のどちらかが他方から借用したはずだ。シュモフスキーはペルシャ語が元、と言っているがそれはどうやってわかるのか?アラビア語と似た形の語形ならそこここの言語に見られる:

1.ルーマニア語の「宝石」giuvaierはオスマン時代のトルコ語cevher(「宝石・本質」)から借用されたもの。トルコ人のCevahirという名前(男女共)もこれと同源だそうだ(対応するアラビア語のJawahirとは女性の名前)。「宝石」はアラビア語でجَوْهَر ‎(jawhar)である。
 さらにトルコ語には「宝石・鉱石」という意味のmücevherという言葉がある。ここで接頭辞がmü とウムラウト化しているのは母音調和のためだろう。トルコ語mücevherの元のアラビア語の言葉مُجَوهَر (mujawhar) は本来「宝石で飾られた(もの)」という意味だそうだ。
 私が馬鹿の一つ覚えで聞いているアラビア語(『7.「本」はどこから来たか』の項参照)K-T-Bにも次のようなmuのついている例があった:

kitāb(書物);kātib(著者); maktūb (手紙);mukātaba(文書)

これで一つ覚えが一気に「馬鹿の四つ覚え」になった。すごい進歩である。

2.インドネシア語jauharもアラビア語からの借用。
3.スワヒリ語johariも見ての通りアラビア語から。
4.ヨーロッパのイスラム教国の言語、アルバニア語では「宝もの」をxhevahirと言うが、xh は dž と発音するから、これも露骨にアラビア語からの借用である。
5.スペイン語にも一目でアラビア語起源とわかるalhaja(「宝石」)という単語があった。インドネシア語のAlkitab(「聖書」「コーラン」)と同じく定冠詞つきの借用だ。ただしこれは「ジャヴハル」および「ジョハル」とは別の حاجه (ḥāǧah) という語からきていて、本来「必要な物」とか「欲望」とかいう意味だとのことだ。

 このようにあまりにもあちこちの言語でアラビア語の「宝石」が借用されているのを見て(スペイン語は別単語ではあるが)こりゃペルシャ語の方がイスラム教といっしょにアラビア語から取り入れたのではないか、という疑いがわいてきた。アルメニア語はそのペルシャ語を通したのではないだろうか。
 で、手始めに両言語の音韻組織を調べて見た。

(1)ペルシャ語
persisch

(2)アラビア語 I
Arabisch-Deutsch

(3)アラビア語 II
Arabisch_Englisch


すると「手始め」のつもりがこれで結論が出てしまった。疑いはほぼ解消。こりゃペルシャ語→アラビア語という方向しかありえない。
 まずここでの注目点は g と dž との対応だ。ペルシャ語がアラビア語から取り入れた、と仮定するとどうしてdžの音(国際音声字母だと [ʤ] )がペルシャ語で g ([g])になるのか説明がつかない。反対にペルシャ語からアラビア語に流れた、と仮定すると簡単に説明できてしまうのだ。

 アラビア語は [g] と [ʤ] を音韻的に区別しない。どちらの音も /dž/(英語の j にあたる)という音素なのである。つまりこれらはアロフォン(異音、絶対「異音素」と混同しないように)である。上の(2)を見て欲しい。 /g/ という独立した音素がない。アラビア語の ج という字は標準アラビア語では[ʤ] と発音するが、地域によってはこれを [g] と発音するところもあるし、そもそも日本語での l と r と同じく、どっちで発音しても構わないのだ。(3)のʒ~d͡ʒ~ɟ~ɡj~ɡ という部分を見るとわかるように [g] から [ʤ] まで様々な音が同じ音素の異音となっている。アラビア語では無声子音の [k] は独立音素だが、有声の [g] は音素ではないのである。
 例を挙げる。下のج という形はこの字を単独で書いた場合の形で語頭での字形は下の一番右にあるように >の下に点がついているような字だが、同じ字をエジプト方言ではg、標準アラビア語では j、つまり dž と発音することがわかるだろう。

「宝石・宝物」
標準アラビア語: جوهرة (jáwhara)
エジプト方言: جوهرة (gawhara)

「キャメル」(جمل、「駱駝」)という英語の元になったアラビア語の「駱駝」の最初の文字(右端)もこれだが、標準アラビア語というか中近東では「ジャメル」である。「カメル」あるいは「ガメル」というのはエジプト方言の発音で、イギリス人はここからとりいれたのだろう。
 
 なので、ペルシア語の g をアラビア語では جで写し取り、その字の標準アラビア語発音で dž と読んだ、そのアラビア語発音がさらに他の言語、特にイスラム教の民族の言語に伝わった、と考えると非常にすっきり説明ができる。アルメニア語はアラビア語を通さず直接ペルシャ語から取り入れたか、そもそもペルシャ語もアルメニア語も印欧語だから元の古い形がどっちにも残っていた、つまり同源だったためか、g の音が残ったのだろう。
 ルーマニア語もこれをdž で取り入れているが(上記参照)、これはアラビア語からの直接借用でなく、アラビア語からこの語を借用したトルコ語をさらに仲介している。ペルシア語→アラビア語→トルコ語→ルーマニア語という経路だ。ひょっとしたらトルコ語との間にさらにブルガリア語が介入しているのではないかとも思うが、とにかく長旅お疲れ様でした。バルカン半島は長い間トルコに支配されていたからこれはわかる。

 さてアラビア語に対してペルシャ語では g と dž はアロフォンでなく異音素である。上の(1)を参照してほしい。/g/ と /dž/ は両方独立した音素として表にのっているだろう。なので、もし「ジョハル」が原型であればそれを「ゴハル」なんかにしないでそのまま「ジョハル」という形で借用できたはずなのだ。だからこの「ゴハル」⇔「ジョハル」は、ペルシア語→アラビア語という借用方向しかありえない。

 ここまで一生懸命調べてからちょっと他の資料を覗いてみたら、「この語は現代ペルシャ語でgohar、中世ペルシャ語ではgwhl またはgōhr(「本質・宝石」、アラビア語はこの中世ペルシャ語からの借用)、そして古期ペルシャ語では*gauθraまたは*gavaθraだった」、とあっさり説明してあるではないか。文献学上ではとっくに証明済みだったわけだ。この古代ペルシャ語はgav- という語幹から派生したもので、もともと「育つ」とか「増える」という意味だそうだ。
 それにしてもせっかく自分で一生懸命検索したり考察したりした私の今までの苦労は完全に無駄な努力・余計なお世話だったのである。ちぇっ。
 
 気を取り直してさらにみてみると、ルーマニア語以外のバルカン諸言語にも「アラビア語の宝石」は広がっているらしい。次のような例が挙げてあった。

ギリシア語: τζοβαΐρι ‎(tzovaḯri、「宝石・宝物」)
セルボ・クロアチア語: džèvēr/џѐве̄р, dževáhir/џева́хир (「高価な宝石」)

「セルボ・クロアチア語」などという古い名称が使われているが、ここに挙がっているdžèvēr(ジェヴェール)、dževáhir (ジェヴァーヒル」)というのは今で言うボスニア語ではないだろうか。私の持っている相当詳しいクロアチア語・ドイツ語辞典にはこの語が出ていなかったし、ここの資料にも「regional な語」とあった。ギリシア語も「セルボ・クロアチア語」もトルコ語のcevahir を借用したらしい。
 さらに面白いことに、現代ペルシャ語は、もともと自分たちのほう、つまり中世ペルシャ語からアラビア語に輸出した語を後になってアラビア語からjauhar (または jawhar)として逆輸入している。ここではアラビア語→ペルシャ語の方向だから当然頭音が j になっていて、まさに上で音韻考察した通りの図式である。なお、そうやって里帰りした際意味の場も変化してしまい、現代ペルシャ語のjauhar が本来の「宝石」の意味で使われるのは「まれ」あるいは「古語的用法」だそうだ。jauharは普通は「本質」「インク」「酸」という意味に使われるとのこと。この3つの意味が同じ単語でいっしょになっているのが不思議だが、これじゃあまり「故郷に錦を飾った」という感じがしない。

追記:ひょっとして英語のjewel やjewelry もコレかとカン違いする人が出てきそうなので念のために書くと、これらはそれぞれ古フランス語のjouel とjueleryeが起源で、さらに遡ると俗ラテン語の*jocale ‎(「品のあるもの」)。しかしもっと遡ると最終的にはラテン語のiocusまたはjocusに行き着くそうだ。なんとこれは見ての通り「ジョーク」とか「娯楽」という意味。ウッソー!


この記事は身の程知らずにもランキングに参加しています(汗)。
 人気ブログランキング
人気ブログランキングへ
このエントリーをはてなブックマークに追加 mixiチェック

 いつだったか、インドの学校では九九を9×9=81までではなく、12×12=144まで暗記させられる、と聞いていたのをふと思い出して調べてみたら12×12ではなく20×20までだった。「じゅうに」と「にじゅう」を聞き違えたのかもしれない。
 言語によっては12で「2」を先にいうこともあるし、反対に20のとき「10」が前に来たりするからややこしい。また、11と12が別単語になっている言語もある、と言っても誰も驚かないだろう。英語がそうだからだ。英語ばかりでなくドイツ語などのゲルマン諸語全体がそういう体系になっている。ゲルマン諸語で1、2、3、10、11、12、13、 20、30はこんな具合だ。
Tabelle1-81
13からは「1の位の数+10」という語構造になっているが11と12だけ系統が違う。11(それぞれelf, elva, ainlif)の頭(e- あるいはain-)は明らかに「1」だが、お尻の -lf、 -iva、 lif はゲルマン祖語の *-lif- または *-lib- から来たもので「残り・余り」という意味だそうだ。印欧祖語では *-liku-。ドイツ語の動詞 bleiben(「残る」)もこの語源である。だから11、12はゲルマン諸語では「1あまり」「2あまり」と言っているわけだ。
 この、11、12を「○あまり」と表現する方法はゲルマン祖語がリトアニア語(というか「バルト祖語」か)から取り入れたらしい。本家リトアニア語では11から19までしっかりこの「○あまり構造」をしていて、20で初めて「10」を使い、日本語と同じく10の桁、「2」のほうを先に言う。
Tabelle2-81
ゲルマン語は現在の南スウェーデンあたりが発祥地だったそうだから、そこでバルト語派のリトアニア語と接触したのかもしれない。そういえば昔ドイツ騎士団領だった地域には東プロシア語という言語が話されていた。死滅してしまったこの言語をゲルマン諸語の一つ、ひどい場合にはドイツ語の一方言だと思い込んでいる人がいるが、東プロシア語はバルト語派である。
 印欧語ではないが、バルト海沿岸で話されているフィンランド語も11から19までは単純に「1と10」という風には表さない。
Tabelle3-81
11、12、13の-toistaという語尾はtoinenから来ていて、もともと「第二の」という意味。だからフィンランド語では例えば11は「二番目の10の1」だ。完全にイコールではないが、意味的にも用法的にもリトアニア語の「○余り」に近い。「20」のパターンもリトアニア語と同じである。
 
 ケルト諸語ではこの「○余り構造」をしておらず、11、12は13と同じくそれぞれ1、2、3と10を使って表し、一の位を先に言う。
Tabelle4-81
アイルランド語の10、a deichはdéag や dhéag と書き方が違うが単語そのものは同一である。後者では「10」が接尾辞と化した形で、これがブルトン語ではさらに弱まって -ek、-zek になっているが構造そのものは変わらない。それより面白いのは20で、「10」も「2」も出て来ず、一単語になっている。これはケルト祖語の *wikantī から来ており、相当語形変化をおこしているがブルトン語の ugentも同語源だそうだ。印欧祖語では *h1wih1kmt* あるいは h₁wih₁ḱm̥ti で、ラテン語の vīgintī もこの古形をそのまま引き継いだものである。「30」、tríocha と tregont も同一語源、ケルト祖語の *trī-kont-es から発展してきたもの。つまり20、30は11から19までより古い言語層になっているわけだ。これはラテン語もそうだったし、それを通して現在のロマンス諸語に引き継がれている。
Tabelle5-81
当然、といっていいのかどうか、サンスクリットやヒンディー語でも「20」は独立単語である。
Tabelle6-81
ヒンディー語の bīs はサンスクリットの viṃśati が変化したもの。下のロマニ語の biš についても辞書に viṃśati 起源と明記してある。もっともそのサンスクリットは数字の表し方がかなり自由で学習者泣かせだそうだが、学習者を泣かせる度合いはヒンディー語のほうが格段に上だろう。上の11、12、13、それぞれ gyārah、 bārah、tērah という言葉を見てもわかるように、ヒンディー語では11から99までの数詞が全部独立単語になっていて闇雲に覚えるしかないそうだ。もっとも13の -te- という頭は3の tīn と同語源だろうし、15は paṅdrah で、明らかに「5」(pāṅc)が入っているから100%盲目的でもないのだろうが、10の位がまったく別の形をしているからあまりエネルギー軽減にはならない。やはり泣くしかないだろう。
 同じインド・イラニアン語派であるロマニ語の、ロシアで話されている方言では20と30で本来の古い形のほかに日本語のように2と10、3と10を使う言い方ができる。
Tabelle7-81
ドイツのロマニ語方言では30をいうのに「20と10」という表し方がある。
Tabelle8-81
ハンガリー・オーストリアのブルゲンラント・ロマの方言では20と30を一単語で表すしかないようだが、11から19までをケルト語やサンスクリットと違って先に10と言ってから1の位を言って表す。これは他のロマニ語方言でもそうだ。
Tabelle9-81
手持ちの文法書には13がbišutrinとあったが、これは誤植だろう。勝手に直しておいた。他の方言にも見えるが、ロマニ語の30、trianda, trianta, trandaはギリシャ語からの借用だそうだ。
Tabelle10-81
古典ギリシア語では13からは11、12とは語が別構造になっているのが面白い。それあってか現代ギリシャ語では11と12では一の位を先に言うのに13からは10の位が先に来ている。20と30はケルト語と同じく独立単語で、20(eikosi または ikosi)は上で述べたブルトン語 ugent、ラテン語の viginti、サンスクリットの viṃśati と同じく印欧祖語の *(h₁)wídḱm̥ti、*wi(h₁)dḱm̥t または *h₁wi(h₁)ḱm̥tih₁ から発展してきた形である。

 あと、面白いのが前にも述べた(『18.バルカン言語連合』『40.バルカン言語連合再び』)バルカン半島の言語で、バルカン連語連合の中核ルーマニア語、アルバニア語では11から19までがone on ten, two on ten... nine on ten という構造になっている。
Tabelle11-81
11を表すルーマニア語の unsprezece、アルバニア語の njëmbëdhjetë、ブルガリア語の edinadesetはそれぞれun-spre-zece、 një-mbë-dhjetë、edi(n)-na-deset と分析でき、un、 një、edinは1、spre、 mbë、naは「~の上に」、zece 、dhjetë、desetが「10」で単語そのものは違うが造語のメカニズムが全く同じである。さらに実はブルガリア語ばかりでなくスラブ語派はバルカン外でも同じ仕組み。
Tabelle12-81
ロシア語 odin-na-dcat’、クロアチア語の jeda-na-est でもちょっと形が端折られていたりするが、one on ten という構造になっていることが見て取れるだろう。20、30は日本語と同じく「に+じゅう」「さん+じゅう」である。

 ここでやめようかとも思ったが、せっかくだからもうちょっと見てみると、11から19までで、1の位を先に言う言語が他にもかなりある。
Tabelle13-81
ヘブライ語は男性形のみにした。アラビア語の「11」の頭についているʾaḥada は一見「1」(wāḥid)と別単語のようだが、前者の語根أ ح د ‎('-ḥ-d) と後者の語根و ح د ‎(w-ḥ-d) は親戚でどちらもセム語祖語の*waḥad-  あるいはʔaḥad- から。ヘブライ語の אֶחָד ‎('ekhád) もここから来たそうだから意味はつながっている。アラビア語ではつまり11だけはちょっと古い形が残っているということだろうか。
 「11だけ形がちょっとイレギュラー」というのはインドネシア語もそうで、12からははっきり1と2に分析できるのに11だけ両形態素が融合している。
Tabelle14-81
この11、sebelas という形は se + belas に分解でき、se は古マレー語で「1」、インドネシア語のsatu と同義の形態素である。belas は11から19までの数詞で「10」を表す形態素。これもマレー語と共通だそうだ。つまりここでも古い形が残っているということだ。
 さらにコーカサスのジョージア語(グルジア語)も1の位を先に言う。
Tabelle15-81
-meṭi は more という意味の形態素だそうで、つまりジョージア語では11から19までを「1多い」「9多い」と表現していることになり、リトアニア語の「○余り構造」とそっくりだ。「13」の ca- はもちろん sami が音同化して生じた形である。また、ジョージア語も「20」という独立単語を持っていて、30は「20と10」である。

 シンタクス構造が日本語と似ているとよく話題になるトルコ語は11~19で日本語のように10の位を先に言う。その点はさすがだが、20と30は残念ながら(?)日本語と違って独立単語である。20(yirmi)も30(otuz)もテュルク祖語からの古い形を踏襲した形なのだそうだ。
Tabelle16-81
バスク語も10の位を先に言うようだ。能格言語という共通点があるのにジョージア語とは違っている。もっとも30は「20と10」で、これはジョージア語と同じである。
Tabelle17-81
こうして見ていくと「20」という独立単語を持っている言語は相当あるし、数詞という一つの体系のなかに新しく造語されて部分と古い形を引き継いだ部分が混在している。調べれば調べるほど面白くなってくる。今時こういう言い回しが若い人に通じるのかどうか不安だが、まさにスルメのように噛めば噛むほど味わいを増す感じ。数詞ネタでさかんに論文や本が書かれているのもわかる気がする。


この記事は身の程知らずにもランキングに参加しています(汗)。
 人気ブログランキング
人気ブログランキングへ
このエントリーをはてなブックマークに追加 mixiチェック

表が多すぎて機種やブラウザによって、特にスマホではグチャグチャになるので(私自身は今時スマホを持っていないので自分のブログをスマホでは見たことがない)、図表を画像に変更しました。データがやたらとあるので再確認して、文章も少し直しました。

元の記事はこちら
内容はこの記事と同じです。

 いつだったか、インドの学校では九九を9×9=81までではなく、12×12=144まで暗記させられる、と聞いていたのをふと思い出して調べてみたら12×12ではなく20×20までだった。「じゅうに」と「にじゅう」を聞き違えたのかもしれない。
 言語によっては12で「2」を先にいうこともあるし、反対に20のとき「10」が前に来たりするからややこしい。また、11と12が別単語になっている言語もある、と言っても誰も驚かないだろう。英語がそうだからだ。英語ばかりでなくドイツ語などのゲルマン諸語全体がそういう体系になっている。ゲルマン諸語で1、2、3、10、11、12、13、 20、30はこんな具合だ。
Tabelle1-81
13からは「1の位の数+10」という語構造になっているが11と12だけ系統が違う。11(それぞれelf, elva, ainlif)の頭(e- あるいはain-)は明らかに「1」だが、お尻の -lf、 -iva、 lif はゲルマン祖語の *-lif- または *-lib- から来たもので「残り・余り」という意味だそうだ。印欧祖語では *-liku-。ドイツ語の動詞 bleiben(「残る」)もこの語源である。だから11、12はゲルマン諸語では「1あまり」「2あまり」と言っているわけだ。
 この、11、12を「○あまり」と表現する方法はゲルマン祖語がリトアニア語(というか「バルト祖語」か)から取り入れたらしい。本家リトアニア語では11から19までしっかりこの「○あまり構造」をしていて、20で初めて「10」を使い、日本語と同じく10の桁、「2」のほうを先に言う。
Tabelle2-81
ゲルマン語は現在の南スウェーデンあたりが発祥地だったそうだから、そこでバルト語派のリトアニア語と接触したのかもしれない。そういえば昔ドイツ騎士団領だった地域には東プロシア語という言語が話されていた。死滅してしまったこの言語をゲルマン諸語の一つ、ひどい場合にはドイツ語の一方言だと思い込んでいる人がいるが、東プロシア語はバルト語派である。
 印欧語ではないが、バルト海沿岸で話されているフィンランド語も11から19までは単純に「1と10」という風には表さない。
Tabelle3-81
11、12、13の-toistaという語尾はtoinenから来ていて、もともと「第二の」という意味。だからフィンランド語では例えば11は「二番目の10の1」だ。完全にイコールではないが、意味的にも用法的にもリトアニア語の「○余り」に近い。「20」のパターンもリトアニア語と同じである。
 
 ケルト諸語ではこの「○余り構造」をしておらず、11、12は13と同じくそれぞれ1、2、3と10を使って表し、一の位を先に言う。
Tabelle4-81
アイルランド語の10、a deichはdéag や dhéag と書き方が違うが単語そのものは同一である。後者では「10」が接尾辞と化した形で、これがブルトン語ではさらに弱まって -ek、-zek になっているが構造そのものは変わらない。それより面白いのは20で、「10」も「2」も出て来ず、一単語になっている。これはケルト祖語の *wikantī から来ており、相当語形変化をおこしているがブルトン語の ugentも同語源だそうだ。印欧祖語では *h1wih1kmt* あるいは h₁wih₁ḱm̥ti で、ラテン語の vīgintī もこの古形をそのまま引き継いだものである。「30」、tríocha と tregont も同一語源、ケルト祖語の *trī-kont-es から発展してきたもの。つまり20、30は11から19までより古い言語層になっているわけだ。これはラテン語もそうだったし、それを通して現在のロマンス諸語に引き継がれている。
Tabelle5-81
当然、といっていいのかどうか、サンスクリットやヒンディー語でも「20」は独立単語である。
Tabelle6-81
ヒンディー語の bīs はサンスクリットの viṃśati が変化したもの。下のロマニ語の biš についても辞書に viṃśati 起源と明記してある。もっともそのサンスクリットは数字の表し方がかなり自由で学習者泣かせだそうだが、学習者を泣かせる度合いはヒンディー語のほうが格段に上だろう。上の11、12、13、それぞれ gyārah、 bārah、tērah という言葉を見てもわかるように、ヒンディー語では11から99までの数詞が全部独立単語になっていて闇雲に覚えるしかないそうだ。もっとも13の -te- という頭は3の tīn と同語源だろうし、15は paṅdrah で、明らかに「5」(pāṅc)が入っているから100%盲目的でもないのだろうが、10の位がまったく別の形をしているからあまりエネルギー軽減にはならない。やはり泣くしかないだろう。
 同じインド・イラニアン語派であるロマニ語の、ロシアで話されている方言では20と30で本来の古い形のほかに日本語のように2と10、3と10を使う言い方ができる。
Tabelle7-81
ドイツのロマニ語方言では30をいうのに「20と10」という表し方がある。
Tabelle8-81
ハンガリー・オーストリアのブルゲンラント・ロマの方言では20と30を一単語で表すしかないようだが、11から19までをケルト語やサンスクリットと違って先に10と言ってから1の位を言って表す。これは他のロマニ語方言でもそうだ。
Tabelle9-81
手持ちの文法書には13がbišutrinとあったが、これは誤植だろう。勝手に直しておいた。他の方言にも見えるが、ロマニ語の30、trianda, trianta, trandaはギリシャ語からの借用だそうだ。
Tabelle10-81
古典ギリシア語では13からは11、12とは語が別構造になっているのが面白い。それあってか現代ギリシャ語では11と12では一の位を先に言うのに13からは10の位が先に来ている。20と30はケルト語と同じく独立単語で、20(eikosi または ikosi)は上で述べたブルトン語 ugent、ラテン語の viginti、サンスクリットの viṃśati と同じく印欧祖語の *(h₁)wídḱm̥ti、*wi(h₁)dḱm̥t または *h₁wi(h₁)ḱm̥tih₁ から発展してきた形である。

 あと、面白いのが前にも述べた(『18.バルカン言語連合』『40.バルカン言語連合再び』)バルカン半島の言語で、バルカン連語連合の中核ルーマニア語、アルバニア語では11から19までがone on ten, two on ten... nine on ten という構造になっている。
Tabelle11-81
11を表すルーマニア語の unsprezece、アルバニア語の njëmbëdhjetë、ブルガリア語の edinadesetはそれぞれun-spre-zece、 një-mbë-dhjetë、edi(n)-na-deset と分析でき、un、 një、edinは1、spre、 mbë、naは「~の上に」、zece 、dhjetë、desetが「10」で単語そのものは違うが造語のメカニズムが全く同じである。さらに実はブルガリア語ばかりでなくスラブ語派はバルカン外でも同じ仕組み。
Tabelle12-81
ロシア語 odin-na-dcat’、クロアチア語の jeda-na-est でもちょっと形が端折られていたりするが、one on ten という構造になっていることが見て取れるだろう。20、30は日本語と同じく「に+じゅう」「さん+じゅう」である。

 ここでやめようかとも思ったが、せっかくだからもうちょっと見てみると、11から19までで、1の位を先に言う言語が他にもかなりある。
Tabelle13-81
ヘブライ語は男性形のみにした。アラビア語の「11」の頭についているʾaḥada は一見「1」(wāḥid)と別単語のようだが、前者の語根أ ح د ‎('-ḥ-d) と後者の語根و ح د ‎(w-ḥ-d) は親戚でどちらもセム語祖語の*waḥad-  あるいはʔaḥad- から。ヘブライ語の אֶחָד ‎('ekhád) もここから来たそうだから意味はつながっている。アラビア語ではつまり11だけはちょっと古い形が残っているということだろうか。
 「11だけ形がちょっとイレギュラー」というのはインドネシア語もそうで、12からははっきり1と2に分析できるのに11だけ両形態素が融合している。
Tabelle14-81
この11、sebelas という形は se + belas に分解でき、se は古マレー語で「1」、インドネシア語のsatu と同義の形態素である。belas は11から19までの数詞で「10」を表す形態素。これもマレー語と共通だそうだ。つまりここでも古い形が残っているということだ。
 さらにコーカサスのジョージア語(グルジア語)も1の位を先に言う。
Tabelle15-81
-meṭi は more という意味の形態素だそうで、つまりジョージア語では11から19までを「1多い」「9多い」と表現していることになり、リトアニア語の「○余り構造」とそっくりだ。「13」の ca- はもちろん sami が音同化して生じた形である。また、ジョージア語も「20」という独立単語を持っていて、30は「20と10」である。

 シンタクス構造が日本語と似ているとよく話題になるトルコ語は11~19で日本語のように10の位を先に言う。その点はさすがだが、20と30は残念ながら(?)日本語と違って独立単語である。20(yirmi)も30(otuz)もテュルク祖語からの古い形を踏襲した形なのだそうだ。
Tabelle16-81
バスク語も10の位を先に言うようだ。能格言語という共通点があるのにジョージア語とは違っている。もっとも30は「20と10」で、これはジョージア語と同じである。
Tabelle17-81
こうして見ていくと「20」という独立単語を持っている言語は相当あるし、数詞という一つの体系のなかに新しく造語されて部分と古い形を引き継いだ部分が混在している。調べれば調べるほど面白くなってくる。今時こういう言い回しが若い人に通じるのかどうか不安だが、まさにスルメのように噛めば噛むほど味わいを増す感じ。数詞ネタでさかんに論文や本が書かれているのもわかる気がする。


この記事は身の程知らずにもランキングに参加しています(汗)。
 人気ブログランキング
人気ブログランキングへ
このエントリーをはてなブックマークに追加 mixiチェック

10年くらい前の記事ですが足りない部分があったので(私の頭のことか?)大幅に書き加えました。表も画像にしました。

元の記事はこちら
内容はこの記事と同じです。

 少し前まではコーカサスやシベリア諸民族の言語をやるにはロシア語が不可欠だった。文献がロシア語で書いてあったからだ。今はもう論文なども英語になってきてしまっているのでロシア語が読めなくても大丈夫だろう。残念といえば残念である。別に英語が嫌いというわけではないのだが、何語であれ一言語ヘゲモニー状態には私は「便利だから」などと手放しでは喜べない。どうしても思考の幅が狭まるからだ。
 そのコーカサス地方の言語、タバサラン語についてちょっと面白い話を小耳にはさんだことがある。

 タバサラン語では「本」のことを kitab と言うそうだ。アラビア語起源なのが明らかではないか。よりによってこの kitab、あるいは子音連続 K-T-B は、私が馬鹿の一つ覚えで知っている唯一のアラビア語なのである。イスラム教とともにこの言語に借用されたのだろう。
 そこで気になったので、現在イスラム教の民族の言語で「本」を何というのかちょっと調べてみた。家に落ちていた辞書だのネットの(無料)オンライン辞書だのをめくら滅法引きまくっただけなので、ハズしているところがあるかも知れない。専門家の方がいたらご指摘いただけるとありがたい。その言語の文字で表記したほうがいいのかもしれないが、それだと不統一だし読めないものもあるのでローマ字表記にした。言語名のあとに所属語族、または語群を記した。何も記していない言語は所属語族や語群が不明のものである。「語族」と「語群」はどう違うのかというのが実は一筋縄ではいかない問題なのだが、「語族」というのは異なる言語の単語間に例外なしの音韻対応が見いだせる場合、その言語はどちらも一つの共通な祖語から発展してきたものとみなし、同一語族とするもの。この音韻対応というのは比較言語学の厳密な規則に従って導き出されるもので、単に単語が(ちょっと)似ているだけですぐ「同族言語ダー」と言い出すことは現に慎まなければいけない。時々そういうことをすぐ言い出す人がいるのは困ったものだ。現在同一語族ということが科学的に証明されているのは事実上印欧語族とセム語族だけだといっていい。そこまで厳密な証明ができていない言語は「語群」としてまとめる。もちろんまとめるからにはまとめるだけの理由があるのでこれもちょっと似た点が見つかったからと言ってフィーリングで「語群」を想定することはできない。「テュルク語」については「語族」でいいじゃないかとも思うのだが、逆に似すぎていて語族と言うより一言語じゃないかよこれ、とでも思われたのか「テュルク語族」とは言わずに「テュルク諸語」と呼んでいる。
 話が飛んで失礼。さて「本」をイスラム教国の言葉でなんというか。基本的に男性単数形を示す。
NEU07-Tabelle1
 このようにアラビア語の単語が実に幅広い語族・地域の言語に取り入れられていることがわかる。アラビア語から直接でなく一旦ペルシャ語を経由して取り入れた場合も少なくないようだが。例外はアルバニア語とボスニア語。前者は明らかにロマンス語からの借用、後者はこの言語本来の、つまりスラブ語本来の語だ。ここの民族がイスラム化したのが新しいので、言語までは影響されなかったのではないだろうか。ンドネシア語の buku は英語からの借用だと思うが、kitab という言葉もちゃんと使われている。pustaka は下で述べるように明らかにサンスクリットからの借用。インドネシア語はイスラム教が普及する(ずっと)以前にサンスクリットの波をかぶったのでその名残り。つまり pustaka は「本」を表わす3語のうちで最も古い層だろう。単語が三つ巴構造になっている。しかも調べてみるとインドネシア語には kitab と別に Alkitab という語が存在する。これは Al-kitab と分析でき、Al はアラビア語の冠詞だからいわば The-Book という泥つきというか The つきのままで借用したものだ。その Alkitab とは「聖書」という意味である。クルド語の pertuk は古アルメニア語 prtu(「紙」「葦」)からの借用だそうだがそれ以上の語源はわからない。とにかくサンスクリットの pustaka ではない。

 面白いからもっと見てみよう。「アフロ・アジア語群」というのは昔「セム・ハム語族」と呼ばれていたグループだ。アラビア語を擁するセム語の方は上でも述べたように「語族」といっていいだろうが、ハム語のほうは「族」という言葉を使っていいのかどうか個人的にちょっと「?」がつくので、現在の名称「アフロ・アジア語」のほうも「族」でなく「群」扱いしておいた。
NEU07-Tabelle2
イスラム教徒が乗り出していった地域で話されていたアフリカのスワヒリ語は「イスラム教の民族の言語」とは言いきれないのだが、「本」という文化語をアラビア語から取り入れているのがわかる。ハウサ語の「本」は形がかけ離れているので最初関係ないのかと思ったが、教えてくれた人がいて、これも「ごく早い時期に」アラビア語から借用したものなのだそうだ。ハウサ語の f は英語やドイツ語の f とは違って、日本語の「ふ」と同じく両唇摩擦音だそうだから、アラビア語bが f になったのかもしれないが、それにしても形が違いすぎる。「ごく早い時期」がいつなのかちょっとわからないのだが、ひょっとしたらイスラム教以前にすでにアラビア語と接触でもしていたのか、第三の言語を仲介したかもしれない。ソマリ語にはもう一つ buug という「本」があるが、インドネシア語の buku と同様英語からの借用である。

 インドの他の言語は次のようになる。
NEU07-Tabelle3
最後に挙げたインド南部のタミル語以外は印欧語族・インド・イラン語派で、冒頭にあげたペルシア語、ウルドゥ語、パシュトー語と言語的に非常に近い(印欧語族、インド・イラン語派)がサンスクリット形の「本」が主流だ。ベンガル語 pustok もヒンディー語 pustak もサンスクリットの pustaka 起源。ただ両言語の地域北インドは現在ではヒンドゥ―教だが、ムガル帝国の支配下にあった時期が長いのでアラビア語系の「本」も使われているのはうなづける。これは直接アラビア語から借用したのではなく、ペルシャ語を通したもの。またベンガル語の boi は英語からの借用かと思ったらサンスクリットの vahikā (「日記、帳簿」)から来ている古い語だそうだ。
 インドも南に下るとイスラム教の影響が薄れるらしく、アラビア語形が出てこなくなる。シンハラ語は仏教地域。これら印欧語はサンスクリットから「本」という語を「取り入れた」のではなく、本来の語を引き続き使っているに過ぎない。それに対してタミル語、テルグ語、マラヤラム語は印欧語ではないから、印欧語族のサンスクリットから借用したのだ。これらの言語はヒンドゥー教あるいは仏教地域である。
 とにかく言語の語彙と言うのは階層構造をなしていることがわかる。上のインドネシア語の pustaka も後にイスラム教を受け入れたのでアラビア語系の語に取って代わられたが消滅はしていない。もっともバリ島など、今もヒンドゥー教地域は残っている。そういうヒンドゥー地域では kitab は使わないのかもしれない。
 「本」を直接アラビア語からでなくペルシャ語を通して受け入れた言語も多いようだが、ではイスラム以前のペルシャ語では「本」を何といっていたのか。中期ペルシャ語(パフラヴィー語)を見ると「本」を表す語が3つあったらしい。mādayān、nāmag、nibēg の3語で、なるほどアラビア語とは関係ないようだ。本来のイラニアン語派の語だろう。 mādayān は古アルメニア語に借用され(matean、「本」)、そこからまた古ジョージア語に輸出(?)されている(maṭiane、「本、物語」)。nāmag も namak (「字」)としてやっぱり古アルメニア語に引き継がれたし、そもそも現代ペルシャ語にもnāme として残っている。「字」という意味の他に合成語に使われて「本」を表す: filmnâme(「脚本」)。最後の nibēg も nebiという形で現代ペルシャ語に細々と残っており「廃れた形」ではあるが「経典」「本」。昔はこの語でコーランを表していたそうだ。

 ではそのアルメニア語やジョージア語では現在どうなっているのか。これらの言語はタバサラン語のすぐ隣、つまりコーカサスで話されているが、キリスト教民族である。アラビア語とは見事に無関係だ。
NEU07-Tabelle4
アルメニア語の matyan は上述の古ペルシャ語 mādayān の子孫で、主流ではなくなったようだが、「雑誌」「原稿」「本」など意味が多様化してまだ存命(?)だ。ジョージア語でも maṭiane(「聖人伝」)として意味を変えたが単語としては生き残っている。girk、cigni がアルメニア語、ジョージア語本来の言葉。オセチア語の činyg は古い東スラブ語の kŭniga からの借用だそうだ。道理で現在のスラブ諸語と形がそっくりだ(下記)。オセチア語と上にあげたイスラム教のタジク語は同じ印欧語のイラニアン語派だし話されている地域も互いにごく近いのに語彙が明確に違っているのが非常に面白い。しかしそのタジク語にも上記中世ペルシャ語の nāmag に対応する noma(「字」)という言葉が存在する。

 また次の言語はセム語族で、言語的には本家アラビア語と近いのに「本」を kitab と言わない。アムハラ・エチオピア民族はキリスト教国だったし、ヘブライ語はもちろんユダヤ教。
NEU07-Tabelle5
 アムハラ語はもちろんゲエズ語からの引継ぎだが、後者はヨーロッパのラテン語と同じく死語なので、本当の音価はわからない。ゲエズ文字をアムハラ語で読んでいるわけだから音形が全く同じになるのは当然と言えば当然だ。アムハラ語もゲエズ語もさすがセム語族だけあって「語幹は3子音からなる」という原則を保持している。これもアラビア語と同様 m- の部分は語幹には属さない接頭辞だから差し引くと、この語の語幹は ṣ-h-f となる。その語幹の動詞 ṣäḥäfä は「書く」。このゲエズ語の「本」はアラビア語に maṣḥaf という形で借用され、「本」「写本」という意味で使われている。アラビア語の方が借用したとはまた凄いが、それどころではなく、ヘブライ語までこのゲエズ語を輸入している。ヘブライ語には「聖書の写本」を表す mitskháf  という単語があるが、これは mäṣḥäf の借用だそうだ。なおゲエズ語の動詞の ṣäḥäfä は古典アラビア語の ṣaḵafa に対応していると考えられるが、後者は「書く」でなく「地面を掘る」という意味だそうだ。は? 
 ヘブライ語の sefer(語根はs-f-r、f は本来帯気の p だそうだ)はアッカド語の時代から続く古い古いセム語の単語で、アラビア語にもその親戚語 sifr という「本」を表す語が存在する。ただ使用範囲が限定されているようだ。
 逆にヘブライ語には katáv(「書く」)あるいは ktivá(「書くこと」)という語もある。一目瞭然、アラビア語の k-t-b と対応する形だ。「本」という意味はないようだが、とにかく単語自体はアラビア語、ヘブライ語どちらにも存在し、そのどちらがメインで「本」という意味を担っているかの程度に違いがあるだけだ。
 
 それにしても「本」などという文化語は時代が相当下ってからでないと生じないはずだ。本が存在するためにはまず文字が発明されていなければいけないからだ。当該言語が文字を持っていなかったら(文字のない言語など特に昔はゴロゴロあった)本もへったくれもない。だから当時の「先進国」から本という実体が入ってきたのと同時にそれを表す言葉も取り入れたことが多かったのだろう。普通「その国にないもの」が導入される時は外来語をそのまま使う。日本語の「パン」「ガラス」などいい例だ。
 言い換えると「本」という語は宗教と共にということもあるが文字文化と共に輸入されたという側面も大きいに違いない。イスラム教が来る以前にすでにローマ文化やラテン語と接していたアルバニア、グラゴール文字、キリル文字、ラテン文字など、文字文化にふれていたボスニアで、「本」がアラビア語にとって変わられなかったのもそれで説明できる。そういえばバルカン半島に文字が広まったのはキリスト教宣教と共にで、9世紀のことだ。イスラム教はすでに世界を席捲していたが、バルカン半島にイスラム教が入ってきたのはトルコ経由で14世紀になってからだ。当地にはとっくに書き言葉の文化が確立されていた。
 アルメニア語、ジョージア語、アムハラ語(ゲーズ語)も古い文字の伝統があって、独自の文字を発達させていた。ヘブライ語やサンスクリット、タミル語は言わずもがな、イスラム教どころかキリスト教が発生する何百年も前から文字が存在した。外来語に対する抵抗力があったのだろう。

 まとめてみるとこうなる。イスラムの台頭とともにアラビア語の「本」という語が当地の言語に語族の如何を問わずブワーッと広まった。特にそれまで文字文化を持っていなかった民族言語は何の抵抗もなく受け入れた。
 すでに文字文化を持っていた言語はちょっと様子が違い、イスラム以前からの語が引き続き使われたか、アラビア語の「本」を取り入れたのしても昔からの語は生き残った。ただその際意味変化するか、使用範囲が狭くなった。
 イスラム教の波を被らなかった民族の言語はアラビア語系の語を取り入れなかった。
 その一方、初期イスラム教のインパクトがどれほど強かったのか改めて見せつけられる思いだ。千年にわたる文字文化を誇っていたペルシャ語、サンスクリットという二大印欧語を敵に回して(?)一歩も引かず、本来の語、mādayān などを四散させてしまった。その際ペルシャ語は文字までアラビア文字に転換した。もっともそれまで使っていたパフラヴィ―文字はアラム文字系統だったからアラビア文字への転換は別に画期的と言えるほどではなかっただろうが、その侵略された(?)ペルシャ語は外来のアラビア語をさらに増幅して広める助けまでしたのだ。ペルシャ語のこのアンプ作用がなかったら中央アジアにまではアラビア語形は浸透しなかったかもしれない。
 ボスニア、アルバニアはずっと時代が下ってからだったから語が転換せずに済んだのだろう。

 実はなんとベラルーシ語にもこのアラビア語起源の кітаб (kitab)言う語が存在する。「本」一般ではなくイスラム教の宗教書のことだが、これはベラルーシ語がリプカ・タタール人によってアラビア文字で表記されていた時代の名残である。このアラビア語表記は16世紀ごろから20世紀に入るまで使われていた。そのころはトルコ語もアラビア文字表記されていて、現在のラテン語表記になったのはやはり20世紀初頭だ。
 このリプカ・タタール人というのはベラルーシばかりでなく、ポーランドやリトアニアにもいる。私がヨーロッパ系のポーランド人から自国内のリプカ・タタール人(国籍としてはポーランド人)と間違われたことは以前にも書いた通りだ。自慢にもならないが。

この記事は身の程知らずにもランキングに参加しています(汗)。
人気ブログランキングへ
このエントリーをはてなブックマークに追加 mixiチェック

↑このページのトップヘ