アルザスのこちら側

一般言語学を専攻し、学位はとったはいいがあとが続かず、ドイツの片隅の大学のさらに片隅でヒステリーを起こしているヘタレ非常勤講師が人を食ったような記事を無責任にガーガー書きなぐっています。それで「人食いアヒルの子」と名のっております。 どうぞよろしくお願いします。

タグ:インドネシア語・インドネシア

表が多すぎて機種やブラウザによって、特にスマホではグチャグチャになるので(私自身は今時スマホを持っていないので自分のブログをスマホでは見たことがない)、図表を画像に変更しました。データがやたらとあるので再確認して、文章も少し直しました。

元の記事はこちら
内容はこの記事と同じです。

 いつだったか、インドの学校では九九を9×9=81までではなく、12×12=144まで暗記させられる、と聞いていたのをふと思い出して調べてみたら12×12ではなく20×20までだった。「じゅうに」と「にじゅう」を聞き違えたのかもしれない。
 言語によっては12で「2」を先にいうこともあるし、反対に20のとき「10」が前に来たりするからややこしい。また、11と12が別単語になっている言語もある、と言っても誰も驚かないだろう。英語がそうだからだ。英語ばかりでなくドイツ語などのゲルマン諸語全体がそういう体系になっている。ゲルマン諸語で1、2、3、10、11、12、13、 20、30はこんな具合だ。
Tabelle1-81
13からは「1の位の数+10」という語構造になっているが11と12だけ系統が違う。11(それぞれelf, elva, ainlif)の頭(e- あるいはain-)は明らかに「1」だが、お尻の -lf、 -iva、 lif はゲルマン祖語の *-lif- または *-lib- から来たもので「残り・余り」という意味だそうだ。印欧祖語では *-liku-。ドイツ語の動詞 bleiben(「残る」)もこの語源である。だから11、12はゲルマン諸語では「1あまり」「2あまり」と言っているわけだ。
 この、11、12を「○あまり」と表現する方法はゲルマン祖語がリトアニア語(というか「バルト祖語」か)から取り入れたらしい。本家リトアニア語では11から19までしっかりこの「○あまり構造」をしていて、20で初めて「10」を使い、日本語と同じく10の桁、「2」のほうを先に言う。
Tabelle2-81
ゲルマン語は現在の南スウェーデンあたりが発祥地だったそうだから、そこでバルト語派のリトアニア語と接触したのかもしれない。そういえば昔ドイツ騎士団領だった地域には東プロシア語という言語が話されていた。死滅してしまったこの言語をゲルマン諸語の一つ、ひどい場合にはドイツ語の一方言だと思い込んでいる人がいるが、東プロシア語はバルト語派である。
 印欧語ではないが、バルト海沿岸で話されているフィンランド語も11から19までは単純に「1と10」という風には表さない。
Tabelle3-81
11、12、13の-toistaという語尾はtoinenから来ていて、もともと「第二の」という意味。だからフィンランド語では例えば11は「二番目の10の1」だ。完全にイコールではないが、意味的にも用法的にもリトアニア語の「○余り」に近い。「20」のパターンもリトアニア語と同じである。
 
 ケルト諸語ではこの「○余り構造」をしておらず、11、12は13と同じくそれぞれ1、2、3と10を使って表し、一の位を先に言う。
Tabelle4-81
アイルランド語の10、a deichはdéag や dhéag と書き方が違うが単語そのものは同一である。後者では「10」が接尾辞と化した形で、これがブルトン語ではさらに弱まって -ek、-zek になっているが構造そのものは変わらない。それより面白いのは20で、「10」も「2」も出て来ず、一単語になっている。これはケルト祖語の *wikantī から来ており、相当語形変化をおこしているがブルトン語の ugentも同語源だそうだ。印欧祖語では *h1wih1kmt* あるいは h₁wih₁ḱm̥ti で、ラテン語の vīgintī もこの古形をそのまま引き継いだものである。「30」、tríocha と tregont も同一語源、ケルト祖語の *trī-kont-es から発展してきたもの。つまり20、30は11から19までより古い言語層になっているわけだ。これはラテン語もそうだったし、それを通して現在のロマンス諸語に引き継がれている。
Tabelle5-81
当然、といっていいのかどうか、サンスクリットやヒンディー語でも「20」は独立単語である。
Tabelle6-81
ヒンディー語の bīs はサンスクリットの viṃśati が変化したもの。下のロマニ語の biš についても辞書に viṃśati 起源と明記してある。もっともそのサンスクリットは数字の表し方がかなり自由で学習者泣かせだそうだが、学習者を泣かせる度合いはヒンディー語のほうが格段に上だろう。上の11、12、13、それぞれ gyārah、 bārah、tērah という言葉を見てもわかるように、ヒンディー語では11から99までの数詞が全部独立単語になっていて闇雲に覚えるしかないそうだ。もっとも13の -te- という頭は3の tīn と同語源だろうし、15は paṅdrah で、明らかに「5」(pāṅc)が入っているから100%盲目的でもないのだろうが、10の位がまったく別の形をしているからあまりエネルギー軽減にはならない。やはり泣くしかないだろう。
 同じインド・イラニアン語派であるロマニ語の、ロシアで話されている方言では20と30で本来の古い形のほかに日本語のように2と10、3と10を使う言い方ができる。
Tabelle7-81
ドイツのロマニ語方言では30をいうのに「20と10」という表し方がある。
Tabelle8-81
ハンガリー・オーストリアのブルゲンラント・ロマの方言では20と30を一単語で表すしかないようだが、11から19までをケルト語やサンスクリットと違って先に10と言ってから1の位を言って表す。これは他のロマニ語方言でもそうだ。
Tabelle9-81
手持ちの文法書には13がbišutrinとあったが、これは誤植だろう。勝手に直しておいた。他の方言にも見えるが、ロマニ語の30、trianda, trianta, trandaはギリシャ語からの借用だそうだ。
Tabelle10-81
古典ギリシア語では13からは11、12とは語が別構造になっているのが面白い。それあってか現代ギリシャ語では11と12では一の位を先に言うのに13からは10の位が先に来ている。20と30はケルト語と同じく独立単語で、20(eikosi または ikosi)は上で述べたブルトン語 ugent、ラテン語の viginti、サンスクリットの viṃśati と同じく印欧祖語の *(h₁)wídḱm̥ti、*wi(h₁)dḱm̥t または *h₁wi(h₁)ḱm̥tih₁ から発展してきた形である。

 あと、面白いのが前にも述べた(『18.バルカン言語連合』『40.バルカン言語連合再び』)バルカン半島の言語で、バルカン連語連合の中核ルーマニア語、アルバニア語では11から19までがone on ten, two on ten... nine on ten という構造になっている。
Tabelle11-81
11を表すルーマニア語の unsprezece、アルバニア語の njëmbëdhjetë、ブルガリア語の edinadesetはそれぞれun-spre-zece、 një-mbë-dhjetë、edi(n)-na-deset と分析でき、un、 një、edinは1、spre、 mbë、naは「~の上に」、zece 、dhjetë、desetが「10」で単語そのものは違うが造語のメカニズムが全く同じである。さらに実はブルガリア語ばかりでなくスラブ語派はバルカン外でも同じ仕組み。
Tabelle12-81
ロシア語 odin-na-dcat’、クロアチア語の jeda-na-est でもちょっと形が端折られていたりするが、one on ten という構造になっていることが見て取れるだろう。20、30は日本語と同じく「に+じゅう」「さん+じゅう」である。

 ここでやめようかとも思ったが、せっかくだからもうちょっと見てみると、11から19までで、1の位を先に言う言語が他にもかなりある。
Tabelle13-81
ヘブライ語は男性形のみにした。アラビア語の「11」の頭についているʾaḥada は一見「1」(wāḥid)と別単語のようだが、前者の語根أ ح د ‎('-ḥ-d) と後者の語根و ح د ‎(w-ḥ-d) は親戚でどちらもセム語祖語の*waḥad-  あるいはʔaḥad- から。ヘブライ語の אֶחָד ‎('ekhád) もここから来たそうだから意味はつながっている。アラビア語ではつまり11だけはちょっと古い形が残っているということだろうか。
 「11だけ形がちょっとイレギュラー」というのはインドネシア語もそうで、12からははっきり1と2に分析できるのに11だけ両形態素が融合している。
Tabelle14-81
この11、sebelas という形は se + belas に分解でき、se は古マレー語で「1」、インドネシア語のsatu と同義の形態素である。belas は11から19までの数詞で「10」を表す形態素。これもマレー語と共通だそうだ。つまりここでも古い形が残っているということだ。
 さらにコーカサスのジョージア語(グルジア語)も1の位を先に言う。
Tabelle15-81
-meṭi は more という意味の形態素だそうで、つまりジョージア語では11から19までを「1多い」「9多い」と表現していることになり、リトアニア語の「○余り構造」とそっくりだ。「13」の ca- はもちろん sami が音同化して生じた形である。また、ジョージア語も「20」という独立単語を持っていて、30は「20と10」である。

 シンタクス構造が日本語と似ているとよく話題になるトルコ語は11~19で日本語のように10の位を先に言う。その点はさすがだが、20と30は残念ながら(?)日本語と違って独立単語である。20(yirmi)も30(otuz)もテュルク祖語からの古い形を踏襲した形なのだそうだ。
Tabelle16-81
バスク語も10の位を先に言うようだ。能格言語という共通点があるのにジョージア語とは違っている。もっとも30は「20と10」で、これはジョージア語と同じである。
Tabelle17-81
こうして見ていくと「20」という独立単語を持っている言語は相当あるし、数詞という一つの体系のなかに新しく造語されて部分と古い形を引き継いだ部分が混在している。調べれば調べるほど面白くなってくる。今時こういう言い回しが若い人に通じるのかどうか不安だが、まさにスルメのように噛めば噛むほど味わいを増す感じ。数詞ネタでさかんに論文や本が書かれているのもわかる気がする。


この記事は身の程知らずにもランキングに参加しています(汗)。
 人気ブログランキング
人気ブログランキングへ
このエントリーをはてなブックマークに追加 mixiチェック

図表を画像に変更したりして一度記事を全面変更しましたが、その後今更英語にも包含と除外を区別する場合があることを安井稔教授が指摘しているのを見たのでさらに変更しました。再投稿します。言語と言うのは本当に驚くことばかりです。

内容はこの記事と同じです。

 セルジオ・レオーネ監督の代表作に Il Buono, il Brutto, il Cattivo(邦題『続・夕陽のガンマン』)というのがある。「いい奴、悪い奴、嫌な奴」という意味だが、英語ではちゃんと直訳されて The good, the bad and the ugly というタイトルがついている。この映画には主人公が3人いて三つ巴の絡み合い、決闘をするのだが、ドイツ語タイトルではこれがなぜか Zwei glorreiche Hallunken(「華麗なる二人のならず者」)となっていて人が一人消えている。消されたのは誰だ?たぶん最後に決闘で倒れる(あっとネタバレ失礼)リー・ヴァン・クリーフ演じる悪漢ではないかと思うが、ここでなぜ素直にdrei (3)を使って「3人の華麗なならず者」とせず、zwei にして一人減らしたのかわけがわからない。リー・ヴァン・クリーフに何か恨みでもあるのか。
 さらに日本でも I quattro dell’ Ave Maria、「アヴェ・マリアの4人」というタイトルの映画が『荒野の三悪党』になって一人タイトルから消えている。無視されたのは黒人のブロック・ピータースだろうか。だとすると人種差別問題だ。ドイツ語では原題直訳で Vier für ein Ave Maria。

 もっともタイトル上で無視されただけならまだマシかもしれない。映画そのものから消された人もいるからだ。レオーネと同じようにセルジオという名前の監督、セルジオ・ソリーマの作品 La Resa dei Conti(「行いの清算」というような意味だ。邦題は『復讐のガンマン』)は、『アルジェの戦い』を担当した脚本家フランコ・ソリナスが協力しているせいか、マカロニウエスタンなのに(?)普通の映画になっている珍しい作品だが、ここで人が一人削除されている。
 この映画はドイツでの劇場公開時にメッタ切り、ほとんど手足切断的にカットされたそうだ。25分以上短くされ、特に信じられないことに最重要登場人物のひとりフォン・シューレンベルク男爵という人がほとんど完全に存在を抹殺されて画面に出て来なくなっているらしい。「らしい」というのは私が見たのはドイツの劇場公開版ではなく、完全版のDVDだからだ(下記)。劇場版では登場人物を一人消しているのだから当然ストーリーにも穴が開き、この映画の売りの一つであるクライマックスでの男爵の決闘シーンも削除。とにかく映画自体がボロボロになっていた。ドイツ語のタイトルは Der Gehetzte der Sierra Madre でちょっとバッチリ決まった日本語にしにくいのだが、「シエラ・マドレの追われる者」というか「シエラ・マドレの追われたる者」というか(「たる」と語形変化させるとやはり雰囲気が出る)、とにかく主人公があらぬ罪を着せられて逃げシエラ・マドレ山脈で狩の獲物のように追われていく、というストーリーの映画のタイトルにぴったりだ。でもタイトルがいくらキマっていても映画自体がそう切り刻まれたのでは台無しだ。
 私はもちろんこの映画を1960年代のドイツでの劇場公開では見ていないが完全版のDVDを見ればどこでカットされたかがわかる。ドイツ語吹き替えの途中で突然会話がイタリア語になり、勝手にドイツ語の字幕が入ってくる部分が所々あるのだ。これが劇場公開で切られた部分である。件の男爵はドイツ語吹き替え版なのにイタリア語しかしゃべらない。つまり劇場版では全く吹き替えされていない、ということは出てきていないということだ。
 この切断行為も理由がまったくわからない。ソリーマ監督自身がいつだったかインタビューで言っていたのを読んだ記憶があるが、このフォン・シューレンベルクという登場人物は、ドイツ人の俳優エーリヒ・フォン・シュトロハイムへのオマージュだったそうだ。なるほど人物設定から容貌から『大いなる幻影』のラウフェンシュタイン大尉にそっくりだ。背後には『エリーゼのために』をモチーフにしたエンニオ・モリコーネの名曲が流れる。そこまで気を使ってくれているのによりによってドイツ人がそれをカットするとは何事か。
 
 ちょっと話が急カーブしすぎかもしれないがやはり「一人足りない」例に、私も大好きなまどみちおさん作詞の「1年生になったら」という童謡がある。「一年生になったら友達を100人作って100人みんなで富士山に登りたい」というストーリーだ。実は当時から子供心に疑問に思っていたのだが、友達が100人いれば自分と合わせるから富士登山する人数は合計で101人になるはずではないのか。一人足りないのではないか。
 この疑問への答のヒントを与えてくれたのがロシア語の мы с тобой(ムィスタヴォイ)という言い回しだ。これは直訳すると we with you なのだが、意味は「我々とあなた」でなく「あなたを含めた我々」、つまり「あなたと私」で、英語でも you and I と訳す。同様にこの友達100人も「私と君たち友達を含めた我々100人」、つまり合計100人、言語学で言う inclusive(包括的あるいは包含的)な表現と見ていいのではないだろうか。逆に富士山に登ったのが101人である場合、つまり話者と相手がきっちりわかれている表現は exclusive(排除的あるいは除外的)な表現といえる。
 
 言語には複数1人称の人称表現、つまり英語の代名詞 we にあたる表現に際して包含的なものと除外的なものを区別する、言い換えると相手を含める場合と相手は含めない場合と2種類の we を体系的に区別するものが少なからずある。アイヌ語がよく知られているが、シベリアの言語やアメリカ先住民族の言語、あとタミル語、さらにそもそも中国語の方言にもこの区別があるらしい。「少なからず」どころか実はこの区別を持つ言語は世界中に広がっているのだ。南北アメリカやアジアだけでなく環太平洋地域、南インドやアフリカ南部の言語にも見られる。さらに足元琉球語の方言にもある。印欧諸語やセム語にはないが、話者数でなく言語の数でみると包含・除外の区別は決して「珍しい」現象ではない。ちょっと例を挙げてみると以下のような感じ。それぞれ左が inclusive、右が exclusiveの「我々」だ。
Tabelle1-22
あちこちの資料から雑多に集めてきたのでちょっと統一がとれていないが、とにかくアフリカ南部からアジア、アメリカ大陸に広がっていることがわかる。ざっと見るだけで結構面白い。
 ジューホアン語というのが見慣れないが、これがアフリカ南部、ナミビアあたりで話されている言葉だ。
 中国語は体系としてはちょっとこの区別が不完全で、「我們」は基本的に inclusive、exclusive 両方の意味で使われるそうだ。他方の「咱們」が特に inclusive として用いられるのは北京語も含む北方の方言。満州語の影響なのではないかということだ。そう言われてみると、満州語と同じくトゥングース語群のエヴェンキ語にもこの対立がある。満州語とエヴェンキ語は inclusive と exclusive がそれぞれmusə と mit、bə と bū だから形まで近い。
 問題はハワイ語やジューホアン語の双数・複数という分類だ。これらは安易にウィキペディアから持ってきた例だが、双数と言うのはつまり私が一人、あなたも一人の合計二人、複数ではこちら側かあちら側かにさらにもう一人いて3人以上、つまり複数なのかと思うとどうも事情は常にそう簡単ではないらしい。言語によっては双数とやらは実は単数あるいは非複数と解釈するべきで、それを「双数」などと言い出したのは、1.文法には数、人称というカテゴリーがあり、2.人称は一人称、二人称、三人称のきっちり三つであるという思考枠から出られない印欧語頭の犯した誤解釈だというのである。これは松本克己教授の指摘だが(もちろん氏は「印欧語頭」などという下品な言い回しは使っていない)、そもそも「一人称複数で包含と除外を区別」という言い方自体に問題があるそうだ。包含形に単・複両形を持つ言語は消して珍しくない。たとえば松本氏の挙げるニブフ語(ギリヤーク語)の人称代名詞は以下のような体系をなしている。
Tabelle2-22
人称は3つだけではないと考えさえすれば極めてすっきりした体系なのに、パンフィーロフ Панфилов В. З というソ連の学者は「1人称でも2人称でも3人称でもない人称」を見抜くことができず、話し手と聞き手が含まれているのだから単数とは見なせないと考えて、全くニブフ語の言語感覚を逸脱した「双数」という概念を藪から棒に一人称にだけ設定して次のように記述した。思い切りわかりにくくなっている。
Tabelle3-22
包含形を一人称複数の一種とせずに独立した一つの人称カテゴリー(包含人称あるいは一人称+二人称)とみなさざるを得ないのはアイマラ語も同じだ。アイマラ語は数のカテゴリーがないが、後に特殊な形態素を付けて増幅形をつくることができる。
Tabelle4-22
上のように hiwasa と naya-naka を比べても唐突すぎてよくわからないが、こうすれば体系をなしているのがよくわかる。さらに南太平洋のトク・ピシンも同じパターンなのが面白い。
Tabelle5-22
トク・ピシンというのは乱暴に言えばメラネシアの現地語の枠組みの上に英語が被さってできた言語だ。mi というのは英語の me、yu は you である。yumi で包含人称を表わすというのはまことに理にかなっている。トク・ピシンには本当に一人称双数形があるが、パンフィーロフ氏はこれをどうやって図式化するのだろう。不可能としか言いようがない。
 それではこれらの言語での包含人称とやらの本質は何なのか。例えばアイヌ語の(いわゆる)一人称複数包含形には1.一人称の間接表現(引用の一人称)、2.2人称の敬称、3.不特定人称の3つの機能があるそうだ。3番目がポイントで、他の言語とも共通している。つまり包含人称は1・2・3人称の枠から独立したいわば第4の人称なのである。「不特定人称」「汎人称」、これが包含形の本質だ。アメリカの言語学では初め inclusive の代わりに indefinite plural または general plural と呼んでいたそうだ。plural が余計なのではないかとも思うが、とにかく多くの言語で(そうでない言語もあるだろうが)包含対除外の単純な二項対立にはなっていないのである。
 そもそも一口に人称代名詞と言っても独立形か所有形(つまりある意味「語」でなく形態素)か、形の違いは語形変化によるのか膠着かによっても機能・意味合いに差が出てくるからまだまだ議論分析の余地が大ありという事だろう。
 
 ところで私の感覚だと、日本語の「私たち」と「私ども」の間にちょっとこの包含対除外のニュアンスの差が感じられるような気がするのだが。「私ども」というと相手が入っていない、つまり exclusive 寄りの意味が強いのではないだろうか。実はこの点を松本教授も指摘していて、それを読んだとき私は「おおっ、著名な言語学者を同じことを考えてたぞ私!」と万歳三唱してしまった。これは私だけの考えだが、この「私たち」と「私ども」の差は直接 inclusive 対 exclusive の対立というより、むしろ「ども」を謙譲の意味とみなして、謙譲だから相手が入っているわけがないと解釈、言い換えると inclusive 対 exclusive の対立的意味合いは二次的に派生してきたと解釈するほうがいいかもしれない。
 また上述のロシア語 мы с тобой 、つまりある意味では包含表現は単純に ты и я(you and me)やмы(we)というより暖かい響きがあるそうだ。 まどみちおさんも実は一人抜かしたのではなくて、むしろ暖かい友だち感を強調したかったのかも知れない。登場人物を映画やタイトルでぶった切るのとは逆である。
 さらに驚くべきことには安井稔氏が英語にも実は inclusive と exclusive を表現し分ける場合があることを指摘している:
Let's go.
Let us go.
という例だが、前者は単に後者を短く言ったものではない。意味と言うか会話上の機能が違う。前者は Shall we go?(さあ行きましょう)、後者は Let us be free! (私たちを行かせてください、自由にしてください)と同じ、つまり Let's の us は相手が含まれる inclusiv、Let us の us は相手が含まれない exclusive の we である。
 
この記事は身の程知らずにもランキングに参加しています(汗)。
 人気ブログランキング
人気ブログランキングへ
このエントリーをはてなブックマークに追加 mixiチェック

10年くらい前の記事ですが足りない部分があったので(私の頭のことか?)大幅に書き加えました。表も画像にしました。

元の記事はこちら
内容はこの記事と同じです。

 少し前まではコーカサスやシベリア諸民族の言語をやるにはロシア語が不可欠だった。文献がロシア語で書いてあったからだ。今はもう論文なども英語になってきてしまっているのでロシア語が読めなくても大丈夫だろう。残念といえば残念である。別に英語が嫌いというわけではないのだが、何語であれ一言語ヘゲモニー状態には私は「便利だから」などと手放しでは喜べない。どうしても思考の幅が狭まるからだ。
 そのコーカサス地方の言語、タバサラン語についてちょっと面白い話を小耳にはさんだことがある。

 タバサラン語では「本」のことを kitab と言うそうだ。アラビア語起源なのが明らかではないか。よりによってこの kitab、あるいは子音連続 K-T-B は、私が馬鹿の一つ覚えで知っている唯一のアラビア語なのである。イスラム教とともにこの言語に借用されたのだろう。
 そこで気になったので、現在イスラム教の民族の言語で「本」を何というのかちょっと調べてみた。家に落ちていた辞書だのネットの(無料)オンライン辞書だのをめくら滅法引きまくっただけなので、ハズしているところがあるかも知れない。専門家の方がいたらご指摘いただけるとありがたい。その言語の文字で表記したほうがいいのかもしれないが、それだと不統一だし読めないものもあるのでローマ字表記にした。言語名のあとに所属語族、または語群を記した。何も記していない言語は所属語族や語群が不明のものである。「語族」と「語群」はどう違うのかというのが実は一筋縄ではいかない問題なのだが、「語族」というのは異なる言語の単語間に例外なしの音韻対応が見いだせる場合、その言語はどちらも一つの共通な祖語から発展してきたものとみなし、同一語族とするもの。この音韻対応というのは比較言語学の厳密な規則に従って導き出されるもので、単に単語が(ちょっと)似ているだけですぐ「同族言語ダー」と言い出すことは現に慎まなければいけない。時々そういうことをすぐ言い出す人がいるのは困ったものだ。現在同一語族ということが科学的に証明されているのは事実上印欧語族とセム語族だけだといっていい。そこまで厳密な証明ができていない言語は「語群」としてまとめる。もちろんまとめるからにはまとめるだけの理由があるのでこれもちょっと似た点が見つかったからと言ってフィーリングで「語群」を想定することはできない。「テュルク語」については「語族」でいいじゃないかとも思うのだが、逆に似すぎていて語族と言うより一言語じゃないかよこれ、とでも思われたのか「テュルク語族」とは言わずに「テュルク諸語」と呼んでいる。
 話が飛んで失礼。さて「本」をイスラム教国の言葉でなんというか。基本的に男性単数形を示す。
NEU07-Tabelle1
 このようにアラビア語の単語が実に幅広い語族・地域の言語に取り入れられていることがわかる。アラビア語から直接でなく一旦ペルシャ語を経由して取り入れた場合も少なくないようだが。例外はアルバニア語とボスニア語。前者は明らかにロマンス語からの借用、後者はこの言語本来の、つまりスラブ語本来の語だ。ここの民族がイスラム化したのが新しいので、言語までは影響されなかったのではないだろうか。ンドネシア語の buku は英語からの借用だと思うが、kitab という言葉もちゃんと使われている。pustaka は下で述べるように明らかにサンスクリットからの借用。インドネシア語はイスラム教が普及する(ずっと)以前にサンスクリットの波をかぶったのでその名残り。つまり pustaka は「本」を表わす3語のうちで最も古い層だろう。単語が三つ巴構造になっている。しかも調べてみるとインドネシア語には kitab と別に Alkitab という語が存在する。これは Al-kitab と分析でき、Al はアラビア語の冠詞だからいわば The-Book という泥つきというか The つきのままで借用したものだ。その Alkitab とは「聖書」という意味である。クルド語の pertuk は古アルメニア語 prtu(「紙」「葦」)からの借用だそうだがそれ以上の語源はわからない。とにかくサンスクリットの pustaka ではない。

 面白いからもっと見てみよう。「アフロ・アジア語群」というのは昔「セム・ハム語族」と呼ばれていたグループだ。アラビア語を擁するセム語の方は上でも述べたように「語族」といっていいだろうが、ハム語のほうは「族」という言葉を使っていいのかどうか個人的にちょっと「?」がつくので、現在の名称「アフロ・アジア語」のほうも「族」でなく「群」扱いしておいた。
NEU07-Tabelle2
イスラム教徒が乗り出していった地域で話されていたアフリカのスワヒリ語は「イスラム教の民族の言語」とは言いきれないのだが、「本」という文化語をアラビア語から取り入れているのがわかる。ハウサ語の「本」は形がかけ離れているので最初関係ないのかと思ったが、教えてくれた人がいて、これも「ごく早い時期に」アラビア語から借用したものなのだそうだ。ハウサ語の f は英語やドイツ語の f とは違って、日本語の「ふ」と同じく両唇摩擦音だそうだから、アラビア語bが f になったのかもしれないが、それにしても形が違いすぎる。「ごく早い時期」がいつなのかちょっとわからないのだが、ひょっとしたらイスラム教以前にすでにアラビア語と接触でもしていたのか、第三の言語を仲介したかもしれない。ソマリ語にはもう一つ buug という「本」があるが、インドネシア語の buku と同様英語からの借用である。

 インドの他の言語は次のようになる。
NEU07-Tabelle3
最後に挙げたインド南部のタミル語以外は印欧語族・インド・イラン語派で、冒頭にあげたペルシア語、ウルドゥ語、パシュトー語と言語的に非常に近い(印欧語族、インド・イラン語派)がサンスクリット形の「本」が主流だ。ベンガル語 pustok もヒンディー語 pustak もサンスクリットの pustaka 起源。ただ両言語の地域北インドは現在ではヒンドゥ―教だが、ムガル帝国の支配下にあった時期が長いのでアラビア語系の「本」も使われているのはうなづける。これは直接アラビア語から借用したのではなく、ペルシャ語を通したもの。またベンガル語の boi は英語からの借用かと思ったらサンスクリットの vahikā (「日記、帳簿」)から来ている古い語だそうだ。
 インドも南に下るとイスラム教の影響が薄れるらしく、アラビア語形が出てこなくなる。シンハラ語は仏教地域。これら印欧語はサンスクリットから「本」という語を「取り入れた」のではなく、本来の語を引き続き使っているに過ぎない。それに対してタミル語、テルグ語、マラヤラム語は印欧語ではないから、印欧語族のサンスクリットから借用したのだ。これらの言語はヒンドゥー教あるいは仏教地域である。
 とにかく言語の語彙と言うのは階層構造をなしていることがわかる。上のインドネシア語の pustaka も後にイスラム教を受け入れたのでアラビア語系の語に取って代わられたが消滅はしていない。もっともバリ島など、今もヒンドゥー教地域は残っている。そういうヒンドゥー地域では kitab は使わないのかもしれない。
 「本」を直接アラビア語からでなくペルシャ語を通して受け入れた言語も多いようだが、ではイスラム以前のペルシャ語では「本」を何といっていたのか。中期ペルシャ語(パフラヴィー語)を見ると「本」を表す語が3つあったらしい。mādayān、nāmag、nibēg の3語で、なるほどアラビア語とは関係ないようだ。本来のイラニアン語派の語だろう。 mādayān は古アルメニア語に借用され(matean、「本」)、そこからまた古ジョージア語に輸出(?)されている(maṭiane、「本、物語」)。nāmag も namak (「字」)としてやっぱり古アルメニア語に引き継がれたし、そもそも現代ペルシャ語にもnāme として残っている。「字」という意味の他に合成語に使われて「本」を表す: filmnâme(「脚本」)。最後の nibēg も nebiという形で現代ペルシャ語に細々と残っており「廃れた形」ではあるが「経典」「本」。昔はこの語でコーランを表していたそうだ。

 ではそのアルメニア語やジョージア語では現在どうなっているのか。これらの言語はタバサラン語のすぐ隣、つまりコーカサスで話されているが、キリスト教民族である。アラビア語とは見事に無関係だ。
NEU07-Tabelle4
アルメニア語の matyan は上述の古ペルシャ語 mādayān の子孫で、主流ではなくなったようだが、「雑誌」「原稿」「本」など意味が多様化してまだ存命(?)だ。ジョージア語でも maṭiane(「聖人伝」)として意味を変えたが単語としては生き残っている。girk、cigni がアルメニア語、ジョージア語本来の言葉。オセチア語の činyg は古い東スラブ語の kŭniga からの借用だそうだ。道理で現在のスラブ諸語と形がそっくりだ(下記)。オセチア語と上にあげたイスラム教のタジク語は同じ印欧語のイラニアン語派だし話されている地域も互いにごく近いのに語彙が明確に違っているのが非常に面白い。しかしそのタジク語にも上記中世ペルシャ語の nāmag に対応する noma(「字」)という言葉が存在する。

 また次の言語はセム語族で、言語的には本家アラビア語と近いのに「本」を kitab と言わない。アムハラ・エチオピア民族はキリスト教国だったし、ヘブライ語はもちろんユダヤ教。
NEU07-Tabelle5
 アムハラ語はもちろんゲエズ語からの引継ぎだが、後者はヨーロッパのラテン語と同じく死語なので、本当の音価はわからない。ゲエズ文字をアムハラ語で読んでいるわけだから音形が全く同じになるのは当然と言えば当然だ。アムハラ語もゲエズ語もさすがセム語族だけあって「語幹は3子音からなる」という原則を保持している。これもアラビア語と同様 m- の部分は語幹には属さない接頭辞だから差し引くと、この語の語幹は ṣ-h-f となる。その語幹の動詞 ṣäḥäfä は「書く」。このゲエズ語の「本」はアラビア語に maṣḥaf という形で借用され、「本」「写本」という意味で使われている。アラビア語の方が借用したとはまた凄いが、それどころではなく、ヘブライ語までこのゲエズ語を輸入している。ヘブライ語には「聖書の写本」を表す mitskháf  という単語があるが、これは mäṣḥäf の借用だそうだ。なおゲエズ語の動詞の ṣäḥäfä は古典アラビア語の ṣaḵafa に対応していると考えられるが、後者は「書く」でなく「地面を掘る」という意味だそうだ。は? 
 ヘブライ語の sefer(語根はs-f-r、f は本来帯気の p だそうだ)はアッカド語の時代から続く古い古いセム語の単語で、アラビア語にもその親戚語 sifr という「本」を表す語が存在する。ただ使用範囲が限定されているようだ。
 逆にヘブライ語には katáv(「書く」)あるいは ktivá(「書くこと」)という語もある。一目瞭然、アラビア語の k-t-b と対応する形だ。「本」という意味はないようだが、とにかく単語自体はアラビア語、ヘブライ語どちらにも存在し、そのどちらがメインで「本」という意味を担っているかの程度に違いがあるだけだ。
 
 それにしても「本」などという文化語は時代が相当下ってからでないと生じないはずだ。本が存在するためにはまず文字が発明されていなければいけないからだ。当該言語が文字を持っていなかったら(文字のない言語など特に昔はゴロゴロあった)本もへったくれもない。だから当時の「先進国」から本という実体が入ってきたのと同時にそれを表す言葉も取り入れたことが多かったのだろう。普通「その国にないもの」が導入される時は外来語をそのまま使う。日本語の「パン」「ガラス」などいい例だ。
 言い換えると「本」という語は宗教と共にということもあるが文字文化と共に輸入されたという側面も大きいに違いない。イスラム教が来る以前にすでにローマ文化やラテン語と接していたアルバニア、グラゴール文字、キリル文字、ラテン文字など、文字文化にふれていたボスニアで、「本」がアラビア語にとって変わられなかったのもそれで説明できる。そういえばバルカン半島に文字が広まったのはキリスト教宣教と共にで、9世紀のことだ。イスラム教はすでに世界を席捲していたが、バルカン半島にイスラム教が入ってきたのはトルコ経由で14世紀になってからだ。当地にはとっくに書き言葉の文化が確立されていた。
 アルメニア語、ジョージア語、アムハラ語(ゲーズ語)も古い文字の伝統があって、独自の文字を発達させていた。ヘブライ語やサンスクリット、タミル語は言わずもがな、イスラム教どころかキリスト教が発生する何百年も前から文字が存在した。外来語に対する抵抗力があったのだろう。

 まとめてみるとこうなる。イスラムの台頭とともにアラビア語の「本」という語が当地の言語に語族の如何を問わずブワーッと広まった。特にそれまで文字文化を持っていなかった民族言語は何の抵抗もなく受け入れた。
 すでに文字文化を持っていた言語はちょっと様子が違い、イスラム以前からの語が引き続き使われたか、アラビア語の「本」を取り入れたのしても昔からの語は生き残った。ただその際意味変化するか、使用範囲が狭くなった。
 イスラム教の波を被らなかった民族の言語はアラビア語系の語を取り入れなかった。
 その一方、初期イスラム教のインパクトがどれほど強かったのか改めて見せつけられる思いだ。千年にわたる文字文化を誇っていたペルシャ語、サンスクリットという二大印欧語を敵に回して(?)一歩も引かず、本来の語、mādayān などを四散させてしまった。その際ペルシャ語は文字までアラビア文字に転換した。もっともそれまで使っていたパフラヴィ―文字はアラム文字系統だったからアラビア文字への転換は別に画期的と言えるほどではなかっただろうが、その侵略された(?)ペルシャ語は外来のアラビア語をさらに増幅して広める助けまでしたのだ。ペルシャ語のこのアンプ作用がなかったら中央アジアにまではアラビア語形は浸透しなかったかもしれない。
 ボスニア、アルバニアはずっと時代が下ってからだったから語が転換せずに済んだのだろう。

 実はなんとベラルーシ語にもこのアラビア語起源の кітаб (kitab)言う語が存在する。「本」一般ではなくイスラム教の宗教書のことだが、これはベラルーシ語がリプカ・タタール人によってアラビア文字で表記されていた時代の名残である。このアラビア語表記は16世紀ごろから20世紀に入るまで使われていた。そのころはトルコ語もアラビア文字表記されていて、現在のラテン語表記になったのはやはり20世紀初頭だ。
 このリプカ・タタール人というのはベラルーシばかりでなく、ポーランドやリトアニアにもいる。私がヨーロッパ系のポーランド人から自国内のリプカ・タタール人(国籍としてはポーランド人)と間違われたことは以前にも書いた通りだ。自慢にもならないが。

この記事は身の程知らずにもランキングに参加しています(汗)。
人気ブログランキングへ
このエントリーをはてなブックマークに追加 mixiチェック

↑このページのトップヘ