Глава 2.1. Лингвистическое время: глоттохронология, лексикостатистика

I. Языковая дивергенция.— II. Роль базисной лексики в датировке языковой дивергенции.— III. Метод Сводеша.— IV. Соотношение между постулатами глоттохронологии и реально наблюдаемой языковой историей.— V. Модификация основной формулы глоттохронологии.— VI. Глоттохронология германских языков.— VII. Этимостатистика.

I. Концепция генеалогического древа предполагает, что родственные языки развиваются из общего языка-предка. Исходя только из структуры дерева, мы можем дать лишь относительную хронологию языковой дивергенции: так, мы можем сказать, что праславянский язык существовал позже прабалтославянского, а последний — позже праиндоевропейского, но не можем сказать, когда существовал каждый из них. Интересно задаться вопросом: существует ли способ измерения абсолютной временн{о/}й глубины языковой дивергенции, иными словами, способ определения времени распада праязыка?

В случаях, когда нам хорошо известна история соответствующей языковой семьи, ответ прост: глубина дивергенции соответствует реально засвидетельствованному времени раздельного существования отдельных языков. Так, в случае с романскими языками мы можем с уверенностью утверждать, что время распада общероманского праязыка (т. е. народной латыни) приблизительно совпадает со временем падения Западной Римской Империи: именно с этого момента диалекты народной латыни, на которых говорили в разных концах этого политического объединения, постепенно начинают превращаться в отдельные языки.

Однако в подавляющем большинстве случаев момент распада праязыка исторически не засвидетельствован. Можно ли по чисто лингвистическим данным определить календарное время дивергенции двух языков, то есть время существования их общего праязыка?

На этот вопрос можно ответить положительно только в том случае, если какие-либо из изменений происходят с более или менее постоянной скоростью: тогда по количеству произошедших изменений можно судить о времени, отделяющем язык от праязыка или два родственных языка друг от друга. Изменения эти должны происходить в одной подсистеме языка, поскольку инновации в разных подсистемах могут быть несопоставимы между собой: например, едва ли можно определить, для чего нужно больше времени — для двух передвижений согласных или для возникновения сингармонизма, для падения редуцированных или для развития эргативности.

II. Но какие из многочисленных языковых изменений могут иметь постоянную скорость? Рассмотрим возможные типы языковых инноваций:

1) изменения в фонетике;

2) изменения в грамматике (в грамматической семантике и синтаксисе);

3) изменения плана содержания слов (т. е. семантические изменения);

4) замена грамматических морфем;

5) лексические замены.

Опираться на фонетические и грамматические изменения сложно из-за их несопоставимости, семантические изменения в настоящее время слишком слабо изучены. Кроме того, известны случаи очень быстрого изменения как фонологических, так и морфологических систем (особенно при активных языковых контактах, см. Гл. 1.4), а также наоборот — чрезвычайного фонологического и морфологического консерватизма, сохранения исходных систем на протяжении очень долгих периодов времени (особенно в случае изолированного существования языка — например, в островных или горных условиях). В то же время изменения в лексике наиболее пригодны для строгих датировок, так как допускают применение статистических методов.

В наиболее простых случаях датировки, полученные при помощи подсчета базисной лексики, хорошо коррелируют с датировками, полученными путем анализа других элементов языка. Для случаев же более сложных желательно пользоваться некоторым единым критерием — с тем, чтобы получать сопоставимые результаты.

Выше (см. Гл. 1.1) мы писали, что основным критерием близости языков — хотя и с многочисленными оговорками — может служить именно лексическая близость. Чтобы сохранялось взаимопонимание между различными поколениями носителей, необходимо, чтобы лексических замен было не слишком много: фонетические и морфологические изменения, как мы видели, мало препятствуют коммуникации, но очень большой процент лексических различий несомненно приведет к утрате взаимопонимания, скажем, между дедами и внуками. При этом меньше всего замен, по-видимому, должно быть в базисной лексике, т. е. в основном словарном составе языка, составляющем его ядро. Кроме того, базисная лексика, в отличие от прочих компонентов языка (т. е. "манеры выражаться" и культурной лексики), мало меняется в ходе языковых контактов, поэтому подсчеты, основанные на ней, позволяют вычислить именно время самостоятельного существования языка, а не степень его вовлеченности в контакты с другими языками.

III. На предположении о постоянной скорости изменений в базисной лексике построил свою теорию глоттохронологии, иногда называемой также лексикостатистикой, американский ученый Морис Сводеш. Эта теория базируется на следующих пяти постулатах (в работах самого М. Сводеша, см. [НВЛ 1960], они не сформулированы, поэтому мы приводим их по книге [Арапов, Херц 1974, 21-22, 25]):

"1. В словаре каждого языка можно выделить специальный фрагмент, который мы будем называть дальше основной, или стабильной частью.

2. Можно указать список значений, которые в любом языке обязательно выражаются словами из основной части... Будем говорить, что эти слова образуют основной список (ОС). Через N{0} обозначим число слов в ОС.

3. Доля p слов из ОС, которые сохранятся (не будут заменены другими словами) на протяжении интервала времени {Dд} t... постоянна (то есть зависит только от величины выбранного промежутка, но не от того, как он выбран или какие слова какого языка рассматриваются).

4. Все слова, составляющие ОС, имеют одинаковые шансы сохраниться (соответственно, не сохраниться, "распасться") на протяжении этого интервала времени.

5. Вероятность для слова из ОС праязыка сохраниться в ОС одного языка-потомка не зависит от его вероятности сохраниться в аналогичном списке другого языка-потомка."

Из совокупности приведенных постулатов выводится основная математическая зависимость глоттохронологии:

N(t)= N{0}e^-{^l^}^t

где время, прошедшее от начала момента развития до некоторого последующего момента обозначается как t (и измеряется в тысячелетиях); N{0} есть исходный ОС; {l} есть "скорость выпадения" слов из N{0}; и N(t) есть доля слов исходного ОС, сохранившихся к моменту t. Зная коэффициент {l} и долю слов, сохранившихся в данном языке из списка ОС, мы можем вычислить длину прошедшего промежутка времени:

Доля слов из ОС, сохранившихся в двух языках, будет составлять соответственно:

N{2}(t)= ,

а время, разделяющее их, будет вычисляться как:

IV. Несмотря на простоту и элегантность данного математического аппарата, уже давно было замечено, что он не очень хорошо работает. Так, К. Бергсланд и Х. Фогт [Bergsland, Vogt 1962], рассматривая материал скандинавских языков, показали, что скорость распадения лексики в исландском языке за последнюю тысячу лет равнялась всего {=~} 0,04, а в литературном норвежском (риксмоле) — {=~} 0,2 (и это при том, что М. Сводеш в качестве константы {l} предлагал величину 0,14!). Соответственно, получались вполне нелепые результаты: для исландского языка около 100-150 лет, а для риксмола — около 1400 лет развития — при том, что оба языка возникли из одного источника и развивались независимо в течение около 1000 лет. В большинстве случаев применение теории Сводеша давало явно "умоложенные" даты по сравнению с теми, которые можно было предположить на основании реальной истории языков. Все это заставило большинство исследователей поставить под сомнение всю глоттохронологическую методику.

Несмотря на это, глоттохронология продолжает существовать. Дело в том, что есть непреложный эмпирический факт, с которым приходится считаться: чем ближе друг к другу языки, тем больше между ними совпадений в области базисной лексики. Так, все индоевропейские языки (из разных подгрупп: немецкий и русский, хинди и польский, болгарский и румынский) имеют между собой около 30% совпадений; все балто-славянские языки (литовский и русский, латышский и чешский) имеют между собой примерно 45-50% совпадений; все славянские языки (русский и польский, чешский и болгарский), а также все германские языки (немецкий и шведский, голландский и исландский) имеют между собой примерно 75-85% совпадений. Налицо, таким образом, явная корреляция между степенью родства и количеством совпадений в базисной лексике. Глоттохронологию, по-видимому, нельзя сбрасывать со счетов, хотя нужен пересмотр некоторых ее постулатов.

V. Здесь следует отметить четыре момента:

1) В случае активных контактов между языками возникают многочисленные заимствования, в том числе и в базисной лексике. Следует, однако, представлять себе, что замена исконного слова на исконное же имеет несколько иной механизм, чем замена исконного слова на заимствование. Замены первого типа происходят постепенно, вне зависимости от культурно-исторического контекста, и только для них можно предполагать некоторую постоянную скорость. Замены второго типа могут происходить в течение краткого времени (при активизации культурных контактов) и, таким образом, как бы нарушают естественный ход развития лексики. Неучет различия этих двух типов замен может привести к серьезным искажениям результатов глоттохронологии. Заметим, что подавляющее большинство "неудачных" результатов глоттохронологических подсчетов, приводивших к искаженным классификациям и неверным датировкам, обусловлено именно неразличением этих двух типов лексических замен. Так, упомянутый выше случай с исландским языком и риксмолом легко объясняется, если учесть, что в исландском вовсе нет заимствований (в силу его изолированного существования), в то время как стословный список риксмола включает в себя 11 датских, 3 шведских и 2 немецких заимствования. Число исконных замен в исландском и норвежском, таким образом, оказывается вполне сопоставимо — однако их не 14%, как это должно было бы быть по Сводешу, а около 5% за последнюю тысячу лет. Аналогичную цифру мы получаем и для других языков, чья история зафиксирована на протяжении нашей эры (японского, китайского, романских и др.).

2) Вероятность для слова из любого списка базисной лексики сохраниться в одном из языков-потомков становится зависимой от того, сохранилось ли оно в другом языке-потомке, при наличии между этими языками-потомками интенсивных контактов (в ту эпоху, когда они были заметно родственными): в активно взаимодействующих заметно родственных языках имеется тенденция к сохранению и/или выпадению из базисной лексики одних и тех же слов (при этом далеко не всегда можно говорить о заимствовании); иногда такие контакты могут вызывать "подскок" доли совпадений даже на 5-6%. Подобную картину мы наблюдаем, например, для белорусского и западнославянских языков, немецкого и скандинавских и пр.

В то же время наличие в языке культивируемой литературной нормы на скорость замены базисной лексики, по-видимому, не влияет: в таких случаях разговорный язык просто отходит от нормы и изменяется сам по себе — такова ситуация во французском, чешском, персидском и многих других языках.

Существенно, однако, что, как показывают многочисленные эксперименты, средняя (по списку) вероятность выпадения слов одинакова для любых языков.

3) Третий постулат глоттохронологии, по-видимому, не вполне верен: доля p слов из ОС, которые сохранятся (не будут заменены другими словами) на протяжении интервала времени {Dд} t не постоянна, но меняется с течением времени. Чем дольше слово "прожило" в языке, тем больше шанс, что оно вскоре выпадет (известны примеры широкого распространения слова в древних языках при почти полной его утрате в современных). Коэффициент {l}, таким образом, должен зависеть от времени t.

Как показывают исследования языков с достаточной длинной письменной историей, скорость распада основного списка равна примерно 0,05 лишь на протяжении последней тысячи — полутора тысяч лет. Если же рассмотреть развитие какого-либо языка в течение, например, 2,5 тысячелетий, то скорость его развития окажется равной {=~} 0,1 (см. [Старостин С. 1989b, 10-13]).

4) С другой стороны, вызывает сомнения и четвертый постулат: все слова, составляющие ОС, имеют одинаковые шансы сохраниться на протяжении интервала времени t. На самом деле среди слов, составляющих ОС, есть более устойчивые слова, сохраняющиеся буквально на протяжении тысяч лет, а есть гораздо менее устойчивая лексика: так, шансов на выпадение из списка у слов `маленький' или `кожа' в целом значительно больше, чем у слов `я', `ты' или `ухо'. Коэффициент сохраняемости индивидуального слова может варьировать в зависимости от культурного и лингвистического окружения (так, слова `облако' и `хвост' весьма устойчивы в тюркских языках и нестабильны в германских).

В силу этих причин наблюдается следующая зависимость: по мере выпадения слов из списка скорость выпадения слов из него — коэффициент {l} — уменьшается, поскольку начинают происходить повторные замены среди менее устойчивой части списка. Таким образом, коэффициент {l} должен зависеть еще и от доли сохранившихся слов N(t).

Эти соображения приводят нас к переформулировке основной зависимости глоттохронологии в следующем виде (обозначим для простоты N(t) как c, а N{0} примем за единицу, поскольку мы имеем дело именно со стословным списком):

Для двух языков будем иметь:

Соответственно, время разделения двух языков будет вычисляться как:

Эта формула, очевидно, является аппроксимацией сложной математической зависимости, учитывающей индивидуальные вероятности выпадения каждого отдельного слова в ОС; она, однако, довольно хорошо работает на всем известном нам языковом материале при принятии {l} = 0,05.

VI. Рассмотрим стословные списки нескольких германских языков:

Таблица 2.1.1

Слово	Нем.	Англ.	Голл.	Исл.	Норв. (гьестал)	Швед.	Дат.
весь	all 1	all 1	al(le) 1	allir 1	adle 1	all 1	al 1
пепел	Asche 2	ashes 2	as 2	aska 2	{Oc}ska 2	aska 2	aske 2
кора	Rinde 3	bark -1	bast 4	b{o:}rkur 5	b{Oc}rk 5	bark 5	bark 5
живот	Bauch 6	belly 7	buik 6	magi 8	maie 8	buk 6	mave 8
живот				kvi{dh=}ur 9		mage 8
большой	gro{sz} 10	big 11	groot 10	st{o/}r 15	store 15	stor 15	stor 15
большой				mikill 16
птица	Vogel 17	bird 18	vogel 17	fugl 17	fogg(e)l 17	f{ao}gel 17	fugl 17
кусать	bei{sz}en 19	bite 19	bijten 19	b{i/}ta 19	bida 19	bita 19	bide 19
черный	schwarz 20	black 21	zwart 20	svartur 20	svarte 20	svart 20	sort 20
кровь	Blut 22	blood 22	bloed 22	bl{o/}{dh=} 22	blo 22	blod 22	blod 22
кость	Knochen 23	bone 24	been 24	bein 24	b{a:}in 24	ben 24	ben 24
грудь	Brust 25	breast 25	borst 25	brj{o/}st 25	br{o:}st 25	br{o_}st 25	bryst 25
жечь	brennen 26	burn 26	branden 26	brenna 26	brenna 26	br{a:}nna 26	br{ae}nde 26
ноготь	Nagel 27	nail 27	nagel 27	nagl 27	negl 27	nagel 27	negl 27
облако	Wolke 28	cloud 155	wolk 28	sk{y/} 29	sjya 29	sky 29	sky 29
холодный	kalt 31	cold 31	koud 31	kaldur 31	kalle 31	kall 31	kold 31
приходить	kommen 32	come 32	komen 32	koma 32	k{Oc}ma 32	komma 32	komme 32
умирать	sterben 33	die -2	sterven 33	deyja 34	d{o:}y 34	d{o:} 34	d{o#/} 34
собака	Hund 35	dog 36	hond 35	hundur 35	honn 35	hund 35	hund 35
пить	trinken 37	drink 37	drinken 37	drekka 37	drikka 37	dricka 37	drikke 37
сухой	trocken 38	dry 38	droog 38	{tp}urr 39	torre 39	torr 39	t{o#/}r 39
ухо	Ohr 40	ear 40	oor 40	eyra 40	{o:}yra 40	{o:}ra 40	{o#/}re 40
земля	Erde 41	earth 41	aarde 41	j{o:}r{dh=} 41	jor 41	jord 41	jord 41
земля				mold 42	m{Oc}ll 42
есть	essen 43	eat 43	eten 43	bor{dh=}a 44	eda 43	{a:}ta 43	spise -1
яйцо	Ei 45	egg 45	ei 45	egg 45	egg 45	{a:}gg 45	{ae}gg 45
глаз	Auge 46	eye 46	oog 46	auga 46	aua 46	{o:}ga 46	{o#/}je 46
жир	Fett -1	fat 47	vet 47	fita 47	feitt 47	fett 47	fedt 47
перо	Feder 48	feather 48	veer 48	fj{o:}{dh=}ur 48	fj{o:}r 48	fj{a:}der 48	fjeder, fjer 48
огонь	Feuer 49	fire 49	vuur 49	eldur 50	ell 50	eld 50	ild 50
рыба	Fisch 51	fish 51	vis 51	fiskur 51	fisk 51	fisk 51	fisk 51
летать	fliegen 52	fly 52	vliegen 52	flj{u/}ga 52	fjoga 52	flyga 52	flyve 52
нога	Fu{sz} 53	foot 53	voet 53	f{o/}tur 53	fod 53	fot 53	fod 53
полный	voll 54	full 54	vol 54	fullur 54	fodle 54	full 54	fuld 54
давать	geben 55	give 55	geven 55	gefa 55	je 55	giva 55	give 55
хороший	gut 56	good 56	goed 56	g{o/}{dh=}ur 56	goe 56	god 56	god 56
зеленый	gr{u:}n 57	green 57	groen 57	gr{a:}nn 57	gr{o:}ne 57	gr{o:}n 57	gr{o#/}n 57
волосы	Haar 58	hair 58	haar 58	h{a/}r 58	h{Oc}r 58	h{ao}r 58	h{ao}r 58
рука	Hand 59	hand 59	hand 59	h{o:}nd 59	h{Oc}nn 59	hand 59	h{ao}nd 59
голова	Kopf -2	head 60	hoofd 60	h{o:}fu{dh=} 60	h{Oc}ve 60	huvud 60	hoved 60
слышать	h{o:}ren 61	hear 61	horen 61	heyra 61	h{o:}yra 61	h{o:}ra 61	h{o#/}re 61
сердце	Herz 62	heart 62	hart 62	hjarta 62	jerta 62	hjerta 62	hjerte 62
рог	Horn 63	horn 63	hoorn 63	horn 63	h{Oc}dd(e)n 63	horn 63	horn 63
я	ich 64	I 64	ik 64	{e/}g 64	{a:}g 64	jag 64	jeg 64
убивать	t{o:}ten 65	kill 66	doden 65	drepa 67	dreba 67	dr{a:}pa 67	dr{ae}be 67
убивать						d{o:}da 65
колено	Knie 68	knee 68	knie 68	hn{e/} 68	kne 68	kn{a:} 68	kn{ae} 68
знать	kennen 69	know 69	kennen 69	vita 70	veda 70	k{a:}nna 69	kende 69
знать	wissen 70		weten 70			veta 70	vide 70
лист	Blatt 71	leaf 72	blad 71	bla{dh=} 71	bla 71	blad 71	blad 71
лист				(laufbla{dh=}) 72 + 71		l{o:}f 72
лежать	liegen 73	lie 73	liggen 73	liggja 73	liddja 73	ligga 73	ligge 73
печень	Leber 74	liver 74	lever 74	lifur 74	livr 74	lever 74	lever 74
длинный	lang 75	long 75	lang 75	langur 75	lange 75	l{ao}ng 75	lang 75
вошь	Laus 76	louse 76	luis 76	l{u/}s 76	lus 76	lus 76	lus 76
мужчина	Mann 77	man 77	man 77	ma{dh=}ur 77	mann 77	man 77	mand 77
много	viel 78	many 79	veel 78	margur 79	mye 16	mycket 16	meget 16
много		much 16		miki{dh=} 16	mange 79	m{ao}nga 79	mange 79
мясо	Fleisch 80	meat 81	vlees 80	kj{Oc}t 83	kj{o:}d 83	k{o:}tt 83	k{o#/}d 83
луна	Mond 84	moon 84	maan 84	tungl 85	m{Oc}ne 84	m{ao}ne 84	m{ao}ne 84
луна				m{a/}ni 84
гора	Berg 86	mountain -3	berg 86	fjall 87	fjedd(e) 87	berg 86	bjerg 86
гора							fjeld 87
рот	Mund 88	mouth 88	mond 88	munnur 88	monn 88	mun 88	mund 88
имя	Name 89	name 89	naam 89	nafn 89	nabbn 89	namn 89	navn 89
шея	Hals 90	neck 91	hals 90	h{a/}ls 90	hals 90	hals 90	hals 90
шея			nek 91
новый	neu 92	new 92	nieuw 92	n{y/}r 92	nye 92	ny 92	ny 92
ночь	Nacht 93	night 93	nacht 93	n{o/}tt 93	n{Oc}tt 93	natt 93	nat 93
нос	Nase 94	nose 94	neus 94	nef 95	nase 94	n{a:}sa, nos 94	n{ae}se 94
не	nicht 96	not 96	niet 96	ekki 97	ikke 97	icke, ej 97	ikke 97
один	ein 98	one 98	een 98	einn 98	enn 98	en 98	en 98
человек	Mensch 77	man 77	mens, man 77	ma{dh=}ur, manneskja 77	mennesje 77	menniska 77	menneske 77
дождь	Regen 99	rain 99	regen 99	rigna 99	regne 99	regn 99	regn 99
красный	rot 100	red 100	rood 100	rau{dh=}ur 100	raue 100	r{o:}d 100	r{o#/}d 100
дорога	Weg 101	road 102	weg 101	vegur 101	veg 101	v{a:}g 101	vei 101
дорога		way 101
корень	Wurzel 103	root 103	wortel 103	r{o/}t 103	rod 103	rot 103	rod 103
круглый	rund -3	round -4	rond -1	kringl{o/}ttur 104	ronne -1	rund -1	rund -1
песок	Sand 105	sand 105	zan 105	sandur 105	sand 105	sand 105	sand 105
сказать	sagen 106	say 106	zeggen 106	segja 106	seia 106	s{a:}ga 106	sige 106
видеть	sehen 107	see 107	zien 107	sj{a/} 107	sj{Oc} 107	se 107	se 107
семя	Same 108	seed 108	zaa 108	fr{a:} 109	fr{a:} 109	fr{o:} 109	fr{o#/} 109
сидеть	sitzen 110	sit 110	zitten 110	sitja 110	sidja 110	sitta 110	sidde 110
кожа	Haut 111	skin -5	huid 111	h{u/}{dh=} 111	sjinn 168	hud 111	hud 111
кожа			vel 112	skinn 168		skinn 168
спать	schlafen 113	sleep 113	slapen 113	sofa 114	s{Oc}va 114	sova 114	sove 114
маленький	klein 115	small 116	klein 115	l{i/}till 117	lid(e)n 117	liten 117	lille, liden 117
маленький		little 117		sm{a/}r 116		sm{ao} 116
дым	Rauch 118	smoke 169	rook 118	reykur 118	r{o:}yg 118	r{o:}k 118	r{o#/}g 118
стоять	stehen 119	stand 119	staan 119	standa 119	st{Oc} 119	st{ao} 119	st{ao} 119
звезда	Stern 120	star 120	ster 120	stjarna 120	sj{o:}dna 120	stjern(a) 120	stjerne 120
камень	Stein 121	stone 121	steen 121	steinn 121	steid(e)n 121	sten 121	sten 121
солнце	Sonne 122	sun 122	zon 122	s{o/}l 122	sol 122	sol 122	sol 122
плавать	schwimmen 123	swim 123	zwemmen 123	synda 124	s{o:}mja 123	simma 123	sv{o#/}mme 123
хвост	Schwanz 125	tail 126	staart 127	hali 128	hale 128	stjert 127	hale 128
хвост				skott 129
тот	jener 130	that 131	die 131	{tp}essi 131	denn, d{a:} 131	den 131	den 131
тот				s{a/} 170			hin,hint 172
этот	dieser 131	this 131	deze 131	{tp}essi 131	dette 131	detta 131	dette 131
ты	du 132	you 133	jij, je 133	{tp}{u/} 132	du 132	du 132	du 132
язык	Zunge 134	tongue 134	tong 134	tunga 134	tonga 134	tunga 134	tunge 134
зуб	Zahn 135	tooth 135	tand 135	t{o:}nn 135	t{Oc}nn 135	tand 135	tand 135
дерево	Baum 136	tree 137	boom 136	tr{e/} 137	tre 137	tr{a:}d 137	tr{ae} 137
два	zwei 138	two 138	twee 138	tveir 138	to 138	tv{ao} 138	to 138
идти	gehen 139	go 139	gaan 139	fara 250	g{Oc} 139	g{ao} 139	g{ao} 139
теплый	warm 140	warm 140	warm 140	hl{y/}r 141	varme 140	varm 140	varm 140
вода	Wasser 142	water 142	water 142	vatn 142	vatt(e)n 142	vatten 142	vand 142
мы	wir 143	we 143	wij 143	vi{dh=} 143	me 211	vi 143	vi 143
что	was 144	what 144	wat 144	hva{dh=} 144	ka 144	hvad 144	hvad 144
белый	wei{sz} 145	white 145	wit 145	hv{i/}tur 145	kvide 145	hvit 145	hvid 145
кто	wer 144	who 144	wie 144	hver 144	kenn 144	hvem 144	hvem 144
женщина	Frau 146	woman 147+77	vrouw 146	kona 148	kvinn 148	qvinna 148	kvinde 148
женщина	Weib 147
желтый	gelb 149	yellow 149	geel 149	gulur 149	gule 149	gul 149	gul 149

В приведенной таблице все корни пронумерованы в соответствии с их этимологиями. Выбирается по возможности основное слово для данного значения в данном языке; однако разрешается учитывать и близкие синонимы, если они имеются и оба являются употребительными (случаи типа little и small для значения `маленький' в английском и т. п.). Особо нужно оговорить заимствованную лексику: заимствованные слова помечены в таблице отрицательными номерами (при этом их этимологические связи не отмечаются), и они не учитываются при подсчете совпадений, то есть, например, пара нем. wir — англ. we засчитывается как совпадение, пара нем. Vogel — англ. bird — как несовпадение, а пара нем. Haut — англ. skin вовсе не учитывается, то есть основной список в данном случае как бы уменьшается на единицу (точно так же мы поступаем и в тех случаях, когда соответствующее слово в языке просто неизвестно — к сожалению, довольно частая ситуация со списками малоизученных и древних языков). Особенно сложна ситуация с отделением заимствованной лексики от исконной в английском языке, поэтому оговорим специально, что разметка английского списка произведена в соответствии со словарем [Skeat 1968]. В качестве представителя "норвежского" языка выбран диалект гьестал, поскольку оба литературных норвежских языка - букмол и нюнорск - изобилуют заимствованиями, причем для многих слов отнесение их к числу исконных или заимствованных спорно.

Подсчет этимологических совпадений (отметим еще раз, что "этимологическими совпадениями" считаются слова, имеющие один и тот же корень, морфологические различия не учитываются) дает нам следующий результат:

Таблица 2.1.2

Язык	Нем.	Англ.	Голл.	Исл.	Норв.	Швед.	Дат.
Нем.	-	0.82	0.95	0.74	0.77	0.82	0.80
Англ.	1.49	-	0.85	0.75	0.78	0.81	0.80
Голл.	0.74	1.31	-	0.76	0.79	0.85	0.82
Исл.	1.86	1.84	1.79	-	0.94	0.93	0.96
Норв.	1.71	1.68	1.64	0.80	-	0.97	0.98
Швед.	1.46	1.53	1.34	0.87	0.56	-	0.99
Дат.	1.57	1.59	1.50	0.65	0.46	0.32	-

В этой таблице верхний треугольник содержит доли совпадений между каждой парой языков, а нижний — вычисленные по этим долям времена расхождения (в тысячелетиях). Так, между английским и немецким 82% совпадений, что соответствует глубине дивергенции приблизительно в 1500 лет. Минимальный процент совпадений здесь — 74% между исландским и немецким, что соответствует времени дивергенции примерно 1800-1900 лет. Легко убедиться, что приведенные доли совпадений и датировки в целом вполне соотносятся с обычными представлениями о глубине германской семьи языков и ее классификации (ниже, см. Гл. 2.2, мы еще поговорим о классификационном аспекте лексикостатистики).

Необходимо особо оговорить то, как при данной глоттохронологической методике следует обращаться с материалом древних языков. Используемый метод исходит из того, что скорость распада основного списка фактически не является постоянной величиной, а зависит от времени, отделяющего язык от праязыка. Следовательно, один и тот же процент совпадений, полученный для двух пар родственных языков, из которых одну пару составляют два современных языка, а вторую – два древних, зафиксированных, скажем, в V веке н. э., будет соответствовать различным периодам дивергенции. Чтобы вычислить соответствующую датировку, необходимо использовать метод табличной коррекции (см. Табл. 2.1.3; c — доля сохранившейся лексики в одном языке, c{2} — доля сохранившейся лексики в двух языках, t — время в тысячелетиях):

Таблица 2.1.3

c	c{2}	t
0,99	0,99	0,3
0,97	0,94	0,8
0,95	0,9
0,9	0,81	1,5
0,85	0,72
0,8	0,64	2,4
0,75	0,56	2,8
0,7	0,49	3,2
0,65	0,42	3,7
0,6	0,36	4,1
0,55	0,3	4,7
0,5	0,25	5,3

и т. д.

Предположим, что мы сравниваем списки двух языков, один из которых (A) засвидетельствован в V в. н. э., а другой (B) — в XII, и получаем 80% совпадений. Поскольку язык A отделен от нашего времени периодом в 1,5 тысяч лет, а язык B — периодом в 0,8 тысяч лет, их современные потомки имели бы 0,8*0,9*0,97 = 0,7, то есть 70% совпадений, что соответствует дивергенции приблизительно в 1900 лет.

После этих предварительных замечаний рассмотрим данные древних германских языков — древнеанглийского, древневерхненемецкого, древнеисландского и готского.

Таблица 2.1.4

Слово	Готский	Др.-исл.	Др.-англ.	Д.-в.-н.
весь	alls 1	allr 1	eall 1	all 1
пепел	azgo 2	aska 2	{ae}sce 2	asca, asga 2
кора	—	b{Oc}rkr 5	rinde 3	rinta 3
живот	wamba 13	magi 8	wamb 13	wamba 13
живот		v{Oc}mb 13		href 14
большой	mikils 16	st{o/}rr 15	micel, mycel 16	mihhil 16
большой		mikill 16	{3Z}r{e_}at 10
птица	fugls 17	fugl 17	fu{3Z}ol 17	fogal 17
кусать	beitan 19	b{i/}ta 19	b{i_}tan 19	b{i_}zzan 19
черный	swarts 20	svartr 20	bl{ae}c 21	swarz 20
черный		bl{a/}r 21	sweart 21
кровь	blo{tp} 22	bl{o/}{dh=} 22	bl{o_}d 22	bluot 22
кость	—	bein 24	b{a_}n 24	bein 24
грудь	brusts 25	brj{o/}st 25	br{e_}ost 25	brust 25
жечь	brinnan 26	brenna 26	byrnan 26	brennen 26
ноготь	—	nagl 27	n{ae}{3Z}el 27	nagal 27
облако	milhma 150	sk{y/} 29	wolcen 28	wolcan 28
холодный	kalds 31	kaldr 31	ceald 31	kalt 31
приходить	qiman 32	koma 32	cuman 32	queman 32
умирать	swiltan 151	deyja 34	steorfan 33	sterban 33
умирать	divan 34	svelta 151	sweltan 151	touen 34
собака	hunds 35	hundr 35	hund 35	hund 35
пить	trigkan 37	drekka 37	drincan 37	trinkan 37
сухой	{tp}airs- 39	{tp}urr 39	dry{3Z}e 38	trokkan 38
ухо	auso 40	eyra 40	{e_}are 40	{o_}ra 40
земля	a{i/}r{tp}a 41	mold 42	eor{dh=}e 41	erda 41
земля		j{Oc}r{dh=} 41
есть	itan 43	eta 43	etan 43	e{z}{z}an 43
есть	matjan 153
яйцо	—	egg 45	{ae}{3Z} 45	ei 45
глаз	augo 46	auga 46	{e_}a{3Z}e 46	ouga 46
жир	sma{i/}r{tp}r 154	fita 47	f{ae}t 47	feizzit 47
перо	—	fj{Oc}{dh=}r 48	fe{dh=}er 48	federa 48
огонь	fon, funa 49	eldr 50	f{y_}r 49	fuir, fiur 49
рыба	fisks 51	fiskr 51	fisc 51	fisc 51
летать	—	flj{u/}ga 52	fl{e_}o{3Z}an 52	fliogan 52
нога	fotus 53	f{o/}tr 53	f{o_}t 53	fuo{z} 53
полный	fulls 54	fullr 54	ful(l) 54	fol 54
давать	giban 55	gefa 55	{3Z}iefan 55	geban 55
хороший	gods 56	g{o/}{dh=}r 56	{3Z}{o_}d 56	guot 56
зеленый	-	groen 57	{3Z}r{e_}ne 57	gruoni 57
волосы	tagl 126	h{a/}r 58	h{e_}r 58	h{a_}r 58
рука	handus 59	h{Oc}nd 59	hand 59	hand 59
голова	haubi{tp} 60	h{Oc}fu{dh=} 60	heafod 60	houbit 60
слышать	hausjan 61	heyra 61	h{i_}eran 61	h{o_}ren 61
сердце	ha{i/}rto 62	hjarta 62	heorte 62	herza 62
рог	haurn 63	horn 63	horn 63	horn 63
я	ik 64	ek 64	ic 64	ih 64
убивать	dau{tp}jan 65	drepa 67	cwellan 66	t{o_}den 65
колено	kniu 68	kn{e/} 68	cn{e_}o(w) 68	knio 68
знать	kunnan 69	kenna, kunna 69	cn{a_}wan 69	kennen 69
знать	witan 70	vita 70	witan 70	wi{z}{z}an 70
лист	laufs 72	lauf 72	l{e_}af 72	blat 71
лист				loub 72
лежать	ligan 73	liggja 73	lic{3Z}an 73	liggen 73
печень	—	lifr 74	lifer 74	lebara 74
длинный	laggs 75	langr 75	lan{3Z} 75	lang 75
вошь	—	l{u/}s 76	l{u_}s 76	lus 76
мужчина	manna 77	verr 156	wer 156	man 77
мужчина	wair 156		man(n)77	wer 156
много	filu 78	margr 79	fe(a)la 78	filu 78
много	manags 79		m{ae}ni{3Z} 79	manag 79
мясо	leik 157	kj{Oc}t 83	fl{ae_}sc 80	fleisk 80
мясо	mimz 158
луна	mena 84	m{a/}ni 84	m{o_}na 84	m{a_}no 84
луна		tungl 85
гора	fairguni 159	fjall 87	beor{3Z} 86	berg 86
рот	mun{tp}s 88	munnr 88	m{u_}{dh=} 88	mund 88
имя	namo 89	nafn 89	nama 89	namo 89
шея	hals 90	hals 90	heals 90	hals 90
шея			sw{e_}ora 161
новый	niujis 92	n{y/}r 92	neowe 92	niuwi 92
ночь	nahts 93	n{o/}tt 93	niht 93	naht 93
нос	—	nasar 94	n{o_}su 94	nasa 94
не	ni, niu 96	eigi, ekki 97	n{e_} 96	ni, ne 96
один	ains 98	einn 98	{a_}n 98	ein 98
человек	manna 77	ma{dh=}r 77	man(n) 77	mennisco 77
человек	guma 162	gumi 162	{3Z}uma 162	gomo 162
дождь	rign 99	regn 99	re{3Z}n 99	regan 99
красный	rauds 100	rau{dh=}r 100	r{e_}ad 100	r{o_}t 100
дорога	wigs 101	vegr 101	we{3Z} 101	weg 101
дорога	staiga 163	stigr 163	st{i_}{3Z} 163
корень	waurds 103	r{o/}t 103	wyrt 103	wurz 103
круглый	—	kringl{o/}ttr 104	—	sinw{e_}l 165
песок	malma 166	sandr 105	sand 105	sant 105
сказать	qi{tp}an 167	segja 106	sec{3Z}an 106	sag{e_}n 106
сказать		kve{dh=}a 167	cwe{dh=}a 167
видеть	saihwan 107	sj{a/} 107	s{e_}on 107	sehan 107
семя	fraiw 109	frj{o/} 109	s{ae_}d 108	s{a_}mo 108
сидеть	sitan 110	sitja 110	sittan 110	sizzen 110
кожа	—	h{u/}{dh=} 111	h{y_}d 111	h{u_}t 111
кожа		skinn 168
спать	slepan 113	sofa 114	sl{ae_}pan 113	sl{a_}ffan 113
маленький	leitils 117	l{i/}till 117	l{y_}tel 117	luzzil 117
маленький	smals 116	sm{a/}r 116	sm{ae}l 116
дым	—	reykr 118	r{e_}c 118	rouh 118
дым			smoca 169
стоять	standan 119	standa 119	standan 119	stantan, st{a_}n 119
звезда	sta{i/}rno 120	stjarna 120	steorra 120	stern 120
камень	stains 121	steinn 121	st{a_}n 121	stein 121
солнце	sunna, sauil 122	s{o/}l, sunna 122	sunne 122	sunna 122
плавать	—	svimma 123	swimman 123	swimman 123
хвост	—	hali 128	t{ae}{3Z}(e)l 126	zagel 126
тот	jains 130	sa 170	se, s{e_} 170	jen{e_}r 130
тот		{tp}at 131
этот	sa 170	{tp}essi, {tp}etta 131	{tp}es 131	deser 131
этот	{tp}iz- 131
ты	{tp}u 132	{tp}{u/} 132	{tp}{u_} 132	{tp}{u_} 132
язык	tuggo 134	tunga 134	tun{3Z}e 134	zunga 134
зуб	tun{tp}us 135	t{Oc}nn 135	t{o_}{dh=} 135	zan(d) 135
дерево	triu 137	tr{e/} 137	tr{e_}o(w) 137	boum 136
дерево	bagms 136
два	twai 138	tveir 138	tw{e_}{3Z}en 138	zw{e_}ne 138
идти	gaggan 139	ganga 139	{3Z}{a_}n 139	gangan, g{e_}n 139
теплый	warm- 140	varmr 140	wearm 140	warm 140
вода	vato 142	vatn 142	w{ae}ter 142	wa{z}{z}ar 142
вода	ahwa 171
мы	weis 143	v{e/}r 143	w{e_} 143	wir 143
что	hwa 144	hvat 144	hw{ae}t 144	hwa{z} 144
белый	hweits 145	hv{i/}tr 145	hw{i_}t 145	hw{i_}{z} 145
кто	hwas 144	hverr 144	hw{a_} 144	hwe 144
женщина	qens 148	kona 148	cw{e_}n 148	w{i_}b 147
женщина			w{i_}f 147
желтый	—	gulr 149	{3Z}eolo 149	gelo 148

Прочерк в таблице означает, что в письменных памятниках данного языка соответствующее слово не зафиксировано. С дефисом приведены корни, сохранившиеся только в производных словах.

Теперь приведем сводную таблицу долей совпадений и датировок по всем германским языкам:

Таблица 2.1.5

Язык	Нем.	Англ.	Голл.	Исл.	Норв.	Швед.	Дат.	Гот.	Др.-исл.	Др.-англ.	Д.-в.-н.
Нем.	-	0.82	0.95	0.74	0.77	0.82	0.80	0.83	0.78	0.91	0.95
Англ.	1.49	-	0.85	0.75	0.78	0.81	0.80	0.78	0.82	0.92	0.86
Голл.	0.74	1.31	-	0.76	0.79	0.85	0.82	0.80	0.80	0.89	0.92
Исл.	1.86	1.84	1.79	-	0.94	0.93	0.96	0.81	0.95	0.81	0.78
Норв.	1.71	1.68	1.64	0.80	-	0.97	0.98	0.81	0.98	0.81	0.82
Швед.	1.46	1.53	1.34	0.87	0.56	-	0.99	0.85	0.98	0.85	0.86
Дат.	1.57	1.59	1.50	0.65	0.46	0.32	-	0.82	0.99	0.84	0.85
Гот.	1.86	2.08	2.00	1.95	1.95	1.80	1.91	-	0.87	0.87	0.86
Др.-исл.	1.83	1.66	1.77	1.02	0.84	0.84	0.77	1.87	-	0.89	0.83
Др.-англ.	1.32	1.28	1.41	1.78	1.78	1.6	1.65	1.92	1.60	-	0.94
Д.-в.-н.	1.05	1.48	1.21	1.87	1.69	1.51	1.56	1.93	1.82	1.39	-

Ниже (Гл. 2.2) мы увидим, как полученную матрицу можно преобразовать в генеалогическое древо; а пока заметим, что полученные датировки в целом довольно хорошо совпадают с историческими данными. Отделение готского языка приходится на I‑II вв. до н. э.; отделение западногерманских языков от скандинавских — на начало н. э.; отделение англосаксонской ветви — на IV‑V вв. н. э.; разделение скандинавских языков датируется X‑XI в. н. э.; разделение верхне- и нижненемецкого — примерно VIII в. н. э.

Разумеется, получаемые датировки довольно приблизительны, и каждая отдельная пара языков может показывать довольно существенные отклонения (в пределах статистической погрешности). Тем не менее, во всех известных нам случаях (а аналогичные подсчеты проводились на материале очень многих языковых семей) результаты получаются правдоподобными, и можно сказать, что в целом глоттохронологическая методика вполне пригодна для использования.

Отметим специально, что эти даты соответствуют не тому времени, когда потомки праязыка уже стали разными языками, а моменту разделения носителей праязыка на две общности, относительно обособленные друг от друга, — именно с этого момента между идиомами-потомками праязыка (в то время еще даже не диалектами, а в лучшем случае говорами) начинают накапливаться независимые различия. Для того, чтобы в стословнике заменилось хотя бы одно слово, два идиома должны развиваться отдельно друг от друга в течение примерно 300 лет. Сами же идиомы при этом, естественно, будут являться диалектами одного и того же языка. Таким образом, время расхождения языков, вычисляемое по методу глоттохронологии, всегда будет более ранним, чем время, начиная с которого можно наблюдать заметные различия между разошедшимися языками.

VII. Еще один способ определения временн{о/}й глубины дивергенции языков — так называемая этимологическая статистика (этимостатистика) или корневая глоттохронология. Эта методика (разработанная одним из авторов данного курса — С.А. Старостиным, см. [Старостин С. 1989b]) исходит из того принципа, что корни, как и слова, имеют определенный срок жизни в языке и некоторую стабильную скорость выпадения, а также из того, что в любом тексте мы можем встретить фиксированное число наиболее частотных в данный момент времени корней. Выделив такие списки корней (а их в принципе может быть произвольное количество, поскольку объем текстов не ограничен), мы можем посчитать процент этимологических совпадений с ними в другом родственном языке и таким образом также измерить расстояние между сравниваемыми языками. Данная методика имеет как свои плюсы, так и свои минусы:

1) С одной стороны, мы не ограничены каким-то заранее заданным списком значений и не должны выбирать "основное" слово, выражающее данное значение в данном языке. Совпадение между нем. Hund `собака' и англ. hound (`охотничий пес') будет достаточным для того, чтобы установить факт тождества: главное в этимостатистической методике — это чтобы корень сохранялся в обоих сравниваемых языках, и требование полного совпадения значений не является обязательным.

Это чрезвычайно существенное достоинство, поскольку если для некоторого значения в языке существует несколько синонимов, то различия в выборе представителя данного значения в стословном списке могут привести к разным датировкам.

Кроме того, этимостатистический анализ позволяет повысить надежность выводов, давая возможность получить для каждой пары сравниваемых языков серию результатов (для которых можно вычислить математическое ожидание и возможные пределы отклонений) любой длины, поскольку количество текстов в принципе неограничено.

Еще одно важное достоинство этимостатистического метода состоит в том, что он позволяет получить более надежные, чем глоттохронология, результаты при датировке распада праязыков макросемей: отдаленно-родственные языки насчитывают лишь 5-10% совпадений по стословнику (что близко к статистической погрешности), доля же совпадающих корней значительно выше — около 15-20%.

2) С другой стороны, для применения этимостатистики требуется хорошо разработанная сравнительная фонетика и этимология сравниваемых языков; необходимым является наличие хороших этимологических словарей. Поэтому для мало изученных и неполно описанных языков данная методика фактически неприменима — в отличие от классической глоттохронологии, для которой достаточно гораздо меньшей степени изученности.

Отметим, впрочем, что изложенная выше методика глоттохронологии также предполагает предварительное установление соответствий между языками — хотя бы для того,