Eksperimentualine murdehien da kielioppiloin verdailu
Nämis eksperimentois opin verdailla karjalan kielen da lähisugukielien
(toinah lähiaijal suomengi?) kielioppiloi dokumentoittuloih
paginnäyttehin libo kielioppiloi keskenäh. Verdailukritierannu
ollah, kui kieliopit libo paginat vastatah Bubrihan et al
murrehatlasan kyzymyksih. Nengomua datua olen kerännyh Bubrihan,
Ahtian, Junuksen, Markianovan, Zaikovan da Jeskazen kielioppilois.
Myöhembi ližiän vie Novakan tverinkarjalan da Grünthalan vepsän
kieliopin – täs versies nämii paginluaduloi edustetah vaiku
erähien paikoin tiijot.
Metodu
Verdailumetodannu käytän "klusteroindua", kudamii jo käytimmö
Karjalan kieli kieloppilois kirjas. Sidä on sellitetty
täl sivustolgi täs
pdf-linkis. Se on yksinkerdaine a pättävy algoritmi juuri täh tarkoitukseh.
Algoritman ydin on
(mitahto) lähimmän susiedan algoritmu. Verkon jogahizele solmule
ečitäh (kieliopillizih eroloih nähte) lähin susiedu da susiedu
yhtistetäh linkil täh solmuh. Nenga solmuloin joukko jagavuu
klusteroikse, kudamis solmus toizeh piäzöy linkilöi myöte. Ku klusteroi
ollou enämbi yhty, jogahizele klusterile ečitäh lähin klusterisusiedu.
Klusterin ero toizes klusteris miärätäh verduamal eroloi toizen
klusterin solmus tämän klusterin solmuh da valliččemal nämis
erolois pienin. Nenga -solmuhizen klusterin da
n-solmuhizen klusterin eroh tarvitah m×n
verdailuu. Nengomii klusteroindukierroksii jatketah, kuni
klusteriloi on vaiku yksi.
Klusteroindas jogahine paikku (olgah "kylä", "paikalline murreh",
"murreh" i m.i.) liittyy suurembah klusterih. Algutilandehes
jogahine paikku on yksin omas klusteris. Algoritmu azettuu,
konzu kai alguperäzet paikat ollah kerävytty yhteh klusterih.
Mielenkiindozet tazot ollah enzimäzen da jälgimäzen välis.
Kolme eksperimentua
-
Enzimäzes eksperimentas kačommo, kui kieliopit kerävytäh klusteriloikse.
Ku kielioppiloi on vaiku kuuzi: Bubrih, Ahtia, Junus, Zaikov, Markianova
da Jeskanen, tävvendämmö joukkuo keskivepsäläzel Järvilöin murdehel
da tverinkarjalazel Tolmačun murdehel. Toinah lähiaijal nämien
sijah tullah Grünthalan da Novakan kieliopit. Enzimäzen da
toizen tazon klusterit ollah "peigalonkynzien" tagah. Klusterikartoi
voi livaimel suurendua 1285×1880 rezolucieh.
Enzimäzes kartas Zaikovan, Junuksen, Jeskazen, Bubrihan kieliopit da
Tolmačun murreh kuulutah yhteh klusterih, Markianova da Ahtia toizeh
da D'ogensuu da Järved kolmandeh klusterih. Toizel tazol kai jo
liitytäh yhteh.
-
Toizes eksperimentas kačommo, kui murrehpaikat klusteroijutah.
Verdailuh otemmo Ven'an Karjalan da Tverin Karjalan paikat
(Bubrihan Atlasas), Raja-Karjalan kuuzi paikkua (E. Leskinen
da FINKA projektu), nelli vepsälästy da kaksi suarekehkarjalastu
paikkua (tiijot suadu I. Novakalpäi):
Kuvat ollah toizen, kolmanden da nelländen tazon klusterois.
Keskimäzes kuvas eroitutah selgiesti Vienan-Tverin, keskikarjalazen
Mändysellän, lyydiläs-vepsäläine da liygiläs-rajakarjalaine
klusteri. Nelländen tazon kaksi klusterii ollah vienalazien, keskikarjalazien
da tveriläzien klusteri da rajakarjalazien, liygiläzien, lyydiläzien da
vepsäläzien klusteri.
-
Kolmandes eksperimentah klusteroindah otammo kai murrehtiijot
da kieliopit:
Tämä klusteroindu ei äijäl eruo iellizes, a vuottamattah toizel
tazol liygiläzet jagavutah kahteh klusterih – päivänlaskupuolizeh
Videlen – Korgienmäin – Vieljärven klusterih da päivännouzupuolizeh
Siämärven – Torasjärven - Anuksen klusterih. Rajakarjalazet
kuulutah täh päivännouzupuolizeh klusterih. Arbuan, ku tämä kummu
tulou Ahtian kieliopin vaikutukses – häi vikse äijän käveli
Suojärven, Siämärven da Anuksen čural.
Midä täs voi opastuo da voibigo nämih tuloksih uskuo?
Pidäy mustua, ku nämä luokittelut perustutah enimyölleh
1900-luvun algupuolen tilandeheh. Sen jälgeh karjalazii on
myllytetty da työnneldy sinne-tänne. Piäjago varzinkarjalazih
da anuksenkarjalazih lyydiläzien da vepsäläzienke nägyy, ga
ei se ole muga selgei ku annetah ellendiä.
Ezimerkikse rajakarjalazet puaksuh ollah "viäräl"
puolel rajua. Verdailemal Bubrihan kielioppii Atlasan
tiedoloih, erähiči čotaičin, ku Bubrihankarjal sijoittus
lähäl Lubasalmie, t.s. lähäl Suomen nygösty päivännouzučökehty
Ilomancis. Sentähbo händy čakattih da suudittih suomimielizekse da
normah pidi ližätä anukselazii piirdehii. Da sit vie
järilleh. Da Bubrihua tyrmäh. A misbo perustuu piäjago varzinkarjalazih da
anuksenkarjalazih? Lähtiettihgo yhtet ezivahnembat Luadogan rannale
tulduu kierdämäh sidä vastupäiväh, toizet myödypäiväh?
Kui luotettavua klusterikartoin tiedo on? Tämän päivän
tieduo se ei ole. Kui luotettavii murrehtiedoloin keriäjät
oldih? Luokittelingo oigein kielioppiloin piirdehet?
Ruadaugo klusteroinduohjelmu oigein da midä klusterois
vois piätellä. Pien tuloksii aiga luotettavinnu. Datua
on äijy eigo hairavot äijiä sevoiteta tuloksii. Eigo
tiedokoneh vie kodihpäi, kui ristikanzu herkäh tiedämättähgi
vedäy. Da nostatetah murrehtorii.