Murrehatlasan jälgikäzittelyy

Tiä šeikuijah karjalan kielen kielikyzymyksii: kielioppii, sanastuo i m.i.

Valvoi: verkomuagari

BUTTON_POST_REPLY
Käyttäjän avatar
mp
Viestit: 2108
Liittyi: 05 08 2008, 19:45

Murrehatlasan jälgikäzittelyy

Viesti Kirjuttai mp »

Bubrih abuniekoinke ruadoi ylen suuren ruavon karjalan murdehien kartoittamizekse. Ruavon tuloksie voi kaččuo Karjalan kielen murrekartasto kirjas.
Kuva Kuva
Panin tiedokonehen verdailemah eri kartoituksen tuloksii da klusteroimah murdehii samanlazuon mugah. Anualizan tuloksii voi kaččuo tiä.

Käyttäjän avatar
mp
Viestit: 2108
Liittyi: 05 08 2008, 19:45

Re: Murrehatlasan jälgikäzittelyy

Viesti Kirjuttai mp »

Kuva
Olen jälgiaijal tarkistannuh syötettyy datua da tävvendellyh Murrehatasan klusteroinduohjelmua. Klusteroindan pohjakse voi vallita mintah Atlasan kartan (kielikyzymyksen), libo kartoin ozajoukon. Piälolijan kuvan datannu ollah kai Atlasan 206 kartua. Kartua ohjelmanke kaččojes (ei piälolijas kuvas!) voi jogahizen kylän kohtal nähtä, kui sie vastattih mihgi kyzymykseh. Valliččemal yksittäzii kartoi libo pienii kartoin ozajoukkoloi, tuloksennu voi olla erinägözii klusteroindupuuloi - variatsiedu on kyläs toizeh mennes. Ga suuri kuva on piälolijan nägöine. Mieldykiinnittäjiä täs kuvas on, ku sen mugah kolme karjalan "piämurrehtu", sangiel sinizel viival yhtistetyl, ollah "Mändyselgä" (keskikarjalua), Kivijärvi (suvivienua) da Suurimägi (livvii). Täs kuvas tver liittyy Kivijärveh. Toizis eksperimentois puaksuh Mändyselgähgi; Raja-Karjalan tiedoloi Atlasas ei ole. Lyydi liittyy Pyhärven da Konnun kauti Suurehmägeh.
Midä tämä tovestau. Ei vältämättäh äijiä. A sen, ku toinah netgi, kuduat jyrkäh prizmitäh kahtu, kolmie, nelliä, viitty karjalan kirjukieldy, ei vältämättäh olla lujal tiijollizel pohjal. Klusteroindukartal suurin välimatku on Kunttikylän (ihan pohjazes) da Kuujärven välil, a ku ollou aziellistu ellendämizen (ellendiä=elgeta=toimitada=toimittua=maltua=ymmärtyä=ponimaija) pohjua, hyvin voi paista da löydiä yhtesymmärrys.
P.S. Kohendukset ollah verkosivuloil, kudamien linki on iellizes viestis. Paiči tiettäväine, iče ei voi vallita kartoi, voi vai kaččuo tiedoloi vallittulois klusterois.

Käyttäjän avatar
mp
Viestit: 2108
Liittyi: 05 08 2008, 19:45

Re: Murrehatlasan jälgikäzittelyy

Viesti Kirjuttai mp »

Jälgimäzen kuun aijannu klusteroinduohjelmah on roinnuh vägi äijängi muutoksii, kudamat toinah avvutetah parembi lugemah klusteroindua, paikku endine http://karjalankieliopit.net/atlas/intro.html

Käyttäjän avatar
mp
Viestit: 2108
Liittyi: 05 08 2008, 19:45

Re: Murrehatlasan jälgikäzittelyy

Viesti Kirjuttai mp »

Klusteroinduohjelmua on päivitetty 21.1.2018
Kuva
Kuvas tazon 2 klusteroindu, kudai perustuu kaikkih Atlasan kartoih 4-209.

Murrehatlazan graafiekas on huomattavu muutos. Uuttu versiedy voi tarkembi kaččuo endizes adresis http://karjalankieliopit.net/atlas/intro.html.
Muutoksii on kaksi:
- Enne klusteriloi yhtistäjes klusterit säilytettih alguperäine väri, vaiku yhtistäjät linkit lizättih. Nygöi kai yhtistetyn klusterin paikat väritetäh samal väril. Nenga kuvat roitah selgiembät.
- Paikkoih on ližätty Salmi, Imbilahti, Suistamo, Suojärvi, Korbiselgä da Ilomantsi. Vastavuksii Bubrihan kyzymyksih on ečitty Eino Leskizen kirjas "Karjalan kielen näytteitä II". Tässah olen kaččonuh vaiku Atlasan kyzymykset 4-41 (vokalit). Leskizen korpussu on pikoi pikkaraine eigo sie onnuako lövvy vastavuksii kaikkih kyzymyksih. A nygöi tarkoitus ongi vaiku kuhkuttua tarkembah arhiivoin ečindäh ezim. opastujien graduprojektoinnu.

Paginua klusteroindas. Allus karjalan "kielii" on 192: 150 paikkua Karjalan tazavallas, 36 paikkua Tveris da 6 piälmainittuu paikkua Raja-Karjalas. Net ollah 192 tazon 0 klusterua kudamis on vaiku yksi paikku. Tazo tazol klusteroi yhtistetäh suurembikse. Ku klusteroindan perustehennu ollah kai Bubrihan 209-4 kartua, tazol 4 kaikin jo mennäh yhteh.

Yhtistymizen perusteh on samanlazus, libo eroloin vähys. Ku jogahine paikku (libo klusteri) liittyy lähimbäh susiedah, paikat (klusterit) jagavutah gruupoikse, klusteroikse. Algoritmu sežo čotaiččou klusterin keskučan, paikan kudai edustau klusterii, "primus inter pares". Printsippu on sama kui sanondas "kirikkö keskel kyliä". Havainnollistan printsippua pienel ezimerkil. Jua nellikkö vertikualizel da horizontualizel viival nelläh nellikköh. Tienristois on 9 paikkua, jogahizen matku lähimbäh susiedah on 1. Ku nämien edustajakse vallitah mitahto 4 čupus, da summatah matkat toizis paikois täh paikkah, summu on 18. Ku edustai vallitah keskel reunua, summu on 15. A ku edustajakse vallitah keskičökeh, summu on 12. Se on paras.

Ku erot lasketah kaikkien 206 kartan mugah, enzimäzen klusteroindan jälgeh klusteriloi on 40, kudamien keskučat ollah D'ogensuu, Suuri Selgi, Suurimägi, Torasjärvi,...,Šuuri Ploskoi, Imbilahti da Suistamo.

Kolmandel tazol 10 karjalan "kieldy" ollah Suurimägi, Lamminselgy, Kaškan, Nuamoilu, Porarvi, Mändyselgä, Sellinkylä, Kivijärvi, Paanajärvi da Klučevoi.

Nelländel tazol kai yhtytäh Mändysellän "kielekse.

Klusteroindumetodan käyttö murdehien verdailuh yhtistäy Dmitry Bubrihan tiijollizen kielisuunnittelun da Kalevi Wiikan kižamielizen tiijollizen šeikkalun. Data on otettu Bubrihan Atlasas da erotaulukon ideju on Wiikaspäi. Teemanmugahizet klusteroindat taritah pohju murdehien balansiiruičendah yhtehisty kieldy luajittajes, Bubrihan tabah. Minun mieles teemoinmugahizet kartat ozutetah, ku ei ole muga selgielöi rajoi murdehien välil kui murrehluokitteluis väitetäh, a kai on jatkumuo.

Korvakuulon mugah, ezim. iänikartan https://karjalankieliopit.net/ianikartu/index.html mugah, väittäzin, ku erot karjalan murdehien välil ei olla suurembat migu suomen murdehien välil. Voizin väittiä, ku čomin karjalan kirjukieli rodiis Suistamon Muuannon Kylmänsellän murdehen pohjal, a nenga voi väittiä kaikis Atlasan kylämurdehis. Kylmälselläl nygöi eletäh vaiku reboi, hukku da kondii eigo ni yhten aberin kirjuttajua lövvy. Kirjukieli vältämättäh on kompromissu, "kirikkö keskel kyliä", ku löydys ruadajua sil kielel. Elävy käyttökieli tarviččou tiedokirjallizuon, kaunehkirjallizuon, zakonoin kirjuttajat i m.i. Kehittiä kirjukielii murdehile on etnogruafistu čomendeluu, kui kanzallisruutat - net einosteta karjalan kieldy nygyaigazekse käyttökielekse. Net pätäh vaiku paikallizen identietan ozuttamizeh. Hos sil paikal jo niken ei elä.

Sinilind
Viestit: 33
Liittyi: 23 08 2017, 10:25

Re: Murrehatlasan jälgikäzittelyy

Viesti Kirjuttai Sinilind »

Värit ollah ylen hyvä dielo. Kartat kerras tovengi roitah selgiembät.

Sivun https://karjalankieliopit.net/atlas/intro.html ylähän olijat linkit murrehkartoih ruatah putilleh, a alahan luvettelonnu olijat linkit ozutetah viärih, olemattomih sivuloih (index.html hos pidäs index0.html).

Voidasgo vie ližäkse olla kaksi kartua, kudamis toizes oldas yhtes tukus kartoin 4–112 tiijot (= fonetiekku), toizes – kartat 113–185 (= morfolougii)? Sit oldas fonetiekal, morfolougiel dai sanastol kaikil omat kartat.

Käyttäjän avatar
mp
Viestit: 2108
Liittyi: 05 08 2008, 19:45

Re: Murrehatlasan jälgikäzittelyy

Viesti Kirjuttai mp »

Passibo kohenduksis! Opiin kohendua, toivottavasti en luadinnuh uuzii hairavoloi. Hil'l'akkazeh rubein jo ielleh kehittämäh. Toinah vuvven, kahten peräs käyttäi vois iče vallita, mis paikois da mis ominazuksis tahtou klusteroindukartan luadie.

Käyttäjän avatar
mp
Viestit: 2108
Liittyi: 05 08 2008, 19:45

Re: Murrehatlasan jälgikäzittelyy

Viesti Kirjuttai mp »

Olen vähäzel muuttanuh klusteroinduohjelman käyttöliittymiä. Syväindyö täl välil en kerrinnyh muuttamah. Raja-Karjalas on vaiku Bubrihan kartoi 4-41 vastuajat tiijot, netgi ylen kaidazen Leskizen korpusan mugah. Yhtelläh, mielien mučkuandah niškoi vähäzen kommentiiruičen, midä klusterois voi nähtä.

Ku Bubrihan karjat juatah kolmeh kluasah: fonetiekku, morfolougii da sanasto, roitah adresis
https://karjalankieliopit.net/atlas/intro.html
löydyjät klusteroindukartat.

Fonetiekas enzimäine klusteroindu yhtistäy 192 kyliä 42 klusterikse, toizes klusteroindas 11 klusterikse, kolmandes klusteroindas 3 klusterikse da nelländel kierroksel kai yhteh. Morfolougies klusteroindutazoloil on 192, 36, 3 da 1 klusterua, sanastos 192, 33, 7, 3 da 1. Fonetiekan, morfolougien da sanaston kolmanden tazon klusteroindat ollah rinnakkai täs kuvas:
Kuva
Hos nämis kolmes kuvas murdehet ollah jagavuttu kolmekse klusterakse, jagolinjat mennäh eri kohtas eigo net jagolinjat tarkah vastata niilöi jagolinjoi, kudamien mugah jälgivuozinnu on kehitetty kirjukielii. Fonetiekan mugah kolmanden tazon murdehien keskučat ollah Ostašiha, Mändyselgä da Rajakondu. Morfolougien mugah kolme piämurrehtu oldas Lendiera, Vahjärvi da Klimentina. Da sanaston mugah Petelniemi, Kondu da Suurimägi. Ottamal klusteroindan perustakse kai Bubrihan atlasan kartat 4-209, kolmanden tazon klustoin keskučat oldas Kivijärvi, Mändyselgä da Suurimägi. Algoritmu ei valliče keskuččua suuruon mugah a sen mugah, kudai on "keskel" eroloih nähte.

Käyttäjän avatar
mp
Viestit: 2108
Liittyi: 05 08 2008, 19:45

Re: Murrehatlasan jälgikäzittelyy

Viesti Kirjuttai mp »

Laitoin uvven versien klusteroindas endizeh paikkah https://karjalankieliopit.net/atlas/intro.html Täs versies olen oppinuh löydiä rajakarjalazet vastavukset kaikkih Bubrihan 206 kartan kyzymyksih. Ga tahton hyvin painokkahasti sanuo, gu minul piäpaino on metodolougies, ei tuloksis. Minun data on ylen kaidaine, da ei ylen hyväluaduine. Minun motivatsii oli ozuttua midä täl metodal voi ozuttua da toivuo ku "arhiivurotat" kerättäs leviembi korpussu anualiizan pohjakse. On mahtotoi piästä nenga hienoh jagoh kui Bubrih, a Suojärven suurus pidäjä pidäs jagua kahteh libo enämbäh palah, sendäh ku pidäjän eri puolil murdehet ollah erilazet. Imbilahten jyttyzes pidäjäs pidäs jaguo duumaija sendäh ku päivänlaskupuolel suomi sevoittuu karjalah. Niilöile ket tarkembi kačotah mingi paikan vastavuksii, mustoitan, ku vastavus ei väitä ku sie ihan nenga sanottas - vastavuksennu on se Bubrihan vaihtoehtolois, kudai on lähimbänny tämän paikan paginua. Oigiehkirjutuksesgi on vaihteluu. Toinah vie vähäzen hivon ohjelmua, ga piäozin kačon gu täs oli minun vuitti täh dieloh.

Käyttäjän avatar
mp
Viestit: 2108
Liittyi: 05 08 2008, 19:45

Re: Murrehatlasan jälgikäzittelyy

Viesti Kirjuttai mp »

Kielioppiprojektan sivut lähikuuloin aigua siirrytäh lopullizeh sijoituskohtah, ga sit dielos sih aigah. Aijembimainittuloin klusteriloin däh jo tallendin Bubrihan murrehatlasan tiijot tiijostoloikse. Nygöi luajiin pikkarazen javascript ohjelman, kudamal voi verrata kahten paikan murdehii murrehatlasan teemoin mugah. Käyttöliittymy on nengoine:
Kuva
Tämä ohjelmu löydyy väliaigazesti adresis https://karjalankieliopit.net/atlas/ver ... dailu.html. Ylembäs men'us vallitah teemu, ezim. morfolougii, kudamua koskijat kyzymykset ollah atlasan kartois 133-185. (Noumeroloi voi ičegi kirjuttua noumerjuaššiekkoih, nenga voi vallita muungi välin migu men'us taritun.) Erotaulun luajindu kestäy erähän sekundan, onhäi datuagi nenga 40000 rivii. Verdailuh otettavat kaksi paikkua vallitah nimen mugah alembas men'us, libo
suorah noumerjuaššiekois. Verdailun tulostu kučutah Kačo erot nybläl. Kui sanottu, data on Bubrihan atlasaspäi, paiči ylen kaidazesti ebävarmua datua kuvves rajakarjalazes pidäjäs. Hos iče sanon, verdailu on ylen mieldykiinnittäjiä. Hos Kudärv da Kunttikylä ollah vastakkazis čuppulois Karjalua da eruo on läs joga kyzymykses, yhtelläh, samua karjalua net ollah da ken tahtou, voi toizen paginua ellendiä.

Käyttäjän avatar
mp
Viestit: 2108
Liittyi: 05 08 2008, 19:45

Murrehatlasan klusteroin luajindu

Viesti Kirjuttai mp »

Algoritmu (Borůvka 1926, Sollin 1965)
1. Paikat p1,p2,...; kartat m1,m2,... Paikkua pi koskiju vastavus
kartan mk kyzymykseh olgah vik. Paikkoin pi da pj ero dij on
nengomien kartoin lugu, kudamil aik<>ajk.
2. Jogahizes paikas pi vejä nuoli nengomah paikkah pj kudaman dij
on pienin (Taulukos merkitty kirrahtusmerkil !). Nuolien vejändy
jagau paikat gruupoih kudamat on yhtistetty nuolil.
3. Vastuoletuksen kauti voi tovestua, ku jogahizes gruupas on tarkalleh
kaksi paikkua pi da pj, kudamis on nuoli toine toizeh. Indeksoin
jälletykses pienin olgah sen gruupan libo klusterin juuri.
4. Suundua gruupan kaikkien paikoin nuolet juureh.
5. Ku klusteriloi ollou mondu, luaji uuzi erotaulu, kudamas
paikoinnu ollah kohtan 3 mugahizet juuret.
6. Laske erotaulu klusteriloile. Olgah kahten klusterin juuret pi da pj.
Olgah dij = min {dxy | px on klusteris pi da py on klusteris pj}.
Jatka kohtas 2.

Ezimerki. Valličemmo Bubrih & al Murrehatlasas
paikat 1,4,18,27,47,57,80,115,130,149,153,179,187,188,189,190
da kačommo, midä
kartat 4,22,63,74,78,107,121,155,161,170,186,204
tietäh nämis paikois, vastavusvaihtoehtot a,b,c,...
Ominazustaulu:

Koodu: Valliče kai

   4 22 63 74 78 107 121 155 161 170 186 204
1  b c a a b  a  a  c  a  a  d  a
4  a e a a b  a  a  c  d  b df  a
18  d c - a b  b  a  c  b  a  d  -
27  e b a a b  a  a  c  b  a  d  a
47  a c a a b  b  a  c  b  a  d  a
57  a e a a b  b  a  c  d  b  f  b
80  a b b a a  b  b  a  e  d  a  c
115 a a c b a  a  b  a  c  e  a  d
130 a a c b a  a  b  a  c  f  a  e
149 a c c b a  a  b  a  c  c  a  d
153 f d b b a  b  b  a ce  e  a  c
179 a d b b a  b  b ab ce  f  a  c
187 a c a a b  a  a  c  b  a  d  a
188 a c a a b  a  a  -  b  -  a  d
189 d b a a b  a  a  a  b  c ag ad
190 d b ab a a  a  a  -  b  - ad ad
Erotaulu:

Koodu: Valliče kai

   1 4 18 27 47 57 80 115 130 149 153 179 187 188 189 190
1  0 4  3  3  4  7 11 11 11 11 12 12  2! 4  6  4
4  4 0  5  4  4  2! 10 10 10 10 12 11  3  4  5  4
18  3 5  0  3  3  5  8 10 10  9  9  9  2! 3  5  3
27  3 4  3  0  3  7 10 11 11 11 12 12  2! 4  4  2
47  4 4  3  3  0  5  9 11 11 10 11 10  1! 3  6  4
57  7 2! 5  7  5  0  9 11 11 11 11 10  6  5  8  7
80 11 10  8 10  9  9  0  7  7  6  4  3! 10  7  8  5
115 11 10 10 11 11 11  7  0  2! 2  5  4 10  6  8  6
130 11 10 10 11 11 11  7  2! 0  3  6  4  0  7  9  7
149 11 10  9 11 10 11  6  2! 3  0  6  5  9  5  7  6
153 12 12  9 12 11 11  4  5  6  6  0  2! 12 10 10  7
179 12 11  9 12 10 10  3  4  4  5  2! 0 11  9 10  7
187 2! 3  2  2  1  6 10 10 10  9 12 11  0  2  4  3
188 4 4  3  4  3  5  7  6  7  5 10  9  2! 0  2  3
189 6 5  5  2  6  8  8  8  9  7 10 10  4  2  0  1! 
190 4 4  3  2  4  7  5  6  7  6  7  7  3  3  1!  0
Enzimäzen tazon klusterit:

Koodu: Valliče kai

1,18,27,47,187,188
4,57
115,130,149
153,80,179
189,190
Klusteriloin erotaulu:

Koodu: Valliče kai

   1  4 115 153 189
1  0  3  9  8  2!
4  3! 0 10  9  4
115 9 10  0  5! 6
153 8  9  5! 0  5
189 2! 4  6  5  0
Toizen tazon klusterit:

Koodu: Valliče kai

1,4,189
115,153
Kolmandel tazol vaiku yksi klusteri, kudaman juuri on 1.

Enzimäine tazo:
Kuva

Toine tazo:
Kuva

BUTTON_POST_REPLY