i
i
i
i
i
i
Kalbos dalis
Veiksm. formos
Giminė
Skaičius
Linksnis
Skaitvardžių tipas
Laipsnis
Apibrėžtumas
Sangrąžiškumas
Nuosaka
Laikas
Asmuo
Dalyvių rūšis
i
i
i
Kalbos dalis
Veiksm. formos
Giminė
Skaičius
Linksnis
Skaitvardžių tipas
Laipsnis
Apibrėžtumas
Sangrąžiškumas
Nuosaka
Laikas
Asmuo
Dalyvių rūšis

Mokomajame tekstyne galima dvejopa paieška: paprastoji ir išplėstinė.

  1. Paprastojoje paieškoje galima rinktis tekstyno dalį pagal kalbos atmainą ir atlikti paiešką tik sakytinės, tik rašytinės kalbos tekstyno dalyje arba abiejose dalyse.

Pasirinkus paprastąją paiešką, galima greitai surasti norimą žodį, taip pat galima ieškoti pagal lemą (antraštinę / žodyninę formą) – tokiu atveju bus pateiktos konkordanso eilutės ne tik su įrašytu žodžiu, bet ir kitomis to žodžio kaitybinėmis formomis (pvz., parašius kalba ir pažymėjus lema, tarp rezultatų bus ir kitos šio žodžio kaitybinės formos: kalbai, kalbą, kalbų, kalboje ir pan.).

Galima ieškoti žodžio dalies: prieš ieškomą žodžio dalį ar po jos parašius žvaigždutę (*), pvz., kalb*, *kalbėti, *kalb*, bus pateikti tokie rezultatai: kalb*: kalba, kalbos, kalbėti, kalbėjimas ir kt.; *kalbėti: pakalbėti, nekalbėti ir kt.; *kalb*: pakalbėti, nekalbu.

Suformulavus ieškomo žodžio ar lemos užklausą, paieškos rezultatas bus pateikiamas konkordanso forma, t. y. žodį ar jo formas matysite minimaliame vienos eilutės kontekste. Ieškomas žodis ar žodžio formos bus pažymėtos raudonai ir pateikiamos konkordanso eilutės centre.

Galima pasirinkti rezultatų skaičių: nuo 10 iki 200 konkordanso eilučių lange. Paieškos lango viršuje rodoma, kiek rasta konkordanso eilučių („Rasta rezultatų“).

Prie kiekvienos konkordanso eilutės pateikiami metaduomenys: paspaudus ant ženklo su i raide, pateikiami metaduomenys: dalyviai, situacija (sakytinei kalbai); teksto tipas, žanras (rašytinei kalbai); kalbos lygis, kalbos atmaina nurodoma tiek sakytinei, tiek rašytinei kalbai.

Konkordanse pateikiami ne ištisi tekstyną sudarantys tekstai, o tik jų ištraukos. Paspaudus ant analizuojamo žodžio (jis pažymėtas raudonai), galima išplėsti konkordansą ir matyti platesnį kontekstą (iki 300 simbolių iš kairės ir dešinės, jei tiek yra tekste).

Konkordanso eilutes galima susirūšiuoti pagal kairįjį ir (ar) dešinįjį kontekstą, taip pat ir (ar) pagal ieškomą žodį: nuvedus žymeklį ant pavadinimų Kairysis kontekstas, Ieškomas žodis, Dešinysis kontekstas, reikia paspausti ant kurio nors pasirinkto rūšiavimo elemento: paspaudus vieną kartą, tarkim, ant Dešinysis kontekstas, pirmiausia pateikiami kontekstiniai žodžiai (pozicijoje pirmas iš dešinės), sugrupuoti pagal abėcėlę Z–A principu; paspaudus antrą kartą – pateikiami tie patys rezultatai pagal abėcėlę A–Z principu. Analizuojamam žodžiui pirmas iš dešinės gali būti ne žodis, o skyrybos ženklas, todėl, rūšiuojant kairįjį ar dešinįjį kontekstą pagal abėcėlę, bus įskaitomi ir skyrybos ar kitokie ženklai.

Rezultatus galima atsisiųsti (prieš tai langeliuose uždėjus varneles prie reikalingų eilučių) arba atskirą eilutę nusikopijuoti į iškarpinę.

  1. Išplėstinėje paieškoje galima naudoti visas paprastojoje paieškoje esančias galimybes ir rasti papildomų.

Galima ieškoti visame tekstyne arba rinktis tekstyno dalį pagal lygius (A1–A2 ar B1–B2 lygio) arba kalbos atmainą (rašytinė ar sakytinė kalba). Pasirinkus rašytinę kalbą, galima toliau rinktis rašytinės kalbos tekstų tipą (vadovėliniai ar nevadovėliniai tekstai) ar (ir) žanrą. Atkreipiame dėmesį, kad skiriasi sakytinės ir rašytinės kalbos tekstyno dalys, A1–A2 ir B1–B2 lygio tekstyno dalys (žr. 1 paveikslą); gana skirtingą dalį sudaro rašytinės kalbos patekstynio vadovėliniai ir nevadovėliniai tekstai (žr. 2 paveikslą).

1 paveikslas. Mokomojo tekstyno sandara (žodžiais)

 

2 paveikslas. Mokomojo tekstyno rašytinės kalbos patekstynio sandara (žodžiais)

 

Tam tikrų rašytinės kalbos patekstynio žanrų tekstų yra labai nevienodas skaičius (žr. 1 lentelę), todėl kai kurių žanrų tekstuose galima nerasti ir palyginti dažnų žodžių.

1 lentelė. Rašytinės kalbos patekstynio žanrai

Žanrai (pagal abėcėlę) Žodžių skaičius Procentai
Anekdotai 4 284 0,69
Anketos 433 0,07
Dainos 4 503 0,73
Dialogai 21 366 3,45
Dokumentai 7 990 1,29
Eilėraščiai 143 0,02
Etiketės 4 566 0,74
Horoskopai 20 487 3,31
Informaciniai tekstai 83 398 13,48
Instrukcijos 10 461 1,69
Interviu 9 261 1,50
Kita 21 0,003
Laiškai, žinutės 22 416 3,62
Linkėjimai, sveikinimai 589 0,10
Pasakojimai 42 489 6,87
Pasakos, legendos 14 864 2,40
Patarimai 56 630 9,15
Pažintiniai tekstai 113 121 18,29
Proza 67 338 10,88
Receptai, meniu 8 285 1,34
Reklamos 3 077 0,50
Sentencijos 601 0,10
Skelbimai 19 870 3,21
Subtitrai 93 941 15,19
Šūkiai 1 263 0,20
Tautosaka 4 333 0,70
Testai, užduotys 1 005 0,16
Tvarkaraščiai, darbotvarkės 158 0,03
Viešieji užrašai 1 744 0,28
Iš viso 618 637 100

 

Daugiau informacijos apie Mokomąjį tekstyną rasite šiame straipsnyje: Kovalevskaitė J., Rimkutė E. 2020: Mokomasis lietuvių kalbos tekstynas: naujas išteklius lietuvių kalbos besimokantiesiems. Darnioji daugiakalbystė 17, 201–233.

Kadangi Mokomasis tekstynas yra morfologiškai anotuotas, išplėstinėje paieškoje yra galimybė atlikti paiešką pagal gramatinius požymius (kalbos dalį, linksnį, skaičių, veiksmažodžio formą ir pan.).

Galima ieškoti vieno arba dviejų žodžių formų ar jų lemų (galima ieškoti vieno žodžio formos, o kito lemos); galima neįrašyti konkrečių žodžių, o rinktis gramatines kategorijas (vieno arba dviejų ieškomų vienetų); galima įrašyti konkretų žodį ir pasirinkti kalbos dalį (pvz., įrašius kalba galima pasirinkti, ar ieškoti daiktavardžio, ar veiksmažodžio).

Gramatinė informacija pateikta taip, kad, pasirinkus tam tikrą kalbos dalį, rodomos jai aktualios gramatinės kategorijos (pvz., giminė, laipsnis, linksnis), o neaktualios yra neaktyvios – jų vartotojas negali pasirinkti. Todėl rekomenduojame pirmiausia pasirinkti kalbos dalį ir tada rinktis norimas gramatines kategorijas (kategorijų galima ir nesirinkti). Pavyzdžiui, jei prie kalbos dalies pasirinksite daiktavardį, bus aktualios giminės, skaičiaus, linksnio ir sangrąžiškumo kategorijos. Toliau galite rinktis visas ar tik kai kurias iš šių kategorijų, o, tarkim, laiko, asmens negalėsite pasirinkti, nes šios kategorijos būdingos veiksmažodžiams.

Jei ieškote dviejų žodžių, kairėje parašytas žodis (ar kitas ieškomas vienetas) paieškos rezultatuose bus kairėje pusėje, o dešinėje parašytas žodis (ar kitas vienetas) bus dešinėje pusėje. Abu ieškomi žodžiai (ar kiti vienetai) gali būti šalia vienas kito arba gali būti nutolę per 3 žodžius ar skyrybos ženklus. Pirmas ieškomas žodis (ar kitas vienetas) rezultatuose parašytas raudonai, o antras žodis (ar kitas vienetas) – mėlynai.

Tekstyną sudarantys rašytinės kalbos tekstai buvo morfologiškai anotuoti automatiškai naudojant http://semantika.lt/ prieinamą morfologinį anotatorių, todėl gali pasitaikyti anotavimo klaidų. Sakytinės kalbos tekstai anotuoti pusiau automatiškai – naudojant lietuvių kalbai adaptuotą programą CHILDES. Kadangi sakytinėje kalboje gausu specifinių formų (sutrumpėjusių formų, žargono ir pan.), taip pat daugiareikšmių formų, dalis teksto anotuota rankiniu būdu.

Norint tekstyne rasti samplaikas, pvz., laba diena, iš viso, iš tikrųjų, reikia parašyti kurį nors samplaikos dėmenį ir atitinkamoje vietoje parašyti žvaigždutę. Pavyzdžiui, anksčiau nurodytas samplaikas galima rasti taip: laba* (bus rasta ne tik laba diena, labas vakaras, labas rytas, bet ir labas, labai), *viso, *tikrųjų.

Sakytinės kalbos tekstų specifika. Dėl anotavimo specifikos sakytinės kalbos tekstuose sakiniai pradedami mažąja raide. Sakytinėje kalboje lema laikomi visi darybiškai susiję žodžiai, pvz., į lemą mama įeina ne tik visos šio žodžio formos, bet ir žodžių mamytė, mamukas formos; į lemą bėgti taip pat įeina ir nebėgti formos.

Sakytinės kalbos patekstynyje vartojami tokie specifiniai žymėjimai:

@sv – užsienio kalbos žodis;
@k – keiksmažodis;
@d – dialektizmas;
xxx – nesuprantamas žodis.

 

Mokomasis lietuvių kalbos tekstynas sudarytas 2017–2019 m. vykdant projektą „Užsienio baltistikos centrų ir Lietuvos mokslo ir studijų institucijų bendradarbiavimo skatinimas“. Tekstyne yra autentiškos lietuvių kalbos vartosenos tekstų, kurie atrinkti pagal kriterijus, kad būtų suprantami ir aktualūs skirtingų lygių besimokantiesiems. Visi tekstai pagal Bendruosius Europos kalbų mokymosi, mokymo ir vertinimo metmenis suklasifikuoti į A1, A2, B1 ir B2 lygius. Tekstyną sudaro skirtingų kalbos atmainų (rašytiniai ir transkribuoti sakytiniai) tekstai: 111 000 žodžių A1–A2 lygio tekstų (96 000 rašytinės kalbos ir 15 000 sakytinės kalbos); 558 000 žodžių B1–B2 lygio tekstų (523 000 rašytinės kalbos ir 35 000 sakytinės kalbos); iš viso 669 000 žodžių.

Sakytinės lietuvių kalbos tekstyno dalį sudaro įvairiose vietose įrašyti natūralūs pokalbiai, apimantys skirtingas kalbėjimo situacijas ir įvairius socialinius pašnekovų vaidmenis. Sukaupti sakytinės kalbos duomenys apima tiesioginius arba telefoninius aptarnavimo srities pokalbius, vykstančius maitinimo įstaigose (restorane, kavinėje ir pan.), prekybos vietose (parduotuvėje, turguje, kioske, knygyne, vaistinėje, teatro / kino / autobusų bilietų kasoje ir pan.), paslaugas teikiančiose įstaigose (kirpykloje, grožio salone, siuvykloje, banke ar pan.), taip pat pokalbius, vykstančius namų ar darbo aplinkoje. Dalis tekstų paimta iš Sakytinės lietuvių kalbos tekstyno (žr. http://sakytinistekstynas.vdu.lt/).

Rašytinės kalbos patekstynį sudaro dvejopi tekstai: 1) tekstai, rinkti iš lietuvių kalbos besimokantiems kitakalbiams skirtų vadovėlių (toliau vadinami vadovėliniais tekstais; jie sudaro apie 17 proc. viso rašytinės kalbos patekstynio), ir 2) tekstai, rinkti iš populiarinamųjų ir grožinių knygų, naujienų portalų, viešųjų užrašų, instrukcijų, skelbimų, dokumentų ir kt. (toliau vadinami nevadovėliniais tekstais; jie sudaro apie 83 proc. viso rašytinės kalbos patekstynio). Vadovėlinių tekstų kalbos lygmuo dažniausiai buvo aiškus, o nevadovėliniai tekstai buvo automatiškai suklasifikuoti panaudojus mašininio mokymo modelius (šių tekstų kalbos lygmuo nustatytas 60 proc. tikslumu).

Vadovėliniai ir nevadovėliniai tekstai suklasifikuoti į 29 žanrus (dialogus, pasakojimus, informacinius tekstus ir kt.) ir jie atitinka keturias grupes pagal komunikacinius tikslus (informacinius, pažintinius, apeliacinius ir meninius). Dažniausi vadovėlinių tekstų žanrai yra pažintiniai tekstai, pasakojimai ir dialogai (kartu šių trijų žanrų tekstai sudaro apie 78 proc. visų vadovėlinių tekstų); nevadovėlinių tekstų: subtitrai, informaciniai tekstai, pažintiniai tekstai, proza ir patarimai (kartu šių penkių žanrų tekstai sudaro apie 73 proc. visų nevadovėlinių tekstų).

Tekstyną rengė VDU Kompiuterinės lingvistikos centro, Tarpkultūrinės komunikacijos ir daugiakalbystės tyrimų centro mokslininkai, taip pat kitų padalinių atstovai: Erika Rimkutė (viso tekstyno rengimo grupės vadovė), Laura Kamandulytė-Merfeldienė (sakytinės kalbos patekstynio rengimo koordinatorė), Gabrielė Aleksandravičiūtė, Laimutė Anglickienė, Giedrė Barkauskaitė, Agnė Bielinskienė, Loïc Boizou, Gintarė Grigonytė, Jolanta Kovalevskaitė, Gabrielė Virbickienė.

Programavimo darbai: Petras Pauliūnas

 

Mokomojo lietuvių kalbos tekstyno rašytinės kalbos patekstynio šaltiniai

1. Vadovėliai

Čubajevaitė L., Ruzaitė J., Lemanaitė G. 2014: Takas. Kaunas: Vytauto Didžiojo universitetas, Vilnius: Versus aureus.

Džežulskienė J. 2005: Lietuvių kalba kitakalbiams. Kaunas: Technologija.

Džežulskienė J. 2014: Kalbu lietuviškai. Prieiga per internetą: https://www.easylithuanian.com/

Hilbig I., Stumbrienė V., Vaškevičienė L. 2009: Trumpas lietuvių kalbos kursas pradedantiesiems. Vilnius: Vilniaus universiteto leidykla.

Hilbig I., Migauskienė R., Našlėnaitė-Eberhardt V., Petrašiūnienė E., Tamošaitienė A., Valančiauskienė A., Vaškevičienė L. 2010: Sveiki atvykę! Vilnius: Vilniaus universiteto leidykla.

Jakaitienė E. 1994: Lietuviškai apie Lietuvą. Vilnius: Alma Littera.

Kruopienė I. 2009: 10 žingsnių. Trumpas lietuvių kalbos kursas pradedantiesiems. Vilnius: Vilniaus universitetas.

Migauskienė R. 2014: Žingsnis. Vilnius: Eugrimas.

Migauskienė R., Vaisėtaitė E. 2014: Žodis žodį veja. Vilnius: Eugrimas.

Narbutas E., Pribušauskaitė J., Ramonienė M., Skapienė S., Vilkienė L. 2002: Slenkstis. Strasbourg: Council of Europe Press.

Pribušauskaitė J., Ramonienė M., Skapienė S., Vilkienė L. 2000: Aukštuma. Strasbourg: Council of Europe Press.

Ramonienė M., Pribušauskaitė J., Vilkienė L. 2006: Pusiaukelė. Europos Taryba.

Ramonienė M., Vilkienė L. 1998, 1999: Po truputį (mokytojo ir mokinio knygos). Vilnius: Baltos lankos.

Stumbrienė V., Kaškelevičienė A. 2002: Nė dienos be lietuvių kalbos. Vilnius: Gimtasis žodis.

Vaškevičienė L., Kutanovienė E., Valančiauskienė A. 2015: Pažiūrėk! Paklausyk! Pasakyk! Vilnius: Eugrimas.

2.Nevadovėliniai šaltiniai

2.1. Informaciniai tekstai

DELFI.lt 2014–2016 m. įvairių rubrikų tekstai.

Dialogai apie gyvenimą, užrašyti 2008 m. Kalbėjosi Rasma Aniulytė, Asta Ziutelytė, Stasė Venčaitienė. VDU Kultūrų studijų katedros Etnologijos rankraštynas.

Dienoraštis, užrašytas 2009 m. Į rankraštyną pateikė Klara Liebutė. VDU Kultūrų studijų katedros Etnologijos rankraštynas.

Diktantai pirmokams, antrokams, trečiokams, ketvirtokams. Prieiga per internetą: http://mudubudu.lt.

Dokumentai (informacija, kaip atsidaryti banko sąskaitą, gauti nedarbo ar motinystės išmoką, būsto paskolą; kas yra draudžiamas privalomuoju sveikatos draudimu; kam išduodamas leidimas gyventi Lietuvoje ir pan.), surinkti 2018 m. iš įvairių valstybinių įstaigų interneto svetainių.

Elektroniniai laiškai. Projekto vykdytojų asmeniniai duomenys.

Etiketės, trumpi aprašai apie prekes, surinkti 2018 m. iš įvairių interneto svetainių.

Horoskopai, surinkti 2010 m. iš įvairių interneto svetainių.

Instrukcijos (informacija apie įvairių buitinių prietaisų (televizoriaus, skalbyklės, lygintuvo ir pan.) naudojimą ir priežiūrą; namų taisyklės (ką galima ir ko negalima daryti), surinktos 2018 m. iš įvairių interneto svetainių.

Pažinčių skelbimai, surinkti 2005 m. iš laikraščių ir žurnalų „Lietuvos rytas“, „Atleisk“, „Viltys ir likimai“, „Antra pusė“, „Gyvenimiškos istorijos“.

SMS žinutės; internetinių forumų žinutės. Projekto vykdytojų asmeniniai duomenys.

Viešieji užrašai, surinkti 2018 m. iš gydymo, maitinimo, kultūros įstaigų, viešojo transporto ir pan. viešųjų vietų.

 

2.2. Pažintiniai tekstai

Aleksaitė I., Jazbutytė N. 2008: Geros manieros – pusė karjeros. Vilnius: Mintis.

Aleksaitė I., Jazbutytė N. 2010: Prie stalo, ant stalo, po stalu: šventė kiekvienuose namuose. Vilnius: Mintis.

Flintas, Flinto bumas (žurnalas), 2008. Kaunas: Jūsų Flintas.

Gudzinskas Z. 2010: Kur uogauti Lietuvoje. Kaunas: Šviesa.

Heiney P. 2008: Ar karvės gali nulipti laiptais? Atsakymai į keblius klausimus. Vilnius: Mintis.

Imbrasienė B. 2010: Lietuvių kulinarijos paveldas. Vilnius: Baltos lankos.

Iršėnaitė R. 2010: Kur grybauti Lietuvoje. Kaunas: Šviesa.

Kauno turizmo informacijos centras (ekskursijų aprašai, lankytų objektų, švenčių aprašai, informacija) (2017). Prieiga per internetą: https://visit.kaunas.lt/lt/.

Kelionių aprašymai, surinkti 2017 m. Prieiga per internetą: http://www.kiveda.lt/.

Kelionių aprašymai, surinkti 2017 m. Prieiga per internetą: https://www.gruda.lt/.

Kelionių aprašymai, surinkti 2017 m. Prieiga per internetą: https://www.makalius.lt/.

Klaipėdos turizmo informacijos centras (ekskursijų aprašai, lankytų objektų, švenčių aprašai, informacija) (2017). Prieiga per internetą: http://www.klaipedainfo.lt/.

Mergaitė (žurnalas), 2008. Vilnius: Egmont Lietuva.

Penki: užduotys, juokai, konkursai, prizai. UAB Presa, 2017 m. Nr. 2.

Pokalbiai apie Kauną, užrašyti 2009 m. Kalbėjosi Justė Vasilionytė-Stašaitienė. VDU Kultūrų studijų katedros Etnologijos rankraštynas.

Saugaus pirmoko pasas, 2012. Demokratinių iniciatyvų centras.

Semaška A. 2007: Lietuvos keliais. Turisto žinynas. Vilnius: Algimantas.

Spalvink: Ledo šalis. Dysney, 2017, Nr. 2, liepa–rugsėjis.

SU P.E.R. (žurnalas), 2008. Kaunas: Jūsų flintas.

Tekstai, gauti iš lietuvių kalbą kaip svetimąją dėstančių dėstytojų.

Vilniaus turizmo informacijos centras (ekskursijų aprašai, lankytų objektų, švenčių aprašai, informacija) (2017). Prieiga per internetą: http://www.vilnius-tourism.lt/.

Žilinskas R. 2010: Kur žvejoti Lietuvoje. Kaunas: Šviesa.

 

2.3. Apeliaciniai tekstai

Reklaminiai ir nereklaminiai šūkiai, surinkti 2017 m. iš įvairių įmonių interneto svetainių.

Socialinės reklamos, surinktos 2008 m. iš pakelės stendų, interneto, televizijos.

 

2.4. Meniniai tekstai

Ambrukaitis J., Pobrein V. 2001: Lietuvių kalba 5. Antroji knyga. Kaunas: Šviesa.

Anekdotai, užrašyti 2009 m. VDU Kultūrų studijų katedros Etnologijos rankraštynas.

Beresnevičius G. 2005: Pabėgęs dvaras. Vilnius: Lietuvos rašytojų sąjungos leidykla.

Dzvankauskaitė I. 2009: Lietuvių šiuolaikinių populiariųjų jaunimo dainų kalbinės ypatybės. Bakalauro darbas. Kaunas: Vytauto Didžiojo universitetas (naudotas priedas, kuriame pateiktos dainos).

Gimberis J. 2011: Jūs turite teisę tylėti. Vilnius: Versus aureus.

Gudonytė K. 2012: Ida iš šešėlių sodo. Vilnius: Tyto alba.

Inis L. 2012: Atsidaro metų durys. Kaunas: Arx reklama.

Kasparavičius K. 2009: Baltasis dramblys. Tolimųjų kraštų istorijos. Vilnius: Nieko rimto.

Kunčinas J. 2006: Baltųjų sūrių naktis. Vilnius: Gimtasis žodis.

Mokyklų himnai, surinkti 2000–2012 m. iš įvairių interneto svetainių.

Patarlės ir priežodžiai: elektroninis sąvadas, 1998–2005. Prieiga per internetą: http://www.aruodai.lt/patarles/.

Skeris R. 1990: Ką žmonės dirba visą dieną? Vilnius: Vyturys.

Subtitrai (meninių filmų). Prieiga per internetą: http://www.subtitrai.net.

Šepetys R. 2011: Tarp pilkų debesų. Vilnius: Alma littera.

Šimaitis V. 2008: Komunalinis bliuzas. Vilnius: Vaga.

Vincė L. 2008: Lenino galva ant padėklo. Amerikietės studentės dienoraštis, rašytas paskutiniais Sovietų Sąjungos gyvavimo metais. Vilnius: Lietuvos rašytojų sąjungos leidykla.


v.1.3