ka | en
Company Slogan TODO

ქართული ენის და მისი ქვესისტემების მორფოლოგიური ანალიზატორი როგორც ტექსტური კორპუსის მენეჯერის ძირითადი კომპონენტი

ავტორი: ლიანა ლორთქიფანიძე
საკვანძო სიტყვები: ტექსტური კორპუსი, კორპუსის მენეჯერი, მორფოლოგიური ანალიზატორი, ქართული ენის დიალექტი
ანოტაცია:

ლინგვისტური ტექსტური კორპუსების მთავარი დანიშნულებაა ენის ლექსიკასა და გრამატიკაში სამეცნიერო კვლევების უზრუნველყოფა. კორპუსის ანოტირების შედეგად შესაძლებელია ტექსტის შესახებ ნებისმიერი ტიპის ანალიტიკური ინფორმაციის მიღება. კორპუსის კვლევის ინსტრუმენტის – კორპუსის მენეჯერის კომპილირებისთვის აუცილებელია მასში შესული ტექსტების მორფოლოგიური მონიშვნა (ანოტირება). რაც განსაკუთრებით რთულია ქართული ენის სხვადასხვა ქვესისტემების შემთხვევაში. მოხსენება შეეხება ქართული ენის ქვესისტემების მორფოლოგიური ანალიზატორის შემუშავებას. ნაგულისხმებია, რომ ყოველი ტექსტური ერთეული, რომლის ანალიზი თანამედროვე ქართული ენის მორფოლოგიური ლექსიკონის მიხედვით უარყოფით შედეგს იძლევა, ეკუთვნის ენის ქვესისტემას (დიალექტს). შესაბამისად შემუშავებულია სხვადასხვა დიალექტების მორფოლოგიური ლექსიკონების შევსება/გამდიდრების მეთოდი. ენის გარკვეული ქვესისტემისთვის ლექსიკონის შედგენის პროცედურა ოთხი ეტაპისაგან შედგება: 1. ლემათა (საბაზისო ფორმათა) ლექსიკონის შევსება უკვე არსებული დიალექტური ლექსიკონების (თუკი ასეთი არსებობს) დახმარებით; 2. მორფოლოგიური ანოტირება ლიტერატურულ და დიალექტურ ლექსიკონებზე დაყრდნობით; 3. ყველა ამოუცნობი სიტყვაფორმების კლასტერებად გაერთიანება, რომლებსაც შემდგომ შეეფარდებათ და მიეწერებათ ლექსემის ყალიბიდან გამომდინარე ჰიპოთეზური ინფორმაცია გრამატიკული მეტყველების ნაწილის, ლემის და სხვა მახასიათებლების შესახებ; 4. ყველაზე სწორი ჰიპოთზების შეფასება და მოცემული დიალექტის მორფოლოგიური ანალიზატორის ლექსიკონში ახალი ლემებისა და ფორმაწარმოებითი წესების დამატება.



Web Development by WebDevelopmentQuote.com
Design downloaded from Free Templates - your source for free web templates
Supported by Hosting24.com