Студенти-лінгвісти ІКНІ під час карантину взяли участь у наповненні корпусу української мови ГРАК

Кафедра ПЛ Львівської політехніки
перелік студентів Університету, які підготували для ГРАКа матеріал

Під час карантину студенти кафедри прикладної лінгвістики Інституту комп’ютерних наук та інформаційних технологій Львівської політехніки продовжили брати участь у наповненні корпусу української мови ГРАК, переклали з англійської мови інструкцію до CQL.

Студенти Університету підготували для ГРАКа корпус журналу «Всесвіт» (1958–1983 рр.) обсягом 14,5 мільйона слів і близько 400 родинних листів.

Генеральний регіонально анотований корпус української мови (ГРАК) – це велика, репрезентативна, структурована колекція текстів українською мовою у супроводі програми, яка дає змогу будувати на базі корпусу власні підкорпуси, шукати слова, граматичні форми та їхні сполучення, а також обробляти результати пошуку, сортувати, робити збалансовані вибірки й одержувати різну статистичну інформацію.

Корпус призначений для здійснення лінгвістичних досліджень з граматики, лексики, історії української літературної мови, а також для використання під час укладання словників та граматик.