За мрежите от думи и езиковите технологии

Разговор на Венета Гаврилова с проф. Петя Осенова в ''За думите''

Има теми и дялове от науката за езика, които не са често предмет на разговор дори в предаването "За думите". Не за друго, а защото е много трудно да бъдат "преведени" на достъпен за нас, неспециалистите, език. Такава област безспорно е компютърната лингвистика, иначе казано, обработката на естествения език така, че да може да бъде анализиран и използван от най-модерните технологии, включително от все по-присъстващия в живота ни изкуствен интелект.

За да направим опит поне да надникнем в тази сложна материя, разговаряме с проф. Петя Осенова, преподавателка в Софийския университет, отскоро член на борда на Международната асоциация за мрежи от думи (Global Wordnet Association), структура, която има за цел да обедини и подпомогне усилията при създаването, поддържането и използването на мрежи от думи за различни езици.

Мрежата от думи е вид речник, тазаурус, но релационен, т.е. с много отношения между думите и подчинени на йерархия. Основната единица е синонимният ред, а не отделната дума, пояснява проф. Осенова. Тези мрежи от думи не са създавани първоначално за езикови технологии и справки, а с идеята да се направи някакво приближение до менталния лексикон чрез повече отношения между думите. Но впоследствие се установява, че може да се ползват и за обработки на езика.

Какво представлява инициативата, започнала по време на ковид пандемията – Корпус от данни за 29 национални и регионални парламента, включително и българския. Защо е необходимо знание за езика в ерата на големите езикови модели и какво правим ние с тези модели. Намалява ли ролята на естествения човешки интелект и професионален опит при все по-съвършените технологии за обработка на езика, чуйте в интервюто с проф. Петя Осенова.