МАКЕДОНСКИ ПРОГРАМЕРИ И НАУЧНИЦИ СОЗДАДОА МОДЕЛ НА ВЕШТАЧКА ИНТЕЛИГЕНЦИЈА НА МАКЕДОНСКИ ЈАЗИК

26.08.2025 Скопје

Студентите Стефан Крстески, Матеа Ташковска, Борјан Саздов, заедно со своите ментори, професорите д-р Христијан Ѓорески и д-р Бранислав Геразов од Факултетот за електротехника и информациски технологии изработија модел на Вештачка Интелигенција на македонски јазик, кој е основа за развој на големи јазични модели, како што се GPT моделите, на македонски јазик.

Тие велат дека нивниот предизвик бил да допринесат за дигитална еволуција на македонскиот јазик и да создадат основа за негов развој во ерата на вештачката интелигенција. Моделот може да се користи во науката, бизнисот, но и во секојдневието. Тимот нагласува дека сите ресурси што ги развива се јавно достапни бидејќи сакаат да им овозможат и на други истражувачи и институции да ги користат, да надградуваат врз нив, а со тоа и да придонесат кон развој на вештачка интелигенција на македонски јазик.

Целта на нашето истражување беше да го поттикнеме развојот на Вештачката Интелигенција (ВИ) и големите јазични модели на македонски јазик. Денес вакви модели, како што се GPT моделите што стојат зад ChatGPT, се користат сè повеќе во различни области за олеснување на секојдневната работа и за подобрување на продуктивноста.

Нашата идеја беше да изградиме модел кој не само што го разбира македонскиот јазик, туку и умее да комуницира на литературен и природен начин. За тоа беше потребна голема количина податоци, па во рамките на трудот го создадовме најголемиот јавно достапен текстуален корпус на македонски јазик. Дополнително, подготвивме и множество културолошки прилагодени инструкции, кои му овозможуваат на моделот подобро да учи како да следи насоки.

Нашата мотивација произлезе од неколку фактори. Од една страна, сведоци сме на брзиот развој на големите јазични модели и нивната широка примена во светот, од образование и наука, до индустрија и секојдневна комуникација. Од друга страна, македонскиот јазик и покрај својата богата културна и историска вредност, сè уште е недоволно застапен во дигиталната сфера. Токму таа празнина ја почувствувавме како предизвик и можност да дадеме придонес кон дигиталната еволуција на македонскиот јазик и да создадеме основа за негов развој во ерата на вештачката интелигенција.

Потенцијалот на моделот е навистина голем, бидејќи претставува голем јазичен модел кој е трениран специјално на македонски податоци и ги препознава особеностите на нашиот јазик. Тоа го прави особено значаен, бидејќи овозможува природна и литературна комуникација.

Придобивките можат да се почувствуваат во повеќе области. Во секојдневието, моделот може да помогне при пишување известувања, резимеа и мејлови, проверка на граматика и стил или автоматско преведување. Во академијата и науката може да врши сумирање на трудови, анализа на текстови и да им помогне на студентите со објаснување на сложени концепти. Бизнис-секторот би можел да го користи за анализа на податоци и пазарни трендови, како и за поефикасна корисничка поддршка преку чет-ботови на македонски. Во медиумите пак, може да се применува за обработка на вести, креирање персонализирани содржини и препознавање на дезинформации. Дополнително, во јавната администрација може да придонесе кон автоматизација на административни процеси и поголема дигитализација на услугите.

Она што е уште поважно е дека моделот има простор за понатамошно надградување, со што неговата точност и применливост ќе се зголемуваат со време. А сите ресурси што ги развивме се јавно достапни што овозможува и други истражувачи и институции да ги користат, да надградуваат врз нив и заеднички да придонесеме кон развој на вештачка интелигенција на македонски јазик.