Evaluacija i klasifikacija korišćenja sintaksnih informacija u određivanju semantičke sličnosti kratkih tekstova

Apstrakt

U ovom radu su prikazani i kategorizovani načini korišćenja sintaksnih informacija u više algoritama za određivanje semantičke sličnosti kratkih tekstova. Evaluacija performansi algoritama je sprovedena korišćenjem rezultata testa detekcije parafraza iz Microsoft Research Paraphrase korpusa. Od svih opisanih algoritama i pristupa korišćenju sintaksnih informacija identifikovani su oni najpogodniji za primenu u jezicima sa ograničenim elektronskim jezičkim alatima i, imajući tu svrhu u vidu, predložena je nova klasifikacija algoritama.

Publikacija
Zbornik radova sa 21. telekomunikacionog foruma (TELFOR 2013), Beograd, Srbija, pp. 821-824, IEEE
Datum