Evaluacija i klasifikacija korišćenja sintaksnih informacija u određivanju semantičke sličnosti kratkih tekstova

Vuk Batanović, Dragan Bojić

Apstrakt

U ovom radu su prikazani i kategorizovani načini korišćenja sintaksnih informacija u više algoritama za određivanje semantičke sličnosti kratkih tekstova. Evaluacija performansi algoritama je sprovedena korišćenjem rezultata testa detekcije parafraza iz Microsoft Research Paraphrase korpusa. Od svih opisanih algoritama i pristupa korišćenju sintaksnih informacija identifikovani su oni najpogodniji za primenu u jezicima sa ograničenim elektronskim jezičkim alatima i, imajući tu svrhu u vidu, predložena je nova klasifikacija algoritama.

Vrsta rada

Konferencijski rad

Publikacija

Zbornik radova sa 21. telekomunikacionog foruma (TELFOR 2013), Beograd, Srbija, pp. 821-824, IEEE

DOI

10.1109/TELFOR.2013.6716356

Datum

Novembar 2013

Linkovi

PDF Skup podataka