Friday, October 17, 2008

jurnal riset Nuri: Pelabelan semantik sebuah kalimat tunggal bahasa Indonesia

Pelabelan semantik sebuah kalimat tunggal bahasa Indonesia
batasan: kalimat tunggal. Untuk kalimat majemuk dipecah menjadi subkalimat2 tunggal secara manual.

Salah satu pelabelan semantik menggunakan PropBank.
Apa itu PropBank dan bagainana cara pelabelan secara otomatik bisa dilihat di

Martha Palmer, Daniel Gildea, Paul Kingsbury, "The Proposition Bank: An Annotated Corpus of Semantic Roles", Computational Linguistics, Volume 31 , Issue 1 (March 2005)

Jika kita menggunakan PropBank misalkan kita harus memilih verb pada sebuah kalimat dengan verb (frame set) yang cocok tergantung dari sense nya . Namun memilih sense yang cocok itu caranya bagaimana? Bisa dengan memilih verb yang JUMLAH arg nya cocok, namun ini hal yang sulit, karena bagaimana melihat mana yang jumlah arg nya cocok (sama banyaknya) dengan yang tersedia (tersisa) pada kalimat?


terkait:
PropBank, TreeBank, Case Grammar

dari Wikipedia:
PropBank is a corpus that is annotated with verbal propositions and their arguments—a "proposition bank"

PropBank Index — A verb-by-verb index to the data in PropBank