Sunday, March 2, 2025

ide penelitian: membangun ensiklopoedi kosa kata Al Quran

Dakam sebuah entri ensiklopedi ada bagian2 (analogi dg aspek pada tejs review).

Contoh kasus kata ghurur

https://corpus.quran.com/search.jsp?q=lem%3Aguruwr+pos%3An

Saturday, March 1, 2025

ide penelitian: QA Al Quran

QA, dimana memperlihatkan sumber jawaban dari mana. Sumber utama kitab2 tafsir.
Kalau bisa ditandai kalimat2 mana sebagai sumber.

Output format umum, bukan hanya faktoid.

Kalau tdk ada jawaban dari korpus sumber, maka tdk dipaksakan harus ada.

Jadi prosesnya spt QA tradisional, urutannya
1. IR. Input semua korpus yg dipakai, output ayat2 kandidat jawaban
2. Pengumpulan kata2 dlm ayat (semacam distabilo).
Input: ayat2 kandidat jawaban, output point.
3. Menghasilkan jawaban. Input: poin2 rangkaian kata/kalimat. Output: disatukan jadi jawaban.

Buat sub-step. Buat reference (kunci jawaban) per sub-step.
Dan tentukan metrik evaluasi per sub-step.

Jawaban bisa ada alternatif2/berbeda berdasarkan pendapat mufasir.

Pada masalah ini perlu mengguankan data berlabel yg terus menerus ditingkatkan kuantitas dan kualitasnya. Termasuk knowledge graph.

Contoh:
Question: mengapa ada orang yg memusuhi jibril (misal QS 2:97).

Surat Al Quran Al Baqarah
Katakanlah: "Barang siapa yang menjadi musuh Jibril, maka Jibril itu telah menurunkannya (Al Quran) ke dalam hatimu dengan seizin Allah; membenarkan apa (kitab-kitab) yang sebelumnya dan menjadi petunjuk serta berita gembira bagi orang-orang yang beriman. (97) 

Lebih lanjut, korpus sumber juga dg Sirah Nabawiyah. 

Misal, pada kasus tsb beri contoh pada masa Rasul siapa yg memusuhi Jibril.

Coba cek bagaimana jika kita gunakan LLM yg ada saat ini.