Friday, October 31, 2008

Apa upaya untuk lebih meningkatkan kualitas konferensi IF di tanah air?

Alhamdulillah di bidang Informatika / Ilmu Komputer semakin banyak konferensi yang diselenggarakan di Indonesia. Kebetulan saya pernah ikut bantu menyelenggarakan sebuah kinferensi semacam itu, dan juga konferensi di bidang terkait dengan IF.

Untuk penerimaan paper, ada "dilema":
  • jika review terlalu ketat, yang mau mengirim "takut", sedikit yang diterima dll..
  • jika review terlalu longgar, ada orang yang enggan mengirim kalau dirasa papernya sangat bagus.. konferensi tahunan review terus dibuat sangat longgar juga bisa menurunkan kualitas konferensi
Bagaimana agar tercapai: mendorong orang semakin banyak mengirimkan tulisan, namun juga meningkatkan kualitas konferensi?

Beberapa yang mungkin kita lakukan:
Tulisan yang kurang baik, hanya diterima dalam versi short paper atau poster dan mungkin tidak usah presentasi
Tulisan yang baik diberi penghargaan (tidak harus harus ada uangnya), masuk ke jurnal

Terkait dengan itu, saya sampai sekarang masih belum paham:
Mengapa yang tulisannya diterima harus bayar? Kalau sekedar biaya makan dll okelah.. Karena ada benefit "kum" sehingga dia harus bayar? Saya tetap belum paham mengapa..

Akan lebih enak kalau konferensi itu tekanannya ke berbagi ilmu dan menjalin jaringan keilmuan. Acaranya sederhana, dan tanpa selebritis (pejabat dll). Jangan undang pejabat tapi pakar di bidang ybs.

Di kita program konfersni juga kurang beragam. Bandungkan dengan misalkan konferensi KDD. Ada tutorial, workshop, kompetisi...

Saya sedang mencoba membuat daftar konferensi terkait data mining (disini)

how long can we go?

Saya pernah baca kira2:

Rasulullah bersabda: hiburanku dalam shalat.

Kalau kita bisa melaksanakan shalat dengan khusuk, tenang, santai, menikmati. Namun juga serius... alangkah nikmatnya.. Kita bisa nonton TV berlama-lama, misalkan nonton bola.

Coba kita mencoba shalat santai... how long can we go? Mengerjakan shalat 3-4 rakaat paling lama saya kira 15 menit..

Buku Tugas Akhir (TA) bisa didownload publik?

Beberapa kali saya jumpai pro kontra boleh tidaknya buku (dan juga source code dll) Tugas Akhir mahasiswa dicopy oleh publik. (Kebetulan IF di IT Telkom saat ini belum ada pasca sarjananya).

Ada plus minus nya kalau bisa diakses publik. Minus terbesarnya: ada kemungkinan mahasiswa lain mencontek dengan mudahnya. Sisi plusnya: berbagi ilmu etc etc...

Saya sejak dulu: PRO.

Justru dengan ditaruhnya dokumen dan program TA di internet lebih mudah diketahui kalau seseorang mencontek.

Kalau kita lihat di Barat, sangat banyak tesis full text yang bisa kita download. Untuk bidang saya 'Data Mining' saja ada ratusan. Namun sangat sulit dijumpai tulisan di Indonesia ini yang bisa didownload full text. Bidang apapun. -CMIIW-

Sayang kalau kita sudah mengerjakan penelitian dengan susah payah akhirnya hasil karya kita hanya ditumpuk di almari begitu saja.

Untuk itu mahasiswa yang melakukan penelitian dengan saya, saya persyaratkan harus boleh karyanya ditaruh diinternet dan didownload publik. Saya tambahkan ke mereka.. insya Allah menjadi amal jariah..

lihat juga daftar beberapa TA dengan saya

Pelabelan peran semantik menggunakan case grammar

Salah satu penelitian yan sedang saya lakukan bersama dengan Nuri (mhs ITTelkom) dan bu Ririn (dosen Unpas yang sering mengajar juga di ITTelkom) adalah pelabelan peran semantik pada kalimat berbahasa Indionesia. Salah satu kemungkinannya menggunakan case grammar.

Goal: semantic role labeling.
Untuk apa pelabelan itu?

Semantic role yang seperti apa? Contoh yang dibuat Widy: .doc.

Bentuk pembagian peran di sini cukup sederhana, karena hanya mengidentifikasi kata kerja (sebagai "target") dan argumen-argumennya.

Namun setahu saya untuk bahasa Indoensia belum ada hasil penelitian yang telah menghasilkan pelabelan seperti ini.

Kemungkinan yang akan dipilih adalah menggunakan Case Grammar.

Wah harus belajar bahasa ...

Case grammar itu apa? Contoh... untuk bahasa Inggris, untuk bahasa Indonesia.

Referensi apa saja untuk hal ini (case grammar untuk semantic role labeling)?

Konsisten - istiqomah - tidak cepat bosan

Setipa Rabu dan Jum'at pagi saat baru tiba di kampus (biasanya saya sampai di kampus sekitar pk.7.15) sering saya lihat teman-teman olah raga tenis. Dan setahu saya itu telah mereka lakukan sejak lama. Salut mereka konsisten menyempatkan diri olah raga disela-sela kegiatan yang padat. Bagaimana saya .... :(

Botol aqua

Sering kita jumpai orang yang minum air kemasan ("aqua") yang kemasan gelas minum beberapa gelas.
Meskipun didekatnya ada "aqua" galon (dispenser) tetap saja mereka mengambil lagi yang kemasan gelas. Tidak dipikirkan akan menambah sampah plastik. Dan ini tidak jarang saya jumpai di tempat kerja saya. Marilah kita berusaha sebisa mungkin berkontribusi untuk lingkungan kita yang sampah plastiknya semakin menjadi permasalahan.

Thursday, October 30, 2008

Mengapa ilmuwan Indonesia kurang terdengar di kancah internasional?

Mengapa ilmuwan Indonesia kurang terdengar di kancah internasional?
Menurut Yansen dalam artikelnya di koran Republika kemarin (29 Okt 08) artikel.

Ringkasannya: [buatlah ringkasannya] :)

Ikhtisar: [oleh Republika]
  • Sangat sedikit peneliti Indonesia yang memublikasikan hasil risetnya di jurnal-jurnal internasional.[dari Republika]
  • Banyak peneliti tidak percaya diri untuk menerbitkan hasil temuan di dunia internasional.
  • Perlu insentif agar lembaga pendidikan bisa berlangganan jurnal internasional.
Komentar saya: [buatlah komentarnya] :)

honor Dikti

Saya barusan tanda tangan, Standar honor Dikti ternyata jauh di atas yang saya bayangkan. Saya pernah juga diberitahu kalau misalkan ada rapat dengan Dikti ada uang rapat yang cukup besar.

Nggak tahu ini sesuatu yang + atau - atau campuran.

stemming teks bhs Indonesia untuk kategorisasi


Dalam information retireval dan text mining, biasanya biasanya salah satu tahap praprosesing adalah melakukan stemming. Jika kemudian dokumen text tersebut akan dilakukan berbagai proses sekaligus, misalkan dia akan digunakan untuk di search, di cluster dan di kategorisasi, summarize .. dll maka idealnya praprosesing tsb, termasuk proses stemming itu akan optimal untuk semua proses itu. Ataukan kalau preprosesing dibuat spesifik untuk proses tertentu (misalkan kategorisasi) maka akan lebih efektif (kategorisasi lebih akurat)? Preprosesing seperti apa yang spesifik?

Siang-sore ini saya berdiskusi dengan Ochie yang sedang melakukan penelitian (untuk Tugas Akhirnya) tentang stemming dokumen bahasa Indonesia dengan tekanan untuk kategorisasi.

Akan diimplementasikan teknik-teknik yang ada (saat ini kami belum menemukan aplikasi stemming bahasa Indonesia yang bisa didownload di internet), dan menganalisis pengaruhnya dalam kategorisasi. Juga akan dilihat kalau stemming nya "sempurna" (artinya dikerjakan oleh manusias sehingga stemmingnya benar-benar 100% tepat) bagaimana pengaruhnya terhadap
kategorisasi.

Ini slide yang dibikin Ochie sekilas ttg stemming:
slide (underconstruction)
Contoh hasil stemming (doc)

Salah satu referensi utama dalam stemming bahasa Indonesia, adalah:

Stemming Indonesian
: A confix-stripping approach
ACM Transactions on Asian Language Information Processing (TALIP) archive
Volume 6 , Issue 4 (December 2007)

surveys existing techniques for stemming Indonesian words to their morphological
roots, presents our novel and highly accurate CS algorithm, and explores the effectiveness of stemming in the context of general-purpose text information retrieval through ad hoc queries.

KNN untuk imbalance classification

Barusan diskusi dengan Tika (Eka Kartika) tentang tugas akhirnya seputar penggunaan KNN untuk imbalance classification, utamanya untuk aplikasi churn prediction.

Dia merencanakan mengambil ide dari tulisan A Scalable Clustering Technique for Intrusion Signature Recognition

Pertama di cluster, instance kelas minor dicluster terpisah dengan yang kelas mayor. Lalu dicek semua instance di training tsb, apakah centroid yang terdekat center dengannya apakah kelasnya sama dengan kelasnya dia atau tidak, kalau tidak maka buatlah cluster baru dengan instance tsb sebagai centroid.... Begitu katanya...

TextRank

Barusan diskusi summarization dengan Nur. Dia penelitiannya summarization dengan graph-based.....

TextRank (TextRank: Bringing Order into Texts) merupakan sebuah teknik yang dibuat untuk meranking kalimat dalam dokumen(atau kumpulan dokumen). Teknik ini adalah sebuah teknik graph-based. Salah satu aplikasi dari pemberian peringkat ini adalah untuk untuk peringkasan dokumen atau sentence extraction.

Ide TextRank berasal dari PageRank (The PageRank citation ranking: Bringing order to the Web) yang dipakai untuk memberi peringkat web page oleh banyak search engine.

Nur sudah membuat contoh penghitungan PageRank dengan Excel. xls. ppt

Slides: pptx

Namun di paper TextRank tidak disebutkan bagaimana cara membuat arahnya edge-nya.

Tampaknya untuk TextRank (dan juga LexRank) lebih ke undirected graph. Dengan undirected graph penghitungan ranking juga menjadi lebih mudah. Di sini tidak ada in link ataupun out link.

Contoh penghitungan undirected graph untuk TextRank juga sudah dubuat oleh Nur .xls


balas SMS

orang mengirim SMS menurut saya seperti halnya orang berbicara kepada kita, jadi sebaiknya setiap SMS dibalas. Kecuali SMS sekedar pemberitahuan, tidak mesti dibalas. Tidak sopan kalau misalkan ada orang mengirim SMS (bertanya) kepada kita lalu kita diam saja. Meski kadang membalas SMSnya tidak seketika itu.

Wednesday, October 29, 2008

Research, research programmer

Tugas akhir mhs S1

Tugas akhir mhs S1 yang bagus seperti apa?
Apa peran dosen pembimbing?

Buku Data Mining Weka

Data Mining: Practical Machine Learning Tools and Techniques (Second Edition)


Setelah sekitar lima kali menjalankan mata kuliah Data Mining, baru semester in kami di Dept Informatika IT Telkom menggunkan buku ini sebagai referensi utama. Biasanya kami menggunakan bukunya Pan Ning Tan "Introduction to Data Mining. Buku ini menurut saya sangat bagus, karena membahas secara cukup menyeluruh dasar-dasar data mining.

Buku ini banyak membicarakan tentang klasifikasi. Ya karena lebih ke "machine learning" oriented dimana pada machine learning memang utamaya adalah klasifikasi. Berbeda dengan bukunya Jiawei Han yang sangat detil menguraikan analisis asosianya misalkan.

Rencananya sih bikin web page yang me review buku- buku data mining, di sini http://sites.google.com/site/pengantardatamining/buku-data-mining

Ketekunan

Banyak pekerjaan yang bermanfaat untuk kita namun ternyata dikerjakan oleh orang lain yang sebenarnya tidak merasakan manfaatnya. Misalnya membuat peta. Buku peta Jakarta dan Bandung yang pertama malah dikerjakan oleh orang asing.

Orang bule banyak mengerjakan hal2 yang harus dikerjakan dengan tekun. Kemarin saya baca di Kompas (copy), Peter Carey seorang sejarahwan membuat buku tebal hampir 1000 halaman tentang Pangeran Diponogoro.

Dikatakan disitu "Peter Carey, yang kini menjadi dosen di Trinity College, Inggris, telah menghabiskan sebagian besar hidupnya untuk menyusun buku ini. I can say that I have lived under the shadow of the Prince [Diponegoro] for nearly all my adult existence..."

Ini adalah salah satu hal yang patut ditiru: tekun untuk jangka waktu lama tidak bosan mengerjakan hal yang sama sampai mendalam dan detil.

Final Destination


Tadi malam saya nonton di TransTV film "Final Destination"

Ya.. untuk hiburan...

Namun ada hikmahnya: ingat bahwa kita semua pasti menuju ke "final destination" yaitu alam baka. PASTI. Entah kapan, dan umur manusia sekarang hampir tidak ada yang melebihi 100 th.
Jadi count down saja ke usia 70an. Walau ingat sebelum count down mencapai nol, kita bisa tiba-tiba sudah sampai ke final destination itu. Bisa kapanpun dimanapun.

Di sisi lain, usia semakin meningkat mestinya lebih giat beramal dan lebih mendekatkan diri kepadaNya.


Meski dalam pemilu AS saya jelas mendukung Obama, namun saya sangat salut dengan McCain yang sudah berusia 72 th, namun sangat energik. bayangkan menjadi calon presiden AS sibuknya seperti apa.

Mengapa banyak PT di Indonesia belum maju?

Mengapa banyak PT di Indonesia belum maju?

Siapa mengatakan banyak PT di Indoensia belum maju? Saya hanya amati sekilas.
Apa yang disebut maju?

Setelah empat tahun menjadi staf akademik di sebuah PTS (IT Telkom) saya coba buat beberapa "perenungan", terutama yang terjadi di kampus saya bekerja.

Beberapa kekurangan PT di tanah air:
  • Belum belum membudayanya, atau mungkin bahkan belum ada satupun dosen di ITTelkom yang melakukan "sabbatical leave".
  • Belum adanya web site institusi dan personal staf akademik yang isinya terkelola dengan baik, lengkap dan uptodate isinya.
  • Tidak ada kosentrasi pekerjaan utama. Sebaiknya ada tugas utama (major) dan pekerjaan kedua (minor). Ada tiga tugas: manajerial, pengajar, peneliti. Tugas utama dilakukan 80%, sedangkan tugas kedua 20%. Misalkan sebagai peneliti, dia harus 80% waktu dan upayanya untuk penelitian. Sangat sulit diharapkan mengerjakan lebih dari satu tugas dan semuanya optimal.
.. insya Allah menyusul yang lain..

Tuesday, October 28, 2008

kompetisi data mining

Pekan lalu IT telkom menjadi tuan rumah GemasTIK 2008. Salah satu programnya adalah kompetisi data mining. kebetulan saya menjadi salah satu anggota tim panitia kompetisi ini dan juga salah satu juri dalam babak final.

Alhamdulillah saya kira GemasTIK (termasuk kompetisi data mining ini) cukup bermanfaat. Ada beberapa yang ingin saya sampaikan ttg kompetisi dami, terutama untuk perbaikan bila akan diselenggarakan kompetisi ini lagi ...

.... maaf mau ngerjain yang lain dulu ....

warung kejujuran

Warung kejujuran. Sangat menarik dan patut didukung, termasuk pelaksanaannya di kampus perguruan tinggi.

Selain diterapkan untuk "warung" bisa diterapkan untuk hal yang lain, misalkan

perpustakaan: peminjaman dan pengembalian buku self service
ujian: tanpa ada pengawas (bbrp ruang dengan kamera dan bbrp ruang dg dummy kamera saja)
dll. Intinya: tanpa diawasi "polisi" kita sudah merasa (dan memang) diawasi oleh Tuhan (ihsan).

= =
Selasa, 28 Oktober 2008 | 06:39 WIB
http://www.kompas.com/read/xml/2008/10/28/06394156/Bekasi.Cetak.Rekor.Kantin.Kejujuran

BEKASI, SELASA
- Pemkot Bekasi akan memperoleh penghargaan dari Museum Rekor Indonesia (Muri) berkat keberhasilannya menggalang 617 sekolah negeri dan swata membuat kantin kejujuran. Itu merupakan rekor terbanyak di Indonesia.

Penyerahan penghargaan tersebut dilakukan bersamaan dengan peresmian kantin kejujuran oleh Jaksa Agung Hendarman Supandji di SMAN I Bekasi, Selasa (28/10) ini.

"Provinsi sekaliber DKI Jakarta saja saat ini baru memiliki 36 kantin kejujuran," kata Wali Kota Bekasi Mochtar Mohamad, kemarin.

.......

WCU

Kampusku (ITTelkom) mencanangkan menjadi world class university tahun 2017 (9 tahun lagi. Ini bukan waktu yang lama)

Apakah WCU itu?

world class pengajaran...
world class program studi
world class riset, world class tim riset, world class lab
world class .... etc etc

Penghargaan terhadap orang lain

aljazeera:
The Syrian foreign minister has described a deadly raid on a village near the border with Iraq, allegedly carried out by the US, as a planned act of "terrorist aggression".
http://english.aljazeera.net/news/middleeast/2008/10/2008102716234134944.html

Nyawa orang dari bangsa lain pada umumnya, dari negara berkembang lebih khususnya, orang Islam lebih khususnya lagi tidak dihargai oleh penguasa AS (dan juga banyak warga AS).

grafik liberalis


gb dari bbc.co.uk

perilaku berlalulintas

Tadi berangkat kantor naik mobil saya lewat jalan bebas hambatan (jalan tol), jalan cukup sepi saya berada di jalur paling kiri, namun tiba-tiba ada mobil yang melaju kencang menyalip dari bahu jalan. Jadi ingat hari Ahad lalu saya ke Bogor di jalan Jagorawi yang cukup ramai tapi sangat lancar ada mobil RI71 melaju di bahu jalan.

Monday, October 27, 2008

deteksi situs internet porno

Baik yang pro maupun kontra RUU Pornografi semua khawatir dengan banyaknya situs internet porno. Menurut menkominfo, ratusan ribu disensor namun bermunculan dan masih banyak yang lain yang belum terdeteksi.

Bagaimana peran data mining dalam hal ini?
Ini satu masalah riil yang harus ditangani.

Thursday, October 23, 2008

acara yg waktunya fleksibel

Kita sdh terbiasa dg acara yg waktunya fleksibel. Kapan mulai? Kapan selesai?

Wednesday, October 22, 2008

RUU Pornografi

Corat-coret kasar ttg RUU Pornografi

Debat RUU Pornografi TVOne Rabu, 22 Okt 2008 pk.19.30

Kontra:

  • UU yang bisa disalahbacakan, multitafsir harus dibatalkan.
  • Karya seni tradisional harus dilestarikan, meskipun mengandung seksualitas.
  • Apakah misalkan ‘serat centini’ harus dilarang?Bukan hanya melindungi seni tradisional, seni modern dan kontemporer tidak dilindungi
  • Melanggar wilayah privat, ibu bisa mengatur anak kami sendiri, para ibu harusnya tersinggung dan protes karena diatur-atur dalam mendidik anaknya.
  • RUU hanya berkait dengan masalah moral, sehingga dari awal sampai akhir harus ditolak.
  • Moral itu bukan diatur negara, tapi moral itu kesadaran dari pribadi masing2
  • Yang ditentang adalah semuanya, konstruksinya, bukan pasal per pasal.
  • Banyak orang menentang RUU ini (missal orang2 DIY, Papua, Bali, Sulut), oleh karena itu pasti ada masalah. Tidak mungkin banyak orang menentang kalau tidak ada masalah.
  • Penerapan RUU ini nanti mengancam kesatuan NKRI. Mengancam adat istiadat. Dengan KUHP sudah cukup. Yang diperlukan perbaikan KUHP. Aturan (KUHP) saja yang belum ditegakkan, yang harus dibenahi adalah penegak hukum agar yang sudah ada diterapkan benar2.
  • Bagaimana yang dimaksudkan dengan “membangkitkan hasrat seksualitas” itu kan multitafsir.
  • Mengapa tidak memikirkan kemiskinan saja, bikin UU butuh biaya besarBagaimana dengan wanita yang karena kondisi (misalkan iming2 konsumerisme, dipaksa) menjadi model porno. Disini penerbitnya malah tidak kena hukuman.Yang diperkulan adalah UU anti kekerasan terhadap anak (termasuk kekerasan seksual)

Bagaimana sikap kita terhadap isu/hal2 ini:

  • Berbikini di pantai boleh?
  • Jalan-jalan dengan pakaian bikini di depan umum (misal di kota Denpasar) boleh?
  • Adegan film yang boleh yang tidak boleh seperti apa? Film yang mengandung “seni pronografi”? Misal Basic Instinct (mungkin)
  • Adegan yang agak "buka-bukaan dikit" namun "mengandung usur seni tinggi"? [ :D] Seperti pada bbrp film Nia Dinata boleh?
  • Situs internet porno? Warnet, ISP, pembuatan situs
  • VCD porno?
  • Majalah? Tabloid? “Majalah dewasa”? distribusinya saja yang diatur?
  • Koteka? Kemben? Punggung kelihatan?
  • Serat centini? Lukisan telanjang pelukis? Karya pelukis dunia yang klasik?
  • Ciuman di tempat umum?
  • Pakai rok sangat mini di tempat umum?
  • Lokalisasi pelacur?


Apa yan diatur Islam:

  • Pakaian: pria, wanita. Seperti apa?
  • Akhlak, terutama berhubungan dengan hubungan pria-wanita seperti apa?

Kontra RUU : Nia Dinata, pengurus perhimpunan hindu, PDS, PDIP,
Pro RUU : Ade Armando, Peri Umar Farouk (orang hukum)

UU UTE (?)
Profil kontra…Profil pro…
Lihat karyanya, lihat penampilannya (cara berpakaian), lingkungan/komunitasnya, perjalanan hidupnya .. dll
Ttg Nia Dinata al lihat http://id.wikipedia.org/wiki/Nia_Dinata

pornografi internetmedia

RUU versi awal, salah satunya isi.. lengkap, ringkasanRUU versi kompromi.. isi lengkap, ringkasan
RUU Anti Pornografi dan Pornoksi à RUU Pornografi
Pro RUU versi awal, kontra versi kompromiPro RUU versi kompromi, kontra versi awalPro RUU versi awal dan kompromiKontra

Kliping Koran terkait RUU initermasuk pecegahan situs intenet porno (menkominfo)
Bikin situs / web page khusus unt perdebatan ini
Satgas pengawalan RUU anti pornografi dan pornoaksi
Korelasi antara sikap thd isu Ahmadiyah (“kebebasan beragama”), RUU Pornografi

Tuesday, October 21, 2008

Biaya penelitian?

Tidak jarang peneliti berkeluh kesah: bagaimana hendak meneliti kalau dana yang tersedia sedikit?
Untuk beberapa bidang (seperti misalkan untuk beberapa topik data mining), dana bukan hal yang urgen.
Yang penting: penelitian diniatkan sebagai ibadah,.... dan penelitian itu menyenangkan, hobi.

Air madu

Ada saran: banyak minum air putih. Ada pendapat: madu baik untuk kesehatan.
Cobalah banyak minum air putih yang sedikit dicampur madu. Supaya memudahkan, madu disimpan dalam botol kecap, sehingga tidak perlu buka tutup botol saat menuangkan madu ke dalam air putih. Saya sudah mencoba beberapa bulan ini, alhamdulillah segar dan insya Allah menyehatkan.

Mobilku tergores

Bila mobil kita tergores sedikit saja tidak sedikit dari kita sudah sibuk me"nak-nik" untuk memperbaiki.
Namun bila iman kita anjlog, banyak diantara kita tidak menyadari atau bahkan tidak peduli.

Terlalu sibuk untuk berlama-lama dengan Allah..

Orang yang shalat tergesa-gesa, artinya dia terlalu sibuk jika harus berlama-lama "bertemu" dengan Allah.

Boosting untuk Imbalance

Saat ini saya sedang mengikuti sidang TA Arie Yanuar ttg Boosting untuk Imbalance. Beberapa coretan:
• Apakah data buatan tsb, sdh mencerminkan kasus riil. Bagaimana sebuah data riil dimapkan to the synthetic data.
• Kritisi the synthetic data.
• How about the other factors, such as: the type of attribute. (eg. Categorical vs numeric).
• What are the difficulty faced by imbalance data? (what is imbalance problem mean)
• The evaluation measure: just only for minority data. It is better for majority data as well.
• The next research for data: include the cost.
• Make an writing about the generic handling for imbalance on boosting methods. And make conclusion about what kind f approach better for imbalance problem.
• Survey paper and tutorial slide: boosting for imbalance problem.  submit for conference.
• What new in the TA? Noise dataset.
• Does boosting approach suitable (from theoretical view) for imbalance problem?
• No sampling?
• How about the splitting for training and testing data? What is the training and the testing data.
• The type of data of training and testing is the same?
• The number of iteration: Arie choosed 10.
• How boosting methods handle imbalance problem? Boosting designed for imbalance are better than boosting not designed for imbalance?

Maaf

Tidak jarang saya mengalami kasus dimana orang yang sebenarnya bersalah, namun dia dengan tenangnya seperti tidak merasa bersalah, apalagi mengucapkan kata maaf. Kasusnya misalkan ada pertemuan kecil tiga empat orang. Satu orang terlambat, sehingga pertemuan terpaksa mulainya ditunda menunggu ybs. Namun saat datang dengan tenangnya dia duduk saja. Ini sekedar contoh, namun contoh seperti itu beberapakali saya alami. Pernyataan maaf tentunya diharapkan bukan sekedar basa-basi.

bayi orang utan vs bayi manusia

Sering kita melihat anak-anak berkeliaran, telantar di jalanan. Kemarin saya lihat seorang anak sekitar usia kelas 5 SD menjadi PRT.

Saya jadi ingat, pernah melihat acara TV ttg peangkaran orang utan: orang utan yg sdh terlanjur dipelihara orang dilatih agar bisa hidup mandiri untuk nanti dilepaskan kembali ke habitatnya.

Ceritanya ada orang saat jalan-jalan lihat ada bayi orang utan, dia sangat terkesan dan terbayang2, sehingga dia membuat usaha "rehabilitasi" seperti itu.

Saya sering lihat bayi manusia yang terlantar, namun sangat sedikit yang telah saya lakukan untuk berkontribusi dalam permasalahan itu :(

Friday, October 17, 2008

Klasifikasi: salah mengenali atau tidak mengenali

Saat ini saya sedang menguji sidang TA seorang mhs tentang pengenalan wajah. Klasifier yang digunakan adalah JST.

Dari sidang ini ada info dan ide menarik yg sebenarnya sudah lama tahu namun baru lebih ‘ngeh’ sekarang: JST dalam mengklasifikasikan saat melakukan tebakan yang salah: bisa salah mengenali dan tidak mengenali. Hal ini berbeda dengan misalkan klasifier pohon keputusan. Dalam klasifier pohon keputusan hanya bisa salah mengenali saja. Sehingga ini dapat dikatakan sebagai salah satu kelebihan ANN dibandingkan dengan pohon keputusan.

Thanks untuk COK.

Rule based mempunyai sifat seperti ANN tsb.

HNP (Herniasis Nucleus Pulposus/Hernia Nuclei Pulposi) / syaraf kejepit

Saya menderita HNP (Herniasis Nucleus Pulposus / Hernia Nuclei Pulposi), pernah di MRI dan sangat nyeri cukup dan terus menerrus kesmutan cukup lama sekitar 1 th, itu kira-kira 5 tahun lalu. Bolak-balik ke dokter, fisioterapi dan semacam tusuk jarum.

Alhamdulillah sekitar 3 tahun lalu ada seorang dokter yang menyarankan agar saya berenang. Saya tidak bisa berenang, bahkan agak takut air. Saya mencari pelatih dan belajar berenang. Alhamdulillah dengan berenang rutin (awalnya setiap hari sampai sekitar 2 bulanan), lalu setiap akhir pekan, sekitar 3-4 bulan sudah jauh lebih baik. Sekarang saya tidak begitu merasa sakit, sudah bisa beraktifitas normal. Tidak nyeri, tidak kesemutan. Di kolam renang saya juga berjumpa dengan bbrp orang (semuanya ibu2) yg mengatakan bahwa mereka juga tadinya sangat nyeri, sekarang sudah bisa beraktivitas normal.

toilet BAK berdiri

Lihat orang-orang buang air kecil (BAK) berdiri serasa aneh, apalagi ramai2 sambil ngobrol. Saya

pernak BAK di toilet dapat dihitung dengan jari sebelah tangan. Mengapa saya tidak suka melakukannya? Potensial najis mengenai pakaian, geleuh buka-buka an di tempat "terbuka".

jurnal riset Nuri: Pelabelan semantik sebuah kalimat tunggal bahasa Indonesia

Pelabelan semantik sebuah kalimat tunggal bahasa Indonesia
batasan: kalimat tunggal. Untuk kalimat majemuk dipecah menjadi subkalimat2 tunggal secara manual.

Salah satu pelabelan semantik menggunakan PropBank.
Apa itu PropBank dan bagainana cara pelabelan secara otomatik bisa dilihat di

Martha Palmer, Daniel Gildea, Paul Kingsbury, "The Proposition Bank: An Annotated Corpus of Semantic Roles", Computational Linguistics, Volume 31 , Issue 1 (March 2005)

Jika kita menggunakan PropBank misalkan kita harus memilih verb pada sebuah kalimat dengan verb (frame set) yang cocok tergantung dari sense nya . Namun memilih sense yang cocok itu caranya bagaimana? Bisa dengan memilih verb yang JUMLAH arg nya cocok, namun ini hal yang sulit, karena bagaimana melihat mana yang jumlah arg nya cocok (sama banyaknya) dengan yang tersedia (tersisa) pada kalimat?


terkait:
PropBank, TreeBank, Case Grammar

dari Wikipedia:
PropBank is a corpus that is annotated with verbal propositions and their arguments—a "proposition bank"

PropBank Index — A verb-by-verb index to the data in PropBank

Bag of concepts pada text mining

Pada text mining ataupun juga information retrieval, biasanya dokumen teks direpresentasikan dengan "bag of term", dimana urutan atau lokasi term tidak diperhitungkan. Pada representasi ini, bobot masing-masing term dihitung secara statistik, biasanya dengan prinsip TF IDF. Umunya "term" di sini adalah "word"/kata.

Salah satu upaya untuk memperbaiki efektifitas dari text mining (atau lebih sempitnya lagi: kategorisasi dan klasterisasi) dan information retrieval adalah dengan menggunakan "bag of concept"

Terkait dengan itu, kami di IT Telkom sedang melakukan penelitian bagaimana mengimpelentasikan untuk bahasa Indoensia dan memperbaiki teknik yang ada untuk kategorisasi dokumen.

Acuan utama kami: Shady Shehata, Fakhri Karray, Mohamed Kamel: A concept-based model for enhancing text categorization. KDD 2007: 629-637

Video saat tulisan itu dipresentasikan ada di VideoLecture.
Copy - biasanya saya jalankan menggunakan Real Player

Mahasiswa yang terlibat:
*Nuri: mengimplementasikan prototipe term semantic labeller untuk bahasa Indonesia.
*Widy: mengimplementasikan Conceptual Ontohological Graph (COG) untuk bahasa Indonesia dan mencoba membuat perbaikan dari teknik semula.
*Candra: mengimplementasikan Statistical Analyzer untuk bahasa Indonesia dan mencoba membuat perbaikan dari teknik semula.

Untuk Widy dan Candra, sementara menggunakan pelabelan semantik secara manual. Kira-kira diperlukan waktu 15 menit untuk melabeli satu dokumen.

Dokumen yang akan diproses utamanya adalah untuk artikel berita bahasa Indonesia.

Penelitan pd PT yg tdk punya prodi pasca sarjana : mata kuliah "Studi Terbimbing"

Di Indonesia cukup banyak perguruan tinggi yang tidak mempunyai program studi S2 apalagi S3, sedangkan penelitian yang intensif bisanya dilakukan oleh dosen/peneliti bersama dengan mhasiswa pasca sarjana. Untuk itu salah satu upaya agar penelitian bisa dilakukan dengan lebih intensif bersama dengan mahasiswa S1 adalah dengan mengadakan kuliah (pilihan) yang isinya sejalan dengan penelitian yang dilakukan pada tugas akhir.

Di departemen Informatika IT Telkom, kami menyelenggarakan matakuliah yang kami namakan "Studi Terbimbing", matakuliah pilihan 3 SKS. Dosen boleh menyelenggarakan MK tersebut sesuia dengan penelitian yang sedang dijalankan. Pada semester ini ada tujuh mahasiswa yang ikut studi terbimbing dengan saya, dan saya bagi menjadi empat kali pertemuan per pekan. Ada beberapa teman dosen yang juga menyelenggarakan matakuliah ini. Mahasiswanya rata-rata tiga atau empat orang. Alhamdulillah dengan adanya studi terbimbing cukup membantu saya dan mahasiwa untuk lebih mengintensifkan penelitian.

Friday, October 10, 2008

Cluster validasi: kasus BIRCH

Salah satu pekerjaan yang sulit dalam data mining adalah validasi cluster. Salah satu algoritma clustering yang populer adalah BIRCH. http://citeseer.ist.psu.edu/zhang96birch.html

Saya tidak ingin menulis tentang algoritma ini, namun tentang bagaimana penulis paper ttg BIRCH melakukan validasi cluster. Dalam paper itu digunakan apa yang mereka sebut radius dan diameter dari cluster. Dimana semakin kecil radius atau diameter, maka kualitas cluster akan semakin bagus.










Intinya adalah jarak antar semua pasangan instance dalam sebuah cluster.

Salah satu yang dilakukan BIRCH adalah menghilangkan noise/outlier.

Khutbah Jum'at

Barusan saya shalat Jum'at di masjid kantor saya (kampus IT Telkom), sayangnya seperti halnya banyak di masjid lain khotbah Jumat seringkali tidak terkait dengan konteks. Mislkan saat sedang sedang ramai isu tentang krisis ekonomi, namun di khutbah sama sekali tidak membahas hal itu. Misalkan bagaimana dalam pandangan Islam. Tidak direncanakan sehingga optimal, misalkan dilihat siapa jamaahnya. Mestinya tidak sama antara khotbah di masjid perkampungan dengan di kampus misalkan. Padahal khotbah Jum'at kalau dioptimalkan saya kira bisa menjadi media yang cukup efektif.

Salah satu mengapa khutbah Jum'at kuran optimal karena pengurus masjid (DKM) biasanya lebih kosentrasi memplot khotib misalkan selama setahun ke depan. Yang penting sudah booking khotib.

Mestinya ada tim-tim dalam kegiatan masjid, salah astunya tim Jum'atan yang diantara ada yang memikirkan secara sungguh-sunggun dan jangka panjang khotbah Jum'at.

Karena yang disampaikan dalam khotbah kebanyakan normatif, tidak menarik dll akhirnya tidak sedikit yang mendengarkan khutbah sambil terkantuk-kantuk. Apalagi biasanya di dalam masjid memang enak angin berhembus sepoi-sepoi... (sepoi-sepoi itu apa sih kok istilahnya kayaknya aneh) :D

Thursday, October 9, 2008

Agama dan baju lebaran anak

Salah satu hal yang saya ingat saat menjelang lebaran ini adalah sebuah pendapat yang mengatakan kurang lebih: bagi anak kita "agama adalah seperti baju lebaran". Jadi seandainya anda orang orag tua yang punya anak jangan paksa anak kita dalam memilihkan baju untuk lebaran. Setiap orang termasuk anak kecil punya selera masing-masing . Jangan kita memaksa anak agar dia harus memakai baju lebaran yang berwarna putih misalkan. Warna putih memang terkesan lebih bersih, namun warna lain mempunyai kelebihan juga. Jangan pula mengharuskan anak perempuan kita mengenakan rok panjang, karena celana panjang juga bisa dikenakan dengan enak dan sopan. Yang penting kita memandu saja anak kita dalam memilih baju lebarannya. Kita tuntun anak kita agar mengenakan pakaian serasi, rapi dll.

Begitupula dengan agama bagi anak kita. Tidak ada satu agama yang mempunyai memonopoli kebenaran, semua agama mengajarkan kebaikan. Semua agama menuju kebenaran. Anak boleh memilih agama mana yang akan dia anut. Atau bahkan kita mengenalkan agama-agama yang ada, nanti anak bisa memilih terutama kalau sudah agak dewasa. Jangan dikte anak kita karena dia juga mempunyai pendapat, pemikiran yang harus kita hargai. Dia adalah manusia yang utuh yang dianugerahi pikiran untuk digunakan. Sebagai guru atau pengelola sekolah kita mesti mengenalkan siswa bukan hanya pada satu agama saja. Kita kenalkan siswa muslim kita pada agama lain dari sudut pandang agama itu. Jangan hanya ada pelajaran agama Islam saja untuk anak yang orang tuanya muslim. Bisa juga pelajaran agama Islam itu dihapus saja, diganti dengan pelajaran yang memperkenalkan agama-agama yang ada.

Meski pendapat ini merupakan pendapat yang 'biasa-bisa saja, tidak perlu dibesar-besarkan, jangan diulang-ulang diperdebatkan' karena ya dicetuskannya saja 'sambil makan kacang saat nonton TV', demkian menurut yang mencetuskannya dan teman-temannya. Bagi saya pendapat seperti ini merupakan pendapat yang 'revolusioner' dalam konteks yang negatif dan sangat merusak. Dan memang ternyata inti pendapat semacam itu merupakan pendapat final yang ingin ditegakkan, bukan sekedar ide awal saja, bukan sebuah draft ide yang nantinya bisa berubah total. Meski tidak setiap pendapat dan tindak tanduk kelompok itu negatif, sebagaimana juga pendapat dan tindak tanduk kita, namun pendapat semacam itu dan pendapat-pendapat liar lain tidak sulit kita temui dalam komunitas yang menamakan diri Jaringan Islam Liberal. Pendapat-pendapat liar sebagaimana 'agama seperti baju lebaran' itu merupakan pemikiran yang sangat mereka perjuangkan. Kita akan ketemu lagi dan ketemu lagi dengan pendapat semacam itu dalam topik-topik lain. Issue-issue krusial dalam Islam merupakan bagaikan bahan eksperimen yang hasilnya mengejutkan dan dengan demikian enaknya dicetuskan.

Tentu tidak semua orang yang bersimpati dengan kelompok itu sependapat dengan pendapat 'agama seperti baju lebaran' tersebut, namun orang itu hanyalah minoritas.

Tidak sedikit orang yang energinya dipakai untuk memperdebatkan hal semacam itu. Saya pernah ikut dalam diskusi-diskusi maya atas hal-hal seperti itu. Namun kemudian saya -orang berprofesi di bidang teknologi- lebih baik menaham diri, kita jangan terlalu tergoda untuk menghabiskan tenaga kita untuk pendapat semacam itu. Meski demikian kita juga jangan berdiam diri sama sekali, kita harus sesekali menyampaikan pendapat kita kepada sebanyak mungkin orang secara efisien, kita sampaikan pendapat misalkan melalui milis dan blog. Kita lebih kosentrasikan jihad kita ke bidang kita masing-masing.

@Prawiromanan, Yk.

Kacaunya PSF DIKTI

Salah satu contoh mengapa kita tertinggal adalah lemahnya perencanaan. Ini salah satu contohnya: masuk kerja setelah libur lebaran ada info: beberapa teman harus mengikuti pelatihan selama dua bulan dalam rangka program Presidential Scholars Fund (PSF) yang diselenggaran Dikti, yang kacau itu. Ada yang bilang pelatihan sebagai program menghabiskan anggaran. Dikti memang payah. Padahal ini kan pertengahan semester, untuk itu harus dadakan dicarikan banyak dosen pengganti untuk mengajar. Kan bisa saja pas libur kuliah. Dan rencana2 saya sendiri juga jadi terganggu.

Mudik: trah syawalan

Salah satu kegiatan utama selama mudik adalah mengiktui apa yang disebut dengan "trah syawalan". Keluarga besar berkumpul. Bisa puluhan atau bahkan sampai dua tiga ratusan orang. Acara ini menurut saya sangat baik, namun sayangnya banyak yang tidak dikelola dengan baik.

Misalkan trah yang saya ikuti adalah trah bani Ashari di Purworejo. Bp. Ashari adalah kakek saya. Alm. mbah Ashari adalah ayah dari ayah saya (alm bpk Muhadjir) . Trah ini merupakan salah satu trah yang paling kecil, hanya dari dua generasi di atas saya. Trah yang lain pada umunya dari tiga, empat atau lebih generasi di atas. Bertempat di rumah salah satu paklik/om, acaranya mendengarkan tausiyah, salam2an kemudian diakhiri makan bersama.

Apa tujuan trah? mempererat silaturahmi, saling membantu (utramanya tidak pada saat pertemuan, misalkan ada keluarga yang kesulitan finansial dll, saling memaafkan)
Dengan trah

Beberapa kegiatan yang mungkin bisa lebih mengoptimalkan trah, misalkan:
- Ada yang memfoto secara keseluruhan: setiap orang/keluarga yang datang langsung difoto, demikian juga dengan saat acara.
- Setiap keluarga diminta biodata yang cukup lengkap (termasuk alamat, email, HP, hobi dll)
- Sesaat sebelum selesai acara trah, dibagikan CD yang berisi foto yang sudah ada keterangannya bahwa yang tercantum di foto itu siapa, dan biodata. Jadi selama acara berlangsung ada panitia yang terus bekerja untuk menata foro, memberi komentar, mengentri biodata.
- Kalau sudah ada informasinya bisa ditayangkan dengan projector/infocus. Atau bahkan setiap kepala keluarga memperkenalkan diri, karena banyak yang antar generasi tidak saling kenal, atau sebaya namun jarang ketemu karena berbeda kota.

Ada juga trah yang kegiatannya cukup menarik, misalkan untuk anak-anak kecil diadakan lomba2.

Perjalanan mudik

Alhamdulillah sudah kembali ke bandung setelah mudik ke Yogya dan Purworejo. Berangkat dari Bandung hari Ahad 29 September 08. Biasanya berangkat pk.06an pagi, lebaran ini berangkat lebih awal sekitar 05.00, berlima: saya, istri, anak sulung, adik ipar, pembantu. Anak ke dua dan keiga sudah ke Yk sepekan sebelumnya naik KA.

Alhamdulillah, perjalann lancar. Namun sampai di sekitar restoran Pringsewu saya srempetan dengan motor pemudik. Mereka bertiga suami istri dan seorang anak usia 4 th an. Kami berjalan pelan (sekitar 60 km/jam an) demikian juga mereka. Saya tidak sadar tahu-tahu buntut Avanza saya senggolan dengan motor mereka. Mereka jatuh. Syukurnya tidak ada kendaraan di belakang kami. Sang bapak (pak Sajiyo, karyawan pabik tekstil di Cimahi dan berasal dari Bantul) lecet-lecet. Anaknya alhamdulillah lebih ringan lecetnya. Hanya ibunya lebih parah, kakinya ada luka yang harus dijahit.

Kami berhenti sekitar tiga jam di balai kesehatan dan di bengkel. Motornya hanya sedikit saja yang rusak (rem tangan dan injakan kaki kanan). Ibu dan anak kami antar sampai ke rumahnya, Bantul. kebetulan kami mudik ke Yk selatan tidak jauh dari Bantul.

Salah satu hikmahnya adalah kami mencoba untuk lebih bersikap empati. Disamping itu kami jadi bertambah saudara/kenalan. Saya sangat terbantu dengan istri saya yang banyak mengurus istrinya pak Sajiyo, dan pembantu saya mbak Bin dari Wonosari yang membantu mengurus anak pak Sajiyo selama perjalanan ke Bantul

Thursday, October 2, 2008

serbuan pasukan salib

Sy sedang lihat film dokumenter di metro tv, al disebutkan 15 juli 1099 serbuan pasukan salib yg bengis. Pelajari sejarah perang salib