Persoalan Penarikan Informasi (1)

– Kegagalan Deskripsi

Halo Mitra Excellent!

Berikut seri kedua dari pembahasan kita tentang Filosofi Bahasa dan Penarikan Informasi. Kali ini kita akan mengulas persoalan penarikan informasi yang pertama, seputar kegagalan deskripsi.

Kegagalan suatu deskripsi dapat terjadi dalam berbagai cara. Kegagalan yang paling jelas adalah ketika bagian dari informasi dideskripsikan secara keliru; contohnya, sebuah buku pelajaran (textbook) tentang “economics” telah dideskripsikan menjadi “anthropology”, atau sebuah buku yang oleh Mark Twain dinyatakan telah ditulis oleh Henry James. Terdapat pula kegagalan yang lebih halus dari deskripsi, yaitu ketika suatu deskripsi umumnya benar akan tetapi di luar komprehensi/pemahaman dari penyelidik yang mungkin telah melihatnya.

Sebuah contoh tentang hal ini adalah satu buku yang mengulas tentang “plate tectonics” di saat penyelidik pada umumnya tertarik dengan teori “continental drift”. Mereka mungkin tidak menyadari bahwa “plate tectonics” adalah deskripsi yang lebih formal dari penunjukan subjek yang sama. Pada situasi lainnya, pandangan yang bertentangan muncul tentang sebuah literatur tertentu, bagaimana seharusnya digambarkan; sebagai contoh, beberapa peneliti mungkin mempertimbangkan “cold fusion” sebagai riset ilmiah dalam ranah yang valid yang memerlukan kategorinya sendiri, sedangkan orang lain melihat kinerja pada “cold fusion” sebagai suatu yang lebih layak jika digolongkan di bawah rubrik “crank theories” atau “pseudo-science”.

Ketika kita melihat hanya pada kebenaran yang beralasan atau deskripsi yang berguna sehingga dapat mendeskripsikan sebuah pokok dari informasi, seperangkat deskripsi yang beralasan ini mungkin jumlahnya begitu besar. Hal ini telah ditunjukkan secara empiris (Swanson, 1996), dan diargumentasikan secara teoretis (Blair, 1990), bahwa sejumlah deskripsi yang berbeda yang dapat mendeskripsikan konten intelekutal bahkan dari dokumen yang relatif pendek mungkin saja tidak memiliki batasan-batasan sekalipun tinggi.

Kesimpulan ini menimbulkan gagasan dan pertanyaan tentang “exhaustive indexing” – sebuah tugas untuk meng-index seluruh deskripsi yang dapat mendeskripsikan konten intelektual dari suatu pokok informasi.

Beberapa berargumentasi bahwa sistem penarikan informasi seharusnya menggunakan semua index yang memungkinkan untuk mendeskrisikan konten intelektual dari sebuah dokumen – sebuah strategi yang disebut “unlimited aliasing” (Furnas, Landauer, Gome, & Dumais, 1987).

Strategi sedemikian mengabaikan dua hal:

Pertama, mungkin tidak ada batas atas (upper bound) pada jumlah kata dan frasa yang dapat mendeskripsikan konten intelektual bahkan dari suatu pokok informasi kecil.

Kedua, beberapa dari banyak index istilah yang memungkinkan akan selalu lebih berguna untuk penarikan informasi dari yang lainnya, jadi tugas bagi setiap index istilah yang beralasan pada sebuah dokumen mungkin bukan strategi index yang terbaik-beberapa index istilah benar-benar lebih baik daripada yang lainnya, sebagaimana Brooks (1993) telah tunjukkan.

Jumlah yang tinggi dari deskripsi yang beralasan sama-sama ada baik dan buruknya. Baik dalam pengertian bahwa dapat sampai pada satu atau lebih index istilah yang beralasan. Namun buruk dalam pengertian bahwa dikarenakan begitu banyak deskripsi yang beralasan dalam satu dokumen, seorang peneliti mungkin mendapati masa yang sulit untuk mengantisipasi seorang yang seharusnya ditugasi tentang dokumen tertentu, dan lebih jauh, dokumen yang memiliki konten intelektual yang sama mungkin dideskripsikan dalam beberapa cara yang berbeda (sebagai contoh, satu dideskripsikan sebagai “continental drift” sedangkan lainnya pada topik yang sama dideskripsikan sebagai “tectonic plates”.

Tulisan seputar Filosofi Bahasa dan Penarikan Informasi ini bersambung di publikasi artikel berikutnya.

Salam Excellent!