Bukan sembarang mesin

MEMBACA | Pembaca pasti punya ketertarikan pada beragam isu, mulai dari masalah negara sampai isu kehidupan sehari-hari.
MEMBACA | Pembaca pasti punya ketertarikan pada beragam isu, mulai dari masalah negara sampai isu kehidupan sehari-hari.
© Pixabay

17 April 2015, sebuah memo dipublikasikan para editor Washington Post kepada staf redaksi mereka lewat blog resmi. Isinya, kebanggaan karena telah memecahkan rekor dalam hal tingkat keterbacaan di situs Washingtonpost.com, edisi digital dari koran yang telah berumur lebih dari 100 tahun.

Tiga orang editor mereka, Martin Baron, Executive Editor; Kevin Merida, Managing Editor; dan Emilio Garcia-Ruiz, Managing Editor; yang menulis memo tersebut.

"Kami telah memecahkan banyak rekor keterbacaan lewat situs, tapi bulan lalu (Maret) kami memecahkan rekor yang spesial. Kami berhasil menjangkau 52,2 juta pengunjung (unique visitors), melewati angka 50 juta yang kami torehkan sebelumnya... Ini sama dengan peningkatan 65 persen dibandingkan tahun sebelumnya..." demikian penggalan kutipan pengumuman itu.

Pengumuman koran yang didirikan Stilson Hutchins pada 1877 itu, rupanya mengundang ketertarikan banyak pihak. Salah satunya adalah KnightLab, sebuah tim dari Northwestern University yang berkampus di Amerika Serikat dan Qatar. Tim yang terdiri dari para teknolog dan jurnalis itu mengembangkan inovasi teknologi untuk media, khususnya di ranah daring.

KnigtLab akhirnya mendapat jawaban, mengapa Wapo--demikian sebutan koran asal kota Washington, Amerika Serikat itu--berhasil meningkatkan keterbacaan di situsnya.

Jawabannya, Wapo tak mengubah formatnya menjadi ala BuzzFeed yang sedang naik daun dan jadi fenomena di dunia permediaan daring. Sebabnya adalah teknologi untuk membantu pembaca menemukan bacaan yang relevan. Teknologi itu disebut Clavis, yang dikembangkan setahun sebelumnya. Pengembangnya dua punggawa Wapo, pengembang perangkat lunak Gary Fenstamaker, dan analis produk digital, Angela Wong.

Sederhananya, Clavis adalah teknologi untuk mengidentifikasi isi sebuah artikel, mengkategorikannya dalam topik, dan membuatkan kata kunci untuk masing-masing. Proses yang sama lalu dilakukan pada pembaca. Pengunjung diidentifikasi ketertarikannya berdasarkan artikel apa saja yang telah dibaca. Dikategorikan dalam kelompok ketertarikan.

Lalu, ini bagian yang menarik. Clavis menggunakan kata kunci dari artikel, dan dicocokkan dengan ketertarikan si pembaca. Alhasil, mereka punya rekomendasi artikel apa saja yang kemungkinan sesuai dengan ketertarikan si pembaca.

Cara merekomendasikan artikel semacam ini memang bukan cara baru. Yang baru adalah, bagaimana Clavis si mesin pintar, dengan algoritma machine learning, mempelajari isi tulisan. Bukan sekadar mengumpulkan kata terbanyak dan merankingnya.

Mesin, membaca tulisan, dan mampu memahami konteksnya.

Baiklah. Singkatnya begini. Beritagar.id juga memberdayakan mesin serupa, meski tak persis sama. Tentu saja belum menghasilkan 50 juta pengunjung seperti yang dicapai Wapo. Dengan senang hati akan saya buatkan pengumuman itu jika momen tersebut tiba.

Tulisan ini, ingin bercerita tentang bagaimana mesin itu dikembangkan di Beritagar.id. Namanya Semar, dikembangkan oleh tim Rekanalar.

Kebutuhannya jelas, bagaimana meningkatkan konsumsi pembaca saat berkunjung ke situs kami. Solusinya, merekomendasikan artikel yang relevan dengan pembaca. Caranya, mirip cara kerja Clavis.

Proyek ambisius ini dikembangkan sejak November 2013, memanfaatkan teknologi berbasis Machine Learning (ML) dan Natural Language Processing (NLP). Pertama kali diujicobakan pada situs kurasi berita, Beritagar.com, cikal bakal Beritagar.id sebelum bergabung dengan Lintas.me.

Sejak awal, saat berdiskusi dengan ilmuwan komputer dari Rekanalar, Jim Geovedi, kami sepakat untuk menghindari echo chamber. Jangan sampai pembaca terjebak dengan isu yang itu-itu saja. Kami percaya pembaca tak hanya tertarik dengan satu isu.

Informasi, kini semakin penting untuk membantu khalayak menentukan sikap terhadap sebuah isu. Pembaca harus "diajari" memahami pendapat pihak lain yang relevan, meski berseberangan dan tak disukainya.

Demikian pula soal keragaman isu. Meski ada sekelompok pembaca lebih tertarik isu otomotif, tak sedikit di antara mereka yang juga menyimak tragedi kemanusiaan, misalnya. Selain itu, pembaca punya hobi, mendengarkan musik, atau menonton film tertentu. Mereka juga punya kehidupan sosial dengan istri/suami, tetangga, pacar, teman sekantor, atau teman sekolah.

Karena itu, akan ada isu yang seharusnya semua khalayak tahu, ada pula isu yang akan disukai kalangan tertentu. Mungkin pada saat tertentu ia berkunjung ke Beritagar.id karena hobinya, tapi ia juga harus disodori tentang apa yang sedang terjadi di negeri ini, agar punya kesempatan bersuara.

Dinamika ketertarikan pada isu tersebut, (seharusnya) bisa dieksploitasi. Maka menerka apa yang menjadi ketertarikan pembaca tanpa melanggar privasi mereka, menjadi tantangan. Personalisasi, berdasarkan kelompok-kelompok ketertarikan yang sama.

Pun soal konten komersial, baik yang berbentuk iklan maupun konten pemasaran (marketing content). Mesin rekomendasi harus cukup pintar untuk memperkirakan konten yang relevan agar pembaca betah, bahkan saat disodori konten komersial tanpa merasa terganggu.

Semar di Beritagar.id jelas bukan Clavis di Washington Post. Mesin yang bisa memahami isi teks berbahasa Indonesia, adalah perbedaan jelas pada keduanya. Selain, beberapa pertimbangan seperti saya tulis di atas.

Lebih dari soal ketertarikan pada isu, personalisasi juga menyoal perilaku pembaca. Beragam peranti yang kini digunakan, dari desktop ke ponsel atau sabak digital, digunakan pada momen berbeda. Perlu mempertimbangkan bagaimana mereka mengonsumsi informasi selama masa aktif dalam 24 jam.

Apa yang pantas direkomendasikan pada jam kerja, atau saat terjebak macet ketika berangkat dan pulang?

Jadi, masih banyak ruang bagi Semar untuk berkembang, tanpa harus mengintil keberhasilan Wapo dengan Clavis. Karakter pembaca media daring di Indonesia yang unik, masih jadi tantangan untuk dicarikan solusinya. Untuk itu, butuh kolaborasi tak henti di antara segenap tim dalam organisasi.

Akhir kata, meski menggunakan contoh dari Washington Post, bukan berarti teknologi serupa hanya ada di sana. Coba tengok Outbrain, atau Taboola. Keduanya bukan dari lembaga media, meski diperuntukkan para pengelola situs web.

BACA JUGA