Laporan Wartawan Nextren, Zihan Fajrin.
Nextren.com -Tokopedia hadirkan START Summit Extension kembali di bulan ini (17/12) dengan tema High Severity! Behind Tokopedia's Reliable Incident Management.
Tokopedia ingin pegiat teknologi pintar tangani sistem untuk melayani pelanggan.
Platform ini memiliki budaya melayani pelanggan, yang dimana sebagai perusahaan menanamkan nilai customer-centric, memastikan pengalaman pengguna merupakan prioritas utama.
Timothy Agustian, Software Engineer Lead Purchase Platform, mengatakan sebagaiperusahaan yang dipercaya oleh jutaan penjual dan pembeli, seluruh tim teknologi Tokopedia memiliki tanggung jawab yang besar untuk mengelola setiap insiden yang terjadi.
Baca Juga: Inilah 5 Kategori Produk Terlaris di Tokopedia di Akhir Tahun 2020
Menyelesaikan suatu insiden tanpa ada pihak yang dirugikan merupakan prioritas utama, sehingga menanamkan budaya kewaspadaan yang tinggi dan keandalan dalam mengelola serta mengidentifikasi masalah teknis sangatlah penting.
Tokopedia memiliki beberapa tahapan dalam mengelola insiden.
Tahapan yang pertama adalah Preparation & Monitoring, dimana tahap ini merupakan fase pertama untuk mempersiapkan sistem ketika insiden belum terjadi.
"Fase ini adalah fase awal yang akan mempengaruhi fase-fase berikutnya," ujar Timothy.
Lanjut ke tahap kedua dalam proses mengelola insiden Tokopedia, yakni Alerting, dimana ini merupakan fase pertama yang dilakukan ketika terjadi insiden.
Saat alarm sudah berbunyi, maka ini merupakan tanda bahwa terdapat suatu insiden.
Insiden yang baik adalah jika alertingnya juga baik, sehingga kita dapat langsung mengetahui saat insiden terjadi dan tidak mengetahuinya dari pihak eksternal atau pengguna, melainkan dapat mengetahuinya terlebih dulu.
Tahapan ketiga setelah Alerting adalah Triage & Notify yang dijelaskan oleh Danish Jatmiko, Engineering Manager Order & Campaign Tokopedia.
Baca Juga: Deretan Tokoh Perempuan di Balik Teknologi Platform Tokopedia Diperkenalkan
Ia menjelaskan seluruh leader di Tokopedia selalu menekankan agar setiap tim selalu berharap yang terbaik.
Namun, apabila hal buruk terjadi, tim diharapkan untuk dapat sigap dengan SOP yang sudah dikemas dengan baik.
Tahapan ini menjelaskan tentang apa yang perlu dilakukan saat insiden datang.
Jika sebelumnya Alerting & Monitoring sudah disiapkan dengan baik, maka kita akan memiliki sistem yang bagus.
Melalui Alerting & Monitoring, kita dapat mengetahui keadaan atau kesehatan sistem kita.
Lalu, apa yang harus dilakukan jika ternyata terjadi suatu insiden terhadap sistem?
Danish menjelaskan bahwa hal pertama yang perlu dilakukan adalah menjaga agar kita tidak panik.
"Kita perlu menenangkan pikiran agar dapat mengambil keputusan dan membaca kondisi dengan maksimal," ujar Danish.
Baca Juga: Inilah Masalah dan Solusi Bagi Perempuan yang Ingin Masuk ke Industri Digital
Selanjutnya, kalian juga perlu mengetahui kondisi sistem seperti apa agar dapat mengenali dan mengidentifikasi musuh.
Dengan Alerting & Monitoring, kalian dapat langsung mengetahui penyebabnya serta cara mengatasi hal tersebut.
Tahapan terakhir pada manajemen insiden adalah Post-Mortem Investigation and Resolution.
Pada tahap ini, kita perlu mencari tahu lebih dalam dan mendetail mengenai penyebab dari insiden yang terjadi.
Tokopedia mengingatkan, setiap karyawan atau anggota dari suatu organisasi perlu memahami apa yang dilakukan dan berusaha untuk melakukan yang terbaik.
Tujuannya agar organisasi tersebut menjadi satu tempat yang mendukung perkembangan setiap tim yang ada.
(*)