Cara Membaca Data & Statistik

"90% pengguna puas!" — angka yang tampak meyakinkan, tapi bisa berarti 9 dari 10 orang saja (n=20). Delapan belas orang bukan sampel valid untuk mengklaim apa pun tentang populasi besar. Angka, sendirian, tidak berarti apa-apa. Yang membuatnya berarti adalah konteks — dan konteks itulah yang paling sering disembunyikan.

Rata-Rata, Median, Modus

Gaji rata-rata kantor Rp 50 juta — kaya? Belum tentu. Kalau ada 1 CEO Rp 500 juta dan 9 staf Rp 5 juta, rata-ratanya Rp 54,5 juta, tapi pengalaman 9 dari 10 orang adalah Rp 5 juta. Rata-rata (mean) sensitif pada nilai ekstrem; median (nilai tengah) lebih jujur. Saat dengar "pendapatan per kapita naik X%", tanyakan: rata-rata atau median?

Survivorship Bias

"10 orang sukses yang drop out kuliah" — Steve Jobs, Bill Gates. Yang tidak ditampilkan: jutaan yang drop out dan tidak sukses. Mereka hilang dari narasi. Setiap baca "rahasia sukses dari X", tanyakan: berapa banyak yang melakukan hal sama tapi gagal?

Grafik yang Berbohong tanpa Berbohong

Sumbu Y dipotong — naik 100→102 terlihat melonjak kalau sumbu mulai dari 99.
Cherry-picking timeframe — "naik 200% dalam 2 tahun", tapi dua tahun yang mana? Mungkin dari titik terendah.
Skala log tanpa label — selisih besar terlihat kecil.

Angka tidak berbohong. Tapi orang yang memilih angka mana yang ditunjukkan — bisa.

Korelasi vs Kausalitas & P-Hacking

Studi observasional hanya bisa menunjukkan korelasi; untuk kausalitas butuh eksperimen terkontrol (RCT). P-hacking: kalau mencoba 20 analisis di data yang sama, satu akan "signifikan" hanya karena kebetulan. Itu sebabnya satu studi tidak cukup — butuh replikasi.

Tujuh Pertanyaan untuk Setiap Statistik

Berapa ukuran sampelnya (n=?)

Rata-rata atau median?

Periode datanya kapan?

Dibandingkan dengan apa? (baseline-nya apa)

Korelasi atau kausalitas?

Sudah direplikasi?

Siapa yang mendanai studinya?