"90% pengguna puas!" — angka yang tampak meyakinkan, tapi bisa berarti 9 dari 10 orang saja (n=20). Delapan belas orang bukan sampel valid untuk mengklaim apa pun tentang populasi besar. Angka, sendirian, tidak berarti apa-apa. Yang membuatnya berarti adalah konteks — dan konteks itulah yang paling sering disembunyikan.
Rata-Rata, Median, Modus
Gaji rata-rata kantor Rp 50 juta — kaya? Belum tentu. Kalau ada 1 CEO Rp 500 juta dan 9 staf Rp 5 juta, rata-ratanya Rp 54,5 juta, tapi pengalaman 9 dari 10 orang adalah Rp 5 juta. Rata-rata (mean) sensitif pada nilai ekstrem; median (nilai tengah) lebih jujur. Saat dengar "pendapatan per kapita naik X%", tanyakan: rata-rata atau median?
Survivorship Bias
"10 orang sukses yang drop out kuliah" — Steve Jobs, Bill Gates. Yang tidak ditampilkan: jutaan yang drop out dan tidak sukses. Mereka hilang dari narasi. Setiap baca "rahasia sukses dari X", tanyakan: berapa banyak yang melakukan hal sama tapi gagal?
Grafik yang Berbohong tanpa Berbohong
- Sumbu Y dipotong — naik 100→102 terlihat melonjak kalau sumbu mulai dari 99.
- Cherry-picking timeframe — "naik 200% dalam 2 tahun", tapi dua tahun yang mana? Mungkin dari titik terendah.
- Skala log tanpa label — selisih besar terlihat kecil.
Angka tidak berbohong. Tapi orang yang memilih angka mana yang ditunjukkan — bisa.
Korelasi vs Kausalitas & P-Hacking
Studi observasional hanya bisa menunjukkan korelasi; untuk kausalitas butuh eksperimen terkontrol (RCT). P-hacking: kalau mencoba 20 analisis di data yang sama, satu akan "signifikan" hanya karena kebetulan. Itu sebabnya satu studi tidak cukup — butuh replikasi.
Tujuh Pertanyaan untuk Setiap Statistik
- Berapa ukuran sampelnya (n=?)
- Rata-rata atau median?
- Periode datanya kapan?
- Dibandingkan dengan apa? (baseline-nya apa)
- Korelasi atau kausalitas?
- Sudah direplikasi?
- Siapa yang mendanai studinya?