Istilah scatter plot tidak terasa asing bagi kita. Mungkin Anda telah mengetahuinya bahkan sejak di bangku SMA. Namun penggunaan scatter plot mungkin masih kurang saat kita berada di sekolah.
Dalam visualisasi data, kita perlu menggunakan fitur scatter plot ini. Scatter plot dapat membantu Anda atau audiens Anda dalam memahami data yang memiliki sebuah hubungan korelasi.
Pada artikel saya kali ini, kita akan membahas tentang visualisasi data menggunakan scatter plot. Berikut penjelasannya
APA ITU SCATTER PLOT?
Scatter plot atau diagram pencar adalah salah satu jenis visualisasi data. Scatter plot dapat menunjukkan hubungan antara variabel yang berbeda. Data ditampilkan dengan cara menempatkan berbagai titik data antara sumbu x (horizontal) dan sumbu y (vertikal).
Setiap titik data seperti terlihat “tersebar” di sekitar grafik, yang menjadikan nama untuk jenis visualisasi data ini.
Scatter plot juga biasa disebut grafik x-y. Tujuan dari penggunaan scatter plot salah satunya adalah untuk menentukan apakah ada pola atau korelasi antara dua variabel.
Pola atau korelasi antara dua variabel pada scatter plot memiliki fitur yang berbeda, yakni sebagai berikut:
- Linear atau non linear: korelasi linier membentuk garis lurus di titik datanya, sedangkan korelasi non linier mungkin memiliki kurva atau bentuk lain dalam titik data.
- Kuat atau lemah: korelasi yang kuat akan memiliki titik data yang berdekatan, sementara korelasi yang lemah akan memiliki titik data yang terpisah lebih jauh
- Positif atau negatif: korelasi positif akan mengarah ke atas (yakni, jika nilai x dan y keduanya meningkat), sedangkan korelasi negatif akan mengarah ke bawah (yakni, jika nilai x meningkat sementara nilai y menurun)
- Namun, jika Anda tidak melihat salah satu fitur ini ada di dalam grafik Anda, tidak perlu khawatir, itu menandakan tidak adanya korelasi antara data Anda
KAPAN MENGGUNAKAN SCATTER PLOT?
Setiap jenis grafik atau jenis visualisasi data memiliki aturannya tersendiri. Pemilihan grafik yang tepat akan menjadikan visualisasi data yang Anda presentasikan mampu menyuguhkan informasi yang tepat.
Jika Anda mencoba untuk melihat arti dalam dua variabel yang berbeda. Maka scatter plot dapat membantu Anda menentukan apakah ada hubungan potensial antara variabel x dan variabel y.
Sebagai contoh jika Anda memiliki bisnis es krim. Anda ingin mengetahui, apakah ada pola mengapa penjualan Anda rendah akhir-akhir ini. Maka Anda dapat membuat scatter plot untuk mengukur, misal hubungan antara penjualan, dengan suhu luar
Seperti yang terlihat pada grafik di atas, orang-orang cenderung membeli es krim ketika suhu luar ruangan meningkat, sedangkan jika suhu luar ruangan semakin dingin, penjualan akan semakin menurun
Menggunakan scatter plot jika ANDA memiliki dua variabel yang berpasangan dengan baik.
Jika Anda memiliki dua variabel yang berpasangan dengan baik, menggunakan scatter plot adalah cara yang tepat untuk melihat hubungan dan melihat apakah korelasinya positif atau negatif.
Sebagai contoh, berat lahir bayi dengan usia kehamilan (berapa lama bayi berada di dalam rahim). Masuk akal jika bay, yang bisa tumbuh di dalam perut ibunya lebih lama akan menjadikan bayi tersebut lebih besar, dan karenanya akan menjadi lebih berat, bukan?
Seperti yang kita dapat perkirakan, Jika semakin lama bayi berada dalam kandungan, maka semakin berat badannya saat lahir
KAPAN ANDA PERLU MENGHINDARI SCATTER PLOT?
Sama seperti ketika ada waktu tertentu menggunakan scatter plot, maka ada waktu ketika Anda harus menghindari penggunaanya dalam memvisualisasikan data. Berikut waktu Anda harus menghindarinya.
1- Hindari scatter plot, ketika data Anda sama sekali tidak terkait
Jika data Anda menunjukkan bahwa tidak ada korelasi, maka scatter plot tidak akan berguna untuk memvisualisasikan data Anda.
Misalnya, jika Anda mengumpulkan survei acak pada audiens Anda, tentang tinggi tubuh audiens, dengan jumlah hewan peliharaan yang mereka miliki di rumah. Itu sangat tidak masuk akal untuk dihubungkan dalam scatter plot.
Kedua variabel di atas jelas tidak memiliki hubungan apapun, dan meskipun masih menyenangkan untuk dibuat grafik, maka untuk solusinya, Anda bisa beralih ke diagram batang sebagai pilihan yang baik.
2- Hindari scatter plot, ketika Anda memiliki kumpulan data yang terlalu besar
Jika Anda memiliki begitu banyak data, saran dari visme adalah menghindarinya.
Ahli statistik Nathan Yau, menyimpulkan fenomena ini dengan cukup baik dalam grafik di atas.
sebagai contoh lain, lihat scatter plot di bawah ini,. Sangat pada sehingga pada dasarnya menjadi satu kumpalan besar dan sulit untuk memahami isi data dari diagram semacam ini.
Jika memang data Anda terlalu banyak pertimbangkan menggunakan grafik dalam bentuk Heat Map. Ini dapat menunjukkan di mana bagian paling banyak dari data Anda berada
Anda juga dapat memberi kode warna pada berbagai kumpulan data menggunakan titik data tembus cahaya untuk membuat efek seperti heat map dan banyak lagi.
Nah itu tadi pembahasan terkait visualisasi data dengan scatter plot . Nantikan tulisan saya berikutnya ya. feel free to share and give new insight for all.
Semoga Bermanfaat
AB
Reference
- https://visme.co/blog/scatter-plot/
- https://chartio.com/learn/charts/what-is-a-scatter-plot/