Home » Piala Dunia 2022: Menerka Sang Jawara dengan Statistika
Piala dunia 2022 menjadi perhelatan akbar yang banyak ditunggu-tunggu orang di seluruh dunia.

Piala Dunia Qatar 2022 saat ini sedang berlangsung, dan dijadwalkan selesai pada 18 Desember 2022. Ini adalah acara akbar yang ditunggu-tunggu banyak orang. Sebagai negara tuan rumah, Qatar tentu akan mengupayakan segala sesuatunya secara maksimal, tak hanya dari segi penyelenggaraan acaranya namun juga performa tim nasionalnya. Tapi ngomong-ngomong bagaimana sebuah tim dengan jumlah poin tertinggi menang? Dan bagaimana kaitan data historis dengan hasil yang akan datang dalam kejuaraan tahun ini? Dalam artikel ini, saya akan meneliti semua itu dengan statistika.

Langkah pertama dalam setiap penelitian, selain menentukan permasalahan, adalah menentukan data apa yang akan dikumpulkan dan dianalisis. Ada dua sumber data utama yang dapat digunakan untuk menerka jalannya pertandingan dalam hal ini: statistik tim dan statistik pemain individu. Saya akan membatasi fokus tulisan pada statistik tim untuk melihat bagaimana mereka dapat digunakan untuk menerka sang jawara Piala Dunia Qatar 2022.

Tim dengan peringkat pertahanan yang tinggi cenderung bermain dengan baik di pertahanan, sementara tim yang unggul dalam menyerang lebih mungkin untuk mencetak banyak gol. Dengan melihat statistik masing-masing tim, kita bisa mendapatkan gambaran tentang bagaimana mereka akan tampil di turnamen ini.

Adapun statistik yang akan saya gunakan adalah jumlah gol, kemenangan, seri, dan poin yang dicetak masing-masing tim yang berpartisipasi di ajang Piala Dunia tahun ini sejak turnamen ini pertama kali digelar di tahun 1930. Perhitungan poin akan mengikuti standar yang berlaku, dimana masing-masing kemenangan dihitung 2 poin dan masing-masing seri 1 poin. Sebagai contoh, jika selama ini sebuah tim tercatat memiliki 20 kemenangan dan 12 seri, poinnya adalah 52 (20 x 2 + 12).

Di bawah adalah tabel data masing-masing tim yang saya peroleh dari Wikipedia, dimana G adalah gol, M adalah kemenangan, S adalah seri, dan P adalah poin.

Tabel 1

Sekarang kita memiliki data yang dibutuhkan untuk memprediksi pemenang Piala Dunia Qatar mendatang, kita dapat menggunakan model statistika untuk menentukan faktor mana yang paling penting dalam memenangkan pertandingan. Ada sejumlah model yang dapat digunakan untuk memprediksi olahraga, tetapi saya akan menggunakan model regresi linier untuk tujuan ini.

Model ini didasarkan pada konsep bahwa tim dapat meningkatkan peluang mereka untuk menang dengan meningkatkan skor mereka di area permainan tertentu. Misalnya, jika sebuah tim memiliki jumlah gol yang tinggi yang dicetak oleh penyerang mereka dan jumlah tembakan ke gawang yang tinggi, maka mereka cenderung lebih berhasil daripada tim yang memiliki lebih sedikit statistik ini.

Dalam model ini, yang akan menjadi variabel prediktor adalah jumlah gol yang dicetak oleh tim selama Piala Dunia, dan variabel responsnya adalah jumlah poin yang dicetak selama Piala Dunia. Model regresi mengasumsikan bahwa ada hubungan langsung antara variabel prediktor dan respons. Dengan kata lain, semakin banyak gol yang dicetak oleh sebuah tim, semakin banyak poin yang mungkin mereka cetak di pertandingan berikutnya.

Kita sudah memperoleh data dan memasukkannya ke dalam tabel seperti di atas. Bagian selanjutnya akan melibatkan pembuatan plot pencar (scatter plot) dan memeriksa hubungan linier antara kedua variabel. Scatter plot adalah grafik yang menunjukkan hubungan antara dua variabel pada bidang dua dimensi. Dalam hal ini, variabel respon (raihan poin) akan diplot pada sumbu vertikal atau sumbu y, dan variabel prediktor (jumlah gol yang dicetak) akan diplot pada sumbu horizontal atau sumbu x.

Idealnya, titik-titik data yang dihasilkan harus membentuk pola yang beraturan atau saling berdekatan untuk menunjukkan bahwa ada hubungan langsung antara kedua variabel ini. Jika tidak, berarti ada hal lain yang mempengaruhi hubungan ini, seperti variabel lain yang tidak diperhitungkan dalam model ini. Grafik di bawah ini menunjukkan memang ada hubungan linier yang kuat antara kedua variabel, yang mendukung hipotesis saya bahwa terdapat hubungan langsung antara jumlah gol yang dicetak dan jumlah poin yang diraih.

Dengan demikian, kita bisa mengambil langkah selanjutnya yaitu menganalisis data dengan menggunakan analisis regresi linier. Variabel prediktor dan respons, atau biasa disebut juga variabel independen dan dependen, telah ditentukan. Selanjutnya, saya akan menggunakan persamaan berikut: Y = a + bX.

Dalam persamaan ini, Y adalah jumlah poin yang akan dicetak tim di pertandingan mendatang, X adalah jumlah poin yang telah dicetak tim di masa lalu, b adalah kemiringan garis yang menunjukkan berapa banyak skor akan berubah untuk setiap peningkatan satu poin dalam jumlah poin yang telah dicetak tim di masa lalu, dan a adalah titik potong garis yang menunjukkan di mana skor poin akan dimulai untuk setiap tim.

Untuk mendapatkan pemahaman yang lebih baik tentang cara kerja persamaan ini, kita dapat menggunakan metode kuadrat terkecil (least squares method) untuk menemukan kecocokan dari data yang ada, di mana persamaan normal untuk a adalah Y = na + b∑X, dan persamaan normal untuk b adalah XY = a∑X + b∑X2. Dengan menyelesaikan dua persamaan normal ini kita bisa mendapatkan garis yang paling sesuai dengan rumus Y = a + bX.

Selanjutnya, kedua persamaan tadi akan saya implementasikan pada data yang telah kita bahas sebelumnya. Namun sebelum itu, kita harus olah kembali data pada tabel di atas agar memenuhi variabel kedua persamaan tersebut, seperti terlihat di bawah.

Tabel 2

Sampai di sini kita telah mendapatkan nilai X dan Y. Berikutnya, kita hanya perlu mencari nilai a dan b untuk mendukung persamaan Y = a + bX. Maka, kita perlu mensubstitusi terlebih dahulu kedua persamaan normal tadi dengan data tabel ini. Dengan kata lain, Y = na + b∑X dapat kita ubah menjadi 1236 = 32a + 1705b (persamaan 1) dan XY = a∑X + b∑X2 menjadi 140532 = 1705a + 196207b (persamaan 2).

Tak perlu bertele-tele, kita bisa langsung melakukan eliminasi kedua persamaan tersebut sehingga didapat nilai b = 0,71. Kemudian kita hanya perlu mensubstitusi nilai b tersebut ke persamaan 1 atau 2 untuk mendapatkan nilai a, yang keduanya akan sama-sama menghasilkan nilai a = 0,76. Dengan begitu, kita tahu sekarang Y = a + bX adalah sama dengan Y = 0,76 + 0,71X.

Untuk memudahkan, persamaan ini dapat kita visualisasikan dalam bentuk grafik sebagai berikut:

Grafik ini menjelaskan kepada kita bahwa y (poin yang diraih sebuah tim) dapat diprediksi dengan 0,76 + 0,71 kali poin yang diraihnya di masa lalu.

Lantas, siapa yang akan meraih poin tertinggi berdasarkan semua konsep statistika di atas? Sekali lagi, kita perlu mengaplikasikan ini pada data yang kita gunakan sebelumnya. Dengan menambahkan kolom baru, tabel baru akan terlihat demikian:

Tabel 3

Sekarang Anda sudah tahu tim mana yang diprediksi dengan skor tertinggi, kan? Data-data di kolom paling kanan adalah petunjuknya. Jika rasanya masih sulit terbaca, mari kita sortir kolom tersebut berdasarkan angka tertinggi ke terendah. Silakan lihat tabel di bawah.

Tabel 4

Ya, Brazil muncul sebagai tim yang, menurut konsep statistika, akan meraih poin tertinggi, diikuti Jerman dan Argentina pada urutan kedua dan ketiga. Dengan konsep regresi linier yang saya sebutkan sebelumnya, mereka yang mampu meraih poin tertinggi adalah pemenangnya, dan itulah Brazil.

Mari kita coba skenario lain untuk yang terakhir. Sekarang saya akan menggunakan data dari lima pertandingan terakhir dari seluruh tim yang berkompetisi agar hasilnya lebih mendekati dengan situasi dan kondisi saat ini. Data saya peroleh dari footystats, sebagai berikut:

Tabel 5

Dengan cara yang sama, saya akan mencari nilai pada persamaan Y = a + bX. Maka, setelah saya olah kembali, tabel 5 akan berubah menjadi demikian:

Tabel 6

Dengan demikian, jika dilakukan dengan benar seperti contoh sebelumnya, kita akan mendapatkan persamaan Y = a + bX yang sama dengan Y = 3,13 + 0,39X. Kita pun bisa kembali mengaplikasikannya pada data yang ada, seperti terlampir di bawah.

Tabel 7

Sekali lagi, Brazil yang muncul sebagai jawaranya. Bedanya, di skenario kedua ini urutan kedua ditempati oleh Argentina dan urutan ketiga oleh Serbia. Ini menarik mengingat Serbia tidak termasuk tim yang diunggulkan, namun memiliki performa yang baik dalam lima pertandingan terakhir sehingga bukan tidak mungkin performa mereka akan berlanjut pada Piala Dunia tahun ini.

Jadi, jelas sekarang siapa jawara Piala Dunia 2022 menurut statistika. Tentu ini tidak bisa dan tidak akan pernah bisa menjadi jaminan bahwa apa yang terjadi di lapangan akan 100 persen sama dengan yang dijelaskan di sini.

Model ini memiliki banyak keterbatasan, salah satunya tidak menggunakan variabel lain yang mungkin juga berpengaruh, seperti kondisi aktual para pemain inti masing-masing tim dan cara mereka menyesuaikan dengan kondisi lingkungan setempat, serta masih banyak lagi keterbatasan lain yang berada di luar kendali manusia.

Oleh karenanya, tolong jangan jadikan tulisan ini sebagai acuan bahan taruhan Anda, ya! Dah lah, jangan judi-judian! Haram! Jika Anda nekat tetap melakukannya, segala risiko yang timbul menjadi tanggungan Anda sendiri, sebagaimana keuntungannya yang pasti akan Anda nikmati sendiri.

Tentang Penulis

______________________________________________________________
Apa pendapat Anda terkait artikel di atas?

(Klik simbol tiga garis di bawah jika Anda menggunakan gawai. Apapun pendapat Anda akan sangat saya hargai.)

Loading spinner

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.