Daudzi mīti un maldinoši viedokļi rodas no aplamas datu analīzes un tās interpretācijas. Ne vienmēr tā ir ļaunprātīga krāpšana. Šoreiz apskatīšu vienu pētījumu no daudziem, kādi rada skaļus virsrakstus, bet patiesībā nekāda nopietna analīze tur nav veikta.
2004. gadā žurnāls Nature publicēja rakstu (Tatum et al., 2004), kurā tika analizēti sportistu 100m skrējiena rezultātu attīstība. Pētījumā tika ņemti Olimpisko spēļu 100m skrējiena uzvarētāja rezultāti(vīrieši un sievietes atsevišķi). Šie rezultāti tika salīdzināti atkarībā no gada, kurā tas uzstādīts. Autori ar lineārās regresijas palīdzību prognozēja turpmāko 100m rezultātu attīstību. Kā redzams autoru izveidotajā attēlā, tad sieviešu rezultātu attīstība ir straujāka kā vīriešiem. Autori prognozēja, ka sieviešu rezultāti pārspēs vīriešu rezultātus 2156.gada Olimpiskajās spēlēs, kurās sieviešu uzvarētāja 100m noskries 8.079s, bet vīriešu uzvarētājs 8.098s.
Nevēlos analizēt dzimumu bioloģisko atšķirību jautājumu un to vai sievietes tiešām kādreiz pārspēs vīriešus sportā, bet vēlos paanalizēt, kas man liekas kļūdains šajā rakstā.
Nepilnīgi dati
Izlasot rakstu, man netapa skaidrs, kāpēc autori nav iekļāvuši 1896.gada Olimpisko spēļu rezultātus, bet tie nav iekļauti. Tos iekļaujot, viņu analīzes rezultātiem vajadzētu mainīties. Ar šiem papildus datiem, vīriešu rezultātu attīstība paaugstinās kā rezultātā prognozētajam gadam, kad sievietes skries ātrāk par vīriešiem, vajadzētu būt 2252.gada Olimpiskajām spēlēm, kurā vīriešu uzvarētājs 100m skries 6.442 sekundēs, bet sievietes 6.424 sekundēs.
Diskvalifikācija
2007. gadā Marion Jones atzinās aizliegto vielu lietošanā pirms Sidnejas Olimpiskajām spēlēm, kā rezultātā viņas rezultāts tika anulēts (USADA, 2007). Izmainot šo rezultātu, sieviešu rezultātu attīstība nedaudz pasligtinās, kas pēc autoru analīzes dotu vīriešu rezultātu apsteigšanu 2204. gada Olimpiskajās spēlēs ar rezultātu 7.448 sekundes (vīriešiem 7.511 sekundes).
Ir nākuši klāt jauni dati
Kopš 2004.gada ir norisinājušās 3 Olimpiskās spēles. Papildinot šo autoru analīzi ar jauno čempionu rezultātiem, abu dzimumu attīstības straujumi mainās. Apvienojot jaunos rezultātus ar jau iepriekš minēto datu nepilnībām/izmaiņām, prognozētajām Olimpiskajām spēlēm, kad sievietes apsteigs vīriešus vajadzētu būt 2608.gadā, kurā ātrākais cilvēks (sieviete) to veiks 2.083 sekundēs (vīrieši 2.095 sekundēs).
Lineārā regresija.
Manis iepriekš minētie piemēri parāda, ka datu apjoms ir ļoti mazs, un pat viena rezultāta izmainīšanās, būtiski maina prognozi, bet, manuprāt, galvenā kļūda ir cilvēku rezultātu attīstības prognozēšana ar lineārās regresijas palīdzību. Nedomāju, ka jebkādā jomā cilvēki attīstās lineāri, un noteikti nedomāju, ka tas tā notiek sportā. Ja tā būtu lineāra, tad sportistiem ar laiku vajadzētu pietuvoties rezultātam 0 sekundes. Ir skaidrs, ka 100 metrus cilvēki 0 sekundēs neskries. Neskries arī 1s, 2s, 3s un pat ne 4 sekundēs. Cilvēkam ir kaut kādi limiti, kurus pārspēt tas nekad nespēs. Cik tuvu vai tālu no tiem mēs esam, rādīs laiks, un šādas prognozes veikt ir ļoti sarežģīti, jo to ietekmē tehnoloģiju attīstība, uztura uzlabošanās, jaunu zināšanu iegūšana, medicīna u.c.. Tā ir sarežģīta prognoze, kas noteikti nav lineāra.
Izmantojot šāda veida prognozēšanas metodi, jāizmēģina veiksme prognozējot 2020.gada Olimpisko spēļu rezultātus. Tātad sieviešu grupas uzvarētājai 100m vajadzētu noskriet 10.534s, bet vīriešu grupas uzvarētājam – 9.536s. Pēc gada paskatīsimies kā sanāca.