Xterra Brasil

O estatístico e triatleta Marcio Renan Marques analisou os dados do Ironman Brasil para saber quem são os  atletas mais rápidos da prova.

_______

Muito se fala em grupos de atletas e seus desempenhos e, geralmente, quando o assunto é esse, é comum ouvir: sub8h, sub9h, sub10h, sub11h, sub12h. A estatística tem métodos que tentam identificar esses grupos (clusters), e um deles é o KMEANS. Sou estatístico e vou tentar explicar, mais ou menos, o método.

Imaginem que eu quisesse classificar os triatletas do Ironman Florianópolis em 3 grupos. O KMEANS, como ponto de partida, buscaria o melhor tempo, o pior tempo e o tempo intermediário. A partir daí, compararíamos cada tempo de cada triatleta com essas 3 marcas iniciais e a que fosse mais próxima seria onde ele se alocaria. Entendido isso, todos os tempos comparados formariam os primeiros grupos, que chamamos de primeira interação. Agora, a partir desses primeiros 3 grupos se calcula a média em cada grupo, e essa média de cada grupo será ponto de partida para a segunda interação, e formação de novos grupos. Será que deu para entender? Assim se segue até que isso se estagne e não seja possível fazer mais interações.

©Wagner Araújo / MundoTRI
©Wagner Araújo / MundoTRI

Mas por que não se distribui pela quantidade de participantes? Para responder a essa pergunta e também o motivo por fazer a opção pelo KMEANS, eu darei um exemplo bem simples. Imaginem apenas 8 triatletas, sendo 2 profissionais e 6 iniciantes em IRONMAN. Os profissionais terminam a prova na casa das 8 horas, enquanto que os iniciantes depois das 13 horas de prova. Se dividíssemos simplesmente em 2 grupos de 4, teríamos 2 iniciantes junto com os profissionais, correto? Qualquer um contestaria isso. Com KMEANS, isso não acontece, os grupos se tornam os mais homogêneos possíveis dentro e o mais heterogêneo possível entre eles, e isso é exatamente o que queremos.

Leia também:  Delegação brasileira motivada para o mundial de duathlon

Foi isso que fiz com os tempos de todos os participantes do Ironman Florianópolis 2015. Eu os dividi em 6 grupos, que decidi chamar de: ELITE, ELITE B, TOP, TOP B, FINISHER E FINISHER B. A tabela mostra o tempo de corte para pertencer a cada grupo. Agora é só conferir! VOCÊ ESTÁ EM QUE GRUPO?

[column col=”1/3″]

Grupo

Elite

Elite B

Top

Top B

Finisher

Finisher B

[/column]

[column col=”1/3″]

Tempo de Corte

09:49:12

10:52:36

11:59:26

13:16:09

14:42:06

16:47:30

[/column]

[column col=”1/3″]

[/column]

Marcio Renan Marques é Estatístico do Ministério da Saúde. Trabalha em análise estatística relacionadas a epidemiologia e saúde coletiva com diversos trabalhos publicados nessa área.

Siga-nos ns redes sociais:
Facebooktwitterrssyoutubeinstagram
Compartilhe este artigo:
Facebooktwitterredditpinterestmail

Comentários

comentários