Quem é a verdadeira elite do Ironman Brasil, uma análise estatística

      O estatístico e triatleta Marcio Renan Marques analisou os dados do Ironman Brasil para saber quem são os  atletas mais rápidos da prova.

      _______

      Muito se fala em grupos de atletas e seus desempenhos e, geralmente, quando o assunto é esse, é comum ouvir: sub8h, sub9h, sub10h, sub11h, sub12h. A estatística tem métodos que tentam identificar esses grupos (clusters), e um deles é o KMEANS. Sou estatístico e vou tentar explicar, mais ou menos, o método.

      Imaginem que eu quisesse classificar os triatletas do Ironman Florianópolis em 3 grupos. O KMEANS, como ponto de partida, buscaria o melhor tempo, o pior tempo e o tempo intermediário. A partir daí, compararíamos cada tempo de cada triatleta com essas 3 marcas iniciais e a que fosse mais próxima seria onde ele se alocaria. Entendido isso, todos os tempos comparados formariam os primeiros grupos, que chamamos de primeira interação. Agora, a partir desses primeiros 3 grupos se calcula a média em cada grupo, e essa média de cada grupo será ponto de partida para a segunda interação, e formação de novos grupos. Será que deu para entender? Assim se segue até que isso se estagne e não seja possível fazer mais interações.

      ©Wagner Araújo / MundoTRI

      ©Wagner Araújo / MundoTRI

      Mas por que não se distribui pela quantidade de participantes? Para responder a essa pergunta e também o motivo por fazer a opção pelo KMEANS, eu darei um exemplo bem simples. Imaginem apenas 8 triatletas, sendo 2 profissionais e 6 iniciantes em IRONMAN. Os profissionais terminam a prova na casa das 8 horas, enquanto que os iniciantes depois das 13 horas de prova. Se dividíssemos simplesmente em 2 grupos de 4, teríamos 2 iniciantes junto com os profissionais, correto? Qualquer um contestaria isso. Com KMEANS, isso não acontece, os grupos se tornam os mais homogêneos possíveis dentro e o mais heterogêneo possível entre eles, e isso é exatamente o que queremos.

      Leia também:  Marcus Fernandes e Fabiola Gomes soberanos nos dois dias em Pirassununga

      Foi isso que fiz com os tempos de todos os participantes do Ironman Florianópolis 2015. Eu os dividi em 6 grupos, que decidi chamar de: ELITE, ELITE B, TOP, TOP B, FINISHER E FINISHER B. A tabela mostra o tempo de corte para pertencer a cada grupo. Agora é só conferir! VOCÊ ESTÁ EM QUE GRUPO?

      Grupo

      Elite

      Elite B

      Top

      Top B

      Finisher

      Finisher B

      Tempo de Corte

      09:49:12

      10:52:36

      11:59:26

      13:16:09

      14:42:06

      16:47:30

      Marcio Renan Marques é Estatístico do Ministério da Saúde. Trabalha em análise estatística relacionadas a epidemiologia e saúde coletiva com diversos trabalhos publicados nessa área.

      Siga-nos ns redes sociais:
      Facebooktwitterrssyoutubeinstagram
      Compartilhe este artigo:
      Facebooktwitterredditpinterestmail

      Comentários

      comentários

        Xterra Brasil

      Leia mais sobre esse assunto