• Anúncios

Uniformidade da cobertura do país

Por muito que tentem negar... it's ALL about the numbers!! Espaço dedicado, gerido e dinamizado pelos obcecados pelos números

Moderador: Moderadores

Uniformidade da cobertura do país

Mensagempor geo-amd » sábado nov 17, 2012 23:32

Seria engraçada uma estatística que medisse a uniformidade da cobertura de Portugal por cada geocacher. A situação ideal seria a dum geocacher com exatamente a mesma percentagem de caches feitas em todos os distritos e regiões autónomas: por exemplo, 10% em todos eles.

A fórmula a aplicar seria o desvio padrão das percentagem nos 18 distritos + 2 regiões autónomas. O uso de percentagens teria a vantagem de ponderar automaticamente o peso de cada zona.

Claro que só se faria a conta para geocachers com mais de 200 caches (por exemplo). Caso contrário o top 10 seria ocupado exclusivamente por novatos com zero caches feitas: uma situação extrema de uniformidade.

NOTA: Isto não é um pedido, é só uma ideia...
Avatar do Utilizador
geo-amd
Extra Large
 
Mensagens: 2271
Registado: segunda mar 01, 2010 11:04
Localização: Costa da Caparica

Re: Uniformidade da cobertura do país

Mensagempor rifkinda » domingo nov 18, 2012 10:18

Cada distrito teria um peso diferente conforme a sua área, é isso?
E o pessoal que ficava no top teria de ser necessariamente um geocacher que tivesse cachado já em todos os distritos + regiões autónomas. Isso reduziria logo muito quem poderia estar num top10, penso.
Pelo menos nós, que cachamos há bastante tempo, ainda nos falta pôr os pés no Arquipélago dos Açores.
rifkinda
Moderador
 
Mensagens: 8445
Registado: quinta mar 31, 2005 13:17

Re: Uniformidade da cobertura do país

Mensagempor geo-amd » domingo nov 18, 2012 10:57

Cada distrito teria um peso diferente conforme o seu número de caches.

Vou exemplificar usado os geocachers geo-amd e rifkidsss. O primeiro concentra o geocaching em poucas zonas do país (o que me parece ser relativamente vulgar) e o segundo distribui o geocaching com alguma uniformidade por todo o país (o que parece ser relativamente invulgar).

As contas são fáceis de fazer com uma folha de cálculo. Para o critério da uniformidade, quanto mais perto do zero estiver a stdev, melhor.
Anexos
stdev.jpg
stdev.jpg (11.57 KiB) Visualizado 13019 vezes
Avatar do Utilizador
geo-amd
Extra Large
 
Mensagens: 2271
Registado: segunda mar 01, 2010 11:04
Localização: Costa da Caparica

Re: Uniformidade da cobertura do país

Mensagempor clcortez » segunda nov 19, 2012 08:36

Finalmente um Top onde posso estar nos primeiros lugares! :)

Além de ter já todos os distritos (apesar de não ter uma grande parte dos logs feitos) tenho por hábito cachar nos locais que visito em trabalho, que é em todo o país.
Esquecendo os números, esta "uniformidade" só nos dá conhecimento alargado da panorâmica e realidade do Geocahcing em Portugal.
Ter 1000 caches feitas em Lisboa e ter 5 anos de Geocaching mas nunca ter saído desse distrito não faz desse geocacher um geocacher conhecedor nem do país nem da nossa realidade de Geocaching.

Avanvem lá com isso que eu faço os meus logs em atraso :)
Avatar do Utilizador
clcortez
Extra Large
 
Mensagens: 1707
Registado: terça nov 04, 2003 22:44

Re: Uniformidade da cobertura do país

Mensagempor rifkinda » segunda nov 19, 2012 10:24

geo-amd, obrigada pelos exemplos que deste.
Já percebi o que pretendes. A ver se no fim de semana temos um tempinho para pôr esse top em acção!
Obrigada pela sugestão.
rifkinda
Moderador
 
Mensagens: 8445
Registado: quinta mar 31, 2005 13:17

Re: Uniformidade da cobertura do país

Mensagempor rifkind » segunda nov 26, 2012 01:08

As contas estão a correr bem! :)

Para já, reduzimos a lista a quem tem mais de 2000 founds em Portugal (desculpa lá, Cláudio :wink: ), para simplificar as contas.
O resultado é assim:
top_desvio.png
top_desvio.png (18.26 KiB) Visualizado 12940 vezes


É para breve, a versão final. :)
rifkind
Site Admin
 
Mensagens: 1728
Registado: terça jun 24, 2003 18:32

Re: Uniformidade da cobertura do país

Mensagempor MAntunes » segunda nov 26, 2012 11:48

Uniformidade de cobertura do país é algo de que também me orgulho. ;))

De acordo com o link abaixo, só ainda não cheguei à Madeira.

Imagem
Imagem
Avatar do Utilizador
MAntunes
Extra Large
 
Mensagens: 4803
Registado: terça abr 22, 2003 20:56
Localização: Lisboa, Portugal

Re: Uniformidade da cobertura do país

Mensagempor rifkinda » segunda nov 26, 2012 12:19

Curiosamente, do top 10 apresentado, só o fire4me já cachou em todos os distritos e regiões autónomas.
rifkinda
Moderador
 
Mensagens: 8445
Registado: quinta mar 31, 2005 13:17

Re: Uniformidade da cobertura do país

Mensagempor clcortez » segunda nov 26, 2012 19:33

...e eu também, mas só depois de fazer os cerca de 230 logs que tenho em atraso é que se vai saber isso ;)
Avatar do Utilizador
clcortez
Extra Large
 
Mensagens: 1707
Registado: terça nov 04, 2003 22:44

Re: Uniformidade da cobertura do país

Mensagempor MAntunes » segunda nov 26, 2012 19:49

É curioso que a ambos apenas nos falte a Madeira. :)

Quanto aos 230 logs em atraso, fazes assim;

"tftc" ctrl+c 1 vez
e depois ctrl+v 229 vezes. [}:)]
Imagem
Avatar do Utilizador
MAntunes
Extra Large
 
Mensagens: 4803
Registado: terça abr 22, 2003 20:56
Localização: Lisboa, Portugal

Re: Uniformidade da cobertura do país

Mensagempor geo-amd » terça nov 27, 2012 03:24

Bom trabalho! Que delícia ver esta ideia a concretizar-se. É realmente interessante ver quem está no top: para mim foi um pouco um abrir de olhos.

Desculpem-me ter escrito lá para trás o nome rifkindsss de forma errada. Ao tentar acertar nos sss finais, escapou-me um "n".
Avatar do Utilizador
geo-amd
Extra Large
 
Mensagens: 2271
Registado: segunda mar 01, 2010 11:04
Localização: Costa da Caparica

Re: Uniformidade da cobertura do país

Mensagempor rifkinda » terça nov 27, 2012 08:21

Não te preocupes com teres escrito mal o nosso nick... também ninguém nos mandou ter um nick esquisito... [:P]
Para nós foi uma surpresa estarmos em primeiro lugar no top para geocachers com mais de 2000 founds, apesar de uma das nossas características é andar sempre para baixo e para cima em viagens para estar com a família.

Quando tivermos mais um tempinho livre (o que tem sido raro... [:(] ), a ver se afinamos essa estatística.
É que se baixarmos muito o número mínimo de caches encontradas em Portugal, o pessoal que passa para a frente em termos de uniformidade, é pessoal que nalguns distritos ainda não encontrou caches e nos outros não tem sequer 1% das caches existentes nesse distrito... ficando assim uma média de 0%'s, alguns realmente zero, outros zeros arredondados (que que essas percentagens são arredondadas à unidade).
Se considerarmos as tais 200 caches encontradas, como tinhas sugerido, isso implicaria geocachers que só fizeram cerca de 1% das caches actualmente disponíveis, e isso claramente se vai repercurtir em valores percentuais muito pequenos para cada distrito... (pelo menos nos casos mais uniformes)

À luz disto, queres sugerir outro valor minimo de founds para esta estatística?
rifkinda
Moderador
 
Mensagens: 8445
Registado: quinta mar 31, 2005 13:17

Re: Uniformidade da cobertura do país

Mensagempor geo-amd » terça nov 27, 2012 21:31

Não tinha pensado nisso e fiquei a meditar.

Para salvar a ideia, talvez se possa trocar o desvio padrão pelo desvio padrão relativo, que se calcula rstdev = stdev/média.

Este artigo diz que a nova estatística é melhor do que a stdev "For comparison between data sets with [...] widely different means." Realmente parece-me que a estatística permite lidar com os diferentes fatores de escala que estão presentes na zona da média 0%, na zona da média 5%, etc.

Será que a divisão pela média favorece que tem mais caches? Talvez pareça que sim, mas julgo que não. O que eu digo é que a stdev original favorece quem tem menos caches duma forma excessiva, tornando-se a distorção caricata para médias baixas. A estatística fica desinteressante e inútil. Na nova estatística, a divisão pela média atenua o fator "número de caches", que é um fator que se intrometeu na stdev para criar distorção.

Em teoria, parece-me que a rstdev é melhor do que a stdev e merece ser experimentada. Mas também terá os seus defeitos certamente...
Anexos
rstdev.jpg
rstdev.jpg (15 KiB) Visualizado 12840 vezes
Avatar do Utilizador
geo-amd
Extra Large
 
Mensagens: 2271
Registado: segunda mar 01, 2010 11:04
Localização: Costa da Caparica

Re: Uniformidade da cobertura do país

Mensagempor rifkinda » quarta nov 28, 2012 00:23

Utilizando o coeficiente de variação (o que tu chamaste de desvio padrão relativo), não podem entrar no top os geocachers com média igual a zero (quer seja um zero absoluto, por não ter feito caches nesse distrito, quer seja um zero resultante de arredondamentos). Isto, porque não podes dividir por zero. Claro que isso pode ser evitado, calculando as percentagem com uma casa decimal.

Não é um coeficiente que costume usar muitas vezes, mas vou pensar se se adequará aqui neste caso.

Já agora, o desvio padrão que foi usado nos nossos cálculos, foi o que se chama de desvio padrão corrigido. Ou seja, antes de aplicar a raiz quadrada, foi feita a divisão da soma dos quadrados dos desvios, por n-1, que neste caso é 19, por serem no total 20 distritos. Há quem prefira usar o desvio padrão não corrigido (dividindo por n), mas eu prefiro este.
Não sei qual é que estás a usar nos teus cálculos.

Para quem não percebe grande coisa de estatística e de matemática... desculpem lá os termos mais técnicos. :roll:
rifkinda
Moderador
 
Mensagens: 8445
Registado: quinta mar 31, 2005 13:17

Uniformidade da cobertura do país

Mensagempor lgass » quarta nov 28, 2012 09:52

Agora falam aqui chinês. Eu e a melpm cachámos por apenas uns 13 distritos. O tempo nao dá para muito mais.

A ver se eu consigo ajuda um pouco: quando procuro ver alguma estatistica normalmente faço com geocachers que tenham 500 ou mais founds. Normalmente isto significa pelo menos um ano de atividade e já alguma experiência. Também conseguimos assin retirar a maior parte de geocachers que entram e saem da atividade depressa.
Imagem
lgass
Large
 
Mensagens: 881
Registado: segunda jul 05, 2010 21:00
Localização: Lisboa

Próximo

Voltar para Stats

Quem está ligado:

Utilizadores a ver este Fórum: Nenhum utilizador registado e 2 visitantes

cron