Página 1 de 4

Uniformidade da cobertura do país

MensagemEnviado: sábado nov 17, 2012 23:32
por geo-amd
Seria engraçada uma estatística que medisse a uniformidade da cobertura de Portugal por cada geocacher. A situação ideal seria a dum geocacher com exatamente a mesma percentagem de caches feitas em todos os distritos e regiões autónomas: por exemplo, 10% em todos eles.

A fórmula a aplicar seria o desvio padrão das percentagem nos 18 distritos + 2 regiões autónomas. O uso de percentagens teria a vantagem de ponderar automaticamente o peso de cada zona.

Claro que só se faria a conta para geocachers com mais de 200 caches (por exemplo). Caso contrário o top 10 seria ocupado exclusivamente por novatos com zero caches feitas: uma situação extrema de uniformidade.

NOTA: Isto não é um pedido, é só uma ideia...

Re: Uniformidade da cobertura do país

MensagemEnviado: domingo nov 18, 2012 10:18
por rifkinda
Cada distrito teria um peso diferente conforme a sua área, é isso?
E o pessoal que ficava no top teria de ser necessariamente um geocacher que tivesse cachado já em todos os distritos + regiões autónomas. Isso reduziria logo muito quem poderia estar num top10, penso.
Pelo menos nós, que cachamos há bastante tempo, ainda nos falta pôr os pés no Arquipélago dos Açores.

Re: Uniformidade da cobertura do país

MensagemEnviado: domingo nov 18, 2012 10:57
por geo-amd
Cada distrito teria um peso diferente conforme o seu número de caches.

Vou exemplificar usado os geocachers geo-amd e rifkidsss. O primeiro concentra o geocaching em poucas zonas do país (o que me parece ser relativamente vulgar) e o segundo distribui o geocaching com alguma uniformidade por todo o país (o que parece ser relativamente invulgar).

As contas são fáceis de fazer com uma folha de cálculo. Para o critério da uniformidade, quanto mais perto do zero estiver a stdev, melhor.

Re: Uniformidade da cobertura do país

MensagemEnviado: segunda nov 19, 2012 08:36
por clcortez
Finalmente um Top onde posso estar nos primeiros lugares! :)

Além de ter já todos os distritos (apesar de não ter uma grande parte dos logs feitos) tenho por hábito cachar nos locais que visito em trabalho, que é em todo o país.
Esquecendo os números, esta "uniformidade" só nos dá conhecimento alargado da panorâmica e realidade do Geocahcing em Portugal.
Ter 1000 caches feitas em Lisboa e ter 5 anos de Geocaching mas nunca ter saído desse distrito não faz desse geocacher um geocacher conhecedor nem do país nem da nossa realidade de Geocaching.

Avanvem lá com isso que eu faço os meus logs em atraso :)

Re: Uniformidade da cobertura do país

MensagemEnviado: segunda nov 19, 2012 10:24
por rifkinda
geo-amd, obrigada pelos exemplos que deste.
Já percebi o que pretendes. A ver se no fim de semana temos um tempinho para pôr esse top em acção!
Obrigada pela sugestão.

Re: Uniformidade da cobertura do país

MensagemEnviado: segunda nov 26, 2012 01:08
por rifkind
As contas estão a correr bem! :)

Para já, reduzimos a lista a quem tem mais de 2000 founds em Portugal (desculpa lá, Cláudio :wink: ), para simplificar as contas.
O resultado é assim:
top_desvio.png
top_desvio.png (18.26 KiB) Visualizado 13040 vezes


É para breve, a versão final. :)

Re: Uniformidade da cobertura do país

MensagemEnviado: segunda nov 26, 2012 11:48
por MAntunes
Uniformidade de cobertura do país é algo de que também me orgulho. ;))

De acordo com o link abaixo, só ainda não cheguei à Madeira.

Imagem

Re: Uniformidade da cobertura do país

MensagemEnviado: segunda nov 26, 2012 12:19
por rifkinda
Curiosamente, do top 10 apresentado, só o fire4me já cachou em todos os distritos e regiões autónomas.

Re: Uniformidade da cobertura do país

MensagemEnviado: segunda nov 26, 2012 19:33
por clcortez
...e eu também, mas só depois de fazer os cerca de 230 logs que tenho em atraso é que se vai saber isso ;)

Re: Uniformidade da cobertura do país

MensagemEnviado: segunda nov 26, 2012 19:49
por MAntunes
É curioso que a ambos apenas nos falte a Madeira. :)

Quanto aos 230 logs em atraso, fazes assim;

"tftc" ctrl+c 1 vez
e depois ctrl+v 229 vezes. [}:)]

Re: Uniformidade da cobertura do país

MensagemEnviado: terça nov 27, 2012 03:24
por geo-amd
Bom trabalho! Que delícia ver esta ideia a concretizar-se. É realmente interessante ver quem está no top: para mim foi um pouco um abrir de olhos.

Desculpem-me ter escrito lá para trás o nome rifkindsss de forma errada. Ao tentar acertar nos sss finais, escapou-me um "n".

Re: Uniformidade da cobertura do país

MensagemEnviado: terça nov 27, 2012 08:21
por rifkinda
Não te preocupes com teres escrito mal o nosso nick... também ninguém nos mandou ter um nick esquisito... [:P]
Para nós foi uma surpresa estarmos em primeiro lugar no top para geocachers com mais de 2000 founds, apesar de uma das nossas características é andar sempre para baixo e para cima em viagens para estar com a família.

Quando tivermos mais um tempinho livre (o que tem sido raro... [:(] ), a ver se afinamos essa estatística.
É que se baixarmos muito o número mínimo de caches encontradas em Portugal, o pessoal que passa para a frente em termos de uniformidade, é pessoal que nalguns distritos ainda não encontrou caches e nos outros não tem sequer 1% das caches existentes nesse distrito... ficando assim uma média de 0%'s, alguns realmente zero, outros zeros arredondados (que que essas percentagens são arredondadas à unidade).
Se considerarmos as tais 200 caches encontradas, como tinhas sugerido, isso implicaria geocachers que só fizeram cerca de 1% das caches actualmente disponíveis, e isso claramente se vai repercurtir em valores percentuais muito pequenos para cada distrito... (pelo menos nos casos mais uniformes)

À luz disto, queres sugerir outro valor minimo de founds para esta estatística?

Re: Uniformidade da cobertura do país

MensagemEnviado: terça nov 27, 2012 21:31
por geo-amd
Não tinha pensado nisso e fiquei a meditar.

Para salvar a ideia, talvez se possa trocar o desvio padrão pelo desvio padrão relativo, que se calcula rstdev = stdev/média.

Este artigo diz que a nova estatística é melhor do que a stdev "For comparison between data sets with [...] widely different means." Realmente parece-me que a estatística permite lidar com os diferentes fatores de escala que estão presentes na zona da média 0%, na zona da média 5%, etc.

Será que a divisão pela média favorece que tem mais caches? Talvez pareça que sim, mas julgo que não. O que eu digo é que a stdev original favorece quem tem menos caches duma forma excessiva, tornando-se a distorção caricata para médias baixas. A estatística fica desinteressante e inútil. Na nova estatística, a divisão pela média atenua o fator "número de caches", que é um fator que se intrometeu na stdev para criar distorção.

Em teoria, parece-me que a rstdev é melhor do que a stdev e merece ser experimentada. Mas também terá os seus defeitos certamente...

Re: Uniformidade da cobertura do país

MensagemEnviado: quarta nov 28, 2012 00:23
por rifkinda
Utilizando o coeficiente de variação (o que tu chamaste de desvio padrão relativo), não podem entrar no top os geocachers com média igual a zero (quer seja um zero absoluto, por não ter feito caches nesse distrito, quer seja um zero resultante de arredondamentos). Isto, porque não podes dividir por zero. Claro que isso pode ser evitado, calculando as percentagem com uma casa decimal.

Não é um coeficiente que costume usar muitas vezes, mas vou pensar se se adequará aqui neste caso.

Já agora, o desvio padrão que foi usado nos nossos cálculos, foi o que se chama de desvio padrão corrigido. Ou seja, antes de aplicar a raiz quadrada, foi feita a divisão da soma dos quadrados dos desvios, por n-1, que neste caso é 19, por serem no total 20 distritos. Há quem prefira usar o desvio padrão não corrigido (dividindo por n), mas eu prefiro este.
Não sei qual é que estás a usar nos teus cálculos.

Para quem não percebe grande coisa de estatística e de matemática... desculpem lá os termos mais técnicos. :roll:

Uniformidade da cobertura do país

MensagemEnviado: quarta nov 28, 2012 09:52
por lgass
Agora falam aqui chinês. Eu e a melpm cachámos por apenas uns 13 distritos. O tempo nao dá para muito mais.

A ver se eu consigo ajuda um pouco: quando procuro ver alguma estatistica normalmente faço com geocachers que tenham 500 ou mais founds. Normalmente isto significa pelo menos um ano de atividade e já alguma experiência. Também conseguimos assin retirar a maior parte de geocachers que entram e saem da atividade depressa.