Isabel,
As amostras de dados, em geral, podem conter valores muito pequenos ou muito grandes ao ponto de ser questionável a sua inclusão no cálculo da média. Esses valores podem ocorrer devido ao acaso, mas também podem ocorrer por erros no registro, nos cálculos ou, no caso de compras públicas, à pressa ou interesse das empresas em elevar o referencial de preços da licitação. Isso contamina a cesta de preços. Sendo assim, quando esses valores distorcidos são considerados com os outros valores da amostra eles podem afetar a média de forma que é possível questionar se ela de fato fornece uma descrição útil ou plausível do “meio” dos dados.
Uma forma de evitar a possibilidade de que esse engano ocorra, em função de valores muito pequenos ou muito altos, ocasionalmente, é possível descrever o “centro” ou “meio” do conjunto de dados com outras medidas estatísticas diferentes da média, tal como a mediana. Por exemplo, uma excursão escolar hipotética com cinco alunos e um professor. Os alunos tem idade de 15, 16, 17, 17 e 18 e o professor tem 40 anos. A média de idade dos participantes da excursão é 20,5. Esse resultado facilmente levaria a uma interpretação equivocada da média de idade dos participantes. Então, para reduzir o risco de indução ao erro por causa de algum valor extremo (pequeno ou grande), podemos omitir o dado estranho ou usar a mediana, que é menos sensível a valores extremos na amostra. No nosso exemplo, usando a mediana, o “centro” ou “meio” dos dados seria 17 anos.
Considerando isso, de acordo com a metodologia de pesquisa de preços do STJ, a regra geral utilizada é usar a mediana quando a amostra é heterogênea, ou seja, contém valor(es) extremo(s) (muito pequenos ou muito grandes) e a média quando a amostra é homogênea, sem grandes variações nos valores. Surge então a necessidade de medir a extensão da variação ou dispersão dos dados para decidir qual medida será utilizada para representar o “centro” ou “meio” da amostra. Essa informação é obtida por meio de medidas de dispersão, em especial o desvio padrão e o coeficiente de variação. O coeficiente de dispersão expressa o desvio padrão como um percentual do que está sendo calculado e é obtido dividindo-se o desvio padrão da amostra pela sua média e multiplicando-se o resultado por 100. Esse coeficiente é, de acordo com o manual do STJ, considerado baixo (indicando um conjunto de dados razoavelmente homogêneo), para fins de licitação, quando for menor ou igual a 25%.
Como curiosidade, no GDF, a regra utilizada é o menor dos preços entre a média e a mediana, sem considerar a dispersão da amostra. Então, espera-se que, quando a amostra for heterogênea, a mediana seja menor e, quando a amostra for homogênea, que a média seja menor. A Portaria MJ 804, no Art. 4°, também traz critérios para avaliação crítica da pesquisa de preços usando o desvio padrão. Conforme a referida norma:
"…
I - excessivamente elevado: preço maior que o resultado da média das propostas somado ao desvio padrão; e
II - inexequível: preço menor que o resultado da média das propostas subtraído do desvio padrão.
…"
Modelo Planilha de Pesquisa de Preços.xlsx (21.2 KB) (Com cálculo do coeficiente de variação para decidir entre média ou mediana)
Manual de Pesquisa de preços do STJ.pdf (730.7 KB) (Pg. 20-22)