Friday, December 28, 2012

Caros Estudantes, vos reemcaminho aos links abaixo indicado para que cada grupo começe a preparar o trabalho final.


http://homepage.ufp.pt/cmanso/ALEA/Dossier11.pdf

A leituras destes documentos vai permitir um melhor conhecimento de como preparar um trabalho que implica estudos de sondagem.



Natureza dos ESTUDOS de MERCADO


A NATUREZA de um ESTUDO de MERCADO está relacionada com o CONTEÚDO DA INFORMAÇÂO pretendida, assim: 
 
De NATUREZA correlacionada com a  Compreensão – O Estudo responderá a perguntas do tipo: Porquê? Motivações? Atitudes? Comportamentos?

De NATUREZA  Factual – O Estudo responderá a perguntas do tipo: Quem? O quê? Quando? Como? Onde?

Deste modo diz-se que ESTUDOS de MERCADO com NATUREZAS correlacionadas com a Compreensão, sofrerão uma  ANÁLISE QUALITATIVA, enquanto estudos de NATUREZA Factual, sofrerão ANÁLISES com um carácter mais QUANTITATIVO.


Definição do Problema e dos Objectivos do Estudo a realizar.



É necessária uma boa definição do problema, sendo que o problema deve ser especificado ao pormenor.
 
Partindo da definição do problema delineiam-se os objectivos para o ESTUDO de MERCADO, de modo a que se consiga:

- Elementos exploratórios sobre o problema;
- Descrever todas as necessidades identificadas;
- Identificar relações de causa-efeito;

Isto é, a falta, ou ausência de informação está sempre na base do problema que o envestigador enfrenta, e constituirá, simultaneamente, a razão de ser do estudo pretendido e, em consequência, os seus objectivos.


Wednesday, December 12, 2012

Correlação Linear


Em pesquisas, frequentemente, procura-se verificar se existe relação entre duas ou mais variáveis, isto é, saber se as alterações sofridas por uma das variáveis são acompanhadas por alterações nas outras. Por exemplo,
peso vs. idade, consumo vs. renda, altura vs. peso, de um indivíduo.

O termo correlação significa relação em dois sentidos (correlação), e é usado em estatística para designar a força que mantém unidos dois conjuntos de valores. A verificação da existência e do grau de relação entre as variáveis é o objecto de estudo da correlação.


Uma vez caracterizada esta relação, procura-se descrevê-la sob forma matemática, através de uma função. A estimação dos parâmetros dessa função matemática é o objecto da regressão.

Os pares de valores das duas variáveis poderão ser colocados num diagrama cartesiano chamado “diagrama de
dispersão”. A vantagem de construir um diagrama de dispersão está em que, muitas vezes sua simples observação já nos dá uma ideia bastante boa de como as duas variáveis se relacionam.


                                                           Exemplo: Renda x Anos de estudo

As correlações variam com respeito a sua força. Podemos visualizar essa força num diagrama de dispersão que é um gráfico capaz de mostrar a maneira pela qual os valores de duas variáveis, X e Y, distribuem-se ao longo da faixa dos possíveis resultados.

Portanto, do gráfico acima pode-se notar que a força da correlação entre X e Y aumenta a medida que os pontos se agrupam em torno de uma linha reta imaginária.

Tipos de Correlação ( Correlação Positiva, Negativa e Curvilínea)


O diagrama de dispersão mostrará que a correlação será tanto mais forte quanto mais próximo estiver o
coeficiente de –1 ou +1, e será tanto mais fraca quanto mais próximo o coeficiente estiver de zero.

a) Correlação perfeita negativa (rxy = -1): Quando os pontos estiverem perfeitamente alinhados, mas em sentido contrário, a correlação é denominada perfeita negativa.
b) Correlação negativa (-1 < rxy < 0): A correlação é considerada negativa quando valores crescentes da variável X estiverem associados a valores decrescentes da variável Y, ou valores decrescentes de X associados a valores crescentes de Y.


c) Correlação nula (rxy = 0): Quando não houver relação entre as variáveis X e Y, ou seja, quando os valores de X e Y ocorrerem independentemente, não existe correlação entre elas.
d) Correlação positiva (0 < rxy < 1): Será considerada positiva se os valores crescentes de X estiverem associados a valores crescentes de Y.
e) Correlação perfeita positiva (rxy = 1): A correlação linear perfeita positiva corresponde ao caso anterior, só que os pontos (X, Y) estão perfeitamente alinhados.



Relação entre duas variáveis quantitativas.


Se retirarmos de uma população, uma amostra casual de tamanho N, teremos para cada elemento da amostra um par de observações: um valor de X e um valor de Y. Esses pares determinam N pontos no plano que podem ser representados graficamente num sistema de eixos cartesianos.




Ao gráfico acima dá-se o nome de diagrama de dispersão, esses nos fornece uma idéia intuitiva da eventual relação entre as duas variáveis.

Pode-se medir essa correlação através do Coeficiente de Correlação Linear de Pearson (r):


onde r varia entre -1 e 1



Coeficiente de Correlação (C)

Expressa numericamente a força e o sentido da correlação. Os coeficientes oscilam entre -1 e 1.





OBSERVAÇÕES:


  •  Correlação não é o mesmo que causa e efeito. Duas variáveis podem estar altamente correlacionadas e, no entanto, não haver relação de causa e efeito entre elas.
  •  Se duas variáveis estiverem amarradas por uma relação de causa e efeito elas estarão, obrigatoriamente, correlacionadas.
  •  O estudo de correlação pressupõe que as variáveis X e Y tenham uma distribuição normal.
  •  A palavra simples que compõe o nome correlação linear simples, indica que estão envolvidas no cálculo somente duas variáveis.
  •  O coeficiente de correlação linear de Pearson mede a correlação em estatística paramétrica.
  •  Coeficiente de correlação de Spearman (correlação por postos}é o correspondente à área não paramétrica..


Exercício Pratico




De acordo com o resultado podemos concluir que existe uma relação forte entre as notas das duas disciplinas, ao seja, os alunos com melhores notas em Matemática tendem a ter melhores notas na disciplina de estatística.






Alguns links importantes

Relatório de Progresso na Execução dos Objectivos de Desenvolvimento do Milénio em Cabo Verde

http://www.un.cv/files/pub-odmcv.pdf



Relatório de análise da situação da Criança e Adolescente em Cabo Verde 2011


Documento de Estrategia, Crescimento e Redução da Pobreza


Relatório do Desenvolvimento Humano de 2011

Tuesday, December 11, 2012

Assimetria


As medidas de assimetria possibilitam analisar uma distribuição de acordo com as relações entre suas medidas de moda, média e mediana, quando observadas graficamente.

Uma distribuição é dita simétrica quando apresenta o mesmo valor para a moda, a média e a mediana.
Mo= Md = X

Quando esta igualdade não acontece, temos uma distribuição assimétrica. Se considerarmos um eixo de referência, que chamaremos de eixo de simetria, traçado sobre o valor da média da distribuição.

Sempre que a curva da distribuição se afastar do referido eixo, será considerada como tendo um certo grau de afastamento, que é considerado como uma assimetria da distribuição.

Ou seja assimetria é o grau de afastamento que uma distribuição apresenta do seu eixo de simetria. Este afastamento pode acontecer do lado esquerdo ou do lado direito da distribuição, chamado de assimetria
negativa ou positiva respectivamente.



Quando a cauda da curva da distribuição declina para direita, temos uma distribuição com curva assimétrica positiva: Mo< Md < X

Analogamente quando a cauda da curva da distribuição declina para esquerda, temos uma distribuição com curva assimétrica negativa: Mo > Md >X


Curtose



Esta é uma medida do grau de achatamento e afunilamento da curva que descreve a distribuição.
O seu valor diz-nos se a curva tende a ser muito afunilada, com uma elevada proporção dos dados aglomerados junto do centro, ou achatada, com os dados espalhando-se ao longo de uma grande amplitude.
Um valor positivo indica que os dados estão concentrados no centro e que a distribuição apresenta um forte pico/elevação nesse lugar (neste caso, diz-se que a distribuição é leptocúrtica). Um valor negativo indica que os dados estão dispersos (diz-se que a distribuição é platicúrtica).

Uma distribuição que não é leptocúrtica nem platicúrtica diz-se mesocúrtica.

Para o cálculo do grau de curtose de uma distribuição utiliza-se o coeficiente de curtose (ou coeficiente percentílico de curtose)  

K = (Q3 – Q1) / 2 . (P90 – P10)

Onde: 

Q3 e Q1 são o terceiro e primeiro quartil

P90 e P10 são o décimo e nonagésimo

Quanto a curtose a distribuição pode ser:
Mesocúrtica – normal. Nem achatada, nem alongada. (K = 0,263)

Platicúrtica – achatada.                                               (k > 0,263)
Leptocúrtica – alongada.                                             (k < 0,263)




O que significa analisar um conjunto quanto à Curtose? Significa apenas verificar o “grau de achatamento da curva”. Ou seja, saber se a Curva de Freqüência que representa o conjunto é mais “afilada” ou mais “achatada” em relação a uma Curva Padrão, chamada de Curva Normal!



Origem e importância

Desde dos primórdios da humanidade o homem tem, muitas vezes, tomado notas de coisas e pessoas, não somente com o fim de acumular números, mas também visando utilizar os dados do passado para a resolução de problemas do presente. Todavia, somente no fim do século XIX e início do século XX, com a aplicação das probabilidades aos problemas sobre a interpretação dos dados, os números passaram a ser utilizados tanto para resolver os problemas do presente quanto prever os acontecimentos futuros.

A etimologia da palavra, do latim status (estado), usada aqui para designar a recolha e a apresentação de dados quantitativos de interesse do Estado, bem reflecte essa origem. Entretanto, a mera recolha de dados assim apresentados está longe de ser o que entendemos, hoje, por Estatística. Na verdade, sua feição essencial é a de ser um conjunto de métodos (métodos estatísticos), especialmente apropriado, no dizer de George Udny Yule (1871 – 1951), ao tratamento de dados numéricos afectados por uma multiplicidade de causas. Esses métodos fazem uso da Matemática, particularmente do cálculo de probabilidades, na recolhta, apresentação, análise e interpretação de dados quantitativos.

O seu ensino remonta o século XVII d.C, e visava descrever as populações e as riquezas do estado. Ainda neste século, ocorreu a expansão da ciência em áreas como saúde pública, educação , transporte, indústria, comércio e densidade demográfica.

No decorrer da sua utilização vários estudiosos vêm contribuindo para o seu desenvolvimento como ciência, como Francis Galton (1822-1911) que apresentou as noções de regressão e correlação; Karl Pearson (1857-1936) que apresentou seus famosos coeficientes, hoje chamados de coeficientes de Pearson; e Fisher que apresentou estudos sobre inferência estatística, dentre outros. Porém, o grande avanço mesmo da ciência foi por volta de 1940, quando o tratamento dos dados deixou de ser manual para ser computadorizado e, com isso, a realização de procedimentos estatísticos que, geralmente eram de alto custo do ponto de vista humano, passaram a ser dinamizados pela aplicação da informática no tratamento dos dados.

A importância da estatística reside no esforço do homem para melhor compreender o mundo, tanto do ponto de vista físico como social.

Medidas de Concentração


Curva de Lorenz


A curva de Lorenz é um gráfico frequentemente utilizado para representar a distribuição relativa de uma variável num domínio determinado. O domínio pode ser o conjunto de pessoas de uma região ou país, por exemplo. A variável cuja distribuição se estuda pode ser rendimento das pessoas. A curva é traçada considerando-se a percentagem acumulada de pessoas no eixo das abcissas e a percentagem acumulada do rendimento no eixo das ordenadas.

Cada ponto da curva é lido como percentagem acumulativa das pessoas. A curva parte da origem (0,0) e termina no ponto (100,100). Se o rendimento estivesse distribuída de forma perfeitamente equitativa, a curva coincidiria com a linha de 45 graus que passa pela origem (por exemplo, 10% da população recebe 10% do rendimento, 50% recebe 50% do rendimento, etc.). Se existisse desigualdade perfeita, ou seja, se uma pessoa detivesse toda a renda, a curva coincidiria com o eixo das abcissas até o ponto (100,00), donde iria até o ponto (100,100). Em geral, a curva se encontra numa situação intermediária entre esses dois extremos.

Portanto, quanto mais próxima da diagonal estiver a curva de Lorenz, mais equitativa é a distribuição e quanto mais afastada estiver, mais desigual é a distribuição.

Vejamos um exemplo:

A seguinte tabela representa os vencimentos mensais dos trabalhadores de uma dada empresa, estratificados por classes de vencimentos (em ECV).Em que x.n são os vencimentos acumulados para as classes de vencimento e com k o número de classes de vencimento, neste caso seis.



e, então, a curva de Lorenz seria a seguinte:






A diagonal representaria a igualdade perfeita da distribuição e a curva a desigualdade real
apresentada na tabela do exemplo.

Indice de Gini

Indice de Gini é uma medida de desigualdade desenvolvida pelo estatístico italiano Corrado Gini, e publicada no documento "Variabilità e mutabilità" ("Variabilidade e mutabilidade" em italiano), em 1912. É comumente utilizada para calcular a desigualdade de distribuição de renda mas pode ser usada para qualquer distribuição. Ele consiste em um número entre 0 e 1, onde 0 corresponde à completa igualdade de renda (onde todos têm a mesma renda) e 1 corresponde à completa desigualdade (onde uma pessoa tem toda a renda, e as demais nada têm). 

O índice de Gini é o coeficiente expresso em pontos percentuais (é igual ao coeficiente multiplicado por 100).
O coeficiente de Gini é maioritariamente usado para medir a desigualdade de renda, pode ser também usado para mensurar a desigualdade de riqueza. Esse uso requer que ninguém tenha uma riqueza líquida negativa.

A partir desta curva obtém-se o Índice de Gini.





Interpretação

  • Quando o índice tem valor igual a um (1), existe perfeita desigualdade, isto é, a renda domiciliar per capita é totalmente apropriada por um único indivíduo. Quando ele tem valor igual à zero (0), tem-se perfeita igualdade, isto é, a renda é distribuída na mesma proporção para todos os domicílios.
  • Quanto mais próximo da unidade, maior a desigualdade na distribuição de renda.

Usos

  • Analisar diferenciais na concentração da renda pessoal ao longo de toda a distribuição de renda.
  • Contribuir para a análise da situação socioeconómico da população, identificando segmentos que requerem maior atenção de políticas públicas de saúde, educação e protecção social, entre outras.
  • Subsidiar processos de planeamento, gestão e avaliação de políticas de distribuição de renda.