Want to create interactive content? It’s easy in Genially!
Estatística Matemática
Luis Tamayo
Created on March 18, 2024
Start designing with a free template
Discover more than 1500 professional designs like these:
Transcript
Estatística
Whiplash!!
Índice
Definição de estatística
Variavel Quantitativa(Tabelas)
17
Abordamento gráfico e intuitivo de distribuições bidimensionais
Objetivo de estatística
10
Média
Diz-se que a estatística, por vezes, é mentirosa!
11
Mediana
Enquadramento Teórico(6 slides)
12
Quartis
Variavel Qualitativa(tema e tabela)
13
Amplitude da Amostra
Gráfico circular
14
Amplitude Interquartil
Gráfico de Barras(qualitativa)
15
Desvio Padrão
Variavel Quantitativa
16
Gráfico de barras(quantitativa)
Introdução:Definição de estatística
A estatística é o campo da matemática que relaciona factos e números em que há um conjunto de métodos que nos possibilita coletar dados e analisá-los, assim sendo possível realizar alguma interpretação deles. A estatística é dividida em duas partes: descritiva e inferencial. A estatística descritiva é caracterizada pela organização, análise e apresentação dos dados, enquanto a estatística inferencial tem como característica o estudo de uma amostra de determinada população e, com base nela, a realização de análises e a apresentação de dados.
Introdução:Objetivo da Estatística
O objetivo da Estatística é, principalmente, extrair informação dos dados para obter uma melhor compreensão das situações que representam, sendo possível transformar essa informação em conhecimento. Esta começa pela recolha de dados, sob a forma de uma amostra, ou a partir de todos os elementos da população. Posteriormente, faz-se a redução e representação desses dados utilizando as tabelas e os diferentes tipos de gráficos, sendo um dos principais objetivos desta fase, a identificação da estrutura subjacente aos dados.
“Diz-se que a estatística, por vezes, é mentirosa!”
Mesmo procurando representar uma realidade, a estatística também possui falhas, sendo por vezes enganosa nos seus dados. A estatística pode ser usada também para enganar as pessoas, por exemplo nas conhecidas publicidades sobre medicamentos, produtos de limpeza ou pastas de dentes, que afirmam que uma maior parte dos profissionais as recomendam. Sendo que esta afirmação é utilizada por grande maioria das companhias, e logo não pode corresponder a uma realidade. Outro exemplo é quando, apesar de se realizar um estudo certeiro de dados de uma amostra, esta mesma não representar uma totalidade. Por exemplo, caso pretendamos realizar uma sondagem sobre qual o partido político que irá ser mais votado, deveríamos tomar como amostra um número igual de indivíduos para cada distrito ou estado do país, de forma a representar um todo. No caso de se tomar uma amostra com mais indivíduos de uma determinada localidade, é lógico que o resultado obtido representará a moda dessa localidade e não de todo o país, logo seriamos induzidos a pensar que uma moda correspondente a um determinado local corresponde à de um país todo
Enquadramento Teórico
Definições:
Sondagem: É um estudo científico de uma parte da população com o objetivo de melhor conhecer atitudes, hábitos e preferências da população relativamente a acontecimentos, circunstâncias e assuntos de interesse comum
Recenseamento:É um estudo estatístico de um Universo de pessoas, instituição ou objetos físicos com o propósito de adquirir conhecimentos observando todos os seus elementos, e fazer juízos quantitativos acerca de caraterísticas importantes desse universo
População:Conjunto de unidades individuais, que podem ser pessoas, com uma ou mais caraterísticas em comum, que se pretendem analisar. Cada elemento de população é uma unidade estatística
Amostra:Parte da população que é observada com o objetivo de obter informação para estudar a caraterística pretendida. Esta deve ser recolhida de modo a representar um todo
Enquadramento Teórico: Tipos de Variável
Na estatística podemos estudar dois tipos de Variáveis. Uma Variável Qualitativa ou uma Variável Quantitativa
Variável quantitativa
Variável qualitativa
As variáveis qualitativas são aquelas que não podem ser medidas numericamente, mas sim descritas ou categorizadas de acordo com as suas características. As Variáveis qualitativas podem ser de dois tipos: nominais, quando não existe uma ordem natural entre as categorias (por exemplo: profissão, sexo), ou ordinais, quando existe uma ordem natural entre as categorias (por exemplo: escolaridade, ranking). As variáveis qualitativas são importantes na análise de dados, por permitirem identificar padrões e tendências entre as diferentes categorias.
As variáveis quantitativas são aquelas que podem ser medidas numericamente e expressam uma quantidade ou magnitude. Estas podem ser contínuas, quando assumem valores nos quais se incluem números que estão para além do conjunto dos números inteiros(por exemplo: números racionais), ou discretas, quando assumem apenas valores inteiros (por exemplo: 1, -5, 7). As variáveis quantitativas são importantes na análise de dados, pois permitem realizar operações matemáticas como média, desvio padrão, correlação e regressão, que possibilitam a identificação de padrões e relações entre variáveis.
Enquadramento Teórico: Frequência absoluta,relativa, simples e acumulada
Frequência
Relativa
Absoluta
Acumulada
Acumulada
Simples
Simples
Acumulada
Como o nome sugere, a frequência relativa acumulada é o acúmulo da frequência relativa. Para determiná-la, primeiro é necessário calcular a frequência relativa,
A Frequência relativa simples é a divisão entre um valor recolhido e o número de dados recolhidos num determinado conjunto. Como o nome sugere,esta determina a frequência que um dado tem em comparação com ao todo, devido a isto, é comum que seja representado em forma de percentagem
A frequência absoluta simples é o registo do número de repetições de uma variável estudada. Como se trata de uma contagem, é representada por números naturais, o que significa que a frequência absoluta é uma grandeza discreta.
A frequência absoluta acumulada é a soma das frequências absolutas ao decorrer das linhas da tabela.
Enquadramento Teórico: Medidas de Dispersão
Amplitude Interquartil
Amplitude da amostra
Desvio Padrão
O desvio Padrão permite distinguir amostras com medidas de tendência central iguais, informando sobre a dispersão dos dados em relação à média. O desvio padrão toma sempre valores maiores ou iguais a zero, e a distribuição é tanto mais dispersa quanto maior for o desvio padrão
A amplitude de uma amostra é a diferença entre o valor máximo e o valor mínimo recolhidos
A amplitude interquartil é a diferença entre o 3º e o 1º quartis
Enquadramento Teórico: Medidas de Localização
Média
Moda
Quartís
Mediana
Os quartís dividem a distribuição em quatro partes iguais, de modo a que cada uma das partes contenha o mesmo número de obsrevações Existem 3 quartis sendo que: O 1º quartil é o valor que divide a amostra em duas partes de modo a que 25% das observações sejam inferiores ou iguais a este, o 2º quartil de modo a que 50% seja inferior ou igual e o 3º Quartil de modo a que 75% seja inferior ou igual
Chama-se Média de um conjunto de dados numéricos ao quociente entre a soma dos respetivos valores e o número total de dados Pode representar-se por
A mediana é o valor que divide a amostra (organizada por ordem crescente) ao meio, isto é, metade dos elementos do conjunto de dados são menores ou iguais à mediana, enquanto os restantes são superiores ou iguais
Chama-se moda de um conjunto de dados discretos à categoria/classe com maior frequência abosluta.Esta pode representar-se por M
Enquadramento Teórico: Bibliografía e Webgrafía
https://brasilescola.uol.com.br/matematica/estatistica-2.htm
https://www.alea.pt/index.php?option=com_content&view=article&id=859&Itemid=1774&lang=pt
https://pt.linkedin.com/pulse/tipos-de-vari%C3%A1veis-usiara-britto
Neves Maria Augusta Ferreira;Guerreiro Luís;Silva António Pinto.Máximo Parte 2 matemática A 10º Ano.1ªEdição. Porto Editora 2022
http://leg.ufpr.br/~silvia/CE055/node8.html
https://www.todamateria.com.br/frequencia-absoluta/
Longo Elisabete;Branco Isabel.Macs Matemática aplicada às Ciências Sociais- 10º Ano. 1º Edição.Texto 2019
https://mundoeducacao.uol.com.br/matematica/frequencia-absoluta.htm
Neves Maria Augusta Ferreira;GuerreiroLuís;Leite António;Silva Jorge nuno.Matemática A 10º Ano.1ªEdição.Porto Editora 2019
https://mundoeducacao.uol.com.br/matematica/frequencia-relativa.htm
https://www.preparaenem.com/matematica/frequencia-relativa.htm
https://www.maxwell.vrac.puc-rio.br/33767/dispersao2.html
https://sweet.ua.pt/pedrocruz/bioestatistica/ed-dist-interquartil-amostral.html#gsc.tab=0
Variavel Qualitativa
No nosso caso decidimos estudar o género musical favorito das pessoas da Turma, Foram escolhidos no total 6 géneros. O Pop, o Rap, o Metal, o Funk, a Música Eletrónica e o Jazz. De forma a concretizar o estudo foi realizado um questionário à turma
Variavel Qualitativa
No final da recolha de dados, foi possível construir a seguinte tabela de frequência:
Género Musical Preferido
Variavel Qualitativa
Género Musical Preferido
Através da análise desta tabela podemos observar que: -A variável è Bimodal, ou seja, existem duas modas. Sendo estas O Pop e o Funk -Os géneros menos comuns na turma são o Rap, a música Eletrônica e o Jazz
Variavel Qualitativa
Género Musical Preferido
Através da análise desta tabela podemos observar que: -A variável è Bimodal, ou seja, existem duas modas. Sendo estas O Pop e o Funk -Os géneros menos comuns na turma são o Rap, a música Eletrônica e o Jazz
Gráfico Circular
Com o auxílio da mesma Tabela também é possível construir um Gráfico circular
Write a great title her
Pop- 5 pessoas
Rap- 1 pessoa
Pop
Metal- 4 pessoas
Jazz
5.9%
Funk-5 pessoas
5.9%
Eletrônica-1 pessoa
Eletrônica
Funk
29.4%
Jazz- 1 pessoa Jazz
29.4%
Rap
Metal
5.9%
23.5%
Gráfico de Barras
Da mesma forma também é possível construir um gráfico de barras
Género de música Favorito
Neste gráfico podemos observar de uma forma mais simples qual a moda da variável
Variavel Quantitativa
No que se refere a variável quantitativa optamos por estudar as médias do 1ro período obtidas por cada aluno da turma na disciplina de Fisico-Química
Após a análise da pauta publicada pela escola foi possível recolher as seguintes informações relacionadas com a variável em estudo: Notas(em valores): -9 -11 -16 -11 -9 -8 -14 -11 -10 -10 -10 -13 -18 -9 -16 -17
Tabelas de Frequência:Tabela de frequência simples
Através destes dados é possível criar uma tabela de frequência simples e uma tabela de frequência acumulada:
Médias de cada aluno da Turma na disciplina de Fisico-Química
Tabelas de Frequência:Tabela de frequência acumulada
Médias de cada aluno da Turma na disciplina de Fisico-Química
Análise das tabelas
Médias de cada aluno da Turma na disciplina de Fisico-Química
-Através da análise da tabela podemos notar que esta variável é plurimodal, ou seja, possui várias modas ,uma vez que, existem vários valores que se repetem em maior quantidade com a mesma frequência absoluta. Ou por outras palavras, nenhum valor possui uma maior frequência absoluta, mas sim vários
Estudo dos dados: Média
Primeiro começaremos por determinar a média dos resultados de modo a determinar qual a média da turma na disciplina em estudo. A média de um determinado conjunto de dados é dado pelo quociente entre a soma dos valores desse conjunto e o número total de dados, podendo esta poder representada por e traduzida pela equação:
X + X + X + X +...... X
1 2 3 4 n
i=1
Ou
Neste caso a media é dada por:
9 + 16 + 9 + 14 + 10 + 10 + 13 + 18 + 9 + 16 + 17 + 11 + 11 + 8 + 11 + 10
12
16
Neste caso, a média é um bom identificador da zona de maior densidade,uma vez que existe uma zona de densidade mais elevada junto à média
Estudo dos dados: Mediana
A mediana de um conjunto de dados é o número que divide os dados exatamente ao meio. Para determinar o valor da mediana, é necessário ordenar o conjunto de dados.
Para posteriormente escolher aquele que fica no meio (ou, se houver dois números no meio, calcular a média desses dois números).
8 9 9 9 10 10 10 11 11 11 13 14 16 16 17 18
Neste caso a mediana é 11.Esta representa o valor central do conjunto de dados, representando também o segundo quartil(2ºQ) Esta divide os valores de modo a que 50% dos números são superiores e 50% são inferiores a essa mediana
11 +11
=11
Estudo dos dados: Quartís
Após ter sido determinada a mediana e, logo, 2ndo quartil, é possável distinguir também um 1ro e 3ro quartil(1ºQ e 3ºQ respetivamente)
2ºQ
1ºQ
3ºQ
8 9 9 9 10 10 10 11 11 11 13 14 16 16 17 18
O primeiro quartil corresponde à mediana do subconjunto de dados de ordem inferior a mediana de toda a amostra Neste caso 1ºQ =9.5 (provem da média dos dois números que se encontram a meio do subconjunto
O terceiro quartil corresponde a mediana do subconjunto de ordem superior à mediana da amostra Neste caso 3ºQ=15
O 2º quartil corresponde a mediana da amostra, ou seja e o dado que ocupa a posição central da sequência ordenada da amostra Como já vimos, neste caso corresponde a 11
Estudo dos dados: Amplitude da amostra
A amplitude da amostra é dada pelo resultado da subtração do valor mais alto registado com o mais baixo, neste caso estes valores correspondem a 18 e 8 respetivamente
8 9 9 9 10 10 10 11 11 11 13 14 16 16 17 18
18-8 = 10
Assim, podemos afirmar que a amplitude de esta amostra é 10, ou seja, que entre o aluno com a nota mais baixa e o aluno com a nota mais alta existe uma diferença de 10 valores
Estudo dos dados: Amplitude interquartil
A amplitude interquartil corresponde ao resultado da subtração entre a mediana do 3ro quartil e a mediana do 1ro quartil, neste caso estas correspondem a 15 e 9.5 respetivamente
1ºQ
3ºQ
8 9 9 9 10 10 10 11 11 11 13 14 16 16 17 18
3ºQ =15
1ºQ =9.5
15-9.5=5.5
Neste intervalo entre o 1º e 3º quartil encontram-se 50% dos dados recolhidos
Estudo dos dados: Desvio Padrão
O desvio padrão de um conjunto de dados é dado pela expressão:
(x - x )
SS
Sx =
Ou
i=1
Sx =
n-1
n-1
Neste caso, fazendo uso dos dados recolhidos e da média determinada SSx=(8-12) + 3(9-12) + 3(10-12) + 3(11-12) + (13-12) + (14-12) + 2(16-12) + (17-12) + (18-12) = 156 Logo Sx= = 3.2249 Assim o desvio Padrão deste conjunto de dados é 3.2249
156
16-1
Ou seja, os dados estão bastante dispersos em relação à média
Estudo dos dados: Gráfico de barras
Por último construimos um Gráfico de barras a partir dos dados recolhidos
Notas dos alunos da turma na disciplina de Fisico-Química
Abordamento gráfico e intuitivo de distribuições bidimensionais: Diagrama de Dispersão
Para construir um diagrama de dispersão primeiros deveremos representar pontos num gráfico cartesiano, pontos cujas ordenadas representarão as notas obtidas a disciplina de Matemática A e cujas abcissas representem as notas da disciplina de Português Assim as notas da disciplina de Português irão constituir a variável resposta, enquanto as notas da disciplina de Matemática A irão constituir a variável explicativa. No final foi possível construir este Diagrama de dispersão.
Abordamento gráfico e intuitivo de distribuições bidimensionais: Centro de Gravidade da nuvem de pontos e equação da reta de regressão
Pelos dados fornecidos pelo diagrama é possível determinar a equação da reta de regressão entre as variáveis sendo esta: y = 1.11502x -3.5 Assim 1 valor adicional a português está associado a um aumento de 1,11502 em matemática. A dispersão dos pontos ao redor da linha indica a variabilidade nas notas. Também é possível determinar o centro de gravidade da nuvem de pontos, sendo que as suas coordenadas correspondem ás medias de cada uma das variáveis, sendo a abcissa correspondente á média das notas de Português e a ordenada á média das notas de Matemática A . Ou seja ( , ) Neste caso o centro de gravidade corresponde a ( 12.5 , 10.47)
Abordamento gráfico e intuitivo de distribuições bidimensionais: Coeficiente de correlação linear
Podemos obter o coeficiente de correlação linear a partir da expressão:
(y - y )
(x - x )
i=1
r=
SS
SS
Com o uso da calculadora gráfica determinamos que r= 0,7662765607 O coeficiente de correlação linear é uma medida estatistica que quantifica a força e a direção da relação entre duas variáveis, permitindo fazer a previsão de valores que não possuimos Como, por exemplo, poderemos prever que nota teria a Português um aluno que obteve uma nota de 18 valores a matemática apesar de não se ter verificado tal caso
Abordamento gráfico e intuitivo de distribuições bidimensionais: Coeficiente de correlação linear
Com a determinação do coeficiente de correlação linear podemos proceder a concluir o tipo de relação existente entre estas duas variáveis.
Esta correlação varia entre -1 e 1. Neste caso a correlação entre as variáveis é uma correlação positiva forte. Tendo em conta esta correlação positiva forte podemos concluir que se um aluno tem uma nota alta a matemática, podemos esperar, com uma certa confiança, que tenha uma nota alta a português.
Fontes: Neves Maria Augusta Ferreira;Guerreiro Luís;Silva António Pinto.Máximo Parte 2 matemática A 11º Ano.1ªEdição. Porto Editora 2023
Autores do trabalho
Marcos Estrela
Luis Tamayo
Rodrigo Axel
Luís Batalha
Catarina Halimon
"I`m not gonna say its all done, ´cause it ain´t ever all done."-Dimebag Darrel
“It's not how big your pencil is; it's how you write your name.”-Dave Mustaine
"We should Kill `em All"-Cliff Burton
“I choose to live, not just exist"-James Hetfield
“Get Out There and Play”-Marty Friedman
Obrigado!
Whiplash!!!