From 76360381b6863576cb7d0cc997a947b22d84b68c Mon Sep 17 00:00:00 2001 From: Soraia Jacome Date: Thu, 8 Aug 2024 22:07:29 -0300 Subject: [PATCH] Adicionei a pasta Soraia com a atividade da semana --- Soraia/soraias10.ipynb | 397 +++++++++++++++++++++++++++++++++++++++++ 1 file changed, 397 insertions(+) create mode 100644 Soraia/soraias10.ipynb diff --git a/Soraia/soraias10.ipynb b/Soraia/soraias10.ipynb new file mode 100644 index 0000000..aa44a43 --- /dev/null +++ b/Soraia/soraias10.ipynb @@ -0,0 +1,397 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Exercício 1: \n", + "Um nutricionista quer testar se a ingestão diária média de calorias de um grupo de 30 pessoas é diferente de 2000 calorias. Os dados das calorias ingeridas são fornecidos abaixo. Realize o teste de hipóteses usando um nível de significância de 0,05.\n", + "\n", + "Dados: [1900, 2100, 2050, 1980, 1950, 2100, 2000, 2150, 2200, 1850, 1990, 1950, 2050, 2080, 2100, 1900, 1950, 2050, 2150, 2000, 2200, 1900, 2100, 2000, 2150, 1850, 1990, 1950, 2050, 2080]" + ] + }, + { + "cell_type": "code", + "execution_count": 4, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "O teste estatístico é igual: 1.44\n", + "O valor p é igual a: 0.16\n", + "aceitamos a hipotese nula\n" + ] + } + ], + "source": [ + "#test T por ser uma comparação de médias\n", + "\n", + "from scipy.stats import ttest_1samp\n", + "#teste de hipótese\n", + "#H0: as médias = 2000\n", + "#H1: as médias != 2000\n", + "\n", + "dados = [1900, 2100, 2050, 1980, 1950, 2100, 2000, 2150, 2200, 1850, 1990, 1950, 2050, 2080, 2100, 1900, 1950, 2050, 2150, 2000, 2200, 1900, 2100, 2000, 2150, 1850, 1990, 1950, 2050, 2080]\n", + "\n", + "t_estatistico, p_valor = ttest_1samp(dados, 2000)\n", + "print(f\"O teste estatístico é igual: {t_estatistico:.2f}\")\n", + "print(f\"O valor p é igual a: {p_valor:.2f}\")\n", + "\n", + "confianca = 0.95\n", + "significancia = 1 - confianca\n", + "if p_valor < significancia:\n", + " print(\"Rejeitamos a hipótese nula\")\n", + "else:\n", + " print(\"aceitamos a hipotese nula\")" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Exercício 2:\n", + "\n", + "Um pesquisador deseja verificar se há uma diferença significativa entre as notas de alunos de duas turmas diferentes após um novo método de ensino. As notas das duas turmas são:\n", + "\n", + "Turma A: [85, 78, 90, 88, 76, 95, 89, 84]\n", + "Turma B: [82, 75, 85, 80, 79, 88, 83, 77]\n", + "\n", + "Realize o teste de hipóteses para comparar as médias das duas turmas usando um nível de significância de 0,05." + ] + }, + { + "cell_type": "code", + "execution_count": 2, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "O teste estatístico é igual: 1.67\n", + "O valor p é igual a: 0.12\n", + "aceitamos a hipotese nula\n" + ] + } + ], + "source": [ + "#test T por ser uma comparação de médias\n", + "\n", + "from scipy.stats import ttest_ind\n", + "#teste de hipótese\n", + "#H0: não há diferença entre as médias\n", + "#H1: há diferença entre as médias\n", + "\n", + "#Turma A: [85, 78, 90, 88, 76, 95, 89, 84]\n", + "#Turma B: [82, 75, 85, 80, 79, 88, 83, 77]\n", + "\n", + "\n", + "a = [85, 78, 90, 88, 76, 95, 89, 84]\n", + "\n", + "b = [82, 75, 85, 80, 79, 88, 83, 77]\n", + "\n", + "\n", + "t_estatistico, p_valor = ttest_ind(a,b)\n", + "print(f\"O teste estatístico é igual: {t_estatistico:.2f}\")\n", + "print(f\"O valor p é igual a: {p_valor:.2f}\")\n", + "\n", + "confianca = 0.95\n", + "significancia = 1 - confianca\n", + "if p_valor < significancia:\n", + " print(\"Rejeitamos a hipótese nula\")\n", + "else:\n", + " print(\"aceitamos a hipotese nula\")\n" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Exercício 3:\n", + "\n", + "Uma empresa testou a eficácia de um novo software em dois períodos de tempo. Os tempos (em minutos) para concluir uma tarefa antes e depois do uso do software são registrados abaixo. Determine se houve uma melhoria significativa no tempo de conclusão da tarefa.\n", + "\n", + "Antes: [30, 28, 35, 33, 40, 29, 32, 36]\n", + "Depois: [25, 22, 30, 28, 35, 27, 30, 31]" + ] + }, + { + "cell_type": "code", + "execution_count": 3, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "O teste estatístico é igual: 8.22\n", + "O valor p é igual a: 0.0000767985\n", + "Rejeitamos a hipótese nula\n" + ] + } + ], + "source": [ + "from scipy.stats import ttest_rel\n", + "#teste de hipótese\n", + "#H0: há diferença entre antes e depois\n", + "#H1: há diferença entre entre antes e depois\n", + "\n", + "#Antes: [30, 28, 35, 33, 40, 29, 32, 36]\n", + "#Depois: [25, 22, 30, 28, 35, 27, 30, 31]\n", + "\n", + "a = [30, 28, 35, 33, 40, 29, 32, 36]\n", + "d = [25, 22, 30, 28, 35, 27, 30, 31]\n", + "\n", + "t_estatistico, p_valor = ttest_rel(a,d)\n", + "print(f\"O teste estatístico é igual: {t_estatistico:.2f}\")\n", + "print(f\"O valor p é igual a: {p_valor:.10f}\")\n", + "\n", + "confianca = 0.95\n", + "significancia = 1 - confianca\n", + "if p_valor < significancia:\n", + " print(\"Rejeitamos a hipótese nula\")\n", + "else:\n", + " print(\"aceitamos a hipotese nula\")" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Exercício 4:\n", + "\n", + "Uma pesquisa foi realizada para verificar a preferência de 100 pessoas por dois tipos de bebidas, A e B, em duas cidades diferentes, X e Y. A tabela de contingência a seguir mostra os resultados:\n", + "\n", + "Cidade X\tCidade Y\n", + "Bebida A\t30\t40\n", + "Bebida B\t20\t10\n", + "\n", + "Verifique se há uma relação significativa entre a cidade e a preferência pela bebida." + ] + }, + { + "cell_type": "code", + "execution_count": 6, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "O teste estatístico é igual: 1.44\n", + "O valor p é igual a: 0.0495\n", + "Rejeitamos a hipótese nula\n" + ] + } + ], + "source": [ + "import numpy as np\n", + "from scipy.stats import chi2_contingency\n", + "dados = np.array([[30, 40],[20, 10]]) \n", + "\n", + "# H0: Não há relação \n", + "# H1: Há a relação\n", + "estatistica, p_valor, grau_de_liberdade, matriz_frequencia = chi2_contingency(dados)\n", + "print(f\"O teste estatístico é igual: {t_estatistico:.2f}\")\n", + "print(f\"O valor p é igual a: {p_valor:.4f}\")\n", + "\n", + "confianca = 0.95\n", + "significancia = 1 - confianca\n", + "if p_valor < significancia:\n", + " print(\"Rejeitamos a hipótese nula\")\n", + "else:\n", + " print(\"aceitamos a hipotese nula\")" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Exercício 5:\n", + "\n", + "Um pesquisador deseja testar se três diferentes tipos de fertilizantes têm um efeito significativo no crescimento de plantas. Os crescimentos das plantas (em cm) para cada fertilizante são dados abaixo:\n", + "\n", + "Fertilizante A: [20, 22, 19, 21, 20]\n", + "Fertilizante B: [18, 20, 17, 19, 18]\n", + "Fertilizante C: [25, 27, 26, 28, 26]\n", + "Realize uma ANOVA de uma via para verificar se há uma diferença significativa entre os grupos." + ] + }, + { + "cell_type": "code", + "execution_count": 5, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "O teste estatístico é igual: 1.440678\n", + "O valor p é igual a: 0.0000003169\n", + "Rejeitamos a hipótese nula\n" + ] + } + ], + "source": [ + "from scipy.stats import f_oneway\n", + "\n", + "fertilizante_a = [20, 22, 19, 21, 20]\n", + "fertilizante_b = [18, 20, 17, 19, 18]\n", + "fertilizante_c = [25, 27, 26, 28, 26]\n", + "\n", + "#H0: as medias de crescimento dos fertilizantes são iguais.\n", + "#H1: pelo menos uma média de crescimento dos fertilizantes é diferente.\n", + "\n", + "estatistica, p_valor = f_oneway(fertilizante_a, fertilizante_b, fertilizante_c)\n", + "print(f\"O teste estatístico é igual: {t_estatistico:4f}\")\n", + "print(f\"O valor p é igual a: {p_valor:.10f}\")\n", + "\n", + "confianca = 0.95\n", + "significancia = 1 - confianca\n", + "if p_valor < significancia:\n", + " print(\"Rejeitamos a hipótese nula\")\n", + "else:\n", + " print(\"aceitamos a hipotese nula\")" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "# Extras\n", + "\n", + "### Exercício 1: \n", + "Um estudo está sendo realizado para comparar o efeito de três métodos diferentes de estudo na performance dos alunos em um exame. As pontuações dos alunos são registradas para cada método:\n", + "\n", + "Método A: [85, 87, 90, 86, 88]\n", + "Método B: [80, 82, 78, 81, 79]\n", + "Método C: [92, 91, 93, 89, 94]\n", + "Use ANOVA de uma via para determinar se existe uma diferença significativa nas pontuações dos alunos entre os três métodos." + ] + }, + { + "cell_type": "code", + "execution_count": 7, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "O teste estatístico é igual: 1.440678\n", + "O valor p é igual a: 0.0000010414\n", + "Rejeitamos a hipótese nula\n" + ] + } + ], + "source": [ + "from scipy.stats import f_oneway\n", + "\n", + "metodo_a = [85, 87, 90, 86, 88]\n", + "metodo_b =[80, 82, 78, 81, 79]\n", + "metodo_c = [92, 91, 93, 89, 94]\n", + "\n", + "#H0: as medias dos métodos são iguais.\n", + "#H1: pelo menos uma média dos métodos é diferente.\n", + "\n", + "estatistica, p_valor = f_oneway(metodo_a, metodo_b, metodo_c)\n", + "print(f\"O teste estatístico é igual: {t_estatistico:4f}\")\n", + "print(f\"O valor p é igual a: {p_valor:.10f}\")\n", + "\n", + "confianca = 0.95\n", + "significancia = 1 - confianca\n", + "if p_valor < significancia:\n", + " print(\"Rejeitamos a hipótese nula\")\n", + "else:\n", + " print(\"aceitamos a hipotese nula\")" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Exercício 2: \n", + "\n", + "Uma empresa deseja realizar uma pesquisa de satisfação com seus clientes. A população de clientes é dividida em três categorias: Regular, Premium e VIP. A empresa quer garantir que cada categoria seja representada proporcionalmente na amostra. A população total é de 10.000 clientes, sendo 5.000 regulares, 3.000 premium, e 2.000 VIP. Se a amostra total deve ser de 500 clientes, quantos clientes de cada categoria devem ser incluídos na amostra?" + ] + }, + { + "cell_type": "code", + "execution_count": 6, + "metadata": {}, + "outputs": [], + "source": [ + "import random\n", + "populacao = {\n", + " 'regular': [list(range(1,5001))],\n", + " 'premium': [list(range(1,3001))],\n", + " 'vip': [list(range(1,2001))]\n", + "}" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Exercício 3: \n", + "\n", + "Uma empresa registrou o tempo (em horas) que seus funcionários gastam em atividades não relacionadas ao trabalho durante uma semana. Os tempos registrados foram: [1.5, 2.0, 1.0, 2.5, 3.0, 2.0, 1.5, 2.5, 3.5, 4.0]. Calcule o desvio padrão desses tempos." + ] + }, + { + "cell_type": "code", + "execution_count": 9, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "O desvio padrão é: 0.896\n" + ] + } + ], + "source": [ + "#desvio padrão\n", + "import math\n", + "\n", + "dados = [1.5, 2.0, 1.0, 2.5, 3.0, 2.0, 1.5, 2.5, 3.5, 4.0]\n", + "\n", + "soma = sum(dados)\n", + "quantidade = len(dados)\n", + "media = soma /quantidade\n", + "\n", + "soma_quadrados_dif = sum((x - media)** 2 for x in dados)\n", + "\n", + "variancia = soma_quadrados_dif / len(dados)\n", + "\n", + "desvio_padrao = math.sqrt(variancia)\n", + "\n", + "print(f\"O desvio padrão é: {desvio_padrao:.3f}\")\n" + ] + } + ], + "metadata": { + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.12.4" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +}