Módulo 2

Resumo

O curso de extensão com título Ciência de Dados para Cultura usando R II conta 25 vagas e visa aprimorar as habilidades dos participantes na análise de dados com a linguagem R, utilizando o framework tidyverse e o pacote statBasics. O curso abordará temas como probabilidade, variável aleatória, distribuição binomial e normal, intervalo de confiança (para uma e duas populações), teste de hipóteses (para uma e duas populações) e ANOVA. A metodologia do curso será de aula expositiva com uso de recursos de multimídia incluindo projetor e computador, e aula prática em laboratório de informática usando um conjunto de dados reais disponibilizado pelo INEP. O público alvo é Pesquisadores, estudante e trabalhadores da área da cultura e artes. Esse curso será gratuito, com carga horária total de 16 horas com aulas no Instituto de Matemática e Estatística e com emissão de certificado pela UFBA.

Local

Laboratório 140 do Instituto de Matemática e Estatística da Universidade Federal da Bahia.

Metodologia

Metodologia do curso será de aulas expositivas e práticas em laboratório de informática usando a linguagem R.

Conteúdo programático

  1. Breve revisão da linguagem R e do RStudio.
  2. Breve introdução sobre variável aleatória
  3. Distribuição binomial e distribuição normal
  4. Intervalo de confiança para uma e duas populações
  5. Teste de Hipóteses para uma e duas populações
  6. ANOVA

Matriz sintética

Matriz sintética

Slides

Slides - inferência estatística

Arquivos

Arquivos

Código criado na aula pelo professor

Código da sala de aula: codeshare.io/LjWoQ6.

Dados Enem por cidade e participante

Baixe o dicionário de dados: dicionario_enem_2023.xlsx.

Amostra com 3.500 candidatas/os do ENEM na edição de 2023.
id nome .xlsx .csv
1 Joseilton Ferreira Do Nascimento goiania.xlsx goiania.csv
2 Gabriel Rodrigues Pereira jundiai.xlsx jundiai.csv
3 Silvana Lumachi Meireles rio_de_janeiro.xlsx rio_de_janeiro.csv
4 Rodrigo Mota Da Silva sao_luis.xlsx sao_luis.csv
5 Priscila Teixeira Das Neves guarulhos.xlsx guarulhos.csv
6 Raíssa Santos Caldas Almeida maceio.xlsx maceio.csv
7 Fernanda Pimenta Vasconcelos curitiba.xlsx curitiba.csv
8 Mona Ribeiro Nascimento juiz_de_fora.xlsx juiz_de_fora.csv
9 Maria São Pedro Santana Pereira belem.xlsx belem.csv
10 Jalinson Jonas Gomes Da Silva sao_jose_do_rio_preto.xlsx sao_jose_do_rio_preto.csv
11 Ernani Coelho Neto ananindeua.xlsx ananindeua.csv
12 Isadora Rodrigues Moreira Da Silva vila_velha.xlsx vila_velha.csv
13 Lúcia Maria Aquino De Queiroz campo_grande.xlsx campo_grande.csv
14 Breno Domingos De Oliveira campinas.xlsx campinas.csv
15 Caroline Fantinel teresina.xlsx teresina.csv
16 Ellen Mello aparecida_de_goiania.xlsx aparecida_de_goiania.csv
17 Lorena Cerqueira Porto D’ Ávila Melo niteroi.xlsx niteroi.csv
18 Silvia Sara Bezerra Leme brasilia.xlsx brasilia.csv
19 Júlia Melo Salgado caxias_do_sul.xlsx caxias_do_sul.csv
20 Layno Sampaio Pedra mogi_das_cruzes.xlsx mogi_das_cruzes.csv
21 Vitor Breno Rocha Oliveira sao_jose_dos_campos.xlsx sao_jose_dos_campos.csv
22 Thainá Silva De Oliveira osasco.xlsx osasco.csv
23 Ana Carolina Marques De Queiroz Branco sao_bernardo_do_campo.xlsx sao_bernardo_do_campo.csv
24 Daniele Pereira Canedo duque_de_caxias.xlsx duque_de_caxias.csv
25 Luiz Cláudio Dos Santos sao_paulo.xlsx sao_paulo.csv
26 Amanda Haubert Ferreira Coelho cuiaba.xlsx cuiaba.csv
27 Kelvin Jordan Bastos Pena porto_velho.xlsx porto_velho.csv
28 Kátia Maria De Souza Costa porto_alegre.xlsx porto_alegre.csv
29 _ juiz_de_fora.xlsx juiz_de_fora.csv
30 _ niteroi.xlsx niteroi.csv
31 _ sao_luis.xlsx sao_luis.csv
32 _ sao_jose_do_rio_preto.xlsx sao_jose_do_rio_preto.csv
33 _ rio_de_janeiro.xlsx rio_de_janeiro.csv
34 _ brasilia.xlsx brasilia.csv
35 _ mogi_das_cruzes.xlsx mogi_das_cruzes.csv
36 _ campo_grande.xlsx campo_grande.csv
37 _ vila_velha.xlsx vila_velha.csv
38 _ jundiai.xlsx jundiai.csv
39 _ maceio.xlsx maceio.csv
40 _ sao_bernardo_do_campo.xlsx sao_bernardo_do_campo.csv
41 _ curitiba.xlsx curitiba.csv
42 _ guarulhos.xlsx guarulhos.csv
43 _ sao_paulo.xlsx sao_paulo.csv
44 _ duque_de_caxias.xlsx duque_de_caxias.csv
45 _ ananindeua.xlsx ananindeua.csv
46 _ teresina.xlsx teresina.csv
47 _ cuiaba.xlsx cuiaba.csv
48 _ porto_alegre.xlsx porto_alegre.csv
49 _ aparecida_de_goiania.xlsx aparecida_de_goiania.csv
50 _ porto_velho.xlsx porto_velho.csv

R e rstudio

Neste curso, a IDE vamos utilizar é o RStudio. Outras opções populares em ciência de dados são o VScode da Microsoft e JupyterLab, caso você tenha familiaridade ou já trabalhe com este editores sinta a vontade para usá-los.

Caso você não queria ou não possa realizar instalações em seu computador, recomendamos que você use as plataformas Google Colaboratory e/ou Posit Cloud. Recomendamos o uso da plataforma Posit Cloud pelo mesmo estilo e aspecto visual do aplicativo RStudio.

Instalação - R

Para instalar o R em seu computador, basta seguir as instruções em cran.r-project.org. É necessário que você instale a versão 4.1 ou superior do R.

Instalação - rstudio

Depois de ter instalado o R, siga as instruções de instalação em posit.co/downloads.


© 2024 OBEC
Observatório da Economia Criativa