Módulo 1

Resumo

O curso de extensão com título Ciência de Dados para Cultura usando R I conta 25 vagas e visa aprimorar as habilidades dos participantes na análise de dados com a linguagem R, utilizando o framework tidyverse, com foco nos pacotes ggplot2 e dplyr. O curso abordará temas como revisão de Indicadores Culturais, programas de planilha (Google Planilhas), criação de tabelas e gráficos, e computação de medidas de resumo. A metodologia do curso será de aula expositiva com uso de recursos de multimídia incluindo projetor e computador, e aula prática em laboratório de informática usando um conjunto de dados reais disponibilizado pelo INEP. O público alvo é Pesquisadores, estudante e trabalhadores da área da cultura e artes. Esse curso será gratuito, com carga horária total de 16 horas com aulas no Instituto de Matemática e Estatística e com emissão de certificado pela UFBA.

Local

Laboratório 140 do Instituto de Matemática e Estatística da Universidade Federal da Bahia.

Metodologia

Metodologia do curso será de aulas expositivas e práticas em laboratório de informática usando a linguagem R.

Conteúdo programático

  1. Revisão de indicadores culturais;
  2. Breve apresentação de planilhas - Google planilhas;
  3. Apresentação da linguagem R;
  4. Leitura e escrita de arquivos .xslx e .csv;
  5. Tabelas e medidas de resumo usando dplyr.
  6. Visualização de dados usando ggplot2.

Matriz sintética

Matriz sintética

Atividade assíncrona

Gostaríamos de destacar que a realização tarefa assíncrona é critério obrigatório para receber o certificado da UFBA e da UFRB.

Complete até o dia 24/04/2024 o módulo 1 do curso Análise de Dados em Linguagem R da Escola Nacional de Administração Pública: Análise de Dados em Linguagem R - Escola Nacional de Administração Pública.

Slides

Slides - planilhas, linguagem R e Estatística e Ciência de Dados
Slides - indicadores culturais

Arquivos

Arquivos

Código criado na aula pelo professor

Código da sala de aula: codeshare.io/LjWoQ6.

Dados Enem por cidade e participante

Baixe o dicionário de dados: dicionario_enem_2023.xlsx.

Amostra com 3.500 candidatas/os do ENEM na edição de 2023.
id nome .xlsx .csv
1 Joseilton Ferreira Do Nascimento goiania.xlsx goiania.csv
2 Gabriel Rodrigues Pereira jundiai.xlsx jundiai.csv
3 Silvana Lumachi Meireles rio_de_janeiro.xlsx rio_de_janeiro.csv
4 Rodrigo Mota Da Silva sao_luis.xlsx sao_luis.csv
5 Priscila Teixeira Das Neves guarulhos.xlsx guarulhos.csv
6 Raíssa Santos Caldas Almeida maceio.xlsx maceio.csv
7 Fernanda Pimenta Vasconcelos curitiba.xlsx curitiba.csv
8 Mona Ribeiro Nascimento juiz_de_fora.xlsx juiz_de_fora.csv
9 Maria São Pedro Santana Pereira belem.xlsx belem.csv
10 Jalinson Jonas Gomes Da Silva sao_jose_do_rio_preto.xlsx sao_jose_do_rio_preto.csv
11 Ernani Coelho Neto ananindeua.xlsx ananindeua.csv
12 Isadora Rodrigues Moreira Da Silva vila_velha.xlsx vila_velha.csv
13 Lúcia Maria Aquino De Queiroz campo_grande.xlsx campo_grande.csv
14 Breno Domingos De Oliveira campinas.xlsx campinas.csv
15 Caroline Fantinel teresina.xlsx teresina.csv
16 Ellen Mello aparecida_de_goiania.xlsx aparecida_de_goiania.csv
17 Lorena Cerqueira Porto D’ Ávila Melo niteroi.xlsx niteroi.csv
18 Silvia Sara Bezerra Leme brasilia.xlsx brasilia.csv
19 Júlia Melo Salgado caxias_do_sul.xlsx caxias_do_sul.csv
20 Layno Sampaio Pedra mogi_das_cruzes.xlsx mogi_das_cruzes.csv
21 Vitor Breno Rocha Oliveira sao_jose_dos_campos.xlsx sao_jose_dos_campos.csv
22 Thainá Silva De Oliveira osasco.xlsx osasco.csv
23 Ana Carolina Marques De Queiroz Branco sao_bernardo_do_campo.xlsx sao_bernardo_do_campo.csv
24 Daniele Pereira Canedo duque_de_caxias.xlsx duque_de_caxias.csv
25 Luiz Cláudio Dos Santos sao_paulo.xlsx sao_paulo.csv
26 Amanda Haubert Ferreira Coelho cuiaba.xlsx cuiaba.csv
27 Kelvin Jordan Bastos Pena porto_velho.xlsx porto_velho.csv
28 Kátia Maria De Souza Costa porto_alegre.xlsx porto_alegre.csv
29 _ juiz_de_fora.xlsx juiz_de_fora.csv
30 _ niteroi.xlsx niteroi.csv
31 _ sao_luis.xlsx sao_luis.csv
32 _ sao_jose_do_rio_preto.xlsx sao_jose_do_rio_preto.csv
33 _ rio_de_janeiro.xlsx rio_de_janeiro.csv
34 _ brasilia.xlsx brasilia.csv
35 _ mogi_das_cruzes.xlsx mogi_das_cruzes.csv
36 _ campo_grande.xlsx campo_grande.csv
37 _ vila_velha.xlsx vila_velha.csv
38 _ jundiai.xlsx jundiai.csv
39 _ maceio.xlsx maceio.csv
40 _ sao_bernardo_do_campo.xlsx sao_bernardo_do_campo.csv
41 _ curitiba.xlsx curitiba.csv
42 _ guarulhos.xlsx guarulhos.csv
43 _ sao_paulo.xlsx sao_paulo.csv
44 _ duque_de_caxias.xlsx duque_de_caxias.csv
45 _ ananindeua.xlsx ananindeua.csv
46 _ teresina.xlsx teresina.csv
47 _ cuiaba.xlsx cuiaba.csv
48 _ porto_alegre.xlsx porto_alegre.csv
49 _ aparecida_de_goiania.xlsx aparecida_de_goiania.csv
50 _ porto_velho.xlsx porto_velho.csv

R e rstudio

Neste curso, a IDE vamos utilizar é o RStudio. Outras opções populares em ciência de dados são o VScode da Microsoft e JupyterLab, caso você tenha familiaridade ou já trabalhe com este editores sinta a vontade para usá-los.

Caso você não queria ou não possa realizar instalações em seu computador, recomendamos que você use as plataformas Google Colaboratory e/ou Posit Cloud. Recomendamos o uso da plataforma Posit Cloud pelo mesmo estilo e aspecto visual do aplicativo RStudio.

Instalação - R

Para instalar o R em seu computador, basta seguir as instruções em cran.r-project.org. É necessário que você instale a versão 4.1 ou superior do R.

Instalação - rstudio

Depois de ter instalado o R, siga as instruções de instalação em posit.co/downloads/rstudio-desktop.


© 2024 OBEC
Observatório da Economia Criativa