Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Revisão checkpoint 1 #1

Open
wants to merge 1 commit into
base: master
Choose a base branch
from
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
45 changes: 33 additions & 12 deletions reports/eda-sense8.Rmd
Original file line number Diff line number Diff line change
@@ -1,18 +1,19 @@
---
title: "EDA Sense8"
output:
html_notebook:
toc: yes
toc_float: yes
html_document:
df_print: paged
toc: yes
toc_float: yes
html_notebook:
toc: yes
toc_float: yes
---

```{r setup, echo=FALSE, warning=FALSE, message=FALSE}
library(tidyverse)
library(here)
library(knitr)
theme_set(theme_bw())
```

Expand Down Expand Up @@ -53,9 +54,10 @@ Outro dado que eu também achei interessante verificar foi a média de votos par

```{r}
votes_means = episodes %>%
group_by(series_name) %>%
summarise(mean = mean(user_votes)) %>%
glimpse
group_by(Série = series_name) %>%
summarise(Média = round(mean(user_votes),2))
votes_means %>%
kable()
```

##Qual das séries que você escolheu é mais bem avaliada no IMDB? A diferença é grande? Pequena? Muda de acordo com as temporadas da série?
Expand All @@ -64,9 +66,10 @@ A média geral da avaliação dos usuários de 'Xena a Princesa Guerreira' é ma

```{r}
means = episodes %>%
group_by(series_name) %>%
summarise(mean(user_rating)) %>%
glimpse
group_by(Série = series_name) %>%
summarise(Média = round(mean(user_rating),2))

means %>% kable()
```


Expand All @@ -78,16 +81,34 @@ season_means = episodes %>%

```{r}
season_means %>%
ggplot(aes(x = season, y = mean)) +
labs (x = "Temporadas", y = "Média das avaliações") +
geom_point() + facet_wrap(~ series_name)
ggplot(aes(x = season, y = mean, group = series_name, color = series_name)) +
geom_point() +
geom_line() +
labs (x = "Temporadas", y = "Média das avaliações", color = "Série")
```

##Qual das séries que você escolheu tem episódios de qualidade mais irregular segundo o IMDB? A diferença é grande? Pequena?

O que podemos observar é que, 'Thundercats'apresentou inicialmente uma maior irregularidade nas avaliações das suas primeiras temporadas, podemos observar que o gráfico apresenta vários picos, tanto negativos como positivos com o decorrer dos episódios, chegando a ter uma diferença de mais de 2 pontos de um episódio para outro dentro de uma mesma temporada, porém essas diferenças foram diminuindo mais próximo do fim da série apresentando uma diferença de pouco mais de meio ponto. Ja em 'Xena' ocorre o contrário, nas 3 primeiras temporadas a diferença é menor entre a qualidade dos episódio e quando observamos as avaliações da 4ª temporada em diante os dados começam a apresentar uma variação mais acentuada, chegando a ter mais de 2 pontos de diferença em episódios em uma única temporada.

>> Os dois plots abaixo são apenas sugestões de visualização, por isso, não inclui interpretação para eles no texto

```{r}
episodes %>%
ggplot(aes(x = season, y = user_rating, color = season)) +
geom_boxplot() +
geom_jitter(alpha = 0.3) +
facet_wrap(~series_name, scales = "free_x") +
theme(legend.position="none") +
labs(x = "Temporada", y = "Avaliações dos usuários")

episodes %>%
ggplot(aes(x = series_name, y = user_rating, color = series_name)) +
geom_boxplot() +
geom_jitter(alpha = 0.3) +
theme(legend.position="none") +
labs(x = "Série", y = "Avaliações dos usuários")

episodes %>%
ggplot(aes(x = series_ep, y = user_rating, color = season)) +
labs(x = "Episódios", y = "Avaliações dos usuários") +
Expand Down
145 changes: 129 additions & 16 deletions reports/eda-sense8.html

Large diffs are not rendered by default.