From 40de9ac36e25a1fdeb01b017b37c4509ff8668cb Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Sun, 17 May 2020 23:20:24 -0300 Subject: [PATCH 01/21] Corrigindo path --- reports/comentarios-e-cultura.Rmd | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index d56ad27..e0e8ef3 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -10,7 +10,7 @@ theme: sandstone library(tidyverse) library(here) library(viridis) -source(here::here("code/lib.R")) +source(here::here("code/import_data.R")) theme_set(theme_bw()) knitr::opts_chunk$set(tidy = FALSE, From 0758e8de1efa6a4cd3244b69568ec92ebc2fd9c8 Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Sun, 17 May 2020 23:26:08 -0300 Subject: [PATCH 02/21] Corrigindo nome de biblioteca --- reports/comentarios-e-cultura.Rmd | 93 ++++++++++++++++++++++++------- 1 file changed, 74 insertions(+), 19 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index e0e8ef3..36a71b7 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -1,13 +1,4 @@ ---- -title: "Comentários e cultura" -output: - html_document: - df_print: paged -theme: sandstone ---- - -```{r echo=FALSE, message=FALSE, warning=FALSE} -library(tidyverse) +ibrary(tidyverse) library(here) library(viridis) source(here::here("code/import_data.R")) @@ -16,9 +7,7 @@ theme_set(theme_bw()) knitr::opts_chunk$set(tidy = FALSE, fig.width = 6, fig.height = 5) -``` -```{r read} dados = read_csv( here::here("data/participation-per-country.csv"), col_types = cols( @@ -31,24 +20,90 @@ dados = read_csv( six_regions = col_character(), `World bank income group 2017` = col_character() ) -) %>% +) %>% filter(usuarios > 200) glimpse(dados) -``` -Estamos interessados na relação entre quanto as pessoas de diferentes países comentam em questões dos outros. A proporção das pessoas do país que comentou nas questões de outros está medido na variável `comentaram_prop`. -Considerando essa variável, queremos examinar a relação entre ela e o quão hierárquicas são as relações em um país (`PDI`). Queremos também levar em conta o quanto as pessoas daquele país têm acesso à Internet (`Internet`) e qual o tamanho da base de dados que detectamos daquele país (`usuarios`). +#Estamos interessados na relação entre quanto as pessoas de diferentes países comentam em questões dos outros. A proporção das pessoas do país que comentou nas questões de outros está medido na variável `comentaram_prop`. + +#Considerando essa variável, queremos examinar a relação entre ela e o quão hierárquicas são as relações em um país (`PDI`). Queremos também levar em conta o quanto as pessoas daquele país têm acesso à Internet (`Internet`) e qual o tamanho da base de dados que detectamos daquele país (`usuarios`). ## Examinando essa relação +dados %>% + ggplot(aes(x = PDI, y = responderam_prop)) + + geom_point() + +dados %>% + ggplot(aes(x = PDI, y = responderam_prop, color = site)) + + geom_point() + +dados %>% + ggplot(aes( + x = PDI, + y = responderam_prop, + color = Internet, + size = log10(usuarios) + )) + + geom_point(alpha = .6) + +dados %>% + ggplot(aes( + size = PDI, + y = responderam_prop, + color = Internet, + x = log10(usuarios) + )) + + geom_point(alpha = .6) -Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto. +dados %>% + ggplot(aes( + x = PDI, + y = responderam_prop, + color = Internet, + size = log10(usuarios) + )) + + geom_point(alpha = .6) + + facet_grid(site ~ ., scales = "free_y") + +dados %>% + ggplot(aes( + x = PDI, + y = responderam_prop, + size = Internet, + color = log10(usuarios) + )) + + geom_point(alpha = .6) + + facet_grid(site ~ ., scales = "free_y") + +#Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto. ## Outras formas de ver -Em seguida, faça 5 visualizações que usem as mesmas variáveis e também pontos, mas que sejam **menos eficazes** que a que você escolheu acima. +#Em seguida, faça 5 visualizações que usem as mesmas variáveis e também pontos, mas que sejam **menos eficazes** que a que você escolheu acima. ## Bônus -Inclua o continente dos países (`six_regions`) na visualização. +#Inclua o continente dos países (`six_regions`) na visualização. +dados %>% + ggplot(aes( + x = PDI, + y = responderam_prop, + size = Internet, + color = log10(usuarios) + )) + + geom_point(alpha = .6) + + facet_grid(six_regions ~ ., scales = "free_y") + +dados %>% + ggplot(aes( + x = PDI, + y = responderam_prop, + size = Internet, + color = log10(usuarios) + )) + + geom_point(alpha = .6) + + facet_grid(six_regions ~ ., scales = "free_x",drop=TRUE) + + six_regions_update<-dados %>% filter(dados$six_regions ) From 81649df133ed7b06da3c9c5e95b2ad113ee8a2fa Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Mon, 18 May 2020 00:03:59 -0300 Subject: [PATCH 03/21] =?UTF-8?q?Implementando=20as=20quest=C3=B5es=20prop?= =?UTF-8?q?ostas.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 70 ++++++++----------------------- reports/participations.Rmd | 2 +- 2 files changed, 19 insertions(+), 53 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index 36a71b7..d10f69d 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -1,4 +1,5 @@ -ibrary(tidyverse) +```{r echo=FALSE, message=FALSE, warning=FALSE} +library(tidyverse) library(here) library(viridis) source(here::here("code/import_data.R")) @@ -7,7 +8,9 @@ theme_set(theme_bw()) knitr::opts_chunk$set(tidy = FALSE, fig.width = 6, fig.height = 5) +``` +```{r read} dados = read_csv( here::here("data/participation-per-country.csv"), col_types = cols( @@ -23,87 +26,50 @@ dados = read_csv( ) %>% filter(usuarios > 200) glimpse(dados) + ``` +Estamos interessados na relação entre quanto as pessoas de diferentes países comentam em questões dos outros. A proporção das pessoas do país que comentou nas questões de outros está medido na variável `comentaram_prop`. -#Estamos interessados na relação entre quanto as pessoas de diferentes países comentam em questões dos outros. A proporção das pessoas do país que comentou nas questões de outros está medido na variável `comentaram_prop`. - -#Considerando essa variável, queremos examinar a relação entre ela e o quão hierárquicas são as relações em um país (`PDI`). Queremos também levar em conta o quanto as pessoas daquele país têm acesso à Internet (`Internet`) e qual o tamanho da base de dados que detectamos daquele país (`usuarios`). +Considerando essa variável, queremos examinar a relação entre ela e o quão hierárquicas são as relações em um país (`PDI`). Queremos também levar em conta o quanto as pessoas daquele país têm acesso à Internet (`Internet`) e qual o tamanho da base de dados que detectamos daquele país (`usuarios`). ## Examinando essa relação + ```{r} dados %>% - ggplot(aes(x = PDI, y = responderam_prop)) + + ggplot(aes(x = PDI, y = comentaram_prop)) + geom_point() dados %>% - ggplot(aes(x = PDI, y = responderam_prop, color = site)) + + ggplot(aes(x = PDI, y = comentaram_prop, color = site)) + geom_point() dados %>% ggplot(aes( x = PDI, - y = responderam_prop, + y = comentaram_prop, color = Internet, size = log10(usuarios) )) + geom_point(alpha = .6) -dados %>% - ggplot(aes( - size = PDI, - y = responderam_prop, - color = Internet, - x = log10(usuarios) - )) + - geom_point(alpha = .6) dados %>% ggplot(aes( x = PDI, - y = responderam_prop, + y = comentaram_prop, color = Internet, size = log10(usuarios) )) + geom_point(alpha = .6) + facet_grid(site ~ ., scales = "free_y") - -dados %>% - ggplot(aes( - x = PDI, - y = responderam_prop, - size = Internet, - color = log10(usuarios) - )) + - geom_point(alpha = .6) + - facet_grid(site ~ ., scales = "free_y") - -#Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto. +``` +Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto. ## Outras formas de ver -#Em seguida, faça 5 visualizações que usem as mesmas variáveis e também pontos, mas que sejam **menos eficazes** que a que você escolheu acima. - -## Bônus +Em seguida, faça 5 visualizações que usem as mesmas variáveis e também pontos, mas que sejam **menos eficazes** que a que você escolheu acima. -#Inclua o continente dos países (`six_regions`) na visualização. -dados %>% - ggplot(aes( - x = PDI, - y = responderam_prop, - size = Internet, - color = log10(usuarios) - )) + - geom_point(alpha = .6) + - facet_grid(six_regions ~ ., scales = "free_y") - -dados %>% - ggplot(aes( - x = PDI, - y = responderam_prop, - size = Internet, - color = log10(usuarios) - )) + - geom_point(alpha = .6) + - facet_grid(six_regions ~ ., scales = "free_x",drop=TRUE) +Bônus - six_regions_update<-dados %>% filter(dados$six_regions ) +Inclua o continente dos países (`six_regions`) na visualização. + diff --git a/reports/participations.Rmd b/reports/participations.Rmd index ceeb6e1..91125fc 100644 --- a/reports/participations.Rmd +++ b/reports/participations.Rmd @@ -10,7 +10,7 @@ theme: sandstone library(tidyverse) library(here) library(viridis) -source(here::here("code/lib.R")) +source(here::here("code/import_data.R")) theme_set(theme_bw()) knitr::opts_chunk$set(tidy = FALSE, From 37446722b88623c61118fd2dff71337f1883b50c Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Mon, 18 May 2020 00:06:28 -0300 Subject: [PATCH 04/21] =?UTF-8?q?Realizando=20an=C3=A1lises.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.html | 511 +++++++++++++++++++++++++++ reports/participations.html | 542 +++++++++++++++++++++++++++++ 2 files changed, 1053 insertions(+) create mode 100644 reports/comentarios-e-cultura.html create mode 100644 reports/participations.html diff --git a/reports/comentarios-e-cultura.html b/reports/comentarios-e-cultura.html new file mode 100644 index 0000000..28e96fc --- /dev/null +++ b/reports/comentarios-e-cultura.html @@ -0,0 +1,511 @@ + + + + + + + + + + + + + +comentarios-e-cultura.utf8 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+ + + + + + + +
dados = read_csv(
+    here::here("data/participation-per-country.csv"),
+    col_types = cols(
+        .default = col_double(),
+        site = col_character(),
+        country = col_character(),
+        geo = col_character(),
+        four_regions = col_character(),
+        eight_regions = col_character(),
+        six_regions = col_character(),
+        `World bank income group 2017` = col_character()
+    )
+) %>%
+    filter(usuarios > 200)
+glimpse(dados)
+
## Rows: 121
+## Columns: 21
+## $ site                           <chr> "StackOverflow", "StackOverflow", "Sta…
+## $ country                        <chr> "Argentina", "Australia", "Austria", "…
+## $ PDI                            <dbl> 49, 36, 11, 80, 65, 69, 70, 39, 63, 80…
+## $ IDV                            <dbl> 46, 90, 55, 20, 75, 38, 30, 80, 23, 20…
+## $ MAS                            <dbl> 56, 61, 79, 55, 54, 49, 40, 52, 28, 66…
+## $ UAI                            <dbl> 86, 51, 70, 60, 94, 76, 85, 48, 86, 30…
+## $ usuarios                       <dbl> 2798, 12313, 2518, 2558, 4275, 10717, …
+## $ responderam_prop               <dbl> 0.5357398, 0.6133355, 0.6310564, 0.392…
+## $ perguntaram_prop               <dbl> 0.5210865, 0.5897832, 0.5933280, 0.475…
+## $ editaram_prop                  <dbl> 0.09256612, 0.14699911, 0.14932486, 0.…
+## $ comentaram_prop                <dbl> 0.25339528, 0.33395598, 0.35027800, 0.…
+## $ GNI                            <dbl> NA, 59570, 48160, 840, 44990, 11630, 6…
+## $ Internet                       <dbl> 51.0, 79.5, 79.8, 5.0, 78.0, 45.0, 51.…
+## $ EPI                            <dbl> 59.02, NA, 63.21, NA, 61.21, 49.96, NA…
+## $ geo                            <chr> "arg", "aus", "aut", "bgd", "bel", "br…
+## $ four_regions                   <chr> "americas", "asia", "europe", "asia", …
+## $ eight_regions                  <chr> "america_south", "east_asia_pacific", …
+## $ six_regions                    <chr> "america", "east_asia_pacific", "europ…
+## $ Latitude                       <dbl> -34.00000, -25.00000, 47.33333, 24.000…
+## $ Longitude                      <dbl> -64.00000, 135.00000, 13.33333, 90.000…
+## $ `World bank income group 2017` <chr> "Upper middle income", "High income", …
+

Estamos interessados na relação entre quanto as pessoas de diferentes países comentam em questões dos outros. A proporção das pessoas do país que comentou nas questões de outros está medido na variável comentaram_prop.

+

Considerando essa variável, queremos examinar a relação entre ela e o quão hierárquicas são as relações em um país (PDI). Queremos também levar em conta o quanto as pessoas daquele país têm acesso à Internet (Internet) e qual o tamanho da base de dados que detectamos daquele país (usuarios).

+
+

Examinando essa relação

+
dados %>%
+   ggplot(aes(x = PDI, y = responderam_prop)) +
+   geom_point()
+

+
dados %>%
+   ggplot(aes(x = PDI, y = responderam_prop, color = site)) +
+   geom_point()
+

+
dados %>%
+   ggplot(aes(
+       x = PDI,
+       y = responderam_prop,
+       color = Internet,
+       size = log10(usuarios)
+   )) +
+   geom_point(alpha = .6)
+

+
dados %>%
+   ggplot(aes(
+       size = PDI,
+       y = responderam_prop,
+       color = Internet,
+       x = log10(usuarios)
+   )) +
+   geom_point(alpha = .6)
+

+
dados %>%
+   ggplot(aes(
+       x = PDI,
+       y = responderam_prop,
+       color = Internet,
+       size = log10(usuarios)
+   )) +
+   geom_point(alpha = .6) +
+   facet_grid(site ~ ., scales = "free_y")
+

+
dados %>%
+   ggplot(aes(
+       x = PDI,
+       y = responderam_prop,
+       size = Internet,
+       color = log10(usuarios)
+   )) +
+   geom_point(alpha = .6) +
+   facet_grid(site ~ ., scales = "free_y")
+
## Warning: Removed 3 rows containing missing values (geom_point).
+

Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto.

+
+
+

Outras formas de ver

+

Em seguida, faça 5 visualizações que usem as mesmas variáveis e também pontos, mas que sejam menos eficazes que a que você escolheu acima.

+

Bônus

+

Inclua o continente dos países (six_regions) na visualização.

+
+ + + + +
+ + + + + + + + + + + + + + + diff --git a/reports/participations.html b/reports/participations.html new file mode 100644 index 0000000..95ef0fb --- /dev/null +++ b/reports/participations.html @@ -0,0 +1,542 @@ + + + + + + + + + + + + + +REPLACE ME + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+ + + + + + + +
dados = read_csv(
+    here::here("data/participation-per-country.csv"),
+    col_types = cols(
+        .default = col_double(),
+        site = col_character(),
+        country = col_character(),
+        geo = col_character(),
+        four_regions = col_character(),
+        eight_regions = col_character(),
+        six_regions = col_character(),
+        `World bank income group 2017` = col_character()
+    )
+) %>% 
+    filter(usuarios > 200)
+glimpse(dados)
+
## Rows: 121
+## Columns: 21
+## $ site                           <chr> "StackOverflow", "StackOverflow", "Sta…
+## $ country                        <chr> "Argentina", "Australia", "Austria", "…
+## $ PDI                            <dbl> 49, 36, 11, 80, 65, 69, 70, 39, 63, 80…
+## $ IDV                            <dbl> 46, 90, 55, 20, 75, 38, 30, 80, 23, 20…
+## $ MAS                            <dbl> 56, 61, 79, 55, 54, 49, 40, 52, 28, 66…
+## $ UAI                            <dbl> 86, 51, 70, 60, 94, 76, 85, 48, 86, 30…
+## $ usuarios                       <dbl> 2798, 12313, 2518, 2558, 4275, 10717, …
+## $ responderam_prop               <dbl> 0.5357398, 0.6133355, 0.6310564, 0.392…
+## $ perguntaram_prop               <dbl> 0.5210865, 0.5897832, 0.5933280, 0.475…
+## $ editaram_prop                  <dbl> 0.09256612, 0.14699911, 0.14932486, 0.…
+## $ comentaram_prop                <dbl> 0.25339528, 0.33395598, 0.35027800, 0.…
+## $ GNI                            <dbl> NA, 59570, 48160, 840, 44990, 11630, 6…
+## $ Internet                       <dbl> 51.0, 79.5, 79.8, 5.0, 78.0, 45.0, 51.…
+## $ EPI                            <dbl> 59.02, NA, 63.21, NA, 61.21, 49.96, NA…
+## $ geo                            <chr> "arg", "aus", "aut", "bgd", "bel", "br…
+## $ four_regions                   <chr> "americas", "asia", "europe", "asia", …
+## $ eight_regions                  <chr> "america_south", "east_asia_pacific", …
+## $ six_regions                    <chr> "america", "east_asia_pacific", "europ…
+## $ Latitude                       <dbl> -34.00000, -25.00000, 47.33333, 24.000…
+## $ Longitude                      <dbl> -64.00000, 135.00000, 13.33333, 90.000…
+## $ `World bank income group 2017` <chr> "Upper middle income", "High income", …
+
dados %>% 
+    ggplot(aes(x = IDV, y = responderam_prop)) + 
+    geom_point()
+

+
dados %>% 
+    ggplot(aes(x = IDV, y = responderam_prop, color = site)) + 
+    geom_point()
+

+
dados %>%
+    ggplot(aes(
+        x = IDV,
+        y = responderam_prop,
+        color = site,
+        size = log10(usuarios)
+    )) +
+    geom_point(alpha = .6)
+

+
dados %>%
+    ggplot(aes(
+        size = IDV,
+        y = responderam_prop,
+        color = site,
+        x = log10(usuarios)
+    )) +
+    geom_point(alpha = .6)
+

+
dados %>%
+    ggplot(aes(
+        x = IDV,
+        y = responderam_prop,
+        color = Internet,
+        size = log10(usuarios)
+    )) +
+    geom_point(alpha = .6) + 
+    facet_grid(site ~ ., scales = "free_y")
+

+
dados %>%
+    ggplot(aes(
+        x = IDV,
+        y = responderam_prop,
+        size = Internet,
+        color = log10(usuarios)
+    )) +
+    geom_point(alpha = .6) + 
+    facet_grid(site ~ ., scales = "free_y")
+
## Warning: Removed 3 rows containing missing values (geom_point).
+

+
so = dados %>% 
+    filter(site == "StackOverflow") %>% 
+    sample_n(20)
+
+so %>%
+    ggplot(aes(
+        x = country,
+        color = responderam_prop,
+        y = ""
+    )) +
+    geom_point(size = 4) + 
+    coord_flip()
+

+
so %>%
+    ggplot(aes(
+        x = country,
+        size = responderam_prop,
+        y = ""
+    )) +
+    geom_point(alpha = .3) + 
+    coord_flip()
+

+
so %>%
+    ggplot(aes(
+        x = country,
+        y = "",
+        size = responderam_prop,
+        color = six_regions
+    )) +
+    geom_point() + 
+    coord_flip()
+

+
so %>%
+    ggplot(aes(
+        x = country,
+        y = responderam_prop,
+        color = six_regions
+    )) +
+    geom_point(size = 3) + 
+    coord_flip()
+

+ + + + +
+ + + + + + + + + + + + + + + From ecca7a25246016b0f2375f2b57bd21691d1054a5 Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Mon, 18 May 2020 00:16:54 -0300 Subject: [PATCH 05/21] =?UTF-8?q?Respondendo=20a=20quest=C3=A3o=201?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 13 ++++------- reports/comentarios-e-cultura.html | 37 ++++-------------------------- 2 files changed, 10 insertions(+), 40 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index d10f69d..d8bacfd 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -33,15 +33,12 @@ Estamos interessados na relação entre quanto as pessoas de diferentes países Considerando essa variável, queremos examinar a relação entre ela e o quão hierárquicas são as relações em um país (`PDI`). Queremos também levar em conta o quanto as pessoas daquele país têm acesso à Internet (`Internet`) e qual o tamanho da base de dados que detectamos daquele país (`usuarios`). ## Examinando essa relação - ```{r} -dados %>% - ggplot(aes(x = PDI, y = comentaram_prop)) + - geom_point() - -dados %>% - ggplot(aes(x = PDI, y = comentaram_prop, color = site)) + - geom_point() +Analisando a questão acima, é solicitado a relação entre quatro variáveis: PDI, comentaram_prop, Internet e usuarios. Para isso, +a melhor forma de integrar todas elas é a partir de um gŕafico em +que no eixo X tenha a variável PDI e no eixo Y a variável comentam_prop. +A partir daí, podemos verificar como essas duas grandezas se relacionam. + ```{r} dados %>% ggplot(aes( x = PDI, diff --git a/reports/comentarios-e-cultura.html b/reports/comentarios-e-cultura.html index 28e96fc..1f308d6 100644 --- a/reports/comentarios-e-cultura.html +++ b/reports/comentarios-e-cultura.html @@ -407,53 +407,26 @@

Considerando essa variável, queremos examinar a relação entre ela e o quão hierárquicas são as relações em um país (PDI). Queremos também levar em conta o quanto as pessoas daquele país têm acesso à Internet (Internet) e qual o tamanho da base de dados que detectamos daquele país (usuarios).

Examinando essa relação

-
dados %>%
-   ggplot(aes(x = PDI, y = responderam_prop)) +
-   geom_point()
-

-
dados %>%
-   ggplot(aes(x = PDI, y = responderam_prop, color = site)) +
-   geom_point()
-

+

Analisando a questão acima, é solicitado a relação entre quatro variáveis: PDI, comentaram_prop, Internet e usuarios. Para isso, a melhor forma de integrar todas elas é a partir de um gŕafico em que no eixo X tenha a variável PDI e no eixo Y a variável comentam_prop. A partir daí, podemos verificar como essas duas grandezas se relacionam.

dados %>%
    ggplot(aes(
        x = PDI,
-       y = responderam_prop,
+       y = comentaram_prop,
        color = Internet,
        size = log10(usuarios)
    )) +
    geom_point(alpha = .6)
-

-
dados %>%
-   ggplot(aes(
-       size = PDI,
-       y = responderam_prop,
-       color = Internet,
-       x = log10(usuarios)
-   )) +
-   geom_point(alpha = .6)
-

+

dados %>%
    ggplot(aes(
        x = PDI,
-       y = responderam_prop,
+       y = comentaram_prop,
        color = Internet,
        size = log10(usuarios)
    )) +
    geom_point(alpha = .6) +
    facet_grid(site ~ ., scales = "free_y")
-

-
dados %>%
-   ggplot(aes(
-       x = PDI,
-       y = responderam_prop,
-       size = Internet,
-       color = log10(usuarios)
-   )) +
-   geom_point(alpha = .6) +
-   facet_grid(site ~ ., scales = "free_y")
-
## Warning: Removed 3 rows containing missing values (geom_point).
-

Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto.

+

Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto.

Outras formas de ver

From 49e1d804f530d8622e34b89a7a95ae97e10defc8 Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Mon, 18 May 2020 01:23:08 -0300 Subject: [PATCH 06/21] =?UTF-8?q?Incluindo=20an=C3=A1lises=20dos=205=20gr?= =?UTF-8?q?=C3=A1ficos=20e=20an=C3=A1lise=20dos=20continentes.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 71 +++++++++++++++++++++++++----- reports/comentarios-e-cultura.html | 56 +++++++++++++++++------ 2 files changed, 102 insertions(+), 25 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index d8bacfd..eb0b6da 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -32,11 +32,14 @@ Estamos interessados na relação entre quanto as pessoas de diferentes países Considerando essa variável, queremos examinar a relação entre ela e o quão hierárquicas são as relações em um país (`PDI`). Queremos também levar em conta o quanto as pessoas daquele país têm acesso à Internet (`Internet`) e qual o tamanho da base de dados que detectamos daquele país (`usuarios`). +Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto. + ## Examinando essa relação Analisando a questão acima, é solicitado a relação entre quatro variáveis: PDI, comentaram_prop, Internet e usuarios. Para isso, a melhor forma de integrar todas elas é a partir de um gŕafico em que no eixo X tenha a variável PDI e no eixo Y a variável comentam_prop. A partir daí, podemos verificar como essas duas grandezas se relacionam. +Também incluiremos as variáveis Internet e quantidade de usuários. ```{r} dados %>% @@ -47,26 +50,70 @@ dados %>% size = log10(usuarios) )) + geom_point(alpha = .6) + +``` + +Pela análise do gráfico acima, percebemos que, de forma geral, existe uma relação inversamente proporcional entre a PDI e a comentaram_prop. +Ou seja, países que possuem as relações hierárquicas menos engessadas, +com menores PDI, os seus usuários são os que mais comentam. Já países com os maiores PDI, aqueles que seus habitantes acham normal as desigualdades, comentam menos. Também é possível observar que países com menores PDI possuem mais acesso à internet. De forma geral, países com +populações menores comentam menos do que países com populações maiores. + +## Outras formas de ver + +Em seguida, faça 5 visualizações que usem as mesmas variáveis e também pontos, mas que sejam **menos eficazes** que a que você escolheu acima. + +O gráfico abaixo mostra a relação entre as variáveis PDI e comentaram_prop. +```{r} dados %>% - ggplot(aes( - x = PDI, - y = comentaram_prop, - color = Internet, - size = log10(usuarios) - )) + - geom_point(alpha = .6) + - facet_grid(site ~ ., scales = "free_y") + ggplot(aes(x = PDI, y = comentaram_prop)) + + geom_point() ``` -Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto. -## Outras formas de ver +O gráfico abaixo mostra a relação entre as variáveis Internet e comentaram_prop. +```{r} +dados %>% + ggplot(aes(x = Internet, y = comentaram_prop)) + + geom_point() +``` -Em seguida, faça 5 visualizações que usem as mesmas variáveis e também pontos, mas que sejam **menos eficazes** que a que você escolheu acima. +O gráfico abaixo mostra a relação entre usuários e comentaram_prop. +```{r} +dados %>% + ggplot(aes(x = log10(usuarios), y = comentaram_prop)) + + geom_point() +``` -Bônus +O gráfico abaixo mostra a relação entre Internet e PDI. +```{r} +dados %>% + ggplot(aes(x = Internet, y = PDI)) + + geom_point() +``` +O gráfico abaixo mostra a relação entre Internet e Usuários . +```{r} +dados %>% + ggplot(aes(x = Internet, y = log10(usuarios))) + + geom_point() +``` + +Bônus Inclua o continente dos países (`six_regions`) na visualização. +```{r} +dados %>% + ggplot(aes( + x = PDI, + y = responderam_prop, + size = Internet, + color = log10(usuarios) + )) + + geom_point(alpha = .6) + + facet_grid(six_regions ~ ., scales = "free_y") + +``` +A partir da análise do gráfico acima, percebemos que os maiores índices +de comentários estão nos países da Europa. diff --git a/reports/comentarios-e-cultura.html b/reports/comentarios-e-cultura.html index 1f308d6..8360875 100644 --- a/reports/comentarios-e-cultura.html +++ b/reports/comentarios-e-cultura.html @@ -405,9 +405,10 @@ ## $ `World bank income group 2017` <chr> "Upper middle income", "High income", …

Estamos interessados na relação entre quanto as pessoas de diferentes países comentam em questões dos outros. A proporção das pessoas do país que comentou nas questões de outros está medido na variável comentaram_prop.

Considerando essa variável, queremos examinar a relação entre ela e o quão hierárquicas são as relações em um país (PDI). Queremos também levar em conta o quanto as pessoas daquele país têm acesso à Internet (Internet) e qual o tamanho da base de dados que detectamos daquele país (usuarios).

+

Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto.

Examinando essa relação

-

Analisando a questão acima, é solicitado a relação entre quatro variáveis: PDI, comentaram_prop, Internet e usuarios. Para isso, a melhor forma de integrar todas elas é a partir de um gŕafico em que no eixo X tenha a variável PDI e no eixo Y a variável comentam_prop. A partir daí, podemos verificar como essas duas grandezas se relacionam.

+

Analisando a questão acima, é solicitado a relação entre quatro variáveis: PDI, comentaram_prop, Internet e usuarios. Para isso, a melhor forma de integrar todas elas é a partir de um gŕafico em que no eixo X tenha a variável PDI e no eixo Y a variável comentam_prop. A partir daí, podemos verificar como essas duas grandezas se relacionam. Também incluiremos as variáveis Internet e quantidade de usuários.

dados %>%
    ggplot(aes(
        x = PDI,
@@ -417,22 +418,51 @@ 

Examinando essa relação

)) + geom_point(alpha = .6)

-
dados %>%
-   ggplot(aes(
-       x = PDI,
-       y = comentaram_prop,
-       color = Internet,
-       size = log10(usuarios)
-   )) +
-   geom_point(alpha = .6) +
-   facet_grid(site ~ ., scales = "free_y")
-

Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto.

+

Pela análise do gráfico acima, percebemos que, de forma geral, existe uma relação inversamente proporcional entre a PDI e a comentaram_prop. Ou seja, países que possuem as relações hierárquicas menos engessadas, com menores PDI, os seus usuários são os que mais comentam. Já países com os maiores PDI, aqueles que seus habitantes acham normal as desigualdades, comentam menos. Também é possível observar que países com menores PDI possuem mais acesso à internet. De forma geral, países com populações menores comentam menos do que países com populações maiores.

Outras formas de ver

Em seguida, faça 5 visualizações que usem as mesmas variáveis e também pontos, mas que sejam menos eficazes que a que você escolheu acima.

-

Bônus

-

Inclua o continente dos países (six_regions) na visualização.

+

O gráfico abaixo mostra a relação entre as variáveis PDI e comentaram_prop.

+
dados %>%
+    ggplot(aes(x = PDI, y = comentaram_prop)) +
+    geom_point()
+

+

O gráfico abaixo mostra a relação entre as variáveis Internet e comentaram_prop.

+
dados %>%
+    ggplot(aes(x = Internet, y = comentaram_prop)) +
+    geom_point()
+
## Warning: Removed 3 rows containing missing values (geom_point).
+

+

O gráfico abaixo mostra a relação entre usuários e comentaram_prop.

+
dados %>%
+    ggplot(aes(x = log10(usuarios), y = comentaram_prop)) +
+    geom_point()
+

+

O gráfico abaixo mostra a relação entre Internet e PDI.

+
dados %>%
+    ggplot(aes(x = Internet, y = PDI)) +
+    geom_point()
+
## Warning: Removed 3 rows containing missing values (geom_point).
+

+

O gráfico abaixo mostra a relação entre Internet e Usuários .

+
dados %>%
+    ggplot(aes(x = Internet, y = log10(usuarios))) +
+    geom_point()
+
## Warning: Removed 3 rows containing missing values (geom_point).
+

+

Bônus Inclua o continente dos países (six_regions) na visualização.

+
dados %>%
+    ggplot(aes(
+        x = PDI,
+        y = responderam_prop,
+        size = Internet,
+        color = log10(usuarios)
+    )) +
+    geom_point(alpha = .6) +
+    facet_grid(six_regions ~ ., scales = "free_y")
+
## Warning: Removed 3 rows containing missing values (geom_point).
+

From 0d3b85438b50a55345df3bfec3c3dcc5570b694f Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Mon, 18 May 2020 02:29:57 -0300 Subject: [PATCH 07/21] =?UTF-8?q?An=C3=A1lise=20a=20ser=20realizada?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 1 + 1 file changed, 1 insertion(+) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index eb0b6da..9d7e43b 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -116,4 +116,5 @@ dados %>% ``` A partir da análise do gráfico acima, percebemos que os maiores índices de comentários estão nos países da Europa. +Análise a ser finalizada From 66de320657e33d5bd14b8b4107fe9ca7a7050779 Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Mon, 18 May 2020 11:22:32 -0300 Subject: [PATCH 08/21] =?UTF-8?q?Melhorando=20as=20an=C3=A1lises=20dos=20c?= =?UTF-8?q?inco=20gr=C3=A1ficos=20auxiliares.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 31 +++++++++++++++++++++++------- reports/comentarios-e-cultura.html | 6 +++--- 2 files changed, 27 insertions(+), 10 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index 9d7e43b..8fee122 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -35,11 +35,8 @@ Considerando essa variável, queremos examinar a relação entre ela e o quão h Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto. ## Examinando essa relação -Analisando a questão acima, é solicitado a relação entre quatro variáveis: PDI, comentaram_prop, Internet e usuarios. Para isso, -a melhor forma de integrar todas elas é a partir de um gŕafico em -que no eixo X tenha a variável PDI e no eixo Y a variável comentam_prop. -A partir daí, podemos verificar como essas duas grandezas se relacionam. -Também incluiremos as variáveis Internet e quantidade de usuários. +Analisando a questão acima, é solicitada a investigação da relação entre quatro variáveis: PDI, comentaram_prop, Internet e usuarios. +Para isso, a melhor forma de integrar todas elas é a partir de um gŕafico em que no eixo X tenha a variável PDI e no eixo Y a variável comentam_prop. A partir daí, podemos verificar como essas duas grandezas se relacionam. Também incluiremos as variáveis Internet e quantidade de usuários. ```{r} dados %>% @@ -55,8 +52,8 @@ dados %>% Pela análise do gráfico acima, percebemos que, de forma geral, existe uma relação inversamente proporcional entre a PDI e a comentaram_prop. Ou seja, países que possuem as relações hierárquicas menos engessadas, -com menores PDI, os seus usuários são os que mais comentam. Já países com os maiores PDI, aqueles que seus habitantes acham normal as desigualdades, comentam menos. Também é possível observar que países com menores PDI possuem mais acesso à internet. De forma geral, países com -populações menores comentam menos do que países com populações maiores. +com menores PDI, os seus usuários são os que mais comentam. Já países com os maiores PDI, aqueles que seus habitantes acham normal as desigualdades e a hierarquia, comentam menos.Também é possível +observar que países com menores PDI possuem mais acesso à internet. De forma geral, países com populações menores comentam menos do que países com populações maiores. ## Outras formas de ver @@ -70,6 +67,10 @@ dados %>% ggplot(aes(x = PDI, y = comentaram_prop)) + geom_point() ``` +Pela análise do gráfico acima (PDI x comentaram_prop), fica evidente a relação inversa entre as +variáveis PDI e comentaram_prop, ou seja, usuários de países com menores PDI comentam mais do que os usuários de países com maiores +PDI. + O gráfico abaixo mostra a relação entre as variáveis Internet e comentaram_prop. ```{r} @@ -77,6 +78,11 @@ dados %>% ggplot(aes(x = Internet, y = comentaram_prop)) + geom_point() ``` +No gráfico acima (Internet x comentaram_prop), é possível visualizar +uma relação linear entre a utilização da Internet pelos usuários e a +quantidade de comentários. Ou seja, países que possuem usuários com +mais acesso à internet comentam mais do que os usuários de países com +menos acesso à internet. O gráfico abaixo mostra a relação entre usuários e comentaram_prop. ```{r} @@ -84,6 +90,11 @@ dados %>% ggplot(aes(x = log10(usuarios), y = comentaram_prop)) + geom_point() ``` +Pela análise do gráfico acima (Usuários x comentaram_prop) é possível +visualizar uma relação direta entre a quantidade de usuários de um +país e a quantidade de comentários, ou seja, quanto mais usuários +um país possui, mais comentários são feitos para usuários de outros países. + O gráfico abaixo mostra a relação entre Internet e PDI. ```{r} @@ -91,6 +102,11 @@ dados %>% ggplot(aes(x = Internet, y = PDI)) + geom_point() ``` +Pela análise do gráfico acima (Internet x PDI) é possível verificar uma +relação inversa entre a quantidade de usuários com acesso à internet e +o valor do PDI. É possível constatar que países com mais acesso à internet possuem menores PDI, ou seja, aceitam menos as desigualdades +sociais e as hierarquias na sociedade. + O gráfico abaixo mostra a relação entre Internet e Usuários . ```{r} @@ -98,6 +114,7 @@ dados %>% ggplot(aes(x = Internet, y = log10(usuarios))) + geom_point() ``` +Pela análise do gráfico acima (Internet x Usuários) não é possível encontrar um padrão nesses dados. Bônus Inclua o continente dos países (`six_regions`) na visualização. diff --git a/reports/comentarios-e-cultura.html b/reports/comentarios-e-cultura.html index 8360875..58a3ad8 100644 --- a/reports/comentarios-e-cultura.html +++ b/reports/comentarios-e-cultura.html @@ -408,7 +408,7 @@

Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto.

Examinando essa relação

-

Analisando a questão acima, é solicitado a relação entre quatro variáveis: PDI, comentaram_prop, Internet e usuarios. Para isso, a melhor forma de integrar todas elas é a partir de um gŕafico em que no eixo X tenha a variável PDI e no eixo Y a variável comentam_prop. A partir daí, podemos verificar como essas duas grandezas se relacionam. Também incluiremos as variáveis Internet e quantidade de usuários.

+

Analisando a questão acima, é solicitada a investigação da relação entre quatro variáveis: PDI, comentaram_prop, Internet e usuarios. Para isso, a melhor forma de integrar todas elas é a partir de um gŕafico em que no eixo X tenha a variável PDI e no eixo Y a variável comentam_prop. A partir daí, podemos verificar como essas duas grandezas se relacionam. Também incluiremos as variáveis Internet e quantidade de usuários.

dados %>%
    ggplot(aes(
        x = PDI,
@@ -418,7 +418,7 @@ 

Examinando essa relação

)) + geom_point(alpha = .6)

-

Pela análise do gráfico acima, percebemos que, de forma geral, existe uma relação inversamente proporcional entre a PDI e a comentaram_prop. Ou seja, países que possuem as relações hierárquicas menos engessadas, com menores PDI, os seus usuários são os que mais comentam. Já países com os maiores PDI, aqueles que seus habitantes acham normal as desigualdades, comentam menos. Também é possível observar que países com menores PDI possuem mais acesso à internet. De forma geral, países com populações menores comentam menos do que países com populações maiores.

+

Pela análise do gráfico acima, percebemos que, de forma geral, existe uma relação inversamente proporcional entre a PDI e a comentaram_prop. Ou seja, países que possuem as relações hierárquicas menos engessadas, com menores PDI, os seus usuários são os que mais comentam. Já países com os maiores PDI, aqueles que seus habitantes acham normal as desigualdades e a hierarquia, comentam menos.Também é possível observar que países com menores PDI possuem mais acesso à internet. De forma geral, países com populações menores comentam menos do que países com populações maiores.

Outras formas de ver

@@ -462,7 +462,7 @@

Outras formas de ver

geom_point(alpha = .6) + facet_grid(six_regions ~ ., scales = "free_y")
## Warning: Removed 3 rows containing missing values (geom_point).
-

+

A partir da análise do gráfico acima, percebemos que os maiores índices de comentários estão nos países da Europa. Análise a ser finalizada

From a62003921428af4cac6c3be6a8174d183eae9a5b Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Mon, 18 May 2020 19:02:55 -0300 Subject: [PATCH 09/21] =?UTF-8?q?Analisando=20gr=C3=A1ficos.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- code/testando-fontes-R.R | 15 ++++ reports/comentarios-e-cultura.Rmd | 134 ++++++++++++++++++++---------- 2 files changed, 103 insertions(+), 46 deletions(-) create mode 100644 code/testando-fontes-R.R diff --git a/code/testando-fontes-R.R b/code/testando-fontes-R.R new file mode 100644 index 0000000..306ad35 --- /dev/null +++ b/code/testando-fontes-R.R @@ -0,0 +1,15 @@ +#https://www.modelodomundo.com/2019/09/importando-fontes-no-r-extrafont/ +library(ggplot2) + +fontes <- fonts() +length(fontes) +m1 <- rep(1:20, 10) +m2 <- rep(1:10, each = 20) +fontes_df <- data.frame(x = m1, y = m2, fontes = fontes, text = "abc123") +ggplot() + + geom_text(data = fontes_df, aes(x = x, y = y, label = text, family = fontes)) + + scale_x_continuous(breaks = 1:20) + + scale_y_continuous(breaks = 1:20) + + theme_classic() + +fontes_df[fontes_df$x == 12 & fontes_df$y == 6, ] \ No newline at end of file diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index 8fee122..55e8fd7 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -1,3 +1,15 @@ +--- +title: "Ramon Nóbrega-comentarios-e-cultura" +author: "Ramon Nóbrega" +date: "18 de maio de 2020" +output: + html_document: + df_print: paged +theme: sandstone +--- + + Ramon Nóbrega (Aluno especial- FPCC2 - 2020.1) + ```{r echo=FALSE, message=FALSE, warning=FALSE} library(tidyverse) library(here) @@ -8,6 +20,11 @@ theme_set(theme_bw()) knitr::opts_chunk$set(tidy = FALSE, fig.width = 6, fig.height = 5) + +library(extrafont) +# Só é preciso fazer isso uma única vez +extrafont::font_import() +extrafont::loadfonts() ``` ```{r read} @@ -44,77 +61,102 @@ dados %>% x = PDI, y = comentaram_prop, color = Internet, - size = log10(usuarios) + size = log10(usuarios), + )) + - geom_point(alpha = .6) + geom_point(alpha = .6)+ + par(family = "Georgia")+ + theme(plot.title = element_text(size = 12,face="bold",family="Times new Roman")) + + labs( + title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", + position="plot", + y = "Porcentagem de usuários que comentam", + x = "Índice de Distância de Poder (PDI)" + ) ``` Pela análise do gráfico acima, percebemos que, de forma geral, existe uma relação inversamente proporcional entre a PDI e a comentaram_prop. Ou seja, países que possuem as relações hierárquicas menos engessadas, -com menores PDI, os seus usuários são os que mais comentam. Já países com os maiores PDI, aqueles que seus habitantes acham normal as desigualdades e a hierarquia, comentam menos.Também é possível -observar que países com menores PDI possuem mais acesso à internet. De forma geral, países com populações menores comentam menos do que países com populações maiores. +com menores PDI, os seus usuários são os que mais comentam. Já países com os maiores PDI, aqueles que seus habitantes acham normal as desigualdades e a hierarquia, comentam menos.Também é possível observar que países com menores PDI possuem mais acesso à internet. De forma geral, países com populações menores comentam menos do que países com populações maiores. ## Outras formas de ver Em seguida, faça 5 visualizações que usem as mesmas variáveis e também pontos, mas que sejam **menos eficazes** que a que você escolheu acima. +Artigo tomando como referência: +6 dicas para a visualização de dados disponível em +https://www.ibpad.com.br/blog/analise-de-dados/6-dicas-para-visualizacao-de-dados/ -O gráfico abaixo mostra a relação entre as variáveis PDI e comentaram_prop. - -```{r} -dados %>% - ggplot(aes(x = PDI, y = comentaram_prop)) + - geom_point() -``` -Pela análise do gráfico acima (PDI x comentaram_prop), fica evidente a relação inversa entre as -variáveis PDI e comentaram_prop, ou seja, usuários de países com menores PDI comentam mais do que os usuários de países com maiores -PDI. +**ANÁLISE DO GRÁFICO 1* +A primeira análise que faremos é baseada na **utilização de fontes legíveis**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. Sabemos que Lobster é bonito, mas não significa que você deve usar num gráfico. Lembre-se, é uma narrativa, não é arte. O segundo mostra uma fonte mais apropriada para os nossos fins. -O gráfico abaixo mostra a relação entre as variáveis Internet e comentaram_prop. -```{r} + ```{r} dados %>% - ggplot(aes(x = Internet, y = comentaram_prop)) + - geom_point() + ggplot(aes( + x = PDI, + y = comentaram_prop, + color = Internet, + size = log10(usuarios) + )) + + geom_point(alpha = .6)+ + theme(plot.title = element_text(size = 12,face="bold",family="Lobster")) + + labs( + title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", + position="plot", + y = "Porcentagem de usuários que comentam", + x = "Índice de Distância de Poder (PDI)" + ) + ``` -No gráfico acima (Internet x comentaram_prop), é possível visualizar -uma relação linear entre a utilização da Internet pelos usuários e a -quantidade de comentários. Ou seja, países que possuem usuários com -mais acesso à internet comentam mais do que os usuários de países com -menos acesso à internet. -O gráfico abaixo mostra a relação entre usuários e comentaram_prop. -```{r} +Análise de gŕafico 2 +A segunda análise que faremos é baseada no **excesso de cores em um gráfico**. Estudos mostram que o excesso de cor pode confundir o visualizador. + + ```{r} dados %>% - ggplot(aes(x = log10(usuarios), y = comentaram_prop)) + - geom_point() + ggplot(aes( + x = PDI, + y = comentaram_prop, + color = Internet, + size = log10(usuarios) + )) + + geom_point(alpha = .6)+ + scale_colour_gradientn(colours=rainbow(4)) + + theme(plot.title = element_text(size = 10,face="bold")) + + labs( + title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", + position="plot", + y = "Porcentagem de usuários que comentam", + x = "Índice de Distância de Poder (PDI)" + ) + ``` -Pela análise do gráfico acima (Usuários x comentaram_prop) é possível -visualizar uma relação direta entre a quantidade de usuários de um -país e a quantidade de comentários, ou seja, quanto mais usuários -um país possui, mais comentários são feitos para usuários de outros países. +Análise de gŕafico 3 +A terceira análise que faremos é baseada no **escolha das variáveis**. -O gráfico abaixo mostra a relação entre Internet e PDI. -```{r} + ```{r} dados %>% - ggplot(aes(x = Internet, y = PDI)) + - geom_point() + ggplot(aes( + x = PDI, + y = comentaram_prop, + color = log10(usuarios), + size = Internet + )) + + geom_point(alpha = .6)+ + theme(plot.title = element_text(size = 10,face="bold")) + + labs( + title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", + position="plot", + y = "Porcentagem de usuários que comentam", + x = "Índice de Distância de Poder (PDI)" + ) + ``` -Pela análise do gráfico acima (Internet x PDI) é possível verificar uma -relação inversa entre a quantidade de usuários com acesso à internet e -o valor do PDI. É possível constatar que países com mais acesso à internet possuem menores PDI, ou seja, aceitam menos as desigualdades -sociais e as hierarquias na sociedade. -O gráfico abaixo mostra a relação entre Internet e Usuários . -```{r} -dados %>% - ggplot(aes(x = Internet, y = log10(usuarios))) + - geom_point() -``` -Pela análise do gráfico acima (Internet x Usuários) não é possível encontrar um padrão nesses dados. Bônus Inclua o continente dos países (`six_regions`) na visualização. From d8a5ccf3f9c015fe9c7ee479b52a696b0e70cee5 Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Mon, 18 May 2020 23:02:42 -0300 Subject: [PATCH 10/21] =?UTF-8?q?Acrescentando=20an=C3=A1lise=20para=20a?= =?UTF-8?q?=20quest=C3=A3o=201.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 6 +++++- 1 file changed, 5 insertions(+), 1 deletion(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index 55e8fd7..fc94dfe 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -65,7 +65,7 @@ dados %>% )) + geom_point(alpha = .6)+ - par(family = "Georgia")+ + #par(family = "Georgia")+ theme(plot.title = element_text(size = 12,face="bold",family="Times new Roman")) + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", @@ -80,6 +80,10 @@ Pela análise do gráfico acima, percebemos que, de forma geral, existe uma rela Ou seja, países que possuem as relações hierárquicas menos engessadas, com menores PDI, os seus usuários são os que mais comentam. Já países com os maiores PDI, aqueles que seus habitantes acham normal as desigualdades e a hierarquia, comentam menos.Também é possível observar que países com menores PDI possuem mais acesso à internet. De forma geral, países com populações menores comentam menos do que países com populações maiores. +Percebemos também que pela coloração das bolas mais claras dos países que possuem mais acesso à internet, os seus usuários comentam mais. Isso se deve a ter estruturas sociais mais democráticas. Com relação a quantidade de usuários das +plataformas, de forma geral, percebe-se uma relação proporcional entre o número de usuários e a quantidade de comentários. + + ## Outras formas de ver Em seguida, faça 5 visualizações que usem as mesmas variáveis e também pontos, mas que sejam **menos eficazes** que a que você escolheu acima. From f6794b9b2e84c3d5e556c068735be4fc2f717318 Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Tue, 19 May 2020 00:48:37 -0300 Subject: [PATCH 11/21] =?UTF-8?q?Continuando=20quest=C3=A3o=20b=C3=B4nus,?= =?UTF-8?q?=20retificando=20tamanho=20da=20legenda?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 63 +++++++++++++++++++------------ 1 file changed, 38 insertions(+), 25 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index fc94dfe..a2d07d1 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -70,8 +70,9 @@ dados %>% labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", position="plot", - y = "Porcentagem de usuários que comentam", - x = "Índice de Distância de Poder (PDI)" + x = "Índice de Distância de Poder (PDI)" , + y = "Porcentagem de usuários que comentam" + ) ``` @@ -93,7 +94,7 @@ Artigo tomando como referência: https://www.ibpad.com.br/blog/analise-de-dados/6-dicas-para-visualizacao-de-dados/ -**ANÁLISE DO GRÁFICO 1* +**ANÁLISE DO GRÁFICO 1** A primeira análise que faremos é baseada na **utilização de fontes legíveis**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. Sabemos que Lobster é bonito, mas não significa que você deve usar num gráfico. Lembre-se, é uma narrativa, não é arte. O segundo mostra uma fonte mais apropriada para os nossos fins. ```{r} @@ -105,18 +106,21 @@ dados %>% size = log10(usuarios) )) + geom_point(alpha = .6)+ - theme(plot.title = element_text(size = 12,face="bold",family="Lobster")) + + theme(plot.title = element_text(size = 10,face="bold")) + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", position="plot", - y = "Porcentagem de usuários que comentam", - x = "Índice de Distância de Poder (PDI)" + x = "Índice de Distância de Poder (PDI)", + y = "Porcentagem de usuários que comentam" + ) ``` -Análise de gŕafico 2 -A segunda análise que faremos é baseada no **excesso de cores em um gráfico**. Estudos mostram que o excesso de cor pode confundir o visualizador. +**ANÁLISE DO GRÁFICO 2** +A segunda análise que faremos é baseada no **excesso de cores em um gráfico**. Estudos mostram que o excesso de cor pode confundir o visualizador. Perceba +que pela visualização do gráfico fica difícil visualizar os países que possuem +menos acesso à internet devido a grande quantidade de cores diferentes. ```{r} dados %>% @@ -132,52 +136,61 @@ dados %>% labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", position="plot", - y = "Porcentagem de usuários que comentam", - x = "Índice de Distância de Poder (PDI)" + x = "Índice de Distância de Poder (PDI)", + y = "Porcentagem de usuários que comentam" + ) - -``` + ``` -Análise de gŕafico 3 -A terceira análise que faremos é baseada no **escolha das variáveis**. +**ANÁLISE DO GRÁFICO 3** +A terceira análise que faremos é baseada na **escolha das variáveis**. Iremos mudar as variáveis x e size: a variável x será a Internet e o size será o PDI. +Perceba que não é possível visualizar de forma clara a relação entre as variáveis +PDI e a porcentagem de usuários que comentam devido a sobreposição de bolas. ```{r} dados %>% ggplot(aes( - x = PDI, + x = Internet, y = comentaram_prop, color = log10(usuarios), - size = Internet + size = PDI )) + geom_point(alpha = .6)+ theme(plot.title = element_text(size = 10,face="bold")) + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", position="plot", - y = "Porcentagem de usuários que comentam", - x = "Índice de Distância de Poder (PDI)" + x = "Internet" , + y = "Porcentagem de usuários que comentam" + ) - ``` - - Bônus Inclua o continente dos países (`six_regions`) na visualização. ```{r} dados %>% + filter(!is.na(six_regions))%>% ggplot(aes( x = PDI, - y = responderam_prop, + y = comentaram_prop, size = Internet, color = log10(usuarios) )) + geom_point(alpha = .6) + - facet_grid(six_regions ~ ., scales = "free_y") - + facet_wrap(six_regions ~ ., scales = "free_y",ncol=2)+ + theme(plot.title = element_text(size = 10, face = "bold")) + + labs( + title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", + subtitle = "Por continente", + y = "Porcentagem de usuários que comentam", + x = "PDI" + ) ``` + + A partir da análise do gráfico acima, percebemos que os maiores índices de comentários estão nos países da Europa. -Análise a ser finalizada + From 96699fdf3706bd82f59189f930dc9c2049228ec2 Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Tue, 19 May 2020 01:08:09 -0300 Subject: [PATCH 12/21] =?UTF-8?q?Adicionando=20a=20utiliza=C3=A7=C3=A3o=20?= =?UTF-8?q?de=20temas=20que=20tem=20uma=20rela=C3=A7=C3=A3o=20ruim=20com?= =?UTF-8?q?=20as=20demais=20cores?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 12 +++++++++--- 1 file changed, 9 insertions(+), 3 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index a2d07d1..c9b0a77 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -65,7 +65,7 @@ dados %>% )) + geom_point(alpha = .6)+ - #par(family = "Georgia")+ + theme_light()+ theme(plot.title = element_text(size = 12,face="bold",family="Times new Roman")) + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", @@ -95,7 +95,7 @@ https://www.ibpad.com.br/blog/analise-de-dados/6-dicas-para-visualizacao-de-dado **ANÁLISE DO GRÁFICO 1** -A primeira análise que faremos é baseada na **utilização de fontes legíveis**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. Sabemos que Lobster é bonito, mas não significa que você deve usar num gráfico. Lembre-se, é uma narrativa, não é arte. O segundo mostra uma fonte mais apropriada para os nossos fins. +A primeira análise que faremos é baseada na **utilização de temas que tem uma relação ruim com as demais cores **. Perceba que a utilização do tema dark deixa o gráfico com uma dificuldade para enxergar valores mais escuros do azul que se confundem com os do cinza. ```{r} dados %>% @@ -106,7 +106,8 @@ dados %>% size = log10(usuarios) )) + geom_point(alpha = .6)+ - theme(plot.title = element_text(size = 10,face="bold")) + + theme(plot.title = element_text(size = 18,face="bold",family="Arial")) + + theme_dark()+ labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", position="plot", @@ -165,6 +166,11 @@ dados %>% ) ``` +**ANÁLISE DO GRÁFICO 4** +A primeira análise que faremos é baseada na **utilização de fontes legíveis**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. Sabemos que Lobster é bonito, mas não significa que você deve usa-la num gráfico. Lembre-se, é uma narrativa, não é arte. + + + Bônus Inclua o continente dos países (`six_regions`) na visualização. From 290a5639822941fd9edfe4a6f1cede0bd08ab94d Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Tue, 19 May 2020 12:00:23 -0300 Subject: [PATCH 13/21] =?UTF-8?q?Corrigindo=20a=20fonte,=20incluindo=20nov?= =?UTF-8?q?as=20an=C3=A1lises=20de=20g=C5=95aficos.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 33 ++++++++++++++++++------------- 1 file changed, 19 insertions(+), 14 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index c9b0a77..ee60d5d 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -1,7 +1,7 @@ --- title: "Ramon Nóbrega-comentarios-e-cultura" -author: "Ramon Nóbrega" -date: "18 de maio de 2020" +author: "Ramon Nóbrega dos Santos" +date: "19 de maio de 2020" output: html_document: df_print: paged @@ -66,7 +66,7 @@ dados %>% )) + geom_point(alpha = .6)+ theme_light()+ - theme(plot.title = element_text(size = 12,face="bold",family="Times new Roman")) + + theme(plot.title = element_text(size = 10,face="bold",family="Times new Roman")) + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", position="plot", @@ -106,17 +106,16 @@ dados %>% size = log10(usuarios) )) + geom_point(alpha = .6)+ - theme(plot.title = element_text(size = 18,face="bold",family="Arial")) + theme_dark()+ + theme(plot.title = element_text(size = 10,face="bold")) + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", position="plot", - x = "Índice de Distância de Poder (PDI)", + x = "Índice de Distância de Poder (PDI)", y = "Porcentagem de usuários que comentam" - + ) - -``` + ``` **ANÁLISE DO GRÁFICO 2** A segunda análise que faremos é baseada no **excesso de cores em um gráfico**. Estudos mostram que o excesso de cor pode confundir o visualizador. Perceba @@ -144,9 +143,8 @@ dados %>% ``` **ANÁLISE DO GRÁFICO 3** -A terceira análise que faremos é baseada na **escolha das variáveis**. Iremos mudar as variáveis x e size: a variável x será a Internet e o size será o PDI. -Perceba que não é possível visualizar de forma clara a relação entre as variáveis -PDI e a porcentagem de usuários que comentam devido a sobreposição de bolas. +A terceira análise que faremos é baseada na **escolha das variáveis equivocadas**. +Nos eixo X e Y devem estar as variáveis mais importantes para a análise. Dessa forma, para constatar essa hipótese, serão mudadas as variáveis x e size: a variável x que antes era o PDI será a Internet e a variável y que antes era PDI será os usuários. Perceba que não é possível visualizar de forma clara a relação entre as variáveis PDI e a porcentagem de usuários devido a não correspondência visual entre tamanho das bolas e cores. ```{r} dados %>% @@ -166,8 +164,14 @@ dados %>% ) ``` + **ANÁLISE DO GRÁFICO 4** -A primeira análise que faremos é baseada na **utilização de fontes legíveis**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. Sabemos que Lobster é bonito, mas não significa que você deve usa-la num gráfico. Lembre-se, é uma narrativa, não é arte. +A quarta análise que faremos é baseada na **utilização de fontes ilegíveis**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. Sabemos que Lobster é bonito, mas não significa que você deve usa-la num gráfico. Lembre-se, é uma narrativa, não é arte. + + + +**ANÁLISE DO GRÁFICO 5** +A quinta análise que faremos é baseada na **utilização de fontes ilegíveis**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. Sabemos que Lobster é bonito, mas não significa que você deve usa-la num gráfico. Lembre-se, é uma narrativa, não é arte. @@ -190,8 +194,9 @@ dados %>% labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", subtitle = "Por continente", - y = "Porcentagem de usuários que comentam", - x = "PDI" + x = "PDI", + y = "Porcentagem de usuários que comentam" + ) ``` From be5717374f2f3e92b7fc50ee9e309c6248217a56 Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Tue, 19 May 2020 12:40:21 -0300 Subject: [PATCH 14/21] =?UTF-8?q?Adicionando=20o=20gr=C3=A1fico=205=20com?= =?UTF-8?q?=20cores=20que=20dificultam=20a=20visualiza=C3=A7=C3=A3o=20do?= =?UTF-8?q?=20g=C5=95afico.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 40 ++++++++++++++++++++++++++++--- 1 file changed, 37 insertions(+), 3 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index ee60d5d..4169901 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -147,7 +147,7 @@ A terceira análise que faremos é baseada na **escolha das variáveis equivocad Nos eixo X e Y devem estar as variáveis mais importantes para a análise. Dessa forma, para constatar essa hipótese, serão mudadas as variáveis x e size: a variável x que antes era o PDI será a Internet e a variável y que antes era PDI será os usuários. Perceba que não é possível visualizar de forma clara a relação entre as variáveis PDI e a porcentagem de usuários devido a não correspondência visual entre tamanho das bolas e cores. ```{r} -dados %>% +grafico3<-dados %>% ggplot(aes( x = Internet, y = comentaram_prop, @@ -171,10 +171,44 @@ A quarta análise que faremos é baseada na **utilização de fontes ilegíveis* **ANÁLISE DO GRÁFICO 5** -A quinta análise que faremos é baseada na **utilização de fontes ilegíveis**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. Sabemos que Lobster é bonito, mas não significa que você deve usa-la num gráfico. Lembre-se, é uma narrativa, não é arte. - +A quinta análise que faremos é baseada na **utilização de cores erradas para títulos e legendas**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. +```{r} +grafico5<-dados %>% + ggplot(aes( + x = PDI, + y = comentaram_prop, + color = Internet, + size = log10(usuarios), + + )) + + geom_point(alpha = .6)+ + theme_light()+ + theme(plot.title = element_text(size = 10,face="bold",family="Times new Roman")) + + labs( + title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", + position="plot", + x = "Índice de Distância de Poder (PDI)" , + y = "Porcentagem de usuários que comentam" + + ) +#adicionando mais características as legendas +#https://socviz.co/refineplots.html +grafico5 + theme(legend.position = "top", + plot.title = element_text(size=rel(1), + lineheight=.5, + family="Times", + face="bold.italic", + colour="orange"), + axis.text.x = element_text(size=rel(1.1), + family="Courier", + face="bold", + color="yellow")) + +grafico5 + +``` Bônus Inclua o continente dos países (`six_regions`) na visualização. From 90c2d5ce84eb98a1367494238a908a8cbcc5a319 Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Tue, 19 May 2020 12:49:09 -0300 Subject: [PATCH 15/21] =?UTF-8?q?Adicionando=20cores=20de=20legendas=20nos?= =?UTF-8?q?=20eixos=20x=20e=20y=20ao=20gr=C3=A1fico=205.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 10 ++++++++-- 1 file changed, 8 insertions(+), 2 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index 4169901..6896f23 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -200,11 +200,17 @@ grafico5 + theme(legend.position = "top", lineheight=.5, family="Times", face="bold.italic", - colour="orange"), + colour="yellow"), axis.text.x = element_text(size=rel(1.1), family="Courier", face="bold", - color="yellow")) + color="yellow"), + axis.text.y = element_text(size=rel(1.1), + family="Courier", + face="bold", + color="yellow") + + ) grafico5 From 3de878558167fa5af2463424176c9a8de62017c2 Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Tue, 19 May 2020 13:41:06 -0300 Subject: [PATCH 16/21] =?UTF-8?q?Atualizando=20gr=C3=A1ficos.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 13 ++++++++----- 1 file changed, 8 insertions(+), 5 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index 6896f23..e7fd9a8 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -56,7 +56,7 @@ Analisando a questão acima, é solicitada a investigação da relação entre q Para isso, a melhor forma de integrar todas elas é a partir de um gŕafico em que no eixo X tenha a variável PDI e no eixo Y a variável comentam_prop. A partir daí, podemos verificar como essas duas grandezas se relacionam. Também incluiremos as variáveis Internet e quantidade de usuários. ```{r} -dados %>% +grafico_base<-dados %>% ggplot(aes( x = PDI, y = comentaram_prop, @@ -72,9 +72,9 @@ dados %>% position="plot", x = "Índice de Distância de Poder (PDI)" , y = "Porcentagem de usuários que comentam" - ) - +grafico_base + ``` Pela análise do gráfico acima, percebemos que, de forma geral, existe uma relação inversamente proporcional entre a PDI e a comentaram_prop. @@ -93,6 +93,8 @@ Artigo tomando como referência: 6 dicas para a visualização de dados disponível em https://www.ibpad.com.br/blog/analise-de-dados/6-dicas-para-visualizacao-de-dados/ +Excelente livro para refinamento de gráficos +https://socviz.co/refineplots.html **ANÁLISE DO GRÁFICO 1** A primeira análise que faremos é baseada na **utilização de temas que tem uma relação ruim com as demais cores **. Perceba que a utilização do tema dark deixa o gráfico com uma dificuldade para enxergar valores mais escuros do azul que se confundem com os do cinza. @@ -106,7 +108,7 @@ dados %>% size = log10(usuarios) )) + geom_point(alpha = .6)+ - theme_dark()+ + theme_dark()+ theme(plot.title = element_text(size = 10,face="bold")) + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", @@ -163,6 +165,7 @@ grafico3<-dados %>% y = "Porcentagem de usuários que comentam" ) + grafico3 ``` **ANÁLISE DO GRÁFICO 4** @@ -171,7 +174,7 @@ A quarta análise que faremos é baseada na **utilização de fontes ilegíveis* **ANÁLISE DO GRÁFICO 5** -A quinta análise que faremos é baseada na **utilização de cores erradas para títulos e legendas**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. +A quinta análise que faremos é baseada na **utilização de cores erradas para títulos e legendas, além do posicionamento ruim da legenda**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. ```{r} From 1d7e47c5b36ac00fbefd212b9f295a60f3aaff91 Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Tue, 19 May 2020 16:38:33 -0300 Subject: [PATCH 17/21] =?UTF-8?q?Atualizando=20gr=C3=A1fico=20da=20quest?= =?UTF-8?q?=C3=A3o=20b=C3=B4nus=20para=20apenas=20uma=20visualiza=C3=A7?= =?UTF-8?q?=C3=A3o.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 74 +++++++++++++++++++++++++------ 1 file changed, 61 insertions(+), 13 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index e7fd9a8..14f78e2 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -96,6 +96,7 @@ https://www.ibpad.com.br/blog/analise-de-dados/6-dicas-para-visualizacao-de-dado Excelente livro para refinamento de gráficos https://socviz.co/refineplots.html + **ANÁLISE DO GRÁFICO 1** A primeira análise que faremos é baseada na **utilização de temas que tem uma relação ruim com as demais cores **. Perceba que a utilização do tema dark deixa o gráfico com uma dificuldade para enxergar valores mais escuros do azul que se confundem com os do cinza. @@ -215,36 +216,83 @@ grafico5 + theme(legend.position = "top", ) -grafico5 ``` - Bônus Inclua o continente dos países (`six_regions`) na visualização. ```{r} -dados %>% + +grafico5<-dados %>% filter(!is.na(six_regions))%>% ggplot(aes( x = PDI, y = comentaram_prop, - size = Internet, - color = log10(usuarios) + color = Internet, + shape=six_regions, + size = log10(usuarios), + )) + - geom_point(alpha = .6) + - facet_wrap(six_regions ~ ., scales = "free_y",ncol=2)+ - theme(plot.title = element_text(size = 10, face = "bold")) + + geom_point(alpha = .6)+ + theme_light()+ + theme(plot.title = element_text(size = 10,face="bold",family="Times new Roman")) + labs( - title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", - subtitle = "Por continente", - x = "PDI", + title = "Relação entre os Usuários e seus comentários", + subtitle= "Incluindo PDI, acesso à Internet e continentes", + position="plot", + x = "Índice de Distância de Poder (PDI)" , y = "Porcentagem de usuários que comentam" - + ) -``` +#adicionando mais características as legendas +#https://socviz.co/refineplots.html +grafico5 + theme(legend.position = "right", + plot.title = element_text(size=rel(1), + lineheight=.5, + family="Times", + face="bold.italic"), + axis.text.x = element_text(size=rel(1.1), + family="Courier", + face="bold"), + axis.text.y = element_text(size=rel(1.1), + family="Courier", + face="bold") + + ) + + +``` A partir da análise do gráfico acima, percebemos que os maiores índices de comentários estão nos países da Europa. + +REFERÊNCIAS + +R cookbook +https://rc2e.com/graphics + +GGPlot Scatter Plot +https://www.datanovia.com/en/lessons/ggplot-scatter-plot/ + +A Detailed Guide to the ggplot Scatter Plot in R +https://michaeltoth.me/a-detailed-guide-to-the-ggplot-scatter-plot-in-r.html + + +Chapter 5 Graphics in R Part 1: ggplot2 +https://www.jeffdoser.com/files/_book/graphics-in-r-part-1-ggplot2.html + +Problemas em gráficos +https://rafalab.github.io/dsbook/ggplot2.html + +Achieving Graphical Excellence +https://bookdown.org/mikemahoney218/LectureBook/achieving-graphical-excellence.html + +Plot Two Continuous Variables: Scatter Graph and Alternatives +http://www.sthda.com/english/articles/32-r-graphics-essentials/131-plot-two-continuous-variables-scatter-graph-and-alternatives/ + +How to draw neat polygons around scatterplot regions in ggplot2 [closed] +https://stats.stackexchange.com/questions/22805/how-to-draw-neat-polygons-around-scatterplot-regions-in-ggplot2 + From 9e843c9ab7eb49106bf62bb0d602c4bd40918aa8 Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Tue, 19 May 2020 17:44:11 -0300 Subject: [PATCH 18/21] =?UTF-8?q?Atualizando=20o=20gr=C3=A1fico=204.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 52 ++++++++++++++++++++++++++++--- 1 file changed, 48 insertions(+), 4 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index 14f78e2..03fd09b 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -170,12 +170,35 @@ grafico3<-dados %>% ``` **ANÁLISE DO GRÁFICO 4** -A quarta análise que faremos é baseada na **utilização de fontes ilegíveis**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. Sabemos que Lobster é bonito, mas não significa que você deve usa-la num gráfico. Lembre-se, é uma narrativa, não é arte. +A quarta análise que faremos é baseada na **utilização de tamanho equivocado de escala para o elemento size da variável Internet**. Perceba que a partir dessa escolha, fica impossível diferenciar o acesso +à internet entre os países, comprometendo também a visualização da quantidade de +usuários por pais, além de dificultar a visualização da relação entre PDI X comentaram_prop + ```{r} +grafico4<-dados %>% + ggplot(aes( + x = PDI, + y = comentaram_prop, + color = Internet, + size = log10(usuarios), + + )) + + geom_point(alpha = .6)+ + scale_size_continuous(range = c(10,20)) + + theme_light()+ + theme(plot.title = element_text(size = 10,face="bold",family="Times new Roman")) + + labs( + title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", + position="plot", + x = "Índice de Distância de Poder (PDI)" , + y = "Porcentagem de usuários que comentam" + ) +grafico4 +``` **ANÁLISE DO GRÁFICO 5** -A quinta análise que faremos é baseada na **utilização de cores erradas para títulos e legendas, além do posicionamento ruim da legenda**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. +A quinta análise que faremos é baseada na **utilização de cores inapropridas para títulos e legendas, além do posicionamento ruim da legenda**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. ```{r} @@ -259,9 +282,30 @@ grafico5 + theme(legend.position = "right", face="bold") ) - - ``` +Inicialmente foi considerado o gráfico acima, entretanto, ficou muito difícil +a visualização já que os elementos de usuário e internet se sobreponham. Daí, foi +criado o gráfico a seguir. + +```{r} +dados %>% + filter(!is.na(six_regions)) %>% + ggplot(aes( + x = PDI, + y = comentaram_prop, + size = Internet, + color = log10(usuarios) + )) + + facet_wrap(~ six_regions) + + geom_point(alpha = .7) + + theme(plot.title = element_text(size = 10, face = "bold")) + + labs( + title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", + subtitle = "Por continente", + y = "Porcentagem de usuários que comentam", + x = "PDI" + ) +``` A partir da análise do gráfico acima, percebemos que os maiores índices From 20f9d3b08c40f56e92a12798906d8dd5d45470e6 Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Tue, 19 May 2020 22:07:22 -0300 Subject: [PATCH 19/21] =?UTF-8?q?Finalizando=20as=20an=C3=A1lises=20e=20aj?= =?UTF-8?q?eitando=20o=20layout=20do=20documento.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- reports/comentarios-e-cultura.Rmd | 99 ++++++++++++++++--------------- 1 file changed, 52 insertions(+), 47 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index 03fd09b..05045c5 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -1,6 +1,6 @@ --- -title: "Ramon Nóbrega-comentarios-e-cultura" -author: "Ramon Nóbrega dos Santos" +title: "Disciplina FPCC2 - Prof. Fábio - Lab 3.2" +author: "Ramon Nóbrega dos Santos(Aluno especial- FPCC2 - 2020.1)" date: "19 de maio de 2020" output: html_document: @@ -8,7 +8,7 @@ output: theme: sandstone --- - Ramon Nóbrega (Aluno especial- FPCC2 - 2020.1) + ```{r echo=FALSE, message=FALSE, warning=FALSE} library(tidyverse) @@ -52,6 +52,8 @@ Considerando essa variável, queremos examinar a relação entre ela e o quão h Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto. ## Examinando essa relação +Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto. + Analisando a questão acima, é solicitada a investigação da relação entre quatro variáveis: PDI, comentaram_prop, Internet e usuarios. Para isso, a melhor forma de integrar todas elas é a partir de um gŕafico em que no eixo X tenha a variável PDI e no eixo Y a variável comentam_prop. A partir daí, podemos verificar como essas duas grandezas se relacionam. Também incluiremos as variáveis Internet e quantidade de usuários. @@ -66,7 +68,8 @@ grafico_base<-dados %>% )) + geom_point(alpha = .6)+ theme_light()+ - theme(plot.title = element_text(size = 10,face="bold",family="Times new Roman")) + + theme(plot.title = element_text(size = 13,face="bold",family="Times new Roman")) + + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", position="plot", @@ -76,30 +79,19 @@ grafico_base<-dados %>% grafico_base ``` - -Pela análise do gráfico acima, percebemos que, de forma geral, existe uma relação inversamente proporcional entre a PDI e a comentaram_prop. -Ou seja, países que possuem as relações hierárquicas menos engessadas, -com menores PDI, os seus usuários são os que mais comentam. Já países com os maiores PDI, aqueles que seus habitantes acham normal as desigualdades e a hierarquia, comentam menos.Também é possível observar que países com menores PDI possuem mais acesso à internet. De forma geral, países com populações menores comentam menos do que países com populações maiores. +



+Pela análise do gráfico acima, percebemos que, de forma geral, existe uma relação inversamente proporcional entre a PDI e a comentaram_prop. Ou seja, países que possuem as relações hierárquicas menos engessadas, com menores PDI, os seus usuários são os que mais comentam. Já países com os maiores PDI, aqueles que seus habitantes acham normal as desigualdades e a hierarquia, comentam menos.Também é possível observar que países com menores PDI possuem mais acesso à internet. De forma geral, países com populações menores comentam menos do que países com populações maiores. Percebemos também que pela coloração das bolas mais claras dos países que possuem mais acesso à internet, os seus usuários comentam mais. Isso se deve a ter estruturas sociais mais democráticas. Com relação a quantidade de usuários das plataformas, de forma geral, percebe-se uma relação proporcional entre o número de usuários e a quantidade de comentários. ## Outras formas de ver +Em seguida, faça 5 visualizações que usem as mesmas variáveis e também pontos, mas que sejam **menos eficazes** que a que você escolheu acima. -Em seguida, faça 5 visualizações que usem as mesmas variáveis e também pontos, mas que sejam **menos eficazes** que a que você escolheu acima. - -Artigo tomando como referência: -6 dicas para a visualização de dados disponível em -https://www.ibpad.com.br/blog/analise-de-dados/6-dicas-para-visualizacao-de-dados/ - -Excelente livro para refinamento de gráficos -https://socviz.co/refineplots.html - - -**ANÁLISE DO GRÁFICO 1** +**ANÁLISE DO GRÁFICO 1**


A primeira análise que faremos é baseada na **utilização de temas que tem uma relação ruim com as demais cores **. Perceba que a utilização do tema dark deixa o gráfico com uma dificuldade para enxergar valores mais escuros do azul que se confundem com os do cinza. - +



```{r} dados %>% ggplot(aes( @@ -110,7 +102,7 @@ dados %>% )) + geom_point(alpha = .6)+ theme_dark()+ - theme(plot.title = element_text(size = 10,face="bold")) + + theme(plot.title = element_text(size = 13,face="bold",family="Times new Roman")) + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", position="plot", @@ -119,8 +111,9 @@ dados %>% ) ``` +



-**ANÁLISE DO GRÁFICO 2** +**ANÁLISE DO GRÁFICO 2**


A segunda análise que faremos é baseada no **excesso de cores em um gráfico**. Estudos mostram que o excesso de cor pode confundir o visualizador. Perceba que pela visualização do gráfico fica difícil visualizar os países que possuem menos acesso à internet devido a grande quantidade de cores diferentes. @@ -135,7 +128,7 @@ dados %>% )) + geom_point(alpha = .6)+ scale_colour_gradientn(colours=rainbow(4)) + - theme(plot.title = element_text(size = 10,face="bold")) + + theme(plot.title = element_text(size = 13,face="bold",family="Times new Roman")) + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", position="plot", @@ -144,11 +137,13 @@ dados %>% ) ``` +



+ -**ANÁLISE DO GRÁFICO 3** +**ANÁLISE DO GRÁFICO 3**


A terceira análise que faremos é baseada na **escolha das variáveis equivocadas**. Nos eixo X e Y devem estar as variáveis mais importantes para a análise. Dessa forma, para constatar essa hipótese, serão mudadas as variáveis x e size: a variável x que antes era o PDI será a Internet e a variável y que antes era PDI será os usuários. Perceba que não é possível visualizar de forma clara a relação entre as variáveis PDI e a porcentagem de usuários devido a não correspondência visual entre tamanho das bolas e cores. - +



```{r} grafico3<-dados %>% ggplot(aes( @@ -158,7 +153,7 @@ grafico3<-dados %>% size = PDI )) + geom_point(alpha = .6)+ - theme(plot.title = element_text(size = 10,face="bold")) + + theme(plot.title = element_text(size = 13,face="bold",family="Times new Roman")) + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", position="plot", @@ -168,24 +163,28 @@ grafico3<-dados %>% ) grafico3 ``` +



+ -**ANÁLISE DO GRÁFICO 4** +**ANÁLISE DO GRÁFICO 4** +



A quarta análise que faremos é baseada na **utilização de tamanho equivocado de escala para o elemento size da variável Internet**. Perceba que a partir dessa escolha, fica impossível diferenciar o acesso à internet entre os países, comprometendo também a visualização da quantidade de usuários por pais, além de dificultar a visualização da relação entre PDI X comentaram_prop +



```{r} grafico4<-dados %>% ggplot(aes( x = PDI, y = comentaram_prop, - color = Internet, + color= Internet, size = log10(usuarios), )) + geom_point(alpha = .6)+ scale_size_continuous(range = c(10,20)) + theme_light()+ - theme(plot.title = element_text(size = 10,face="bold",family="Times new Roman")) + + theme(plot.title = element_text(size = 13,face="bold",family="Times new Roman")) + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", position="plot", @@ -193,12 +192,14 @@ grafico4<-dados %>% y = "Porcentagem de usuários que comentam" ) grafico4 - ``` +



-**ANÁLISE DO GRÁFICO 5** -A quinta análise que faremos é baseada na **utilização de cores inapropridas para títulos e legendas, além do posicionamento ruim da legenda**. Parece uma dica tão óbvia, mas o uso de fontes regularmente é uma fonte de problemas numa visualização. +**ANÁLISE DO GRÁFICO 5**



+A quinta análise que faremos é baseada na **utilização de cores inapropridas para títulos e legendas, além do posicionamento ruim da legenda**. Perceba que fica quase impossível enxergar as informações do título e legenda. Além disso, o posicionamento da legenda fica muito próximo do título, empobrecendo a estética +do gráfico. +



```{r} @@ -212,7 +213,7 @@ grafico5<-dados %>% )) + geom_point(alpha = .6)+ theme_light()+ - theme(plot.title = element_text(size = 10,face="bold",family="Times new Roman")) + + theme(plot.title = element_text(size = 13,face="bold",family="Times new Roman")) + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", position="plot", @@ -238,12 +239,12 @@ grafico5 + theme(legend.position = "top", color="yellow") ) - - ``` -Bônus -Inclua o continente dos países (`six_regions`) na visualização. +



+ +Bônus - Inclua a região dos países (`six_regions`) na visualização.





+Primeiramente, considerei a utilização de um gráfico que incluia uma forma shape referente a região. ```{r} grafico5<-dados %>% @@ -258,7 +259,7 @@ grafico5<-dados %>% )) + geom_point(alpha = .6)+ theme_light()+ - theme(plot.title = element_text(size = 10,face="bold",family="Times new Roman")) + + theme(plot.title = element_text(size = 13,face="bold",family="Times new Roman")) + labs( title = "Relação entre os Usuários e seus comentários", subtitle= "Incluindo PDI, acesso à Internet e continentes", @@ -283,10 +284,11 @@ grafico5 + theme(legend.position = "right", ) ``` +



Inicialmente foi considerado o gráfico acima, entretanto, ficou muito difícil a visualização já que os elementos de usuário e internet se sobreponham. Daí, foi -criado o gráfico a seguir. - +criado o gráfico a seguir, o qual é bem mais ilustrativo já que é possível a visualização clara das diferenças entre as seis regiões consideradas. A partir da análise do gráfico acima, percebemos que os maiores índices de comentários estão nos países da Europa Central e Ásia. +



```{r} dados %>% filter(!is.na(six_regions)) %>% @@ -298,21 +300,25 @@ dados %>% )) + facet_wrap(~ six_regions) + geom_point(alpha = .7) + - theme(plot.title = element_text(size = 10, face = "bold")) + + theme(plot.title = element_text(size = 13, face = "bold",family="Times new Roman")) + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", - subtitle = "Por continente", + subtitle = "Por região", y = "Porcentagem de usuários que comentam", x = "PDI" ) ``` +



+



+



+**REFERÊNCIAS** -A partir da análise do gráfico acima, percebemos que os maiores índices -de comentários estão nos países da Europa. - +6 dicas para a visualização de dados disponível em +https://www.ibpad.com.br/blog/analise-de-dados/6-dicas-para-visualizacao-de-dados/ -REFERÊNCIAS +Excelente livro para refinamento de gráficos +https://socviz.co/refineplots.html R cookbook https://rc2e.com/graphics @@ -323,7 +329,6 @@ https://www.datanovia.com/en/lessons/ggplot-scatter-plot/ A Detailed Guide to the ggplot Scatter Plot in R https://michaeltoth.me/a-detailed-guide-to-the-ggplot-scatter-plot-in-r.html - Chapter 5 Graphics in R Part 1: ggplot2 https://www.jeffdoser.com/files/_book/graphics-in-r-part-1-ggplot2.html From 5425a18c07b60a24df53ed469fb8755dfbeb724e Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Tue, 19 May 2020 23:23:05 -0300 Subject: [PATCH 20/21] Finalizando atividade. --- reports/comentarios-e-cultura.Rmd | 72 +++++++++++++------------------ 1 file changed, 30 insertions(+), 42 deletions(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index 05045c5..c88920d 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -1,5 +1,5 @@ --- -title: "Disciplina FPCC2 - Prof. Fábio - Lab 3.2" +title: "Comentários e Cultura - Disciplina FPCC2 - Prof. Fábio - Lab 3.2" author: "Ramon Nóbrega dos Santos(Aluno especial- FPCC2 - 2020.1)" date: "19 de maio de 2020" output: @@ -21,10 +21,10 @@ knitr::opts_chunk$set(tidy = FALSE, fig.width = 6, fig.height = 5) -library(extrafont) +#library(extrafont) # Só é preciso fazer isso uma única vez -extrafont::font_import() -extrafont::loadfonts() +#extrafont::font_import() +#extrafont::loadfonts() ``` ```{r read} @@ -54,8 +54,8 @@ Faça uma visualização que usa os princípios de eficácia no projeto de visua ## Examinando essa relação Faça uma visualização que usa os princípios de eficácia no projeto de visualizações para facilitar as comparações que você acha que são as mais importantes para entendermos esse contexto. -Analisando a questão acima, é solicitada a investigação da relação entre quatro variáveis: PDI, comentaram_prop, Internet e usuarios. -Para isso, a melhor forma de integrar todas elas é a partir de um gŕafico em que no eixo X tenha a variável PDI e no eixo Y a variável comentam_prop. A partir daí, podemos verificar como essas duas grandezas se relacionam. Também incluiremos as variáveis Internet e quantidade de usuários. +Analisando a questão acima, é solicitada a investigação da relação entre quatro variáveis: **PDI**, **comentaram_prop**, **Internet** e **usuarios**. Para isso, a melhor forma de integrar todas elas é a partir de um gŕafico em que no eixo X tenha a variável **PDI** e no eixo Y a variável **comentam_prop**. A partir daí, podemos verificar como essas duas grandezas se relacionam. Também incluiremos as variáveis **Internet** e **usuarios**. +



```{r} grafico_base<-dados %>% @@ -80,15 +80,12 @@ grafico_base ```



-Pela análise do gráfico acima, percebemos que, de forma geral, existe uma relação inversamente proporcional entre a PDI e a comentaram_prop. Ou seja, países que possuem as relações hierárquicas menos engessadas, com menores PDI, os seus usuários são os que mais comentam. Já países com os maiores PDI, aqueles que seus habitantes acham normal as desigualdades e a hierarquia, comentam menos.Também é possível observar que países com menores PDI possuem mais acesso à internet. De forma geral, países com populações menores comentam menos do que países com populações maiores. - -Percebemos também que pela coloração das bolas mais claras dos países que possuem mais acesso à internet, os seus usuários comentam mais. Isso se deve a ter estruturas sociais mais democráticas. Com relação a quantidade de usuários das -plataformas, de forma geral, percebe-se uma relação proporcional entre o número de usuários e a quantidade de comentários. - +Pela análise do gráfico acima, percebemos que, de forma geral, existe uma relação inversamente proporcional entre a **PDI** e a **comentaram_prop**. Ou seja, países que possuem as relações hierárquicas menos engessadas, com menores **PDI**, os seus usuários são os que mais comentam. Já países com os maiores **PDI**, aqueles que seus habitantes acham normal as desigualdades e a hierarquia, comentam menos possuindo menores **comentaram_prop**.Também é possível observar que países com menores **PDI** possuem mais acesso à internet, ou seja, possuem maiores valores de **internet**. De forma geral, países com populações menores comentam menos do que países com populações maiores. Percebemos também que pela coloração das bolas mais claras dos países que possuem mais acesso à internet, os seus usuários comentam mais. Isso se deve a ter estruturas sociais mais democráticas. Com relação a quantidade de usuários, de forma geral, percebe-se uma relação proporcional entre o número de usuários e a quantidade de comentários. +



## Outras formas de ver Em seguida, faça 5 visualizações que usem as mesmas variáveis e também pontos, mas que sejam **menos eficazes** que a que você escolheu acima. - +







**ANÁLISE DO GRÁFICO 1**


A primeira análise que faremos é baseada na **utilização de temas que tem uma relação ruim com as demais cores **. Perceba que a utilização do tema dark deixa o gráfico com uma dificuldade para enxergar valores mais escuros do azul que se confundem com os do cinza.



@@ -114,9 +111,7 @@ dados %>%



**ANÁLISE DO GRÁFICO 2**


-A segunda análise que faremos é baseada no **excesso de cores em um gráfico**. Estudos mostram que o excesso de cor pode confundir o visualizador. Perceba -que pela visualização do gráfico fica difícil visualizar os países que possuem -menos acesso à internet devido a grande quantidade de cores diferentes. +A segunda análise que faremos é baseada no **excesso de cores em um gráfico**. Estudos mostram que o excesso de cor pode confundir o visualizador. Perceba que pela visualização do gráfico fica difícil visualizar os países que possuem menos acesso à internet devido a grande quantidade de cores diferentes. ```{r} dados %>% @@ -142,7 +137,7 @@ dados %>% **ANÁLISE DO GRÁFICO 3**


A terceira análise que faremos é baseada na **escolha das variáveis equivocadas**. -Nos eixo X e Y devem estar as variáveis mais importantes para a análise. Dessa forma, para constatar essa hipótese, serão mudadas as variáveis x e size: a variável x que antes era o PDI será a Internet e a variável y que antes era PDI será os usuários. Perceba que não é possível visualizar de forma clara a relação entre as variáveis PDI e a porcentagem de usuários devido a não correspondência visual entre tamanho das bolas e cores. +Nos eixo X e Y devem estar as variáveis mais importantes para a análise. Dessa forma, para constatar essa hipótese, serão mudadas as variáveis x e size: a variável x que antes era o **PDI** será a **Internet** e a variável y que antes era **PDI** será **usuario**. Perceba que não é possível visualizar de forma clara a relação entre as variáveis **PDI** e a **usuario** devido a não correspondência visual entre tamanho das bolas e cores.



```{r} grafico3<-dados %>% @@ -168,9 +163,7 @@ grafico3<-dados %>% **ANÁLISE DO GRÁFICO 4**



-A quarta análise que faremos é baseada na **utilização de tamanho equivocado de escala para o elemento size da variável Internet**. Perceba que a partir dessa escolha, fica impossível diferenciar o acesso -à internet entre os países, comprometendo também a visualização da quantidade de -usuários por pais, além de dificultar a visualização da relação entre PDI X comentaram_prop +A quarta análise que faremos é baseada na **utilização de tamanho equivocado de escala para o elemento size da variável Internet**. Perceba que a partir dessa escolha, fica impossível diferenciar o acesso à internet entre os países, comprometendo também a visualização da quantidade de usuários por pais, além de dificultar a visualização da relação entre **PDI** X **comentaram_prop**



```{r} grafico4<-dados %>% @@ -197,12 +190,9 @@ grafico4 **ANÁLISE DO GRÁFICO 5**



-A quinta análise que faremos é baseada na **utilização de cores inapropridas para títulos e legendas, além do posicionamento ruim da legenda**. Perceba que fica quase impossível enxergar as informações do título e legenda. Além disso, o posicionamento da legenda fica muito próximo do título, empobrecendo a estética -do gráfico. +A quinta análise que faremos é baseada na **utilização de cores inapropridas para títulos e legendas, além do posicionamento ruim da legenda**. Perceba que fica bastante dificultada enxergar as informações do título e legenda. Além disso, o posicionamento da legenda fica muito próximo do título, empobrecendo a estética do gráfico.



- ```{r} - grafico5<-dados %>% ggplot(aes( x = PDI, @@ -213,7 +203,7 @@ grafico5<-dados %>% )) + geom_point(alpha = .6)+ theme_light()+ - theme(plot.title = element_text(size = 13,face="bold",family="Times new Roman")) + + theme(plot.title = element_text(size = 10,face="bold",family="Times new Roman")) + labs( title = "Relação entre os Usuários, seus comentários, PDI e acesso à Internet", position="plot", @@ -228,7 +218,7 @@ grafico5 + theme(legend.position = "top", lineheight=.5, family="Times", face="bold.italic", - colour="yellow"), + colour="orange"), axis.text.x = element_text(size=rel(1.1), family="Courier", face="bold", @@ -236,18 +226,16 @@ grafico5 + theme(legend.position = "top", axis.text.y = element_text(size=rel(1.1), family="Courier", face="bold", - color="yellow") - - ) -``` + color="yellow")) +``` +



-Bônus - Inclua a região dos países (`six_regions`) na visualização.





+**Bônus - Inclua a região dos países (`six_regions`) na visualização.**



Primeiramente, considerei a utilização de um gráfico que incluia uma forma shape referente a região. ```{r} - -grafico5<-dados %>% +grafico_bonus<-dados %>% filter(!is.na(six_regions))%>% ggplot(aes( x = PDI, @@ -255,14 +243,14 @@ grafico5<-dados %>% color = Internet, shape=six_regions, size = log10(usuarios), - + )) + geom_point(alpha = .6)+ theme_light()+ - theme(plot.title = element_text(size = 13,face="bold",family="Times new Roman")) + + theme(plot.title = element_text(size = 10,face="bold",family="Times new Roman")) + labs( title = "Relação entre os Usuários e seus comentários", - subtitle= "Incluindo PDI, acesso à Internet e continentes", + subtitle= "Incluindo PDI, acesso à Internet e regiões", position="plot", x = "Índice de Distância de Poder (PDI)" , y = "Porcentagem de usuários que comentam" @@ -270,7 +258,7 @@ grafico5<-dados %>% ) #adicionando mais características as legendas #https://socviz.co/refineplots.html -grafico5 + theme(legend.position = "right", +grafico_bonus + theme(legend.position = "right", plot.title = element_text(size=rel(1), lineheight=.5, family="Times", @@ -283,11 +271,9 @@ grafico5 + theme(legend.position = "right", face="bold") ) -``` -



-Inicialmente foi considerado o gráfico acima, entretanto, ficou muito difícil -a visualização já que os elementos de usuário e internet se sobreponham. Daí, foi -criado o gráfico a seguir, o qual é bem mais ilustrativo já que é possível a visualização clara das diferenças entre as seis regiões consideradas. A partir da análise do gráfico acima, percebemos que os maiores índices de comentários estão nos países da Europa Central e Ásia. +``` +







+Inicialmente foi considerado o gráfico acima, entretanto, ficou muito difícil a visualização já que os elementos de usuário e internet se sobreponham. Daí, foi criado o gráfico a seguir, o qual é bem mais ilustrativo já que é possível a visualização clara das diferenças entre as seis regiões consideradas.



```{r} dados %>% @@ -309,9 +295,11 @@ dados %>% ) ```



- +A partir da análise do gráfico acima, percebemos que os maiores índices de comentários estão nos países da Europa Central e Ásia. Os comentários dos países do sul da Ásia são bem pequenos. O maior acesso à internet é na região da Europa e Ásia Central.



+



+ **REFERÊNCIAS** 6 dicas para a visualização de dados disponível em From 0534b86e66ab0a2791bf5fd4e6be603c4fdace67 Mon Sep 17 00:00:00 2001 From: ramonob13 Date: Tue, 19 May 2020 23:51:03 -0300 Subject: [PATCH 21/21] Finalizando atividade. --- reports/comentarios-e-cultura.Rmd | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/reports/comentarios-e-cultura.Rmd b/reports/comentarios-e-cultura.Rmd index c88920d..171b85f 100644 --- a/reports/comentarios-e-cultura.Rmd +++ b/reports/comentarios-e-cultura.Rmd @@ -218,7 +218,7 @@ grafico5 + theme(legend.position = "top", lineheight=.5, family="Times", face="bold.italic", - colour="orange"), + colour="yellow"), axis.text.x = element_text(size=rel(1.1), family="Courier", face="bold",