-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathproyecto_1github.Rmd
164 lines (121 loc) · 6.89 KB
/
proyecto_1github.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
---
# # Formato 1: HTML sin bibliografia formateada o da error !--
title: "El chocolate"
author: "MVAP, MVAP2, MVAP3"
date: "2024-11-19"
output:
github_document:
toc: true
html_preview: false
# si no quieres el indice; output:html_document
# si quieres que sea una barra de navegación añade toc_float: true
bibliography: ["zotero.bib", "libraries.bib"]
link-citations: true
# # Formato 2: Figura al principio del documento, nombres separados, output HTML sin bibliografia formateada o da error ! --
# title: |
# ![](Logo_UCO.png){width=2in}
# "El chocolate"
# author:
# - MVAP [email protected]
# - MVAP2 [email protected]
# - MVAP3 [email protected]
# date: "`r Sys.Date()`"
# output:
# html_document:
# toc: true
# toc_float: true
# # bibliografía
# bibliography: [zotero.bib, libraries.bib]
# # crear links entre las citas de bibliografía y las citas a pie de página para poder inspeccionarlas
# link-citations: true
# Formato 3: Figura al principio del documento, nombres separados, output pdf con bibliografía formateada ! --
# title:
# ![](Logo_UCO.png){width=2in}
# "El chocolate"
# author:
# - MVAP [email protected]
# - MVAP2 [email protected]
# - MVAP3 [email protected]
# date: "`r Sys.Date()`"
# output:
# pdf_document:
# citation_package: natbib
# # bibliografía
# bibliography: [zotero.bib, libraries.bib]
# # crear links entre las citas de bibliografía y las citas a pie de página para poder inspeccionarlas
# link-citations: true
---
<!-- Antes de comenzar !!!
debes crear el archivo con las referencias de R y los paquetes que vayas a utilizar.
Puedes actualizar el archivo en cualquier momento, sólo copia en la terminal el siguiente código y añade el nuevo paquete a la lista, se creará un nuevo archivo con las referencias en el formato adecuado "BibTeX". De forma automática incluye la referencia de R-->
<!-- knitr::write_bib(c(.packages(), 'dplyr', 'ggplot2', 'knitr', 'tinytex'), 'libraries.bib') -->
<!-- Inicio Rmd -->
<!-- Configuración global de los bloques de código, `echo = TRUE` -> todo el código utilizado en este documento aparecerá en el documento final salvo que se expecifique lo contrario, a excepción de este bloque de código, `include=TRUE` -->
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```
<!-- Para generar títulos, subtítulos etc se usa # el número de # determina el estilo y el formato del texto -->
## Intruducción
### 1.1 El chocolate
<!-- Trabajamos los diferentes estilos de text (negrita, cursiva, tachado, superíndice y subíndice), notas a pie de página [^N], citas > y referencias [@código] -->
<!-- En HTML podemos usar la etiqueda de css para usar diferentes colores en el texto: -->
<!-- <span style:"color:blue"PALABRA(S)</span> -->
El <span style="color: red;">**chocolate**</span> (del náhuatl, *xocoatl*)[^1] [^2] es el alimento que se obtiene mezclando azúcar con dos producto<span style="color:blue;">**~s~**</span> que derivan de l<span style="color:green;">**^a^**</span> manipulación de las ~~semillas~~ del cacao: la masa del cacao y la manteca de cacao. A partir de esta combinación básica se elaboran los distintos tipos de chocolate que dependen de la proporción entre estos elementos y de su mezcla, o no, con otros productos ya sea como leche, colorante, y/o frutos secos [@kiss_modified_2024].
[^1]: Hernández Triviño, Ascensión (2013-12). «Chocolate: historia de un nahuatlismo». Estudios de cultura náhuatl 46: 37-87. ISSN 0071-1675. Consultado el 7 de marzo de 2021.
[^2]: Real Academia Española. «chocolate». Diccionario de la lengua española (23.ª edición).
En 1896 El famoso gastrónomo francés J. A. Brillat-Savarin definió chocolate de la siguiente manera
> "Se ha convenido en dar el nombre de chocolate a la mezcla compuesta de la semilla del árbol del cacao tostada, que lleva azúcar y canela; tal es la definición clásica del chocolate. El azúcar forma parte integrante, porque con cacao sólo resulta únicamente pasta de cacao y no chocolate."
### 1.2 Los datos
<!-- cargar las librerias que vamos a utilizar, queremos que el código se ejecute, pero no que aparezca en el documento final, también excluímos los avisos y mensajes -->
```{r cargar-librerias, echo=FALSE, warning=FALSE, message=FALSE}
library('dplyr')
library('ggplot2')
```
<!-- Leer los datos desde el fichero que está en la misma carpeta que Rmarkdown. Si el fichero está en otra carpeta actualizar la localización del archivo -->
```{r leer-datos, echo=FALSE}
mydata <- read.csv("flavors_of_cacao.csv", row.names = NULL)
```
<!-- Trabajamos los links a páginas/archivos externos [](direcciónLink) y el código R en línea -->
Los datos de este proyectos fueron descargados desde [kaggle](https://www.kaggle.com). Participaron `r length(unique(mydata$Company..Maker.if.known.))` compañias fabricantes de cocholate y se incluyeron chocolates de `r length(unique(mydata$Broad.Bean.Origin))` paises diferentes.
<!-- insertar nueva página -->
\newpage
<!-- Primera vista de los datos -->
```{r vista-datos, echo=FALSE}
knitr::kable(head(mydata, 10), align = 'c', caption = "Tabla 1: Diez primeras filas")
```
Los datos tienen `r nrow(mydata)` entradas. Si los ordenamos por número de empresas:
<!-- calcular el número de compañias por pais con la función `count` y guardar los datos ordenados de forma descendiente en variable nueva -->
```{r pais-más-empresas, echo = FALSE}
bypais <- mydata %>%
count(Company.Location) %>%
arrange(desc(n))
```
<!-- Utilizar la variable nueva para hacer un gráfico de barras incluyendo el pie de figura y la posición -->
```{r grafico-empresa-pais, echo=FALSE, fig.cap="Fig 1. Paises top productores de barras de chocolate", fig.align='center'}
ggplot(head(bypais)) +
geom_col(aes(y = Company.Location, x = n))+
xlab("Num. de compañias")+
ylab("Países")
```
### 1.3 Hipótesis
Nuestra hipótesis es que cuanto mayor es el porcentaje de cacao mayor es el rating.
## Materiales y Methods
<!-- Para indicar una referencia se utiliza [@codigo] -->
Para llevar a cabo el análisis usamos R [@R-base] con las librerias dplyr [@R-dplyr] y ggplot [@R-ggplot2; @ggplot22016]. Para la creación de este informe hemos utilizado el paquete knitr [@R-knitr; @knitr2015; @knitr2014] y pandoc y para crear PDFs tinytex [@tinytex2019]
## Resultados
Los chocolates mejor valorados tienen entre 60 y 70% de cacao (Fig 2).
```{r modelo, echo=FALSE, fig.cap="Fig 2. relación entre el ratio y el porcentaje de cacao", warning=FALSE, message=FALSE,}
ggplot(mydata, aes(x = Rating, y = Rating, color = Cocoa.Percent)) +
geom_point() +
geom_jitter() +
geom_smooth(method = 'lm')
```
## Conclusiones
Los datos no apoyan nuestra hipótesis.
---
<!-- Para asegurar la reproducibilidad de los resultados es necsario conocer el sistema operativo y la version de software y paquetes -->
## Información de la sesión y referencias
```{r sessionInfo, echo=FALSE}
session <- sessionInfo()
print(session)
```