mirror of
https://github.com/flowsta/uc3m-periodismo-datos.git
synced 2024-12-26 07:41:23 +01:00
Puesta a punto, con cuenta y email
This commit is contained in:
parent
c553bbd9ef
commit
5b661bf28e
8 changed files with 553 additions and 0 deletions
|
@ -3,6 +3,7 @@
|
||||||
Notas sobre **Periodismo de Datos** en *UC3M*
|
Notas sobre **Periodismo de Datos** en *UC3M*
|
||||||
|
|
||||||
## Qué es el periodismo de datos
|
## Qué es el periodismo de datos
|
||||||
|
### Tres saberes implicados
|
||||||
- Periodismo
|
- Periodismo
|
||||||
- Visualización
|
- Visualización
|
||||||
- Datos
|
- Datos
|
||||||
|
|
BIN
img/Concepcion_Arenal_1.jpg
Normal file
BIN
img/Concepcion_Arenal_1.jpg
Normal file
Binary file not shown.
After Width: | Height: | Size: 71 KiB |
BIN
img/concepcionarenalexpo.jpg
Normal file
BIN
img/concepcionarenalexpo.jpg
Normal file
Binary file not shown.
After Width: | Height: | Size: 37 KiB |
BIN
img/the-guardian-source.png
Normal file
BIN
img/the-guardian-source.png
Normal file
Binary file not shown.
After Width: | Height: | Size: 47 KiB |
BIN
img/thereisnocloud-bluecolor-preview.png
Normal file
BIN
img/thereisnocloud-bluecolor-preview.png
Normal file
Binary file not shown.
After Width: | Height: | Size: 36 KiB |
185
sesiones/2021-09-07.md
Normal file
185
sesiones/2021-09-07.md
Normal file
|
@ -0,0 +1,185 @@
|
||||||
|
|
||||||
|
# Adolfo Antón Bravo
|
||||||
|
|
||||||
|
- Permitidme que me presente. Soy Adolfo Antón Bravo.
|
||||||
|
- Este es mi primer año como profesor asociado en la UC3M y espero que sea el inicio de muchos.
|
||||||
|
- He dado y doy clases en diversos másters. Para no hacer propaganda y por si alguien quiere conocer mi trabajo un poco más os muestro la página web [infotics.es](https://infotics.es) donde suelo poner todo lo que hago.
|
||||||
|
- También soy [@adolflow](https://twitter.com/adolflow) en Twitter o [@flowsta](https://github.com/flowsta) en Github.
|
||||||
|
- Mi recorrido por el Periodismo de datos comienza en 2013 cuando me encontraba realizando mi programa de doctorado y me tope con el periodismo de datos y Mar Cabra. A partir de ahí no os quiero aburrir y os remito a la web.
|
||||||
|
|
||||||
|
|
||||||
|
# ¿Qué es el Periodismo de datos?
|
||||||
|
|
||||||
|
Algunos comentarios sobre el periodismo de datos:
|
||||||
|
|
||||||
|
- Se dice que en Periodismo de Datos hay que aprender Excel. Me gustaría explicaros qué es Excel a continuación.
|
||||||
|
- El periodismo de datos moderno, del que bebemos actualmente, nace en 2006-2008 con una combinación de factores: abundancia de software de código abierto, HTML5 y Open Data. Hablaremos de ello más adelante.
|
||||||
|
- [The Guardian](https://www.theguardian.com/international) es uno de los medios pioneros del periodismo de datos moderno.
|
||||||
|
- Como es una disciplina nueva también es una disciplina contenedor. Fundamentalmente hay tres áreas implicadas en el periodismo de datos:
|
||||||
|
1. El periodismo, y solo puede haber periodismo si hay investigación.
|
||||||
|
2. Los datos, es decir, registros electrónicos que han de ser tratados por ordenador.
|
||||||
|
3. La visualización de datos: desde la Web hasta el papel pasando por la estadística, las distintas visualizaciones o la infografía.
|
||||||
|
|
||||||
|
|
||||||
|
# Debate sobre el término
|
||||||
|
|
||||||
|
Esto se produjo en distintos momentos de los dos primeros días pero lo seguiremos recordando y ampliando.
|
||||||
|
|
||||||
|
- Aquí y ahora hablamos de periodismo de datos, y está bien.
|
||||||
|
- Cuando empezó en Europa y EE.UU. en 2008 se denominó periodismo guiado por datos. Suele ocurrir en inglés al menos con los saberes que, cuando se realizan de otra manera, se traslada ese proceso al nombre. Así por ejemplo en los 1990' yo hice cursos de Diseño gráfico asistido por ordenador (del *computer assisted graphic design*), ya que hasta entonces se hacía "diseño gráfico" de forma analógica.
|
||||||
|
- La irrupción de los portales de datos abiertos hizo que se denominara *Data Driven Journalism*, aunque luego se acortó a *Data Journalism*, pero ambos términos conviven.
|
||||||
|
- En EE.UU., por ejemplo, el precedente del periodismo de datos es el *precision journalism* o periodismo de precisión. José Luis Dader, catedrático de la Facultad de Ciencias de la Información de la UCM y que fue profesor durante el programa de doctorado, nos contaba cómo estuvo en EE.UU. para aprender esa disciplina y, al traerla a España y traducir el libro de Philip Meyer pensar si "periodismo de precisión" era un término apropiado. Pensó en "periodismo matemático", por su rigurosidad, pero pensaba que no se entendía bien; pensó en "periodismo informático", pero se iba a malinterpretar; o "periodismo científico", pero se iba a confundir con el periodismo que habla de ciencia. Al final se quedó con el original "periodismo de precisión" que al menos no inducía a errores y sí que hablaba de algo nuevo, sin por ello dejar de crear polémica ya que pareciera que el resto del periodismo no fuera preciso! Lo cierto es que se denominó así en EE.UU. para oponerse a un periodismo del estilo de Truman Capote.
|
||||||
|
- Ese periodismo de precisión no era la primera vez que en los EE.UU. se utilizaban ordenadores en periodismo. Veremos más adelante tanto el caso de Philip Meyer como el de la CBS de 1952. Este y otros usos de los ordenadores dieron en llamar a este periodismo como *Computer Assisted Reporting* o periodismo asistido por ordenador. Esta denominación pervive en la actualidad.
|
||||||
|
- Hay otras denominaciones en EE.UU. como la que la comunidad de computer assisted reporters ha creado: *News Nerdery* o los frikis de las redacciones.
|
||||||
|
- En Inglaterra, por ejemplo, la comunidad de periodistas de datos se ha denominado *Journocoders* o perioprogramadores.
|
||||||
|
- Y en EE.UU. también una comunidad pionera fue la denominada *Hacks and Hackers*. *Hacks* significa "hachazos" y se refiere al martilletear de teclear en la máquina de escribir.
|
||||||
|
- En Argentina, Sandra Crucianelli sigue hablando de "periodismo de bases de datos", y no le falta razón pues finalmente, para trabajar con los datos, alguna "base de datos" has de tener… aunque el concepto de base de datos también ha evolucionado.
|
||||||
|
|
||||||
|
|
||||||
|
# Qué conocimientos previos tenéis
|
||||||
|
|
||||||
|
Comentáis tres tecnologías:
|
||||||
|
|
||||||
|
|
||||||
|
## Wordpress
|
||||||
|
|
||||||
|
- No lo vamos a usar pero me gusta que lo citéis para ver si sabemos lo que es y todo lo que implica.
|
||||||
|
- [Wordpress](https://wordpress.com/es/) es un *CMS* (Content Management System, sistema de gestión de contenidos).
|
||||||
|
- Tanto Wordpress como otros CMS funcionan con la arquitectura WAMP o LAMP, principalmente está última.
|
||||||
|
- *LAMP* responde a Linux, Apache, MySQL y PHP y es la combinación de las cuatro tecnologías implicadas en Wordpress.
|
||||||
|
- Cuando vemos una página en Wordpress estamos viendo el ordenador de alguien, sea una persona o una empresa. Ese ordenador va normalmente con el sistema operativo GNU/Linux.
|
||||||
|
- Para que ese ordenador sirva páginas web requiere un servidor web. [Apache](https://apache.org/) es el más utilizado en el mundo, es software libre también, como GNU/Linux, aunque con otra licencia. También se usa mucho [NGINX](https://www.nginx.com/).
|
||||||
|
- En el HTML de Wordpress se incluye el lenguaje de programación [PHP](https://www.php.net/) (PHP Hypertext Preprocessor, un acrónimo recursivo, figura muy utilizada en el mundo del software) que es el que construye las páginas HTML haciendo las llamadas a la base de datos donde se almacenan los contenidos de Wordpress.
|
||||||
|
- MySQL (donde SQL significa *Structured Query Language* o lenguaje de consulta estructurada) es el servidor de la base de datos.
|
||||||
|
|
||||||
|
|
||||||
|
## SEO
|
||||||
|
|
||||||
|
- *SEO* responde a *Search Engine Optimization* u optimización del motor de búsqueda.
|
||||||
|
- No tiene más relación con Wordpress que el hecho de que Wordpress se utiliza para hacer web y cualquier web suele querer ser encontrada por un motor de búsqueda. Lo veremos en otro momento.
|
||||||
|
|
||||||
|
|
||||||
|
## Excel
|
||||||
|
|
||||||
|
- No vamos a usar Excel pero conviene que sepamos qué es y por qué.
|
||||||
|
- Hay quien confunde Excel con hojas de cálculo o tablas de datos pero Excel es, por un lado, un programa para visualizar datos tabulados; por otro, un programa donde se pueden utilizar funciones para trabajar con los datos tabulados; y finalmente, un formato de datos XLSX.
|
||||||
|
- Para trabajar con datos tabulados veremos más adelante distintas formas, preferiblemente libres y/o abiertas.
|
||||||
|
- La última X proviene de XML cuando en 2008 Microsoft Office convirtió sus formatos de archivo en formatos compatibles con XML.
|
||||||
|
- *XML* significa *eXtensible Markup Language*. Se utiliza mucho en la industria/administraciones públicas pero no vamos a utilizarlo, al menos de momento, a no ser que lleguemos a otra cosa que es el *XPath* para el *scrapping*.
|
||||||
|
- Básicamente, XML es como que cualquiera puede crear sus propios elementos HTML. Por eso se puede utilizar para organizar la información, los datos o los procesos y compartirlo, si se quisiera.
|
||||||
|
- Microsoft Office es software propietario y privativo, no permite el libre uso. Más información en la siguiente sesión.
|
||||||
|
- Quizás veamos cosas de
|
||||||
|
|
||||||
|
|
||||||
|
## HTML
|
||||||
|
|
||||||
|
Veamos un poco también de *HTML* ya que, aunque no vamos a trabajarlo específicamente, sí que se usará en determinados momentos.
|
||||||
|
|
||||||
|
- *HTML* es el acrónimo de *HyperText Markup Language* o lenguaje de marcado de hipertexto.
|
||||||
|
- Es uno de los lenguajes, el básico y principal, que se utiliza en la Web.
|
||||||
|
- Es un lenguaje estructurado de marcas expresado en los signos `<>`.
|
||||||
|
- Dentro de las marcas se sitúan los **elementos** HTML como por ejemplo `p` de párrafo o `h1` de *header 1*, algo así como el título o encabezamiento principal.
|
||||||
|
- Conviene no confundir marcas con elementos.
|
||||||
|
- HTML es un lenguaje informático pero no es un lenguaje de programación.
|
||||||
|
- En un navegador (me refiero a Firefox, Chrome o derivados) si pulsamos el atajo de teclado `C-u` (Control + u) accedemos al código fuente de la página.
|
||||||
|
- Probad con una página de un medio internacional como [The Guardian](https://www.theguardian.com/) que además es referente como pionero del periodismo de datos moderno con el equipo del Datablog en 2008 compuesto por Simon Rogers y Paul Bradshaw (ya hablaremos de ellos en próximas clases).
|
||||||
|
- Lo que sale entre las marcas `<!--` y `-->` son comentarios de HTML, es decir, contenido que aunque está en el codigo fuente, en el HTML, no se visualiza. Esto es habitual en todos los lenguajes informáticos, unos caracteres reservados para que el navegador/visualizador del HTML, no interprete el contenido que está a continuación.
|
||||||
|
- Si no llegas aquí no puedes saber que quizás seas la próxima persona a la que contraten.
|
||||||
|
|
||||||
|
![img](//img/the-guardian-source.png "We are Hiring!")
|
||||||
|
|
||||||
|
|
||||||
|
# Lenguajes informáticos
|
||||||
|
|
||||||
|
Habéis comentado que algunas cosas os suenan a *lenguajes informáticos* o *lenguajes de programación* pero, ¿son lo mismo?
|
||||||
|
|
||||||
|
- Los lenguajes informáticos son todos los que entiende o puede entender el ordenador (a través de software, claro).
|
||||||
|
- Dentro de los lenguajes informáticos están los lenguajes estructurados, como puede ser HTML, que sirve para estructurar documentos.
|
||||||
|
- Y también están los lenguajes de programación que sirven para programar acciones que haga el ordenador. Entre estos se encuentran Java, C, C#, Python o R.
|
||||||
|
- En la web se utiliza mucho JavaScript, es el que aporta la interactividad. Tampoco lo vamos a abordar pero algo veremos… ¡al menos saber que existe y qué es lo que hace!
|
||||||
|
|
||||||
|
|
||||||
|
# ¿Qué es la Web?
|
||||||
|
|
||||||
|
Ante esta preguntas algunas habéis respondido:
|
||||||
|
|
||||||
|
1. Un sistema que comunica información que se comparte globalmente.
|
||||||
|
2. Un espacio virtual de compartimentos que se relacionan entre sí.
|
||||||
|
3. Una base de servidores
|
||||||
|
4. ¿Qué pintan los dominios?
|
||||||
|
|
||||||
|
Son buenas respuestas para debatir. Un aspecto importante de la Web es que, a nivel técnico, es otro servicio de los que corren/se prestan en la red de redes que es Internet.
|
||||||
|
|
||||||
|
|
||||||
|
# Qué es Internet
|
||||||
|
|
||||||
|
La Internet… :keycap\_asterisk:
|
||||||
|
|
||||||
|
- Además de la mencionada definición concisa y precisa de "una red de redes", Internet funciona gracias a los protocolos TCP/IP.
|
||||||
|
- *TCP* responde a *Transmission Control Protocol* o protocolo de control de la transmisión.
|
||||||
|
- *IP* responde a *Internet Protocol*, os resultará más familiar porque al estar conectado a una red como es una Intranet el router nos tiene que dar una dirección de la red local, una IP.
|
||||||
|
- En una red TCP/IP hay unos 65500 puertos de escucha o de comunicación posible. La Web utiliza uno de ellos al menos, el 80.
|
||||||
|
- Hay otros servicios como el correo electrónico o la mensajería instantánea que utilizan otros puertos.
|
||||||
|
- Es cierto que se puede acceder a servicios de correo electrónico y mensajería instantánea por la Web, eso es porque las webs también pueden ser *webapps* o aplicaciones web. Esas aplicaciones conectan con los servicios de correo electrónico o mensajería instantánea que operan en los otros puertos y nos los muestran en un entorno web.
|
||||||
|
|
||||||
|
|
||||||
|
# HTTP
|
||||||
|
|
||||||
|
También os suena y sabéis la diferencia entre HTTP y HTTPS, la S es de "segura" y ahora es el estándar por defecto. No os fiéis de una página que no lo tenga.
|
||||||
|
|
||||||
|
- *HTTP* responde a *HyperText Transmission Protocol* o protocolo de control de la transmisión.
|
||||||
|
- Es como funciona la web, un protocolo muy simple pero no por ello limitado, al contrario.
|
||||||
|
- Cuenta con 4 acciones posibles:
|
||||||
|
1. POST, publicar o crear. Es cuando se crea un documento nuevo.
|
||||||
|
2. GET, obtener o bajarse. Es lo que hacemos cuando vemos una página web, solicitamos una copia de la web al servidor.
|
||||||
|
3. DELETE, borrar el documento.
|
||||||
|
4. PUT, actualiza un documento ya existente.
|
||||||
|
- Esta es una de las *APIs* más sencillas y conocidas. *API* significa *Access Programming Interface* o interfaz de programación de acceso, es algo así como los códigos para comunicarse con una web.
|
||||||
|
- HTTP es una API universal pero luego cada recurso puede tener la suya propia. Por ejemplo, Twitter tiene su propia API y así ocurre con muchos recursos que tienen muchos contenidos que ofrecen de maneras diversas.
|
||||||
|
- Si recordáis estas cuatro acciones que permite HTTP os aseguro que tenéis mucho ganado en relación con el uso que vais a hacer de la Web.
|
||||||
|
|
||||||
|
|
||||||
|
# Dominios
|
||||||
|
|
||||||
|
Y también habéis comentado algo de los dominios.
|
||||||
|
|
||||||
|
- Los dominios están ahí para evitar tener que sabernos la dirección IP del servidor donde está alojada la página web que queremos visitar.
|
||||||
|
- Cuando escribimos el dominio en el navegador el ordenador consulta con el servidor de nombres de dominio *DNS* (/Domain Name System
|
||||||
|
|
||||||
|
) e indica en qué dirección IP se encuentra alojada la web. Esto es una petición GET de HTTP.
|
||||||
|
|
||||||
|
|
||||||
|
# Github
|
||||||
|
|
||||||
|
Os presento a [Github](https://github.com). Aunque lo ha comprado Micro$oft y ha perdido mucho de su glamour es una buena forma de habituarse a trabajar con un software de control de versiones que permite la colaboración y además, Github ofrece algunas posibilidades que hacen que lo vayamos a utilizar bastante.
|
||||||
|
|
||||||
|
- Se trata de una de las herramientas más usadas en periodismo de datos.
|
||||||
|
- Github es la suma de [git](https://git-scm.org), el software, y hub, el espacio montado por GitHub..
|
||||||
|
- Github es un espacio donde podemos alojar los repositorios o proyectos git.
|
||||||
|
- Empezamos dando por válido una analogía: es como un Wordpress donde vamos a poner nuestros contenidos web.
|
||||||
|
- Se pueden crear repositorios, algo así como una carpeta de nuestro sistema de ficheros del ordenador.
|
||||||
|
- Ahora también se pueden crear proyectos pero, de momento, creamos un repositorio.
|
||||||
|
- Hay que crear una cuenta :abc:
|
||||||
|
- En GitHub y en lo que escribamos no utilizaremos M$Word sino otros programas libres y/o abiertos y la sintaxis simple Markdown.
|
||||||
|
|
||||||
|
|
||||||
|
# Las nubes
|
||||||
|
|
||||||
|
¡Cuidado con las nubes! :cloud-lightning:
|
||||||
|
|
||||||
|
- Se habla de la nube, cloud storage, *cloud computing* pero no hay nubes sino ordenadores de otras personas.
|
||||||
|
- En Periodismo de datos, dado que es periodismo de investigación, conviene no utilizar software del que no nos fiemos ni aplicaciones de terceros ni servicios en la nube. No solo nuestros datos o nuestra investigación pueden estar en peligro, también nosotrxs mismxs.
|
||||||
|
- Preferiblemente usaremos aplicaciones libres y/o abiertas y aplicaciones locales, aunque hay algunas excepciones que debieran circunscribirse al inicio y ser temporales.
|
||||||
|
|
||||||
|
![img](//img/thereisnocloud-bluecolor-preview.png "There is no cloud, just other people's computers")
|
||||||
|
|
||||||
|
|
||||||
|
# Herramientas de visualización
|
||||||
|
|
||||||
|
- Depende del ritmo, veremos unas u otras. Hay muuuuchas.
|
||||||
|
- Seguro que veremos [Datawrapper](https://www.datawrapper.de/) que aunque es un servicio de terceros, es gratuita y está basada en [D3js](https://d3js.org/) que es libre.
|
||||||
|
- Hay otras similares como Infogram o Flourish.
|
||||||
|
- Hay librerías de visualización de datos de los lenguajes de programación Bash, Python y R que veremos si exploramos o no.
|
||||||
|
- Atlas o taxonomías de visulización de datos.
|
||||||
|
- Ejemplos, proyectos, compendios, newsletters…
|
||||||
|
|
184
sesiones/2021-09-08.md
Normal file
184
sesiones/2021-09-08.md
Normal file
|
@ -0,0 +1,184 @@
|
||||||
|
|
||||||
|
# Tres saberes implicados en Periodismo de Datos
|
||||||
|
|
||||||
|
A propósito de una pregunta sobre "¿quiénes somos, de dónde venimos y a dónde vamos?", recordamos los tres saberes implicados en periodismo de datos:
|
||||||
|
|
||||||
|
1. Periodismo
|
||||||
|
2. Visualización
|
||||||
|
3. Datos
|
||||||
|
|
||||||
|
Los tres son importantes pero ojo que la visualización va más allá de la visualización como producto final. En la etapa de visualizar también realizamos análisis, aplicamos técnicas estadísticas, programas informáticos que hagan que de un gran volumen de datos seamos capaces de sacar hipótesis o conclusiones.
|
||||||
|
|
||||||
|
|
||||||
|
# Uso de herramientas o software libres
|
||||||
|
|
||||||
|
Cuando se habla de herramientas libres, de software, se refiere al hecho de que tengan licencias de software libres y/o abiertas.
|
||||||
|
|
||||||
|
- Sin abordar una vieja polémica entre software libre vs software de código abierto, hablamos aquí de todas ellas como un conjunto.
|
||||||
|
- Tened en cuenta que el software, en España/Europa, tiene consideración de obra inmaterial y tiene los mismos derechos que el Copyright de las obras escritas.
|
||||||
|
- Cuando escribimos no hace falta señalar el Copyright, lo tenemos por ley por defecto, de manera predeterminada.
|
||||||
|
- Se pueden resumir los usos sobre una obra inmaterial en cuatro:
|
||||||
|
1. Uso. Lectura de un libro o lectura de un software.
|
||||||
|
2. Distribución. Dejar prestado el libro, texto o software.
|
||||||
|
3. Modificación. Poder adaptar el texto, libro o software.
|
||||||
|
4. Redistribución. Poder distribuir esa adaptación
|
||||||
|
- El software libre y las licencias [Creative Commons](https://creativecommons.org/) (utilizadas en producción cultural) "juegan" con esos derechos del Copyright para cederlos.
|
||||||
|
- Por ejemplo, [eldiario.es](https://www.eldiario.es/) tiene una licencia [Creative Commons](https://creativecommons.org/licenses/by-nc/4.0/deed.es) BY-NC, es decir, se puede usar su contenido pero hay que citar su proveniencia y autoría (BY) pero no se puede hacer esto de forma comercial (NC, Non Commercial).
|
||||||
|
- Hay otras licencias como las consideradas "AntiCopyright" de BSD ya que solo con mencionar la proveniencia permitían la adaptación y redistribución total de las obras derivadas. Esto es lo que ocurrió con parte del sistema operativo MacOSX que está basado en OpenBSD (como siempre, en los resúmenes se pierden detalles importantes, en [StackExchange](https://unix.stackexchange.com/questions/695/where-does-mac-os-x-come-from) hay un hilo sobre esto).
|
||||||
|
- Con el software libre no solo se pueden hacer las cosas que el software permita sino que, si avanzamos en el conocimiento del propio software, podemos participar de su creación.
|
||||||
|
|
||||||
|
|
||||||
|
# Git
|
||||||
|
|
||||||
|
- [Git](https://git-scm.com/) se utiliza en proyectos de software. Es un programa para el trabajo colaborativo y distribuido.
|
||||||
|
- También se utiliza en proyectos de periodismo y visualización de datos.
|
||||||
|
- Hay una visión del periodismo de datos denominada "Content as Code" que encaja con este uso.
|
||||||
|
- En cualquier caso, tiene muchas ventajas. Los únicos inconvenientes pueden venir de no conocer bien cómo funciona.
|
||||||
|
- Permite ramas de los proyectos que luego pueden integrarse.
|
||||||
|
- Permite volver a momentos concretos de los proyectos.
|
||||||
|
- Nos acostumbra a trabajar comentando lo que hacemos.
|
||||||
|
- Nos habituamos a un software cliente/servidor.
|
||||||
|
- Permite más de un servidor.
|
||||||
|
- Lo crea Linus Torvalds, el mismo creador del kernel Linux (de los sistemas operativos GNU/Linux) precisamente para el desarrollo del kernel, de esta parte fundamental del software de un sistema operativo.
|
||||||
|
|
||||||
|
|
||||||
|
# Github
|
||||||
|
|
||||||
|
- Dado que git nace de los proyectos de software conviene saber qué tres piezas suelen tener estos proyectos, aunque a veces esté todo resumido en el propio archivo del software:
|
||||||
|
1. El archivo Readme, en texto plano, donde se explica de qué va el software, cómo surgió, quién/es están detrás de él, cómo se usa, etc.
|
||||||
|
2. La licencia del software.
|
||||||
|
3. El propio software
|
||||||
|
- Mis notas de Github las podéis encontrar [aquí](https://github.com/flowsta/github).
|
||||||
|
|
||||||
|
|
||||||
|
# Datos
|
||||||
|
|
||||||
|
- Volviendo la mirada sobre los datos, recordad que cuando hablamos de datos no nos referimos solo a unos datos estructurados o a un conjunto de datos.
|
||||||
|
- Veremos datos de todo tipo y también tipos de datos.
|
||||||
|
- Pero pensad que se tratan de registros electrónicos, donde puede haber datos estructurados pero también no estructurados, el texto y/o la web como datos, la música, las imágenes, los vídeos…
|
||||||
|
- E incluso nuestro comportamiento, tanto con las aplicaciones como con los dispositivos electrónicos.
|
||||||
|
- Se pregunta si en una página se puede seguir cuando pinchas en un enlace y cuando no… se puede seguir todo, es decir, se registra todo nuestro comportamiento, se puede reproducir, se hacen pruebas constantes con lo que hacemos, con nuestras decisiones, nuestros estímulos… técnicas A/B, etc.
|
||||||
|
|
||||||
|
|
||||||
|
# Markdown
|
||||||
|
|
||||||
|
- En el mundo de los datos, el tamaño importa.
|
||||||
|
- La Web funciona con HTML, actualmente la versión 5: HTML5
|
||||||
|
- HTML está muy bien pero Dan Gruber pensó que tenía un inconveniente: era difícil de leer el texto de un código HTML.
|
||||||
|
- Por eso inventó Markdown. Markdown es dos cosas a la vez:
|
||||||
|
1. Una sintaxis simple. Veréis que es muy, muy simple.
|
||||||
|
2. Un "parseador" o conversor de esa sintaxis en HTML
|
||||||
|
- Así, en Github escribimos Markdown y Github lo muestra como HTML, pero si vemos el archivo fuente sigue siendo Markdown. Tiene truco, claro. Si le das a "ver código fuente" lo ves en HTML pero ese HTML no es el que modificas para que se vea un HTML u otro sino que lo que modificas es Markdown y luego se hace la conversión de nuevo.
|
||||||
|
- Markdown es tan simple que hay sitios donde no llega. Por eso desde el inicio se permite en Markdown usar también lenguaje HTML si lo necesitamos.
|
||||||
|
- También hay versiones de Markdown como Markdown BlackFriday o RMarkdown en R.
|
||||||
|
- Hay muchas guías de Markdown. Lo mejor es probar y aprender.
|
||||||
|
- Mi guía la podéis encontrar en [github](https://github.com/flowsta/markdown).
|
||||||
|
|
||||||
|
|
||||||
|
# Pero, ¿por qué tantas tecnologías y términos?
|
||||||
|
|
||||||
|
- Veamos, volvamos al principio. Estamos en Periodismo de Datos. Sí, podríamos tener una pequeña tabla, ir a un servicio de terceros y hacer un gráfico. Fácil. De hecho, lo haremos.
|
||||||
|
- Parémonos un momento en eso que dijimos del *Computer Assisted Reporting*, periodismo asistido por ordenador. Sí, esto es fundamental, debemos saber manejar un ordenador.
|
||||||
|
|
||||||
|
|
||||||
|
## Programación literaria e investigación reproducible
|
||||||
|
|
||||||
|
- Ya en programación Donald Knuth, inventor del fundamental \LaTeX, pieza clave en la investigación reproducible, lo hizo pensando en el paradigma de la "programación literaria".
|
||||||
|
- Es decir, como vimos con HTML, todo lenguaje informático tiene "comentarios" sobre el código.
|
||||||
|
- Estos comentarios son útiles para recordarme por dónde voy, por qué he hecho tal cosa si tal otra falló, lo que quiero hacer, etc.
|
||||||
|
- La programación literaria propone hacerlo "al revés". Es decir, escribir lo que quiero hacer y los trozos que sean código identificarlos como tal.
|
||||||
|
|
||||||
|
|
||||||
|
## Content as Code
|
||||||
|
|
||||||
|
- Tanto Github como Markdown como otras tecnologías están alineadas con algo que se ha denominado "el contenido como código".
|
||||||
|
- En el mundo del periodismo de datos se utiliza mucho Python con Jupyter; R con RStudio; Javascript con ObservableHQ; etc. Los veremos en otro momento.
|
||||||
|
- El uso de sintaxis simple nos permite reutilizar el texto, nuestro código, y también insertar código.
|
||||||
|
|
||||||
|
|
||||||
|
## COPE
|
||||||
|
|
||||||
|
- En la radio pública de EE.UU. desarrollaron la estrategia *COPE*: *Create Once, Publish Everywhere* para reutilizar contenidos de las distintas emisoras.
|
||||||
|
|
||||||
|
|
||||||
|
# Manos a la obra: Github
|
||||||
|
|
||||||
|
- Entramos en Github
|
||||||
|
- Creamos un repositorio nuevo
|
||||||
|
- Lo llamamos, por ejemplo, "uc3m-periodismo-datos". Es importante en este momento que, si no lo hacíais hasta ahora, empecéis a no usar espacios en blanco para los nombres de archivo y directorios/carpetas :boom:
|
||||||
|
- Sí que inicializamos el repositorio con un archivo que se llamará "README.md". El ".md" significa que tiene sintaxis Markdown.
|
||||||
|
- Finalizamos el proceso.
|
||||||
|
- Ahora tenemos un archivo `README.md` que contiene una sola línea "# uc3m-periodismo-datos". Esto es porque Github ha tomado el nombre del repositorio y lo ha convertido en el título o H1 de HTML en este documento.
|
||||||
|
|
||||||
|
|
||||||
|
## Editar
|
||||||
|
|
||||||
|
Vamos al lápiz, pinchamos y editamos. Escribimos:
|
||||||
|
|
||||||
|
# Periodismo de Datos en UC3M
|
||||||
|
|
||||||
|
Notas sobre **Periodismo de Datos** en *UC3M*
|
||||||
|
|
||||||
|
## Qué es el periodismo de datos
|
||||||
|
- Periodismo
|
||||||
|
- Visualización
|
||||||
|
- Datos
|
||||||
|
|
||||||
|
## HTTP
|
||||||
|
Es una _API_ que tiene cuatro tareas posibles:
|
||||||
|
1. POST
|
||||||
|
2. GET
|
||||||
|
3. DELETE
|
||||||
|
4. PUT
|
||||||
|
|
||||||
|
- Veis que en el editor hay una pestaña a la derecha para previsualizar el texto en HTML.
|
||||||
|
- Si estamos de acuerdo, "guardamos".
|
||||||
|
- En Github, como es software git lo que hay detrás, no se "guarda" el documento sino que se hace un "commit", una explicación simple o extensa de lo que hemos hecho, por si tuviéramos que volver a este punto. Ahora sí, "comiteamos".
|
||||||
|
- Si queremos volver a editar para cambiar algo, repetimos la operación.
|
||||||
|
|
||||||
|
|
||||||
|
## Crear archivo
|
||||||
|
|
||||||
|
- Pinchamos en crear archivo y lo nombramos.
|
||||||
|
- Importante:
|
||||||
|
- No usar tildes ni espacios en blanco ni caracteres que no sean ASCII, es decir, tampoco las eñes.
|
||||||
|
- Si se trata de un archivo markdown tendrá una extensión "md", como el README, es decir, por ejemplo, "nuevo-archivo.md"
|
||||||
|
|
||||||
|
|
||||||
|
# Para el próximo día
|
||||||
|
|
||||||
|
Ahora que ya tenemos un primer repositorio en Github y que sabéis crear archivos, os propongo que escribáis un comentario crítico sobre una o varias visualizaciones de datos y/o infografías.
|
||||||
|
|
||||||
|
- No se exige un número mínimo de palabras ni máximo.
|
||||||
|
- Puede ser de una o de varias.
|
||||||
|
- Lo interesante no es que me enseñéis la que pensáis que puede ser para mí la mejor visualización o infografía sino que escribáis libremente, sin prejuicios.
|
||||||
|
- Importante, repito: este texto tiene que estar en formato Markdown en un documento creado en el mismo repositorio de Github que habéis creado.
|
||||||
|
- Si la/s visualizaciones o infografía/s tienen URL, podéis añadirlas.
|
||||||
|
- Cualquier duda la podemos resolver también por el foro.
|
||||||
|
|
||||||
|
|
||||||
|
# Para la próxima sesión…
|
||||||
|
|
||||||
|
|
||||||
|
## Tener instalada el emulador de terminal
|
||||||
|
|
||||||
|
- En Windows hay que descargarse [Cygwin](https://cygwin.com)
|
||||||
|
- En MacOSX hay que descargarse y activar XCode. En MacPorts hay una [guía](https://guide.macports.org/#installing.xcode) pero seguro que hay otras.
|
||||||
|
|
||||||
|
|
||||||
|
## Cosas que nunca te dije
|
||||||
|
|
||||||
|
- [ ] Arquitectura cliente/servidor
|
||||||
|
- [ ] Periodismo de bases de datos
|
||||||
|
- [ ] Mostrar D3js.
|
||||||
|
- [ ] Crear una cuenta en Datawrapper.
|
||||||
|
- [ ] Explicar JSON como formato de datos.
|
||||||
|
- [ ] Explicar formatos de datos.
|
||||||
|
- [ ] Licencias de datos
|
||||||
|
- [ ] Bibliografía
|
||||||
|
- [ ] Comunidades
|
||||||
|
- [ ] Ejemplos
|
||||||
|
- [ ] Taxonomías de visualización
|
||||||
|
- [ ] Periodismo de datos como ciencia de datos.
|
||||||
|
- [ ] La pirámide invertida del periodismo de datos.
|
||||||
|
|
183
sesiones/2021-09-08.md~
Normal file
183
sesiones/2021-09-08.md~
Normal file
|
@ -0,0 +1,183 @@
|
||||||
|
|
||||||
|
# Tres saberes implicados en Periodismo de Datos
|
||||||
|
|
||||||
|
A propósito de una pregunta sobre "¿quiénes somos, de dónde venimos y a dónde vamos?", recordamos los tres saberes implicados en periodismo de datos:
|
||||||
|
|
||||||
|
1. Periodismo
|
||||||
|
2. Visualización
|
||||||
|
3. Datos
|
||||||
|
|
||||||
|
Los tres son importantes pero ojo que la visualización va más allá de la visualización como producto final. En la etapa de visualizar también realizamos análisis, aplicamos técnicas estadísticas, programas informáticos que hagan que de un gran volumen de datos seamos capaces de sacar hipótesis o conclusiones.
|
||||||
|
|
||||||
|
|
||||||
|
# Uso de herramientas o software libres
|
||||||
|
|
||||||
|
Cuando se habla de herramientas libres, de software, se refiere al hecho de que tengan licencias de software libres y/o abiertas.
|
||||||
|
|
||||||
|
- Sin abordar una vieja polémica entre software libre vs software de código abierto, hablamos aquí de todas ellas como un conjunto.
|
||||||
|
- Tened en cuenta que el software, en España/Europa, tiene consideración de obra inmaterial y tiene los mismos derechos que el Copyright de las obras escritas.
|
||||||
|
- Cuando escribimos no hace falta señalar el Copyright, lo tenemos por ley por defecto, de manera predeterminada.
|
||||||
|
- Se pueden resumir los usos sobre una obra inmaterial en cuatro:
|
||||||
|
1. Uso. Lectura de un libro o lectura de un software.
|
||||||
|
2. Distribución. Dejar prestado el libro, texto o software.
|
||||||
|
3. Modificación. Poder adaptar el texto, libro o software.
|
||||||
|
4. Redistribución. Poder distribuir esa adaptación
|
||||||
|
- El software libre y las licencias [Creative Commons](https://creativecommons.org/) (utilizadas en producción cultural) "juegan" con esos derechos del Copyright para cederlos.
|
||||||
|
- Por ejemplo, [eldiario.es](https://www.eldiario.es/) tiene una licencia [Creative Commons](https://creativecommons.org/licenses/by-nc/4.0/deed.es) BY-NC, es decir, se puede usar su contenido pero hay que citar su proveniencia y autoría (BY) pero no se puede hacer esto de forma comercial (NC, Non Commercial).
|
||||||
|
- Hay otras licencias como las consideradas "AntiCopyright" de BSD ya que solo con mencionar la proveniencia permitían la adaptación y redistribución total de las obras derivadas. Esto es lo que ocurrió con parte del sistema operativo MacOSX que está basado en OpenBSD (como siempre, en los resúmenes se pierden detalles importantes, en [StackExchange](https://unix.stackexchange.com/questions/695/where-does-mac-os-x-come-from) hay un hilo sobre esto).
|
||||||
|
- Con el software libre no solo se pueden hacer las cosas que el software permita sino que, si avanzamos en el conocimiento del propio software, podemos participar de su creación.
|
||||||
|
|
||||||
|
|
||||||
|
# Git
|
||||||
|
|
||||||
|
- [Git](https://git-scm.com/) se utiliza en proyectos de software. Es un programa para el trabajo colaborativo y distribuido.
|
||||||
|
- También se utiliza en proyectos de periodismo y visualización de datos.
|
||||||
|
- Hay una visión del periodismo de datos denominada "Content as Code" que encaja con este uso.
|
||||||
|
- En cualquier caso, tiene muchas ventajas. Los únicos inconvenientes pueden venir de no conocer bien cómo funciona.
|
||||||
|
- Permite ramas de los proyectos que luego pueden integrarse.
|
||||||
|
- Permite volver a momentos concretos de los proyectos.
|
||||||
|
- Nos acostumbra a trabajar comentando lo que hacemos.
|
||||||
|
- Nos habituamos a un software cliente/servidor.
|
||||||
|
- Permite más de un servidor.
|
||||||
|
- Lo crea Linus Torvalds, el mismo creador del kernel Linux (de los sistemas operativos GNU/Linux) precisamente para el desarrollo del kernel, de esta parte fundamental del software de un sistema operativo.
|
||||||
|
|
||||||
|
|
||||||
|
# Github
|
||||||
|
|
||||||
|
- Dado que git nace de los proyectos de software conviene saber qué tres piezas suelen tener estos proyectos, aunque a veces esté todo resumido en el propio archivo del software:
|
||||||
|
1. El archivo Readme, en texto plano, donde se explica de qué va el software, cómo surgió, quién/es están detrás de él, cómo se usa, etc.
|
||||||
|
2. La licencia del software.
|
||||||
|
3. El propio software
|
||||||
|
|
||||||
|
|
||||||
|
# Datos
|
||||||
|
|
||||||
|
- Volviendo la mirada sobre los datos, recordad que cuando hablamos de datos no nos referimos solo a unos datos estructurados o a un conjunto de datos.
|
||||||
|
- Veremos datos de todo tipo y también tipos de datos.
|
||||||
|
- Pero pensad que se tratan de registros electrónicos, donde puede haber datos estructurados pero también no estructurados, el texto y/o la web como datos, la música, las imágenes, los vídeos…
|
||||||
|
- E incluso nuestro comportamiento, tanto con las aplicaciones como con los dispositivos electrónicos.
|
||||||
|
- Se pregunta si en una página se puede seguir cuando pinchas en un enlace y cuando no… se puede seguir todo, es decir, se registra todo nuestro comportamiento, se puede reproducir, se hacen pruebas constantes con lo que hacemos, con nuestras decisiones, nuestros estímulos… técnicas A/B, etc.
|
||||||
|
|
||||||
|
|
||||||
|
# Markdown
|
||||||
|
|
||||||
|
- En el mundo de los datos, el tamaño importa.
|
||||||
|
- La Web funciona con HTML, actualmente la versión 5: HTML5
|
||||||
|
- HTML está muy bien pero Dan Gruber pensó que tenía un inconveniente: era difícil de leer el texto de un código HTML.
|
||||||
|
- Por eso inventó Markdown. Markdown es dos cosas a la vez:
|
||||||
|
1. Una sintaxis simple. Veréis que es muy, muy simple.
|
||||||
|
2. Un "parseador" o conversor de esa sintaxis en HTML
|
||||||
|
- Así, en Github escribimos Markdown y Github lo muestra como HTML, pero si vemos el archivo fuente sigue siendo Markdown. Tiene truco, claro. Si le das a "ver código fuente" lo ves en HTML pero ese HTML no es el que modificas para que se vea un HTML u otro sino que lo que modificas es Markdown y luego se hace la conversión de nuevo.
|
||||||
|
- Markdown es tan simple que hay sitios donde no llega. Por eso desde el inicio se permite en Markdown usar también lenguaje HTML si lo necesitamos.
|
||||||
|
- También hay versiones de Markdown como Markdown BlackFriday o RMarkdown en R.
|
||||||
|
- Hay muchas guías de Markdown. Lo mejor es probar y aprender.
|
||||||
|
- Mi guía la podéis encontrar en [github](https://github.com/flowsta/markdown).
|
||||||
|
|
||||||
|
|
||||||
|
# Pero, ¿por qué tantas tecnologías y términos?
|
||||||
|
|
||||||
|
- Veamos, volvamos al principio. Estamos en Periodismo de Datos. Sí, podríamos tener una pequeña tabla, ir a un servicio de terceros y hacer un gráfico. Fácil. De hecho, lo haremos.
|
||||||
|
- Parémonos un momento en eso que dijimos del *Computer Assisted Reporting*, periodismo asistido por ordenador. Sí, esto es fundamental, debemos saber manejar un ordenador.
|
||||||
|
|
||||||
|
|
||||||
|
## Programación literaria e investigación reproducible
|
||||||
|
|
||||||
|
- Ya en programación Donald Knuth, inventor del fundamental \LaTeX, pieza clave en la investigación reproducible, lo hizo pensando en el paradigma de la "programación literaria".
|
||||||
|
- Es decir, como vimos con HTML, todo lenguaje informático tiene "comentarios" sobre el código.
|
||||||
|
- Estos comentarios son útiles para recordarme por dónde voy, por qué he hecho tal cosa si tal otra falló, lo que quiero hacer, etc.
|
||||||
|
- La programación literaria propone hacerlo "al revés". Es decir, escribir lo que quiero hacer y los trozos que sean código identificarlos como tal.
|
||||||
|
|
||||||
|
|
||||||
|
## Content as Code
|
||||||
|
|
||||||
|
- Tanto Github como Markdown como otras tecnologías están alineadas con algo que se ha denominado "el contenido como código".
|
||||||
|
- En el mundo del periodismo de datos se utiliza mucho Python con Jupyter; R con RStudio; Javascript con ObservableHQ; etc. Los veremos en otro momento.
|
||||||
|
- El uso de sintaxis simple nos permite reutilizar el texto, nuestro código, y también insertar código.
|
||||||
|
|
||||||
|
|
||||||
|
## COPE
|
||||||
|
|
||||||
|
- En la radio pública de EE.UU. desarrollaron la estrategia *COPE*: *Create Once, Publish Everywhere* para reutilizar contenidos de las distintas emisoras.
|
||||||
|
|
||||||
|
|
||||||
|
# Manos a la obra: Github
|
||||||
|
|
||||||
|
- Entramos en Github
|
||||||
|
- Creamos un repositorio nuevo
|
||||||
|
- Lo llamamos, por ejemplo, "uc3m-periodismo-datos". Es importante en este momento que, si no lo hacíais hasta ahora, empecéis a no usar espacios en blanco para los nombres de archivo y directorios/carpetas :boom:
|
||||||
|
- Sí que inicializamos el repositorio con un archivo que se llamará "README.md". El ".md" significa que tiene sintaxis Markdown.
|
||||||
|
- Finalizamos el proceso.
|
||||||
|
- Ahora tenemos un archivo `README.md` que contiene una sola línea "# uc3m-periodismo-datos". Esto es porque Github ha tomado el nombre del repositorio y lo ha convertido en el título o H1 de HTML en este documento.
|
||||||
|
|
||||||
|
|
||||||
|
## Editar
|
||||||
|
|
||||||
|
Vamos al lápiz, pinchamos y editamos. Escribimos:
|
||||||
|
|
||||||
|
# Periodismo de Datos en UC3M
|
||||||
|
|
||||||
|
Notas sobre **Periodismo de Datos** en *UC3M*
|
||||||
|
|
||||||
|
## Qué es el periodismo de datos
|
||||||
|
- Periodismo
|
||||||
|
- Visualización
|
||||||
|
- Datos
|
||||||
|
|
||||||
|
## HTTP
|
||||||
|
Es una _API_ que tiene cuatro tareas posibles:
|
||||||
|
1. POST
|
||||||
|
2. GET
|
||||||
|
3. DELETE
|
||||||
|
4. PUT
|
||||||
|
|
||||||
|
- Veis que en el editor hay una pestaña a la derecha para previsualizar el texto en HTML.
|
||||||
|
- Si estamos de acuerdo, "guardamos".
|
||||||
|
- En Github, como es software git lo que hay detrás, no se "guarda" el documento sino que se hace un "commit", una explicación simple o extensa de lo que hemos hecho, por si tuviéramos que volver a este punto. Ahora sí, "comiteamos".
|
||||||
|
- Si queremos volver a editar para cambiar algo, repetimos la operación.
|
||||||
|
|
||||||
|
|
||||||
|
## Crear archivo
|
||||||
|
|
||||||
|
- Pinchamos en crear archivo y lo nombramos.
|
||||||
|
- Importante:
|
||||||
|
- No usar tildes ni espacios en blanco ni caracteres que no sean ASCII, es decir, tampoco las eñes.
|
||||||
|
- Si se trata de un archivo markdown tendrá una extensión "md", como el README, es decir, por ejemplo, "nuevo-archivo.md"
|
||||||
|
|
||||||
|
|
||||||
|
# Para el próximo día
|
||||||
|
|
||||||
|
Ahora que ya tenemos un primer repositorio en Github y que sabéis crear archivos, os propongo que escribáis un comentario crítico sobre una o varias visualizaciones de datos y/o infografías.
|
||||||
|
|
||||||
|
- No se exige un número mínimo de palabras ni máximo.
|
||||||
|
- Puede ser de una o de varias.
|
||||||
|
- Lo interesante no es que me enseñéis la que pensáis que puede ser para mí la mejor visualización o infografía sino que escribáis libremente, sin prejuicios.
|
||||||
|
- Importante, repito: este texto tiene que estar en formato Markdown en un documento creado en el mismo repositorio de Github que habéis creado.
|
||||||
|
- Si la/s visualizaciones o infografía/s tienen URL, podéis añadirlas.
|
||||||
|
- Cualquier duda la podemos resolver también por el foro.
|
||||||
|
|
||||||
|
|
||||||
|
# Para la próxima sesión…
|
||||||
|
|
||||||
|
|
||||||
|
## Tener instalada el emulador de terminal
|
||||||
|
|
||||||
|
- En Windows hay que descargarse [Cygwin](https://cygwin.com)
|
||||||
|
- En MacOSX hay que descargarse y activar XCode. En MacPorts hay una [guía](https://guide.macports.org/#installing.xcode) pero seguro que hay otras.
|
||||||
|
|
||||||
|
|
||||||
|
## Cosas que nunca te dije
|
||||||
|
|
||||||
|
- [ ] Arquitectura cliente/servidor
|
||||||
|
- [ ] Periodismo de bases de datos
|
||||||
|
- [ ] Mostrar D3js.
|
||||||
|
- [ ] Crear una cuenta en Datawrapper.
|
||||||
|
- [ ] Explicar JSON como formato de datos.
|
||||||
|
- [ ] Explicar formatos de datos.
|
||||||
|
- [ ] Licencias de datos
|
||||||
|
- [ ] Bibliografía
|
||||||
|
- [ ] Comunidades
|
||||||
|
- [ ] Ejemplos
|
||||||
|
- [ ] Taxonomías de visualización
|
||||||
|
- [ ] Periodismo de datos como ciencia de datos.
|
||||||
|
- [ ] La pirámide invertida del periodismo de datos.
|
||||||
|
|
Loading…
Reference in a new issue