- Nació como un proyecto de Google de software libre, Google Refine.
- Cuando Google decidió dejarlo, la comunidad de usuarixs y desarrolladorxs hicieron un "fork" del proyecto y comenzó Open Refine, que es la evolución "natural" de Google Refine.
- Por eso hay quien se refiere a el software como Google Refine, Open Refine o, directamente, Refine.
- El archivo `feliz.csv` proviene de los datos recopilados por TRESCA para explorar las tendencias de Twitter durante un periodo de la pandemia del COVID19.
- El nombre responde a que de todo ese bruto de datos recopilados se han seleccionado los mensajes que contuvieran la expresión "feliz". (aunque esto tiene truco, lo recordamos en la siguiente sesión).
- Se recopila a través de la API de Twitter.
- Conviene señalar que Twitter devuelve por "tendencias" tanto los "hashtags" más usados (es decir, aquellas expresiones que comienzan por una almohadilla `#`, como por ejemplo `#FelizNavidad`) como las expresiones que detecta que se usan más aunque no estén marcadas por lxs usuarixs como hashtag (como por ejemplo `Feliz Navidad`.
- Hay dos campos de fecha.
- Un campo del término de la tendencia y otro de la consulta de la tendencia.
- Hay que tener en cuenta que la visualización de datos también se refiere a esta etapa en la que el análisis de ciertas cantidades de datos se va a apoyar en herramientas visuales que favorecerán ese análisis.
- Se le considera la "navaja suiza" del periodismo de datos por todo lo que se puede hacer "limpiando datos".
- Se ha procedido a la instalación contemplando los diversos escenarios: máquinas W$ con Java, sin Java, OSX o GNU/Linux.
- También se han superado las advertencias de W$ u OSX sobre instalar software "no verificado".
- Un paréntesis sobre esto. Por norma general, esos avisos son una buena costumbre y previenen de instalar cosas que no estén verificadas/gestionadas/testadas por quienes hacen el sistema operativo.
- La contraparte es que mucho software libre, que por su naturaleza es de código abierto, que cualquier persona puede investigar para ver si es o no dañino, que suele tener una comunidad de desarrolladorxs y usuarixs que lo "quieren" y que puede no pasar por los procesos de esas compañías de sistemas operativos propietarios también se ven incluidos en el mismo "saco" que los anteriores.
- Aunque no es un dogma de fe, si el software es libre sueles poder fiarte más que si no lo es, pero depende de ti o de que confíes en quien te lo ofrece o quien te lo recomienda que sigas ese consejo o no. Lo importante aquí es que cualquiera tiene, potencialmente, la capacidad para investigar si efectivamente es bueno o no.
- En Windows y Mac hay que pinchar sobre el ejecutable mientras que en GNU/Linux tenemos que ir desde la terminal al directorio donde se encuentra el ejecutable y ejecutarlo con `./refine`.
- Se abre una pantalla negra que no hay que cerrar, es la del programa.
- En el navegador se debería abrir una pestaña nueva (o el navegador con esa página si no lo teníamos abierto) donde aparece la interfaz de Refine.
- Refine es una aplicación web **PERO** no requiere de conexión a Internet, se ejecuta localmente (esa es la pantalla negra).
- Como toda aplicación web cliente-servidor, monta un servidor en el puerto `3333`, que es donde nos conectamos para verlo.
- El nombre de nuestro ordenador es `localhost` y su dirección IP (reservada) es `127.0.0.1`.
- Recordad que se puede ver esto en el archivo `/etc/hosts`
- Podemos tener varias pestañas abiertas pero todas serán de la misma instancia.
- Podemos tener varias sesiones de Refine abiertas en puertos distintos (se ve en siguiente sesión de Refine).
- Encontrar problemas no es malo, podemos aprender mucho de su resolución.
- En lo que respecta a git se recomienda seguir el siguiente procedimiento:
- Quitar `git` con `apt-cyg remove git`.
- Instalar `gcc-core`, `libcurl4`, `libcurl-devel`, `openssl`. Recordad que se pueden buscar estos paquetes con `apt-cyg searchall lo-que-queramos-buscar`.
- En la página lo explican muy bien: <https://www.msys2.org/>
- Es otro proyecto de terminal multipropósito llamada Mintty que tiene cosas de Cygwin pero es independiente.
- A efectos de uso, una diferencia fundamental es la gestión de paquetes que no se realiza con apt-cyg o el software de instalación (setup) sino con `pacman`, un modelo que nace en la distribución de GNU/Linux ArchLinux: <https://archlinux.org/pacman/>
- Para aprender un poco de cómo gestionar (buscar, instalar, actualizar, borrar) paquetes se puede ir a <https://www.msys2.org/docs/package-management/> o <https://www.lifewire.com/using-the-pacman-package-manager-4018823>
- No tendría por qué ser la última opción a abordar pero, en el caso concreto de tener el problema con git, sí.
- Virtualbox es un programa libre de Oracle disponible para W$, OSX o GX que sirve para virtualizar sistemas operativos.
- Es decir, desde un ordenador W$ se puede instalar en ese programa otro sistema operativo, ya sea otra versión de W$, de OSX o de GX, y esto funciona como un programa.
- De esta forma se pueden probar otros sistemas operativos o alguna de sus aplicaciones sin tocar el sistema operativo de nuestro ordenador.
- Se puede descargar de <https://www.virtualbox.org/>
Ha habido varias dudas sobre cómo poner una imagen en Github. Esto lo he comentado en clase el truco pero lo pondré más detallado por aquí:
1. La opción fácil es mirar cómo lo he hecho yo en uno de los documentos markdown que os he compartido y hacer lo mismo. No sé si alguien ha hecho esto, no tengo constancia.
2. Otra opción muy fácil que habéis empleado es el "modo Windows", arrastrar al editor de Github y que ponga la ruta. Eso, si bien no es lo que se pide, también puede servir para que nos dé pistas de cómo hacerlo.
3. Hacerlo bien.
Para hacerlo bien tenemos que tener en nuestro repositorio git la misma imagen que queremos tener en Github, siempre que esta imagen sea "nuestra", es decir:
- Que tenga la propiedad de la imagen, porque la he tomado o creado con software. En este caso no hace falta especificar que se trata de una imagen tuya, pues todo el contenido tuyo es tuyo, pero sí que conviene ponerlo.
- Que la haya generado yo, por ejemplo, a través de una captura de pantalla de una infografía de una página web. En este caso conviene poner un aviso de "Captura de pantalla realizada de la web-que-sea cuya propiedad intelectual pertenece a quien-sea".
Entonces, si la imagen es "nuestra":
- En la carpeta del repositorio, creamos una carpeta para las imágenes de nombre, por ejemplo, `img` con `mkdir img`.
- Copiamos la imagen con `cp ruta-imagen-origen img/.`
- Editamos con `nano` nuestro archivo y enlazamos la imagen con `![texto de la imagen)[/img/nombre-de-la-imagen "title o texto que aparece cuando pasamos por encima"]`. Guardamos y salimos.
- Nota: para crear un enlace de texto es igual, solo cambia que no se coloca el signo de cierre de admiración delante.
- Miramos el estado de nuestro repositorio con `git status`. Nos dirá que hay archivos sin seguimiento.
- Los añadimos con `git add ruta-archivos`
- Comentamos la acción con `git commit -m "comentario útil"`