Get it on Google Play
Apache Kafka | Streams API

Apache Kafka | Streams API

Buenas digitales! Continuamos con el tema de Apache Kafka y hoy le ha tocado el turno a Streams API. El API Streams nos permite crear aplicaciones que procesen datos de una lista de entrada y los publiquen en una lista de salida(En streaming y gestionado desde dentro del propio cluster). El API nos proveerá de […]

01/09/2020 by Albert Coronado 
Como elegir la herramienta para crear y compartir tus dashboards y reports

Como elegir la herramienta para crear y compartir tus dashboards y reports

Los datos en las empresas son cada vez mas valiosos a la hora de gestionar, monitorizar o hacer crecer las empresas y se pide que circulen con agilidad. Atención! Porque circular con agilidad no implica circular sin control y sin seguridad. Hoy vamos a ver que alternativas tenemos para generar esos valiosos dashboards y reports, […]

17/07/2020 by Albert Coronado 
Carga masiva de datos CSV en ElasticSearch

Carga masiva de datos CSV en ElasticSearch

En el vídeo de hoy hemos visto como creamos un proceso ETL(Extración, tranformado y cargado) de datos en ElasticSearch usando LogStash: Básicamente, el único código que hay que tener en cuenta es el del fichero de configuración del proceso que os lo dejo aquí: El fichero de ciudades, como es habitual, os lo podéis descargar […]

06/12/2019 by Albert Coronado 
Aplicaciones Big Data y Data Science sobre Apache Spark

Aplicaciones Big Data y Data Science sobre Apache Spark

Muy buenas digitales pues aquí tenéis, como es de costumbre, el código del vídeo: Todos los temas de instalación y primeros pasos los encontrareis en el vídeo anterior “Analítica de datos Big Data con Apache Spark“. Si en el anterior vídeo nos centramos en instalar la plataforma y su uso a través de su shell […]

02/12/2019 by Albert Coronado 
Analítica de datos Big Data con Apache Spark

Analítica de datos Big Data con Apache Spark

Apache Spark es el motor unificado para analítica para Big Data mas usado en estos momentos(O de los mas usados). En pasados artículos en el blog ya hablamos de alternativas tipo Hadoop/MapReduce o Storm. Apache Spark tiene un montón de ventajas como: que es bastante mas rápido, que es fácil de usar o es compatible […]

08/07/2019 by Albert Coronado 
BI  desde 0: Crear reports e infografías programaticamente con wkhtml2pdf

BI desde 0: Crear reports e infografías programaticamente con wkhtml2pdf

Una nueva semana y un nuevo vídeo! En esta ocasión continuamos con la temática de datos, BI(Business Intelligence), visualizaciones, etc. Donde gracias a Wkhtmltopdf podremos generar automáticamente reportes e infografias(Entre muchas otras cosas): El código lo teneis disponible en mi cuenta de Github ‘https://github.com/acoronadoc/html5-google-charts-wkhtmltopdf‘ donde podréis descargar el código HTML5, CSS y Javascript. Además de […]

06/05/2019 by Albert Coronado 
Formacion ElasticSearch: Procesos de ETL con Logstash

Formacion ElasticSearch: Procesos de ETL con Logstash

En este vídeo hemos visto lo potente que es Logstash para hacer procesos ETL(Extract, Transform and Load). Aquí os dejo los principales pasos del vídeo(Que os recomiendo mucho que os lo miréis hasta el final y lo comentéis): Instalación de Logstash Lo primero ha sido ir a la página web de elastic.co y en la […]

02/09/2018 by Albert Coronado 
Gestión de backups para ElasticSearch

Gestión de backups para ElasticSearch

ElastichSearch permite hacer copias de seguridad sobre distintos soportes: Discos, Amazon S3, etc. Para ello, lo primero que tendremos que hacer es configurar un repositorio en el fichero ‘elasticsearch.yml’: Solamente con esta configuración ya podemos configurar el Backup a través de su API(En este ejemplo con curl). Vamos a crear un backup llamado ‘my_backup’, serà […]

15/08/2018 by Albert Coronado 
MySQL de supervivencia, gestionar procesos

MySQL de supervivencia, gestionar procesos

Esta semana hemos tenido una incidencia rara, un servidor de MySQL con la CPU desbocada. A partir de aquí hemos tenido que ver que procesos se estaban ejecutando con la sentencia: Esto nos devuelve un listado de procesos parecido a esto: El listado de procesos nos da cantidad de información útil como el progreso de […]

17/07/2018 by Albert Coronado 
Liberación de los datos de participación de esta web

Liberación de los datos de participación de esta web

Hace un poco mas de un mes que anuncié que implementaba un sistema de feedback en esta web. Básicamente se trata de la posibilidad de valorar que te ha parecido un artículo con una puntuación del uno(Muy mal) al cuatro(Muy bien). Lo tenéis disponible en el pié de este post. Esto puede parecer de poca […]

27/06/2018 by Albert Coronado