Cómo convertir tablas de PDF a Excel o CSV con Tabula

Pasar y convertir pdf a csv y excel

Mirando los datos históricos que ofrece un observatorio meteorológico de mi ciudad, veo que sólo los ofrecen gráficamente y para descargar como PDF. No entiendo porqué no dejan descargarlos en csv que sería mucho más útil para todos.

Así que he estado buscando una solución para pasar estas tablas de pdf a csv o si alguien quiere a formato Excel o Libre Office. Me gusta csv porque con un csv haces de todo puedes tratarlo con python y sus librerías o puedes importarlo fácilmente en cualquier hoja de cálculo.

Como la idea es conseguir un proceso automatizado lo que quiero es un script para trabajar con Python y aquí es donde entra Tabula.

Sigue leyendoCómo convertir tablas de PDF a Excel o CSV con Tabula

Tutorial Anaconda: Qué es, cómo instalarlo y cómo se usa

Anaconda Data Science, big data y pytho, R disribución

En este artículo dejo una guía de instalación de Anaconda y guía de uso de su gestor de paquetes Conda. Con esto podremos crear entornos de desarrollo para python y R con las librerías que deseemos. Muy interesante para empezar a trastear con Machine Learning, análisis de datos y programación con Python.

Anaconda es una distribución libre y Open Source de los lenguajes de programación Python y R muy usada en computación científica (Data ScienceData Science, Machine Learning, Ciencia, Ingeniería, analítica predictiva,Big Data, etc).

Nos instala una gran cantidad de aplicaciones muy utilizadas en estas disciplinas todas de una vez, en lugar de tener que ir instalándolas una a una. . Más de 1400 y que son los más utilizados en estas disciplinas. Algunos ejemplos

  • Numpy
  • Pandas
  • Tensorflow
  • H20.ai
  • Scipy
  • Jupyter
  • Dask
  • OpenCV
  • MatplotLib

Sigue leyendoTutorial Anaconda: Qué es, cómo instalarlo y cómo se usa

Cómo instalar Keras y TensorFlow de backend en Ubuntu

como instalar keras en ubuntu

Tras acabar el curso de Machine Learning, estuve mirando por donde continuar. Los entornos de desarrollo usados en el curso para protopipar en Octave/Matlab no son lo que usa la gente, así que hay que dar el salto a algo de más calidad. Entre los candidatos que más me han recomendado está Keras, usando a TensorFlow de backend. No voy a entrar en si Keras es mejor que otras herramientas u otros frameworks o si elegir TensorFlow o Theano. Tan solo voy a explicar como se puede instalar en Ubuntu.

Primero probé a instalarlo a partir de la documentación de las paǵinas oficiales, y me resultó imposible, siempre me aparecía algún error, alguna duda no resuelta. Al final me fui a buscar tutoriales específicos de cómo instlar keras en Ubuntu y aún así me he pasado dos días echándole bastante tiempo por la noche. Al final lo he conseguido y te dejo cómo lo he hecho por si puede allanarte el camino.

Como vamos a seguir los pasos que recomiendan las webs que os dejo de fuentes al final del tutorial, vamos a instalar PIP que yo no lo tenía, para administrar los paquetes. pip en linux es eso, un sistema de gestión de paquetes escrito en python.

Sigue leyendoCómo instalar Keras y TensorFlow de backend en Ubuntu

He acabado el curso de Machine Learning de Coursera

He acabado el curso de Machine Learning de Coursera

He acabado el Curso de Machine Learning ofrecido por la universidad de Stanford en Coursera, y como ya son varios los que me han preguntado en abierto y en privado sobre el mismo, he querido detallar un poco más lo que me ha parecido y que el que decida hacerlo sepa con qué se va a encontrar.

Se trata de un curso gratuito sobre Machine Learning, impartido por Andrew Ng. una vez acabado si quieres puedes tener un certificado donde se avala las aptitudes conseguidas por 68€.  Está dividido en 3 pilares, vídeos, Exámenes o Quizz y ejercicios de programación. Está en inglés. Tienes subtítulos en varios idiomas, pero los españoles no están muy bien y a veces van desfasados, mucho mejor que los pongas en inglés.

Es bastante teórico. Pero quizás por eso me parece una buena forma de iniciarse porque no sólo vas a aprender qué hacer sino por qué lo haces.

Sigue leyendoHe acabado el curso de Machine Learning de Coursera