Voy a explicarte 2 métodos para subir archivos grandes a Colab. Y es que hay un problema en Google Colab, o quizá es una restricción, que no permite subir archivos más grandes de 1Mb usando su interfaz gráfica.
Es muy útil para aquellos que vayan a trabajar con Whisper, ya que cualquier audio pesa más de 1 MB
Al subir un archivo, empieza a cargar, tarda mucho y al final la carga desaparece o se sube solo 1Mb de nuestro archivo, dejándolo incompleto.
Te dejo un vídeo
Para solucionar esto voy a explicar 2 métodos:
- Importando los archivos desde Google Drive
- Con la librería files
También te dejo un Colab con el código para que puedas verlo y probarlo en directo
Importar archivos a Colab desde Google Drive
Otra opción para trabajar con los archivos grandes en Colab consiste en subirlos a nuestro Google Drive y sincronizar Colab con Drive, de forma que podemos usar cualquier archivo que tengamos ahí.
Una opción muy interesante, sobre todo cuando tengamos que utilizar de forma recurrente un Cuaderno. Hay que recordar que cada vez que ejecutemos un cuaderno, toda la información que hay en el disco duro virtual se pierde. Por tanto teniendo el cuaderno conectado a Drive
IMPORTANTE: Que el mail de la cuenta de Colab y la e Google Drive sea la misma, cuando he probado a cambiarlo, usando una cuenta de colab y otra de Driva me ha dado problemas aunque en teoría debería de funcionar bien.
Para esto usaremos el siguiente código
from google.colab import drive drive.mount('/content/drive')
Drive nos pedirá permisos desde la cuenta
Una vez aceptado veremos que monta el disco duro y ya podemos ver los archivos
Y luego
Estarán en una carpeta llamada drive o mydrive, en nuestro caso dentro de content como le hemos indicado
Puedes actualizar el contenido en la barra de la izquierda, con el icono de la carpeta.
Cómo subir archivos a Colab con files
Muy sencillo tan solo añadiremos 2 celdas con el siguiente código, podría hacerse todo en una celda pero me gusta tener la que nos permite seleccionar nuestro archivo en una celda individual.
Así al inicio de nuestro Colab usaremos
from google.colab import files
para importar esa librería de Python
Y luego en el paso que queramos subir nuestro archivo pondremos
files.upload()
Con esto se subirá a la raíz del Colab.
Si conoces alguna forma más, deja un comentario.