Saltar al contenido principal

HDFS CLI Cheat Sheet

Guía rápida de comandos para la shell de HDFS (hdfs dfs). Todos los comandos se invocan a través del script de shell de HDFS.

Sintaxis Básica

hdfs dfs <comando> [OPCIONES]

Comandos de Sistema de Archivos (DFS)

ComandoDescripciónEjemplo
-lsLista los archivos y directorios.hdfs dfs -ls /user/centos
-mkdirCrea un nuevo directorio.hdfs dfs -mkdir /data
-putSube un archivo local a HDFS.hdfs dfs -put local.txt /data/
-getDescarga un archivo de HDFS al sistema local.hdfs dfs -get /data/file.txt .
-catMuestra el contenido de un archivo.hdfs dfs -cat /data/log.txt
-cpCopia archivos dentro de HDFS.hdfs dfs -cp /src /dest
-mvMueve o renombra archivos en HDFS.hdfs dfs -mv /old /new
-rmElimina un archivo o directorio.hdfs dfs -rm -r /tmp/data
-chmodCambia permisos de un archivo/directorio.hdfs dfs -chmod 755 /data

Otros Comandos Útiles de HDFS

  • hdfs classpath: Muestra el classpath necesario para ejecutar aplicaciones Hadoop.
  • hdfs fsck: Verifica la integridad del sistema de archivos (bloques corruptos o faltantes).
  • hdfs dfadmin: Ejecuta comandos de administración del clúster.
  • hdfs balancer: Ejecuta el balanceador de carga del clúster.

Atributos de Archivos en HDFS

Al ejecutar hdfs dfs -ls, la salida muestra:

  1. Permissions: (ej. drwxr-xr-x) - d para directorio, - para archivo.
  2. Replication Factor: Número de copias (0 para directorios).
  3. Owner & Group: Propietario y grupo del archivo.
  4. File Size: Tamaño en bytes.
  5. Modification Date: Fecha y hora de la última modificación.
  6. Name: Ruta absoluta del archivo.
Nota sobre Rutas

HDFS utiliza rutas absolutas. No existe el comando cd en la shell de HDFS. Siempre debes referenciar la ruta completa o el sistema usará /user/<username> por defecto.