Hola a todos, hoy voy a empezar una nueva sección para el estudio de Ceph y sus características. Recientemente hemos comenzado a trabajar en un proyecto de almacenamiento distribuido e hiperescalable y la primera parada es el estudio de Ceph.
De momento hemos comenzado leyendo la tonelada de documentación existente pero, como puntos importantes a tener en cuenta durante el estudio y posible despliegue del sistema tenemos lo siguiente:
- Como cluster hiperescalable de almacenamiento, el sistema se basa en bloques de construcción formados por nodos que se van añadiendo al cluster con lo que, cuantos más nodos añadamos más almacenamiento y más rendimiento deberíamos obtener, siempre y cuando escalemos la red adecuadamente.
- Es muy importante que estos bloques de construcción de los que hablamos sean idénticos para asegurar el mismo rendimiento en todos los casos y un adecuado balanceo de la carga entre todos.
- De forma muy simple un cluster Ceph tiene dos tipos de demonios, los OSDs que permiten a los clientes leer o escribir los datos y los monitor, encargados de mantener la información actualizada del estado del cluster y el mapa de distribución de los datos.
- Los hosts se comunicarán con los monitor y los OSDs directamente usando un cliente específico que, usando el algoritmo CRUSH, permitirá determinar donde se encuentran los datos. Esto implica que los hosts que accedan al cluster Ceph deben tener instalado un cliente específico.
- El cliente Ceph no está disponible para sistemas Windows, con lo que será necesario usar gateways para dichos casos.
Según avancemos iré añadiendo entradas con más información sobre este sistema de almacenamiento y sus características.