En Cassandra, distribución y
replicación de datos van de la mano. Esto se debe a que Cassandra está diseñado
como un sistema de peer-to-peer que hace copias de los datos y distribuye las
copias entre un grupo de nodos. Los datos se organizan por tablas (“FamilyColumn”)
y se identifica mediante una Llave principal. La Llave principal determina en qué
nodo se almacenan los datos. Las copias de las filas se denominan réplicas.
Cuando su crear un clúster, debe especificar lo siguiente:
- Nodos virtuales: asigna la propiedad de los datos de las máquinas físicas.
- Particionamiento: particiones de los datos en todo el clúster.
- Estrategia de replicación: determina las réplicas para cada fila de datos.
- Soplón: define la información de topología que la estrategia de replicación utiliza para colocar las réplicas.
No hay comentarios:
Publicar un comentario