Cómo usar Apache Cassandra con Python

Aprender cómo trabajar con la base de datos Apache Cassandra conjuntamente con el lenguaje Python.

Trabajando con Apache Cassandra y Python

La base de datos Cassandra tiene su propio su propio lenguaje, conocido como CQL, pero no es habitual tirar queries directamente a la base de datos, si no lo habitual es tener un driver que ataque a dicha base de datos en código.

Para la práctica vamos a utilizar el notebook que preparamos en un vídeo anterior, en el cual podemos lanzar cualquier tipo de query CQL, pero lo que nos interesa mostraros es cómo lo podemos hacer con el lenguaje Python.

Para ello lo primero que debemos hacer es tener una versión de Python instalada en nuestro equipo. En este caso estamos utilizando Anaconda, que podemos descargar desde su página web oficial e instalar en nuestro sistema.

Una vez tengamos arrancada la distribución Anaconda, abriremos el IDE JupyterLab para trabajar con la práctica.

Para conectar desde Python hasta Cassandra lo hacemos con una librería llamada Cassandra Driver. Para instalarlo lo haremos desde el IDE con este comando:

	!pip install cassandra-driver

La exclamación inicial nos sirve para marcar lo que está a continuación es un comando como si se estuviera escribiendo en la terminal.

Una vez instalada la vamos a importar:

	from cassandra.cluster import Clúster

Para lanzar después el notebook lo hacemos pulsando las teclas Shift + Enter.

Y a continuación nos conectaremos a la base de datos, lo que haremos de esta forma:

	cluster = Cluster(contact_points=[‘192.168.99.100’], port=9042)

Así indicamos dónde está situada nuestra Cassandra, que recordemos que normalmente forma un anillo de máquinas distribuidas corriendo en paralelo.

Ahora lo que haremos será conectarnos:

	session = cluster.connect()

Una vez estemos conectados podemos hacer cualquier cosa, como ya veremos a lo largo del curso de Apache Cassandra.

Como ejemplo de uso, en la variable session vamos a lanzar un execute, y dentro del mismo podemos lanzar el código CQL que queramos, por ejemplo:

	session.execute(“””CREATE KEYSPACE mikeyspace WITH replication = {‘class’ : ‘SimpleStrategy’, ‘replication_factor’:1};”””)

De esa forma creamos un keyspace que vamos a llamar mikeyspace y le vamos a poner una estrategia de replicación de tipo SimpleStrategy y con un factor de replicación igual a 1.

Con SimpleStrategy lo que indicamos es que todos los nodos de nuestro anillo, tengan el mismo factor de replicación, y se utiliza para un único Data Center.

Una vez lanzado ese comando, se genera nuestro keyspace, a partir del cual ya podríamos crear tablas dentro y demás.

Aprende todo sobre las bases de datos NoSQL. Conoce ahora su arquitectura y cómo desarrollar tu entorno de trabajo con Cassandra.

Recuerda que puedes comenzar este curso con tu suscripción de OpenWebinars. Si todavía no estás suscrito, aprovecha para hacerlo ahora.

Las cookies nos permiten ofrecer nuestros servicios. Al utilizar nuestros servicios, aceptas el uso que hacemos de las cookies. Más Información