Параллельные и распределенные вычисления

Семинар 14

Apache Cassandra

Пономаренко Роман
@rerand0m
rerandom@ispras.ru

CAP теорема

  • Consistency, согласованность - данные в различных узлах не противоречат друг другу
  • Availability, доступность - на любой запрос следует отклик
  • Partition tolerance, устойчивость к разделению - разделение не приводит к некорректному отклику

Apache Cassandra

  • Распределённая СУБД
  • Отказоустойчивая
  • noSQL
  • Единица хранения - строка
  • CAP: *AP*
  • master-master реплики (seed node)
  • CQL
  • Нет JOIN

Партицирование

Распространение информации об узлах

  • Ненадёжная сеть
  • Ненадёжные узлы
flowgossip

Модель данных

Vector clock

Подключение из командной строки

node: mipt-node01...08

Например:

Сразу выполнить команду:

Создание KeySpace

Попробовать у себя

KeySpace

Посмотреть все пространства ключей:

Посмотреть свойства пространства ключей:

Удаление пространства ключей:

Таблицы

Синтаксис создания:

Композитный ключ:

Ключ раздела, кластерный ключ

Запросы

Получение информации о всех таблицах в кластере:

О какой-то одной таблице:

Python API

Гайд по Java API

Гайд по подключению к Jupyter