cassandra

Recursos de programación de cassandra
"Once you start working with Big Data systems, you discover a whole bunch of problems you won’t find in monolithic systems. Monitoring all of the components becomes a big data problem itself. In the talk, we’ll mention all of the aspects that you should take in consideration when monitoring a distributed system using tools like: Web Services, Kubernetes, Spark, Cassandra, MongoDB, Google Cloud, AWS. Not only the tools, what should you monitor about the actual data that flows in the system? We’ll cover the simplest solution with your day to day open source tools, the surprising thing... that it comes not from an Ops Guy."
En esta charla haremos una introducción a los conceptos básicos y herramientas imprescindibles para utilizar Cassandra para después centrarnos en el modelado de datos escalable con algunos ejemplos prácticos. El objetivo de esta charla es evitar los GRAVES, INDESEABLES y COSTOSOS problemas de escalabilidad y rendimiento a los que muchos desarrolladores nos hemos enfrentado porque somos IMPACIENTES y nos cuesta leer hasta el final de los tutoriales/documentación. Especialmente cuando tenemos un background relacional descubrimos el parecido entre CQL y SQL. Esta charla va dirigida a todo aquel que quiera iniciarse con Cassandra o ya iniciados que quieran profundizar en conceptos y pulir y perfeccionar sus modelos.
¿Te imaginas una base de datos que soporta todo el tráfico que quieras, añadiendo o quitando nodos de forma automática y que es capaz de funcionar sin interrupciones incluso si un volcán se pone a escupir lava sobre uno de tus centros de datos? Esa es la promesa de sistemas de almacenamiento distribuídos como Cassandra, Voldemort o Riak. Pero, ¿Cómo lo hacen? En esta charla te contaré los conceptos básicos para una posible base de datos distribuída. Pásate por aquí si quieres aprender qué significan cosas como CAP, BASE, escalabilidad incremental, replicación, o consenso. También explicaré cosas todavía más geeks como gossip, vector clocks, hinted handoff o entropía. Al acabar la charla entenderás cuál es la arquitectura que, por ejemplo, permite a Amazon tener su funcionalidad de carrito funcionando las 24 horas del año, los 365.25 días del año o a linkedin spammearte sin parar. ¿Cuándo fue la última vez que viste caídas las webs de Amazon o Linkedin?
Akka es un modelo de programación reactivo altamente concurrente basado en actores, diseñado para facilitar la creación de sistemas distribuidos. En Java disfruta de mucha fama, y ahora con el port de Akka a la plataforma .NET tenemos disponible toda su potencia en C# y F#. En esta charla daremos un (breve) repaso a qué es la programación con actores, qué aporta Akka.Net (que ya se graduó con su versión 1.0) y también veremos algunos ejemplos prácticos, incluyendo módulos que han sido recientemente portados a .Net (persistencia, por ejemplo, con bases de datos como MongoDB o Cassandra). También veremos lo bien que se integra con web API y signalR en una aplicación web con angularjs. El ecosistema .NET va cambiando!
En esta charla contaremos todo el proceso que hemos llevado a cabo para montar un sistema de Disaster Recovery entre Estados Unidos y Europa en una plataforma real de giros postales, desde su análisis hasta su ejecución real. Aunque el punto de vista de la charla es de operaciones e infraestructura principalmente indicar que la plataforma funciona con Java sobre tomcat (en algunos casos sobre kubernetes) y bases de datos SQL Server, MySQL y Cassandra sobre Amazon Web Services.. Abordaremos los problemas encontrados pero también la repercusión en las aplicaciones y la complicación a futuro que genera una instalación de este tipo. https://www.koliseo.com/events/commit-2018/r4p/5630471824211968/agenda #/5734118109216768/5997283774562304
Full title: DevOps at ING Analytics: data engineering, data operations ING was one of the early adopters of the DevOps movement. Currently, there is a lot of expertise in the organization: way of working, tools, and HR are all catered for DevOps. In the Analytics area, these best practices were the basis of a modern and stable architecture where data engineers, operations, and data scientists work together with business people on daily basis. The technology stack includes Hadoop, Spark, Flink, Kafka, Cassandra, and several IBM tools. In the talk I’m going to share tools evolution, skills and processes in place. Touching in the second part two use-cases.
In this presentation we will talk about our approach to build complex and distributed applications following DDD and Reactive principles. You will learn on how we approached this problem from a pure functional way using our opensource framework (reactive-platform), how Scala helped us through its advanced type system and DSL capabilities to combine underlying technologies such as Kafka, Cassandra and Akka to implement an actor distributed system based on CQRS/ES and NoSQL.
SMACK è l'acronimo di Spark, Mesos, Akka, Cassandra e Kafka. Il titolo del talk "provocatoriamente" confronta lo stack di tecnologie per lo sviluppo di applicazioni Reactive con quello più comunemente utilizzato nell'ambito dello sviluppo web. Durante il talk verranno illustrati i concetti di base della Reactive programming, le differenze concettuali introdotte da questo paradigma rispetto all'approccio "classico" della programmazione web ed alcuni casi di successo legati all'utilizzo di queste tecnologie.
En el mundo de las bases de datos a veces es complicado saber elegir qué base de datos es la más optima para cada tipo de problema, sobre todo si no has trabajado mucho con ellas. ¿Qué base de datos es más optima para búsquedas textuales? ¿Cuál para gestionar datos geoespaciales? ¿Y si solo queremos almacenarlos para analizarlos? Desafortunadamente no os voy a poder dar la clave para elegir la que mejor se adapta a vuestro problema, pero vamos a repasar juntos algunos de los conceptos técnicos (sin profundizar en ellos) que se esconden debajo de muchas bases de datos para que cuando os enfrentéis a este problema estéis mejor preparados: ¿Qué índices son usados para buscar sobre textos? ¿Y sobre datos geoespaciales? (Como los que se esconden detrás de bases de datos como PostgreSQL con PostGIS o Elasticsearch). ¿Cómo hacen algunas bases de datos para escalar casi "de forma lineal" (Como Cassandra)? ¿Qué algoritmos y sistemas permiten analizar grandes volúmenes de datos (Como algunos sistemas del ecosistema Hadoop)? Todos estos conceptos los veremos desde una forma superficial, para poder tener una visión amplia de estos sistemas y que podamos profundizar cuando nos sea necesario.` https://2017.codemotion.es/agenda.html #5693168230072320/5651253979774976