miércoles, junio 19, 2013

Apache Accumulo a.k.a NSA Bigtable

Estos últimos días la National Security Agency (NSA) ha estado en boca de todo el mundo tras la publicación por The Guardian de varias noticias sobre lo que debería de ser obvio para todo el mundo desde hace mucho tiempo: los Estados espían, y lo que hacen con la información es desconocido para todos - oficialmente luchar contra los malos -. Los Estados siempre se han preocupado mucho de poder pinchar las comunicaciones, y en general los ciudadanos suelen mirar para otro lado pensando que no tienen nada que esconder. Además, en este programa, PRIM, parecer ser que están involucradas todas las grandes tecnológicas y empresas de telecomunicaciones de Estados Unidos.

Sin embargo este aluvión de noticias ha tenido un efecto positivo: Por diferentes agregadores de noticias han empezado a surgir referencias a software en el que ha estado trabajando la NSA, y que podría estar siendo utilizado dentro de estos programas de espionaje. Dicho software, que la NSA donó a la fundación Apache hace dos años, es Apache Accumulo. Los responsables del proyecto lo describen de la siguiente manera:

The Apache Accumulo™ sorted, distributed key/value store is a robust, scalable, high performance data storage and retrieval system. Apache Accumulo is based on Google's BigTable design and is built on top of Apache Hadoop, Zookeeper, and Thrift. Apache Accumulo features a few novel improvements on the BigTable design in the form of cell-based access control and a server-side programming mechanism that can modify key/value pairs at various points in the data management process

Es una mejora de las ideas implementadas por Google en BigTable, un sistema de almacenamiento y recuperación de información basado en clave valor ordenados, con el añadido de seguridad a nivel de celda y la posibilidad de ejecutar procesos en el servidor a través de mecanismos de personalización implementados en el mismo. La particularidad es que las consultas al sistema devuelven siempre los datos ordenados según las claves, en función del orden lexicográfico de las mismas.

A su vez el software usa varios bloques de para construirse que están bajo el paraguas de la fundación Apache como Hadoop, Thrift o Zookeeper

Referencias


Technorati Tags:

No hay comentarios: