Dentro de la Bestia: La Ingeniería, Evolución y Futuro de Amazon S3

Amazon S3 es a menudo referido como la "columna vertebral" de internet, pero pocos entienden la magnitud real de sus operaciones. Lanzado originalmente el 14 de marzo de 2006 con la premisa simple de proveer almacenamiento "infinito", el servicio ha crecido hasta gestionar más de 500 billones de objetos y cientos de exabytes de datos. Para visualizar esta escala, si apiláramos todos los discos duros de S3 uno encima del otro, llegarían hasta la Estación Espacial Internacional y de regreso. Lo que comenzó como una arquitectura rudimentaria de seis microservicios ha evolucionado hacia un ecosistema complejo de más de 300 microservicios altamente desacoplados, un proceso que los ingenieros describen como "reconstruir el avión en pleno vuelo".

En el centro de la propuesta de valor de S3 está su increíble garantía de durabilidad del 99.999999999% (once nueves). Lograr esto sin el costo prohibitivo de triplicar el hardware de almacenamiento requirió un cambio de la replicación simple a la Codificación de Borrado (Erasure Coding). S3 utiliza algoritmos basados en códigos Reed-Solomon, específicamente un diseño 5+4 donde los datos se dividen en fragmentos y paridad. Esto permite al sistema tolerar la pérdida simultánea de una Zona de Disponibilidad completa y un nodo adicional en otra zona sin perder datos, manteniendo la resiliencia contra fallas correlacionadas.

Un momento crucial en la historia de S3 ocurrió en diciembre de 2020, cuando el servicio migró de un modelo de consistencia eventual a una consistencia fuerte para todas las solicitudes. Anteriormente, el sistema priorizaba la disponibilidad, lo que significaba que un listado de objetos podría no reflejar inmediatamente una escritura reciente. El equipo de ingeniería resolvió esto implementando una nueva estructura de datos de "journal" replicado y un protocolo de coherencia de caché con tolerancias a fallas. Sorprendentemente, esta actualización arquitectónica masiva se implementó sin tiempo de inactividad y sin costo adicional para los clientes.

Para manejar el flujo masivo de millones de solicitudes por segundo, S3 emplea un escalado horizontal inteligente. El sistema particiona el índice basándose en los prefijos de las claves de los objetos. Inicialmente, las claves residen en una sola partición, pero a medida que el tráfico crece, S3 divide automáticamente estas particiones para soportar un mayor rendimiento: hasta 3,500 solicitudes de escritura o 5,500 de lectura por segundo por prefijo. Esta "evolucionabilidad" permite a S3 tratar la escala como una ventaja, donde el rendimiento realmente mejora a medida que el sistema crece y las cargas de trabajo se decorrelacionan.

Bajo el capó, la capa de almacenamiento físico también se ha transformado. Aunque históricamente construido en C++, los nuevos nodos de almacenamiento utilizan "ShardStore", un motor escrito en Rust para garantizar la seguridad de la memoria y un alto rendimiento concurrente. ShardStore gestiona los datos en unidades llamadas "extents" y utiliza árboles LSM (Log-Structured Merge) para mapear identificadores de fragmentos a ubicaciones físicas. Para garantizar la corrección a esta escala, AWS emplea "métodos formales ligeros", utilizando modelos matemáticos para verificar la lógica del código y prevenir errores de concurrencia antes de que lleguen a producción.

En 2024, S3 evolucionó más allá del simple almacenamiento de objetos hacia una plataforma de datos activa para IA y análisis. El lanzamiento de Amazon S3 Tables proporciona soporte nativo para el formato Apache Iceberg, automatizando tareas de mantenimiento como la compactación. Además, S3 lanzó soporte para Vectores, una nueva primitiva diseñada para almacenar incrustaciones semánticas (embeddings) para aplicaciones de IA, permitiendo búsquedas de similitud de alta dimensión directamente dentro de la capa de almacenamiento.

La seguridad en S3 no se trata solo de permisos, sino de certeza matemática. El servicio utiliza herramientas de razonamiento automatizado como Zelkova para traducir las políticas de IAM y de buckets en fórmulas lógicas, verificando que los controles de acceso se comporten exactamente como se pretende. Este enfoque se ha extendido para garantizar que las aplicaciones de IA generativa construidas en AWS no violen las políticas de seguridad, tratando la seguridad como un problema de corrección demostrable.

En última instancia, el liderazgo de S3 lo describe como un "organismo vivo y que respira" que continúa cambiando de forma según cómo el mundo usa los datos. Desde sus orígenes como una simple "bolsa de bits" hasta un sistema sofisticado que soporta consultas SQL y búsqueda vectorial, S3 demuestra que en los sistemas distribuidos de hiperescala, la simplicidad de la interfaz de usuario oculta una de las hazañas de ingeniería más complejas y robustas de la historia.

Fuentes

Amazon S3 - Wikipedia & AWS re:Invent 2024 announcements
From Bits to Tables: The Evolution of S3 Storage
S3-like Object Storage - Book Notes
The History of Amazon S3 - CloudSee Drive
AWS re:Invent 2024 announcements and keynote updates
AWS re:Invent 2024 - The Candid Startup
How Amazon S3 Stores 100 Trillion Objects Without Losing One
Our Origins - AWS & Erasure Coding sources
Optimizing Performance Of Amazon S3
Amazon S3 Update – Strong Read-After-Write Consistency
Import from Amazon S3 Vectors to OpenSearch Serverless
ShardStore: A "new storage backend for Amazon S3" on 40k lines of Rust
Cloud Storage Deep Dive (Part 2) & S3 Tables announcements
How does Amazon S3 ensure data Durability and Availability?
Erasure Coding — This is how cloud providers store multiple copies
Understanding erasure coding
What is Amazon S3? & Automated Reasoning sources
Amazon S3 Strong Consistency
Deep dive on Amazon S3 (PDF)
Amazon S3 Metadata now supports metadata for all your S3 objects
Millions of Tiny Databases - USENIX
How automated reasoning helps Amazon S3 innovate at scale
Erasure Coding | System Design - AlgoMaster.io
Erasure Coding Chapter - AlgoMaster.io
How Amazon S3 Stores 100 Trillion Objects Without Losing One (Ajit Singh)
Request Routing and Performance (Partition Keys)
Better Key Design & Partitioning
How S3 is built - Transcript (Milan, VP of Data & Analytics at AWS)
Stack of drives to ISS (Transcript)
S3 Origins & Eventual Consistency (Transcript)
Eventual Consistency rationale (Transcript)
S3 Basic Architecture (Put/Get) (Transcript)
Replicated Journal & Strong Consistency implementation (Transcript)
Failure Allowance & Cache Coherency (Transcript)
No cost for Strong Consistency (Transcript)
Automated Reasoning & Formal Methods (Transcript)
Proofing correctness on check-ins (Transcript)
Math saves you at scale (Transcript)
Correlated Failures (Transcript)
S3 Tables & SQL (Transcript)
S3 Vectors & Embeddings (Transcript)
Vectors as a new primitive (Transcript)
Scale is to your advantage (Transcript)
Product Shape & Coherency (Transcript)
S3 as a living organism (Transcript)

🎵 Spotify Podcast

Fuentes