“Hola, solo quería saludar. ¿Puedo invertir un poco más?”. Los líderes de startups prometedoras se ven bombardeados por textos como este en estos tiempos. En particular, los grandes fondos se atropellan tratando de hacerse de una porción de la torta tecnológica. Sin embargo, un fundador parece haber recibido una mayor proporción de tales propuestas: Ali Ghodsi, CEO de Databricks. Y le ha dicho que sí a muchos. El 31 de agosto la compañía confirmó que tan solo seis meses después de lograr un acuerdo financiero por US$1000 millones, había obtenido otros US$1600 millones, que la valúan en US$38.000 millones, US$10.000 millones más que luego de la ronda anterior. Entre los que conocen Silicon Valley, estas cifras consolidan el estatus de Databricks como la compañía que hace más ruido hoy en día.
Es probable que el fabricante de software pronto sea conocido en un ámbito más amplio. Se prevé que antes de fin de año protagonizará el mayor lanzamiento inicial de acciones (IPO, según sus siglas en inglés) de una firma de software, superior al de Snowflake, su principal rival, a fines de 2020. Alternativamente algunos predicen que podría ser comprada por Microsoft en la absorción más grande de la historia en el sector del software. Sea cual sea el resultado, la pomposidad tiene sustancia. Databricks podría convertirse, en la era de la inteligencia artificial (IA), en lo que fueron en un tiempo Oracle y sus bases de datos en el mundo del software corporativo convencional: la plataforma dominante sobre la que se construyen y funcionan las aplicaciones.
Databricks fue fundada en 2013 para comercializar Spark, un software de código abierto que procesa cantidades de datos de distintas fuentes para entrenar algoritmos que se vuelven los motores de aplicaciones de IA. La firma agregó recursos, incluyendo código que le facilita programar el sistema además de manejar el flujo de tareas, y ofreció el paquete como un servicio de suscripción con base en la nube.
Sin embargo, Databricks recién despegó realmente cuando agregó otro componente llamado “lakehouse” (casa del lago). Es la combinación de dos tipos de bases de datos, un “depósito de datos” y un “lago de datos”, de allí el nombre. Históricamente ambas han estado separadas debido a limitaciones técnicas y porque sirven a distintos propósitos. Los depósitos están llenos de datos corporativos bien definidos, que permiten a una firma analizar su pasado, por ejemplo, cómo han evolucionado sus ventas, algo que se conoce como “inteligencia de negocios” (IN). Los lagos de datos son esencialmente un terreno donde volcar todo tipo de datos que pueden revelar el futuro de una firma, incluyendo si es probable que las ventas suban o bajen. Pero esta separación es crecientemente ineficiente e innecesaria, explica Max Schireson, de Battery Ventures, un inversor en Databricks. “Hacer IN e IA en sistemas diferentes hoy es medio estúpido”, señala.
Las firmas se han volcado aceleradamente a lo que ofrece Databricks, en particular las empresas establecidas a las que les preocupa verse superadas por una startup basada en IA. Comcast, un proveedor estadounidense de banda ancha, lo usa para permitir a los clientes seleccionar películas a través de la voz; el banco holandés ABN Amro, para recomendar servicios, y la cadena de tiendas H&M, para optimizar su cadena de producción.
Databricks ahora cuenta con más de 5000 clientes e ingresos por suscripciones anuales de US$600 millones, un crecimiento del 75% año contra año.
What I really wish I could find are WINDOWS and HORSES. These are two early DOS animations (kinda like screensavers… https://t.co/1pPJowz6gj
— Rachel Weil 🌈 HXLNT Sat Jul 03 21:20:15 +0000 2021
Ghodsi apunta aún más alto. “Al final, todo lo que sea datos debe estar en Databricks”, dice. Planea invertir el nuevo capital reunido para seguir creciendo y convertirse en el líder en sistemas lakehouse. Nadie debe culpar a Ghodsi –que hace un tiempo enseñaba ciencias de la computación en la Universidad de California, en Berkeley– por su ambición. Pero realizarla no será fácil. Otras firmas ya están metiéndose en su territorio. Probablemente podrá contener a los tres grandes proveedores de computación en la nube: Amazon Web Services, Google Cloud Plataform y Microsoft Azure.
Aunque tienen más que suficientes recursos para competir y ofrecer paquetes de IA integrada, comparten un gran problema. Cada vez más compañías prefieren no guardar todos sus datos en una sola nube temiendo quedar atrapados con un solo proveedor. En cambio, optan por productos como los de Databricks, que operan en varias nubes.
Snowflake es otra historia. También está construyendo lakehouse. Y también tiene un enfoque diferente. Mientras Databricks agrega IN a su plataforma de IA, Snowflake, que ha crecido en el mundo de los depósitos de datos, está agregando IA a su paquete de IN con base en la nube, lo que significa que sus respectivos productos se superpondrán crecientemente. Mientras que la mayor parte del código de Databricks es abierto, el de Snowflake es de propiedad exclusiva de la empresa; y mientras Databricks mayormente ha mantenido una estrategia de “ocupar tierras y expandirse” (por lo que pequeños negocios de software se vuelven más grandes), Snowflake práctica un modelo de ventas más convencional de arriba hacia abajo, que se centra en acuerdos grandes desde el comienzo.
Todo esto llevará a una batalla a lo largo de los próximos años pero podría verse bruscamente interrumpida si Microsoft compra Databricks. La firma de software ya es uno de los inversores de Databricks y coopera estrechamente con ella. Entre otras cosas, Azure ofrece una versión de la plataforma de Databricks y Microsoft usa su nombre en presentaciones respecto de su estrategia, algo que rara vez hace con otras firmas. Encajarían bien.
Centralmente, Microsoft sigue siendo una compañía que vende herramientas para que los diseñadores hagan aplicaciones y plataformas para que corran. Y Databricks representa tanto un complemento como una amenaza estratégica: permite que los datos, en vez que las personas, hagan la programación.
El IPO de Databricks no busca convertir a la firma en una empresa que cotiza en Bolsa, según algunos analistas, sino definir su precio, para que las negociaciones puedan empezar por algo. Pero el ruido que rodea a la compañía podría frustrar tales planes. Snowflake ahora vale alrededor de US$90.000 millones. Si el IPO de Databricks supera el de Snowflake, el precio de venta muy bien podría superar los US$100.000 millones. Y, al igual que Pinterest, un red social que Microsoft consideró comprar este año, puede volverse demasiado cara incluso para una compañía con tantos fondos como la mayor firma de software del mundo.