Nexo AI

Notas para Google · solicitud al programa AI Scale

Empezamos haciendo una sola cosa:
llamadas que parecen humanas.

Lo curioso es que, para que funcionaran de verdad, tuvimos que escribir nosotros mismos las dos capas que casi nadie escribe: la telefonía y el motor de voz. Esto es lo que aprendimos y por qué creemos que tiene sentido hacerlo sobre Google.

Compañía

Nexo AI SAS · Colombia · Voice AI

Etapa

Pre-seed cerrada · Mayo 2026

01 — Lo que notamos

La mayoría de las llamadas en un call center no necesitan a un humano. Pero el modelo de negocio depende de que sí.

Eso explica varias cosas raras. Por qué los BPO crecen contratando, no automatizando. Por qué la gente rota cada seis meses. Por qué un banco grande paga decenas de millones de dólares al año para llamar a sus propios clientes y aun así apenas contacta a uno de cada diez.

Síntomas en la operación humana

30–50%

Rotación anual de operadores

~12%

Tasa de contacto efectivo humano

300+

Operadores por sede para sostener un cliente medio

1,5–2,5 s

Latencia conversacional de los bots ensamblados con piezas alquiladas

Tamaño del problema · Colombia 2024

$2.951M USD

Lo que mueve el BPO de Colombia en un año

750K+

Personas trabajando en esa industria

$33,5B COP

Cartera en mora que alguien tiene que llamar

$16.000M COP

Lo que cuestan las inasistencias médicas al año, sólo en Bogotá

Cuando un mercado tiene esos síntomas durante años sin que nadie los arregle, normalmente es porque la solución obvia no funciona todavía. Hace dos años no funcionaba. Ahora empieza a funcionar.

02 — Lo que hacemos

Hacemos llamadas. Eso es lo más simple que se puede decir. La parte interesante es cómo.

Levantamos el teléfono, hablamos con alguien en español latinoamericano, entendemos lo que dice, lo conectamos con su CRM o su core, y cerramos lo que haya que cerrar. Una cita, un cobro, una venta, una verificación. Sin que un operador humano toque la llamada.

Cosas que ya hace bien

Llama y recibe llamadas para tareas que aburren a un humano: agendar, cobrar, vender, dar soporte, verificar identidad, encuestar.
Suena como alguien de Colombia o de México, no como un robot. Eso importa más de lo que parece.
Se enchufa al CRM y al core del cliente y deja todo escrito ahí. Nadie tiene que transcribir.
No infringe la Ley 2300. Una persona se equivoca con la regulación; una máquina bien programada no.

Lo que hay debajo del capó

Telefonía

La escribimos nosotros

PBX y SIP propios. No alquilamos Twilio. Eso es raro y resultó ser la decisión más importante.

Voz y decisión

También la escribimos

TTS, motor de decisión y orquestación de LLM viven en el mismo proceso. Por eso responde rápido.

Capacidad

1.000 llamadas/segundo

Esto no lo decimos para impresionar. Lo decimos porque es la razón por la que un banco grande puede usarnos.

Equipo

7 personas

Pocos, pero todos técnicos. Eso lo decidimos a propósito.

03 — Una decisión rara que terminó importando

Por qué dejamos de usar Twilio. Y luego también de usar Bland.

Empezamos como cualquiera. Twilio para la telefonía, Bland para el agente, una LLM API arriba. Funcionaba lo suficiente como para hacer demos. No lo suficiente como para que un cliente con cien mil llamadas al día nos tomara en serio.

Cómo lo hace casi todo el mundo

Twilio + Bland + LLM API

TelefoníaAlquilada

Voz / agenteAlquilada

Latencia~1,5–2,5 s

ConcurrenciaLa que te deje el proveedor

MargenLo que sobre después de pagar tres facturas

Compliance localNo es problema suyo

vs

Lo que hicimos en cambio

Escribir cada capa

TelefoníaPBX propia

Voz / agenteMotor propio

Latencia< 1 s

Concurrencia1.000/segundo sostenidas

MargenUna sola factura: la nube

Compliance localLey 2300 y SFC dentro del producto

La parte que no es obvia: como bajamos a una sola factura, casi todo lo que crecemos depende del costo de cómputo. Por eso este pitch tiene sentido para Google. La nube ya no es un gasto, es el insumo.

04 — El tamaño

Cuando hicimos los números, el mercado resultó más grande de lo que pensamos.

No estamos persiguiendo un TAM hipotético. Estamos sumando los presupuestos reales de los segmentos donde ya tenemos cliente o donde alguien del board ya hizo la primera llamada por nosotros.

Tres formas de mirarlo

~$80B USD

TAM · todo lo que se va a gastar en automatizar voz hacia 2030, en cualquier parte del mundo.

~$6,5B USD

SAM en LatAm · BPO, cobranza, ecommerce, salud y sector público sumados. Aquí es donde podemos pelear sin salirnos del idioma.

~$120M USD

SOM a 24 meses · Colombia y México, los clientes que de verdad podemos cerrar con el equipo que tenemos hoy.

De dónde sale el SAM

BPO en LatAm

$2,9B USD+

Cobranza (la mora se vuelve pago si alguien llama bien)

$7,8B USD

Ecommerce y retail

$26B USD GMV

Salud (los no-shows son dinero tirado)

$4M USD/año Bogotá

Político y sector público

Episódico

Fuentes: Invest in Bogotá, Superfinanciera, CCCE, Secretaría de Salud Bogotá.

05 — Algo que no esperábamos

Cuando uno de nuestros inversionistas abrió su libreta de contactos, el pipeline cambió de forma.

Llevábamos un año vendiéndoles a campañas políticas, que es donde habíamos empezado. Eran clientes reales pero pequeños y episódicos. Lo que cambió todo no fue una mejora de producto. Fue una mesa de socios.

Lo que ya hay

7+ campañas

Políticas corridas en Colombia. Ahí aprendimos a no caernos cuando llaman miles a la vez.

Clientes B2B activos

Pequeños todavía, pero pagan todos los meses. Eso enseña más que una campaña grande.

Pre-seed cerrada

Inversionistas con red propia. Resulta que vino con un efecto secundario: las reuniones que están abajo.

Millones

De llamadas procesadas en los últimos 18 meses. Casi todas, en producción.

Conversaciones abiertas hoy

Retail

Mercagán

Sentados con la mesa de socios. Quieren resolver atención y recuperación.

Hospitality y fitness

Ziruss Pizza · Bodytech

Conversaciones con founder y founder respectivamente. Reservas, retención, soporte multi-sede.

Microfinanzas

Grupo Crezcamos

Cobranza Ley 2300 sobre cartera microfinanciera. Caso de uso casi a la medida.

Banca grande

Grupo Aval

Acercamiento con los dueños. Conversación larga, premio grande.

Salud

IPS top de Bucaramanga

Agendamiento y no-shows. La cifra de Bogotá hace los números fáciles.

BPO global

Teleperformance

Hablando con el gerente general en Colombia. Aquí no competimos con ellos; somos la capa cognitiva sobre sus asientos.

Ninguna de estas reuniones llegó por outbound frío. Eso, más que cualquier feature, es lo que hace este pipeline interesante.

06 — Los números que más costaron

Hay tres cifras que casi todo el mundo promete y que muy poca gente puede mostrar en producción.

Las pongo primero porque son las que nos toman años de obtener y las que vuelven posible el resto del negocio.

1.000/seg

Llamadas concurrentes sostenidas. Esto es lo que hace la diferencia entre vender a una pyme y vender a un banco. Casi nadie en LatAm lo tiene en producción.

< 1 s

Latencia conversacional real. Si te toma más, la persona del otro lado nota que no eres humano.

Millones

De llamadas procesadas en producción en los últimos 18 meses.

7+ campañas

Donde aprendimos a no caernos en picos

PBX + SIP

Capas que casi nadie escribe por su cuenta

ES LatAm

Acento y prosodia entrenados aquí, no traducidos

Ley 2300

Compliance dentro del producto, no como hoja de Excel

Lo que tenemos resuelto es la telefonía. Lo que aún nos limita es el cómputo. Por eso este pitch existe.

07 — De una cosa a varias

Empezamos por política porque era lo que conocíamos. Después descubrimos que el motor servía para más cosas.

Resulta que una llamada a un votante y una llamada a un cliente moroso se parecen más de lo que parece. Cambian las palabras y las reglas. La infraestructura es la misma.

Política · donde aprendimos

Funciona

Cobranza · donde el premio es mayor (Crezcamos · Aval · fintechs)

En conversación

Retail y hospitality (Mercagán · Ziruss · Bodytech)

Reuniones con founders

Salud · agendamiento (IPS Bucaramanga)

Acercamiento

BPO · Teleperformance Colombia

Conversación abierta

Por qué multi-vertical y no horizontal puro

Cada vertical comparte el mismo motor. Lo que cambia son los prompts, las integraciones y las reglas. Cambiar de industria nos cuesta días, no meses.
El pricing cambia bonito: cobranza paga por recuperado, retail por interacción, BPO por minuto, salud por cita. Mezclar verticales suaviza el riesgo.
El acceso ejecutivo viene del board, no del SDR. Por eso podemos hablar con varias industrias al tiempo sin contratar diez vendedores.

Qué necesitamos para seguir así

Cómputo que crezca con la campaña, no con la planeación. Eso es lo que ofrece Google sin que tengamos que reservar capacidad fija.
Modelos de voz finos por país y por sector. Para eso necesitamos entrenar más, no menos.
Una capa de datos donde guardar millones de transcripciones y poder hacerles preguntas. Ahí entra BigQuery.

08 — Cómo se vería sobre Google

La telefonía la dejamos donde está. Todo lo demás se mueve a GCP.

Esto no es un dibujo de arquitectura para impresionar. Es la lista concreta de servicios que vamos a consumir si el programa nos aprueba. La pongo así para que sea fácil de auditar.

Lo que se monta arriba

Edge · telefonía

Sigue siendo nuestra PBX y nuestro SIP. Lo que añadimos es Cloud Load Balancing y Cloud Armor para señalización y protección.

Compute · orquestación

GKE y Compute Engine para ruteo, motor de decisión y orquestación conversacional. Con autoscaling para sostener las mil por segundo sin pre-reservar.

IA · capa cognitiva

Vertex AI para entrenar voz LatAm, Gemini para entender lo que dice el usuario, Speech-to-Text y TTS de Google para los idiomas que aún no entrenamos, TPUs para hacerlo barato.

Lo que va al fondo

Datos

BigQuery para analítica de campañas, Cloud Storage para logs de audio, Firestore para el estado de cada llamada mientras pasa.

Observabilidad

Cloud Logging y Monitoring con SLOs por cliente. Esto importa: un banco quiere trazas que aguanten una auditoría.

Seguridad

Secret Manager, IAM y VPC Service Controls. Roadmap a SOC2 Type I, ojalá con apoyo de arquitectos del programa.

Si tuviera que resumir en una frase qué le pediríamos a Google: poder entrenar e inferir modelos de voz en español a mil llamadas por segundo, sin tener que pensar en cuánto vamos a gastar este mes.

09 — En qué se irían

Si nos aprueban el AI Scale, así se gastarían los $200–250 mil dólares.

Lo dividimos en tres trimestres para no engañarnos. Cada fase tiene un hito que se puede verificar. Si no lo cumplimos, el siguiente bloque no se gasta.

Mes 1–3 · construir (~30%)

Entrenar la voz que queremos

Fine-tuning del modelo de voz para Colombia, México y Andinos en Vertex AI y TPUs.
Mover la capa de orquestación a GKE con autoscaling.
Montar BigQuery desde el día uno, con esquema de eventos de llamada bien pensado.
Hito: un cliente nuevo en producción usando el modelo entrenado aquí.

Mes 4–9 · escalar (~50%)

Llevar el motor a clientes grandes

Inferencia real para sostener las mil por segundo con clientes de cobranza, retail y salud al tiempo.
Gemini en el motor de decisión, en vez de las reglas estáticas que tenemos hoy.
Dashboards ejecutivos por cliente, donde quepan millones de llamadas sin verse lentos.
Hito: 3 a 5 clientes enterprise activos y ARR multiplicado contra hoy.

Mes 10–12 · multi-país (~20%)

Salirnos de Colombia sin romper nada

Réplicas activas en regiones de México y Brasil, con los mismos modelos.
Bajar el costo por minuto con committed use discounts sobre la huella estable.
Empezar SOC2 Type I con apoyo de arquitectos del programa.
Hito: plan multianual de consumo firmado con Google.

Por qué encajamos en AI Scale: la IA no es un feature del producto, es el producto. Y la mayor parte del consumo cae justo donde Google quiere que caiga: Vertex AI, Gemini, TPUs y BigQuery.

10 — Lo que habremos construido

Dentro de 12 meses, esto es lo que esperamos poder mostrar.

No es un plan perfecto. Es el plan que creemos hoy. Si vamos más rápido en lo técnico que en lo comercial, o al revés, el plan se ajusta. Lo único que no se mueve es el foco.

Por el lado técnico

T1: al menos un cliente enterprise hablando con un modelo entrenado por nosotros en Vertex AI.
T2: autoscaling en GKE aguantando picos de campaña sin subirse de un segundo de latencia.
T3: Gemini reemplazando reglas estáticas en cobranza y retail.
T4: SOC2 Type I iniciado y réplicas activas en mx y br.

Por el lado comercial

T1: primer contrato enterprise cerrado con alguno de los que ya están en pipeline (Crezcamos, Aval, Mercagán, Bodytech).
T2: al menos una cuenta activa en cobranza, una en retail y una en salud, al tiempo.
T3: el primer cliente en México, idealmente con un partner de Google ayudando.
T4: ARR repetible y retención lo suficientemente clara como para levantar una serie A en buenos términos.

No queremos ser una startup que usa Google por unos meses y se va. Queremos ser una de esas referencias que ustedes ponen cuando alguien pregunta qué se puede hacer en voz desde LatAm sobre Google Cloud.

11 — Por qué creemos que esto cierra

No estamos solos. Y eso explica buena parte del pipeline.

Las startups que cierran contratos enterprise tempranos casi nunca lo hacen por outbound. Lo hacen porque alguien con credibilidad les abre la primera puerta. Eso es lo que tenemos.

Quién nos respalda

Pre-seed cerrada

Equity verificable. Cumplimos el requisito de Scale y de AI Scale. El monto exacto y los nombres se comparten directo con el equipo de Google bajo NDA.

Razón social

Nexo AI SAS · Colombia. Billing Account de GCP activo con dominio corporativo. El sitio web se está actualizando a la nueva marca.

Equipo

7 personas en core. Todas técnicas, todas full-time. No tenemos vicepresidentes; tenemos gente que escribe código y atiende clientes.

Puertas abiertas por el board

Mercagán — sentados con la mesa de socios.
Ziruss Pizza y Bodytech — conversaciones con los founders.
Grupo Crezcamos — caso de cobranza casi a la medida.
Grupo Aval — acercamiento con los dueños.
IPS top de Bucaramanga — agendamiento y no-shows.
Teleperformance Colombia — conversación con el gerente general.
Campañas políticas grandes que ya han trabajado con nosotros y vuelven.

Ninguna de estas reuniones llegó por LinkedIn. Eso es lo que cambia la economía del primer año.

12 — Lo que pedimos

Una sola cosa: que nos dejen construir esto sobre Google.

Solicitud

Aprobación al AI Scale del Google for Startups Cloud Program, con $200.000–$250.000 USD en créditos para los próximos doce meses, destinados sobre todo a entrenar voz LatAm en Vertex AI, inferencia con Gemini, training en TPUs y analítica de campañas en BigQuery.

01 — Créditos

Lo segundo más importante

Acceso al Startup Success Manager y a arquitectos de GCP para diseñar el multi-región, el autoscaling y el camino hacia SOC2 Type I.

03 — Visibilidad

Lo que nos haría volver el favor

Casos de estudio juntos en cobranza, retail y BPO. Y acceso a partners regionales de Google Cloud, para llegar a los clientes enterprise un poco más rápido.

Si funciona, dentro de un par de años queremos ser la respuesta corta cuando alguien pregunte qué se puede hacer en voz desde LatAm corriendo sobre Google Cloud.

Empezamos haciendo una sola cosa:llamadas que parecen humanas.