NOTAS PARA GOOGLE · MAYO 2026
01/13
Nexo AI
Notas para Google · solicitud al programa AI Scale

Empezamos haciendo una sola cosa:
llamadas que parecen humanas.

Lo curioso es que, para que funcionaran de verdad, tuvimos que escribir nosotros mismos las dos capas que casi nadie escribe: la telefonía y el motor de voz. Esto es lo que aprendimos y por qué creemos que tiene sentido hacerlo sobre Google.

Compañía
Nexo AI SAS  ·  Colombia  ·  Voice AI
Etapa
Pre-seed cerrada  ·  Mayo 2026
01 — Lo que notamos

La mayoría de las llamadas en un call center no necesitan a un humano. Pero el modelo de negocio depende de que sí.

Eso explica varias cosas raras. Por qué los BPO crecen contratando, no automatizando. Por qué la gente rota cada seis meses. Por qué un banco grande paga decenas de millones de dólares al año para llamar a sus propios clientes y aun así apenas contacta a uno de cada diez.

Síntomas en la operación humana
30–50%
Rotación anual de operadores
~12%
Tasa de contacto efectivo humano
300+
Operadores por sede para sostener un cliente medio
1,5–2,5 s
Latencia conversacional de los bots ensamblados con piezas alquiladas
Tamaño del problema · Colombia 2024
$2.951M USD
Lo que mueve el BPO de Colombia en un año
750K+
Personas trabajando en esa industria
$33,5B COP
Cartera en mora que alguien tiene que llamar
$16.000M COP
Lo que cuestan las inasistencias médicas al año, sólo en Bogotá

Cuando un mercado tiene esos síntomas durante años sin que nadie los arregle, normalmente es porque la solución obvia no funciona todavía. Hace dos años no funcionaba. Ahora empieza a funcionar.

02 — Lo que hacemos

Hacemos llamadas. Eso es lo más simple que se puede decir. La parte interesante es cómo.

Levantamos el teléfono, hablamos con alguien en español latinoamericano, entendemos lo que dice, lo conectamos con su CRM o su core, y cerramos lo que haya que cerrar. Una cita, un cobro, una venta, una verificación. Sin que un operador humano toque la llamada.

Cosas que ya hace bien
  • Llama y recibe llamadas para tareas que aburren a un humano: agendar, cobrar, vender, dar soporte, verificar identidad, encuestar.
  • Suena como alguien de Colombia o de México, no como un robot. Eso importa más de lo que parece.
  • Se enchufa al CRM y al core del cliente y deja todo escrito ahí. Nadie tiene que transcribir.
  • No infringe la Ley 2300. Una persona se equivoca con la regulación; una máquina bien programada no.
Lo que hay debajo del capó
Telefonía
La escribimos nosotros
PBX y SIP propios. No alquilamos Twilio. Eso es raro y resultó ser la decisión más importante.
Voz y decisión
También la escribimos
TTS, motor de decisión y orquestación de LLM viven en el mismo proceso. Por eso responde rápido.
Capacidad
1.000 llamadas/segundo
Esto no lo decimos para impresionar. Lo decimos porque es la razón por la que un banco grande puede usarnos.
Equipo
7 personas
Pocos, pero todos técnicos. Eso lo decidimos a propósito.
03 — Una decisión rara que terminó importando

Por qué dejamos de usar Twilio. Y luego también de usar Bland.

Empezamos como cualquiera. Twilio para la telefonía, Bland para el agente, una LLM API arriba. Funcionaba lo suficiente como para hacer demos. No lo suficiente como para que un cliente con cien mil llamadas al día nos tomara en serio.

Cómo lo hace casi todo el mundo

Twilio + Bland + LLM API

TelefoníaAlquilada
Voz / agenteAlquilada
Latencia~1,5–2,5 s
ConcurrenciaLa que te deje el proveedor
MargenLo que sobre después de pagar tres facturas
Compliance localNo es problema suyo
vs
Lo que hicimos en cambio

Escribir cada capa

TelefoníaPBX propia
Voz / agenteMotor propio
Latencia< 1 s
Concurrencia1.000/segundo sostenidas
MargenUna sola factura: la nube
Compliance localLey 2300 y SFC dentro del producto

La parte que no es obvia: como bajamos a una sola factura, casi todo lo que crecemos depende del costo de cómputo. Por eso este pitch tiene sentido para Google. La nube ya no es un gasto, es el insumo.

04 — El tamaño

Cuando hicimos los números, el mercado resultó más grande de lo que pensamos.

No estamos persiguiendo un TAM hipotético. Estamos sumando los presupuestos reales de los segmentos donde ya tenemos cliente o donde alguien del board ya hizo la primera llamada por nosotros.

Tres formas de mirarlo
~$80B USD
TAM · todo lo que se va a gastar en automatizar voz hacia 2030, en cualquier parte del mundo.
~$6,5B USD
SAM en LatAm · BPO, cobranza, ecommerce, salud y sector público sumados. Aquí es donde podemos pelear sin salirnos del idioma.
~$120M USD
SOM a 24 meses · Colombia y México, los clientes que de verdad podemos cerrar con el equipo que tenemos hoy.
De dónde sale el SAM
BPO en LatAm
$2,9B USD+
Cobranza (la mora se vuelve pago si alguien llama bien)
$7,8B USD
Ecommerce y retail
$26B USD GMV
Salud (los no-shows son dinero tirado)
$4M USD/año Bogotá
Político y sector público
Episódico

Fuentes: Invest in Bogotá, Superfinanciera, CCCE, Secretaría de Salud Bogotá.

05 — Algo que no esperábamos

Cuando uno de nuestros inversionistas abrió su libreta de contactos, el pipeline cambió de forma.

Llevábamos un año vendiéndoles a campañas políticas, que es donde habíamos empezado. Eran clientes reales pero pequeños y episódicos. Lo que cambió todo no fue una mejora de producto. Fue una mesa de socios.

Lo que ya hay
7+ campañas
Políticas corridas en Colombia. Ahí aprendimos a no caernos cuando llaman miles a la vez.
Clientes B2B activos
Pequeños todavía, pero pagan todos los meses. Eso enseña más que una campaña grande.
Pre-seed cerrada
Inversionistas con red propia. Resulta que vino con un efecto secundario: las reuniones que están abajo.
Millones
De llamadas procesadas en los últimos 18 meses. Casi todas, en producción.
Conversaciones abiertas hoy
Retail
Mercagán
Sentados con la mesa de socios. Quieren resolver atención y recuperación.
Hospitality y fitness
Ziruss Pizza · Bodytech
Conversaciones con founder y founder respectivamente. Reservas, retención, soporte multi-sede.
Microfinanzas
Grupo Crezcamos
Cobranza Ley 2300 sobre cartera microfinanciera. Caso de uso casi a la medida.
Banca grande
Grupo Aval
Acercamiento con los dueños. Conversación larga, premio grande.
Salud
IPS top de Bucaramanga
Agendamiento y no-shows. La cifra de Bogotá hace los números fáciles.
BPO global
Teleperformance
Hablando con el gerente general en Colombia. Aquí no competimos con ellos; somos la capa cognitiva sobre sus asientos.

Ninguna de estas reuniones llegó por outbound frío. Eso, más que cualquier feature, es lo que hace este pipeline interesante.

06 — Los números que más costaron

Hay tres cifras que casi todo el mundo promete y que muy poca gente puede mostrar en producción.

Las pongo primero porque son las que nos toman años de obtener y las que vuelven posible el resto del negocio.

1.000/seg
Llamadas concurrentes sostenidas. Esto es lo que hace la diferencia entre vender a una pyme y vender a un banco. Casi nadie en LatAm lo tiene en producción.
< 1 s
Latencia conversacional real. Si te toma más, la persona del otro lado nota que no eres humano.
Millones
De llamadas procesadas en producción en los últimos 18 meses.
7+ campañas
Donde aprendimos a no caernos en picos
PBX + SIP
Capas que casi nadie escribe por su cuenta
ES LatAm
Acento y prosodia entrenados aquí, no traducidos
Ley 2300
Compliance dentro del producto, no como hoja de Excel

Lo que tenemos resuelto es la telefonía. Lo que aún nos limita es el cómputo. Por eso este pitch existe.

07 — De una cosa a varias

Empezamos por política porque era lo que conocíamos. Después descubrimos que el motor servía para más cosas.

Resulta que una llamada a un votante y una llamada a un cliente moroso se parecen más de lo que parece. Cambian las palabras y las reglas. La infraestructura es la misma.

Política · donde aprendimos
Funciona
Cobranza · donde el premio es mayor (Crezcamos · Aval · fintechs)
En conversación
Retail y hospitality (Mercagán · Ziruss · Bodytech)
Reuniones con founders
Salud · agendamiento (IPS Bucaramanga)
Acercamiento
BPO · Teleperformance Colombia
Conversación abierta
Por qué multi-vertical y no horizontal puro
  • Cada vertical comparte el mismo motor. Lo que cambia son los prompts, las integraciones y las reglas. Cambiar de industria nos cuesta días, no meses.
  • El pricing cambia bonito: cobranza paga por recuperado, retail por interacción, BPO por minuto, salud por cita. Mezclar verticales suaviza el riesgo.
  • El acceso ejecutivo viene del board, no del SDR. Por eso podemos hablar con varias industrias al tiempo sin contratar diez vendedores.
Qué necesitamos para seguir así
  • Cómputo que crezca con la campaña, no con la planeación. Eso es lo que ofrece Google sin que tengamos que reservar capacidad fija.
  • Modelos de voz finos por país y por sector. Para eso necesitamos entrenar más, no menos.
  • Una capa de datos donde guardar millones de transcripciones y poder hacerles preguntas. Ahí entra BigQuery.
08 — Cómo se vería sobre Google

La telefonía la dejamos donde está. Todo lo demás se mueve a GCP.

Esto no es un dibujo de arquitectura para impresionar. Es la lista concreta de servicios que vamos a consumir si el programa nos aprueba. La pongo así para que sea fácil de auditar.

Lo que se monta arriba
Edge · telefonía
Sigue siendo nuestra PBX y nuestro SIP. Lo que añadimos es Cloud Load Balancing y Cloud Armor para señalización y protección.
Compute · orquestación
GKE y Compute Engine para ruteo, motor de decisión y orquestación conversacional. Con autoscaling para sostener las mil por segundo sin pre-reservar.
IA · capa cognitiva
Vertex AI para entrenar voz LatAm, Gemini para entender lo que dice el usuario, Speech-to-Text y TTS de Google para los idiomas que aún no entrenamos, TPUs para hacerlo barato.
Lo que va al fondo
Datos
BigQuery para analítica de campañas, Cloud Storage para logs de audio, Firestore para el estado de cada llamada mientras pasa.
Observabilidad
Cloud Logging y Monitoring con SLOs por cliente. Esto importa: un banco quiere trazas que aguanten una auditoría.
Seguridad
Secret Manager, IAM y VPC Service Controls. Roadmap a SOC2 Type I, ojalá con apoyo de arquitectos del programa.

Si tuviera que resumir en una frase qué le pediríamos a Google: poder entrenar e inferir modelos de voz en español a mil llamadas por segundo, sin tener que pensar en cuánto vamos a gastar este mes.

09 — En qué se irían

Si nos aprueban el AI Scale, así se gastarían los $200–250 mil dólares.

Lo dividimos en tres trimestres para no engañarnos. Cada fase tiene un hito que se puede verificar. Si no lo cumplimos, el siguiente bloque no se gasta.

Mes 1–3 · construir (~30%)

Entrenar la voz que queremos

  • Fine-tuning del modelo de voz para Colombia, México y Andinos en Vertex AI y TPUs.
  • Mover la capa de orquestación a GKE con autoscaling.
  • Montar BigQuery desde el día uno, con esquema de eventos de llamada bien pensado.
  • Hito: un cliente nuevo en producción usando el modelo entrenado aquí.
Mes 4–9 · escalar (~50%)

Llevar el motor a clientes grandes

  • Inferencia real para sostener las mil por segundo con clientes de cobranza, retail y salud al tiempo.
  • Gemini en el motor de decisión, en vez de las reglas estáticas que tenemos hoy.
  • Dashboards ejecutivos por cliente, donde quepan millones de llamadas sin verse lentos.
  • Hito: 3 a 5 clientes enterprise activos y ARR multiplicado contra hoy.
Mes 10–12 · multi-país (~20%)

Salirnos de Colombia sin romper nada

  • Réplicas activas en regiones de México y Brasil, con los mismos modelos.
  • Bajar el costo por minuto con committed use discounts sobre la huella estable.
  • Empezar SOC2 Type I con apoyo de arquitectos del programa.
  • Hito: plan multianual de consumo firmado con Google.

Por qué encajamos en AI Scale: la IA no es un feature del producto, es el producto. Y la mayor parte del consumo cae justo donde Google quiere que caiga: Vertex AI, Gemini, TPUs y BigQuery.

10 — Lo que habremos construido

Dentro de 12 meses, esto es lo que esperamos poder mostrar.

No es un plan perfecto. Es el plan que creemos hoy. Si vamos más rápido en lo técnico que en lo comercial, o al revés, el plan se ajusta. Lo único que no se mueve es el foco.

Por el lado técnico
  • T1: al menos un cliente enterprise hablando con un modelo entrenado por nosotros en Vertex AI.
  • T2: autoscaling en GKE aguantando picos de campaña sin subirse de un segundo de latencia.
  • T3: Gemini reemplazando reglas estáticas en cobranza y retail.
  • T4: SOC2 Type I iniciado y réplicas activas en mx y br.
Por el lado comercial
  • T1: primer contrato enterprise cerrado con alguno de los que ya están en pipeline (Crezcamos, Aval, Mercagán, Bodytech).
  • T2: al menos una cuenta activa en cobranza, una en retail y una en salud, al tiempo.
  • T3: el primer cliente en México, idealmente con un partner de Google ayudando.
  • T4: ARR repetible y retención lo suficientemente clara como para levantar una serie A en buenos términos.

No queremos ser una startup que usa Google por unos meses y se va. Queremos ser una de esas referencias que ustedes ponen cuando alguien pregunta qué se puede hacer en voz desde LatAm sobre Google Cloud.

11 — Por qué creemos que esto cierra

No estamos solos. Y eso explica buena parte del pipeline.

Las startups que cierran contratos enterprise tempranos casi nunca lo hacen por outbound. Lo hacen porque alguien con credibilidad les abre la primera puerta. Eso es lo que tenemos.

Quién nos respalda
Pre-seed cerrada
Equity verificable. Cumplimos el requisito de Scale y de AI Scale. El monto exacto y los nombres se comparten directo con el equipo de Google bajo NDA.
Razón social
Nexo AI SAS · Colombia. Billing Account de GCP activo con dominio corporativo. El sitio web se está actualizando a la nueva marca.
Equipo
7 personas en core. Todas técnicas, todas full-time. No tenemos vicepresidentes; tenemos gente que escribe código y atiende clientes.
Puertas abiertas por el board
  • Mercagán — sentados con la mesa de socios.
  • Ziruss Pizza y Bodytech — conversaciones con los founders.
  • Grupo Crezcamos — caso de cobranza casi a la medida.
  • Grupo Aval — acercamiento con los dueños.
  • IPS top de Bucaramanga — agendamiento y no-shows.
  • Teleperformance Colombia — conversación con el gerente general.
  • Campañas políticas grandes que ya han trabajado con nosotros y vuelven.

Ninguna de estas reuniones llegó por LinkedIn. Eso es lo que cambia la economía del primer año.

12 — Lo que pedimos

Una sola cosa: que nos dejen construir esto sobre Google.

Solicitud

Aprobación al AI Scale del Google for Startups Cloud Program, con $200.000–$250.000 USD en créditos para los próximos doce meses, destinados sobre todo a entrenar voz LatAm en Vertex AI, inferencia con Gemini, training en TPUs y analítica de campañas en BigQuery.

01 — Créditos

Lo más importante

Sostener entrenamiento e inferencia de voz LatAm a mil llamadas por segundo y analítica de millones de conversaciones, sin tener que reservar capacidad fija.

02 — Acompañamiento

Lo segundo más importante

Acceso al Startup Success Manager y a arquitectos de GCP para diseñar el multi-región, el autoscaling y el camino hacia SOC2 Type I.

03 — Visibilidad

Lo que nos haría volver el favor

Casos de estudio juntos en cobranza, retail y BPO. Y acceso a partners regionales de Google Cloud, para llegar a los clientes enterprise un poco más rápido.

Si funciona, dentro de un par de años queremos ser la respuesta corta cuando alguien pregunte qué se puede hacer en voz desde LatAm corriendo sobre Google Cloud.