IA generativa rentable: cómo pasar del piloto al ROI real
Cómo superar la curva J de la IA generativa con experimentos rigurosos y medir su impacto real antes de escalar.

Conocí a un gerente —lo llamaré Daniel, dueño de una empresa de logística mediana en Bucaramanga— que el año pasado hizo lo que “tocaba hacer”: compró licencias de IA generativa para sus 40 empleados, pagó una capacitación de un día y mandó un correo entusiasta anunciando que entraban “a la era de la inteligencia artificial”. Doce meses después, sentado frente a mí con el estado de resultados abierto, me dijo una frase que resume el drama de miles de empresas latinoamericanas: “Pagué la IA, todos dicen que la usan, y no veo un solo peso de diferencia en la utilidad.”
Daniel no es un caso aislado ni un mal administrador. Es la regla. Y el problema no fue la tecnología que compró: fue que compró una herramienta cuando lo que necesitaba era un método para aprender a usarla. Soy Jhon Mosquera, economista y especialista en Big Data, y en este artículo quiero mostrarle, con evidencia verificable de Harvard, el NBER y la propia realidad colombiana, por qué la mayoría invierte en IA y no ve retorno —y, sobre todo, cómo sí lograrlo: con experimentación organizacional rigurosa y una forma seria de medir el ROI. Sin humo. Solo método.
En corto: la mayoría de las empresas no ve retorno de la IA generativa porque compra la herramienta sin un método para aprender a usarla. La salida no es comprar más IA, sino experimentar con rigor —grupos de control, KPIs— y medir el ROI de verdad. (Actualizado: 30 de junio de 2026.)
Contenido de esta guía
- 1. ¿Por qué la mayoría de las empresas invierte en IA generativa y no ve retorno?
- 2. ¿Qué es la "Curva J" de la productividad y cuánto tarda la IA en dar rentabilidad?
- 3. ¿Por qué fracasan los pilotos tradicionales de IA en las empresas?
- 4. ¿Qué es un experimento organizacional y en qué se diferencia de un piloto?
- 5. ¿Cuánto aumenta de verdad la productividad con IA generativa?
- 6. ¿La IA generativa beneficia más a los expertos o a los novatos?
- 7. ¿Cómo afecta la IA al factor humano, la seguridad laboral y el miedo al reemplazo?
- 8. ¿Cómo diseñar un experimento de IA paso a paso?
- 9. ¿Cómo se mide el ROI real de la IA generativa?
- 10. ¿Qué deben hacer las pymes de Colombia y Latinoamérica para rentabilizar la IA?
1. ¿Por qué la mayoría de las empresas invierte en IA generativa y no ve retorno?
La mayoría de las empresas no ve retorno de la IA generativa porque confunde “adoptar la herramienta” con “transformar la organización”. La adopción es masiva, pero el impacto financiero es raro: según la encuesta State of AI 2025 de McKinsey, el 88% de las organizaciones ya usa IA en al menos una función (frente al 78% un año antes), pero solo el 39% atribuye algún impacto en su EBIT a la IA, y el impacto significativo en las ganancias “sigue siendo raro” [3]. El artículo de Harvard Business Review que sirve de columna a este análisis lo resume sin anestesia: más del 80% de las firmas reportó que la IA “todavía no había tenido un impacto significativo en sus ganancias” [1][2].
En Colombia el espejo es todavía más nítido. El 92% de los trabajadores encuestados ya usa herramientas de IA [9], y el 66% de las empresas superó la etapa inicial de integración [11]; sin embargo, solo el 21% de las organizaciones colombianas —cerca de 2 de cada 10— dice haber alcanzado mayoritaria o totalmente los beneficios que esperaba [10]. Tenemos un país lleno de gente usando IA y un puñado de empresas rentabilizándola. Esa distancia entre el uso y el valor es, exactamente, el problema de Daniel.
¿Por qué ocurre? Porque la IA generativa no es un software que se instala y rinde, como una hoja de cálculo. Es lo que los economistas llamamos una tecnología de propósito general —motor de la nueva economía digital—: para dar fruto exige rediseñar procesos, formar personas y cambiar flujos de trabajo. Y ese rediseño no se compra: se aprende. Quien no lo aprende con método se queda, como Daniel, pagando la licencia sin mover la aguja.
2. ¿Qué es la “Curva J” de la productividad y cuánto tarda la IA en dar rentabilidad?
La “Curva J” de la productividad describe por qué una tecnología poderosa primero baja el rendimiento y solo después lo dispara. Cuando una empresa adopta una tecnología de propósito general, debe invertir en activos intangibles —rediseño de procesos, capital humano, nuevos flujos de trabajo— que al inicio cuestan y no se ven en las cuentas. Eso produce una caída aparente de la productividad (el tramo descendente de la “J”) antes del repunte. El concepto lo formalizaron Brynjolfsson, Rock y Syverson: las inversiones complementarias intangibles, mal medidas al principio, hacen que la productividad se subestime en los primeros años y se sobreestime después, cuando esos intangibles rinden [8].
La analogía histórica es la electricidad. Las fábricas tardaron alrededor de 40 años en volverse realmente más productivas con energía eléctrica, no porque la electricidad fuera mala, sino porque hubo que rediseñar la fábrica entera: pasar del eje central de vapor a máquinas distribuidas, reorganizar la planta y repensar la división del trabajo, reentrenar a los obreros. La IA generativa está en su propio tramo descendente de la “J”: muchas empresas ya pagaron la inversión, pero todavía no cosecharon el rediseño.
¿Cuánto tarda, entonces, en dar rentabilidad? No hay un número mágico, y desconfíe de quien se lo prometa. Lo honesto es decir que depende de la velocidad con la que la organización aprenda, no de la potencia del modelo que compre. Y ahí está la buena noticia para una pyme: usted no puede competir con Google en cómputo, pero sí puede competir —y ganar— en velocidad de aprendizaje. La pregunta correcta no es “¿qué IA compro?”, sino “¿cómo reorganizo mi empresa para que esta IA funcione, y cómo lo mido?”.
3. ¿Por qué fracasan los pilotos tradicionales de IA en las empresas?
Los pilotos tradicionales de IA fracasan porque están diseñados para confirmar entusiasmo, no para producir conocimiento. Un piloto típico —en una firma de abogados de Bogotá o una fábrica de Bucaramanga— elige a un equipo de “entusiastas”, les da la herramienta y recoge anécdotas. El resultado es positivo por defecto, y por eso engaña. Cuando la decisión de escalar se toma sobre ese espejismo, la inversión se hace masiva justo donde la evidencia era más débil.
La evidencia revela tres fallas estructurales del piloto informal:
- Sesgo de selección. Si le da la herramienta solo a los más motivados, nunca sabrá si funciona con el empleado promedio. El día que obligue al resto a usarla, fracasará.
- Falta de causalidad. Sin un grupo de comparación, no puede saber si la mejora vino de la IA o de que el equipo simplemente tuvo una buena semana.
- Escalamiento a ciegas. Las decisiones de expansión se basan en el “me gustó la herramienta” y no en datos duros, lo que multiplica el riesgo financiero.
Aquí conviene un matiz que muchos pilotos ignoran y que cambia todo: la IA no ayuda igual en todas las tareas. El estudio de Harvard con 758 consultores de Boston Consulting Group encontró una “frontera tecnológica dentada”: en las tareas dentro de la frontera de la IA, los consultores que la usaron completaron 12,2% más tareas, 25,1% más rápido y con 40% más de calidad; pero en tareas fuera de esa frontera, los que usaron IA rindieron unos 19 puntos porcentuales peor que quienes no la usaron [7]. Un piloto informal mezcla esas tareas y promedia un resultado que no le sirve para decidir nada. Un experimento serio las separa.
4. ¿Qué es un experimento organizacional y en qué se diferencia de un piloto?
Un experimento organizacional aplica el método científico al trabajo: define una hipótesis medible, compara un grupo que usa la IA contra uno que no, y aísla el efecto causal real. No pregunta “¿les gustó?”; pregunta “¿esta herramienta, en esta tarea, mejora este KPI frente a no usarla?”. Esa es la diferencia entre comprar información barata para decidir bien y comprar entusiasmo caro para decidir mal. El equipo de Harvard Business Review —con autores de Siemens, LMU Munich y Harvard Business School— sostiene que, para reducir riesgo y escalar con criterio, las empresas “necesitan más pruebas a nivel organizacional” [1].
La mecánica tiene tres piezas: (1) una hipótesis testeable (“¿el asistente reduce 20% el tiempo de redacción de cotizaciones?”); (2) un grupo de tratamiento y uno de control, asignados al azar o mediante un despliegue escalonado (una sucursal arranca en enero, otra en febrero y sirve de control ese mes); y (3) el aislamiento de variables, que permite distinguir si fue la IA o si simplemente le dimos la herramienta a quienes ya eran los más eficientes.
La siguiente tabla aterriza la diferencia. Léala pensando en su propia empresa:
| Dimensión | Piloto tradicional (la vieja escuela) | Experimento organizacional (enfoque científico) |
|---|---|---|
| Pregunta que responde | “¿Les gustó la herramienta?” | “¿Mejora este KPI frente a no usarla?” |
| Participantes | Equipo “elegido a dedo” (los más entusiastas) → sesgo de selección | Asignación aleatoria o despliegue escalonado → comparabilidad |
| Grupo de control | Inexistente; no hay con qué comparar | Grupo de tratamiento (con IA) vs. control (sin IA) |
| Medición | Anecdótica (“me sirvió mucho”) | KPIs cuantitativos antes/después + feedback cualitativo |
| Qué revela | Si “funciona” en general (poco accionable) | Para quién funciona (novatos vs. expertos) y en qué tareas |
| Base de la decisión | Entusiasmo e intuición | Evidencia causal; menos falsos positivos |
| Riesgo financiero | Alto: se escala lo que parecía bueno | Acotado: se valida costo y beneficio antes de escalar |
| Costo del error | Se descubre tras gastar el presupuesto | Se descubre en pequeño, antes de gastarlo |
El caso que cierra el argumento: GitHub y Google corrieron ensayos controlados con desarrolladores asignados al azar; quienes usaron asistentes de IA completaron sus tareas entre 21% y 55% más rápido que el grupo manual [1][2]. El extremo superior de ese rango está documentado en el ensayo de GitHub Copilot de Peng y colegas, donde el grupo con IA terminó la tarea (programar un servidor HTTP) un 55,8% más rápido que el control [4]. Ese sí es un dato con el que uno puede entrar al comité financiero.
5. ¿Cuánto aumenta de verdad la productividad con IA generativa?
La IA generativa aumenta la productividad de forma real pero desigual: típicamente entre 14% y 55% según la tarea, con efectos grandes en trabajo acotado y nulos —o negativos— fuera de la frontera de la IA. No es magia uniforme; es una palanca que funciona donde encaja. El estudio del NBER más citado sobre el tema, con 5.179 agentes de soporte al cliente, encontró que el acceso a un asistente de IA subió la productividad un 14% en promedio [5]. En desarrollo de software, los ensayos de GitHub/Google reportan 21%-55% más rápido [1][2][4]. En consultoría, los consultores de BCG dentro de la frontera de la IA fueron 25,1% más rápidos y con 40% más de calidad [7].
Pero el mismo cuerpo de evidencia exige prudencia. En las tareas que caían fuera de la frontera, los consultores con IA acertaron unos 19 puntos porcentuales menos que los que trabajaron sin ella [7]. Es decir: usar IA en la tarea equivocada no solo no ayuda, puede destruir valor. Por eso el promedio de un folleto comercial (“hasta 50% más productivo”) es inútil para decidir: lo que rentabiliza no es el promedio, es saber en qué tareas suyas la IA está dentro de la frontera. Y eso solo se sabe midiendo.
La lectura para una pyme latinoamericana es liberadora: usted no necesita el mejor modelo del mundo para capturar la mayor parte de estos beneficios. Las cifras altas aparecen en tareas frecuentes y acotadas —redactar, resumir, dar soporte, escribir código rutinario—, que son justamente las que abundan en una empresa mediana. La ventaja no está en el modelo; está en identificar bien la tarea.
6. ¿La IA generativa beneficia más a los expertos o a los novatos?
La evidencia es contundente: la IA generativa beneficia mucho más a los novatos que a los expertos, funcionando como un nivelador del talento. En el estudio del NBER con 5.179 agentes de soporte, mientras la productividad general subió 14%, los trabajadores novatos y menos calificados mejoraron un 34%, y el impacto en los expertos fue prácticamente nulo [5]. La explicación de los autores es elegante: la IA disemina las mejores prácticas de los trabajadores más hábiles y ayuda a los nuevos a “bajar la curva de aprendizaje” más rápido [5].
Mi lectura económica es que la IA generativa actúa como un acelerador de la curva de aprendizaje: permite que un junior rinda casi como un senior en mucho menos tiempo. Para Latinoamérica, donde la brecha de habilidades es un problema estructural, esto no es un detalle técnico: es una palanca de equidad y de competitividad.
Las implicaciones de gestión son directas y, sin un experimento segmentado por nivel de experiencia, invisibles. Si Daniel hubiera medido, habría descubierto que gastar licencias premium en sus seniors —donde el retorno marginal es casi cero— era desperdicio, y que el oro estaba en habilitar a su equipo junior. Un piloto promedio le habría dicho “la IA funciona”. Un experimento le habría dicho “la IA funciona para ellos, en estas tareas”. La segunda frase es la que ahorra (y hace ganar) dinero.
7. ¿Cómo afecta la IA al factor humano, la seguridad laboral y el miedo al reemplazo?
Bien implementada, la IA generativa reduce el miedo al reemplazo en lugar de aumentarlo: empodera al trabajador, le da autonomía y, paradójicamente, lo hace sentir más seguro. El caso documentado en el artículo de Harvard Business Review es el de Siemens, que implementó un asistente de IA generativa en su fábrica de Erlangen (Alemania) para apoyar el mantenimiento de maquinaria. Al principio, los técnicos temían por sus empleos —la reacción natural ante lo desconocido—. Pero a las pocas semanas de usar el asistente en la planta, “reportaron sentirse más seguros en sus trabajos” [1][2].


¿Por qué cambió la percepción? Porque la herramienta resolvió fricciones reales: redujo drásticamente el tiempo de búsqueda en manuales técnicos complejos y permitió que los técnicos resolvieran problemas sin depender de llamar al “ingeniero experto”, lo que aumentó su autonomía y su orgullo profesional. La planta incluso mantuvo la producción estable cuando el equipo se redujo por razones ajenas a la IA, porque el asistente compensó la falta de personal de apoyo [1][2].
Como especialista en gestión de equipos, esto valida una tesis que repito en cada proyecto: **la IA que se diseña con la gente, y no contra la gente, gana dos veces** —captura el beneficio de productividad y, además, la seguridad psicológica del equipo, que es la que sostiene cualquier cambio en el tiempo—. El miedo al reemplazo no se disuelve con un discurso motivacional; se disuelve cuando el trabajador experimenta que la herramienta lo hace mejor en lo suyo. Y eso, otra vez, es algo que se diseña y se mide.
8. ¿Cómo diseñar un experimento de IA paso a paso?
Diseñar un experimento de IA no requiere un laboratorio: requiere disciplina en cinco pasos, accesibles incluso para una pyme. La meta es comprar información barata —probar en pequeño con rigor— para evitar fracasos caros. Esta es la hoja de ruta que recomiendo:


- Diagnostique el dolor real, no el “nice to have”. No implemente IA porque está de moda. P&G no buscó “usar IA”: detectó que la fricción entre Marketing e I+D era un problema concreto y construyó un “compañero cibernético” para esa colaboración específica [6]. Acción: entreviste a su equipo y busque el problema doloroso, no la solución brillante.
- **Defina una hipótesis y los KPIs antes de empezar.** “El asistente reduce 20% el tiempo de cotización” es testeable; “vamos a ver qué pasa” no lo es. Fije las métricas de antemano: tiempo de resolución, calidad, satisfacción del cliente, nivel de estrés del empleado.
- Cree un grupo de control. Si no puede hacer una asignación aleatoria perfecta, use un despliegue escalonado: introduzca la IA en la sucursal Norte en enero y use la Sur, que aún no la tiene, como control durante ese mes. La comparación es lo que convierte una anécdota en evidencia.
- Segmente y prototipe rápido. Mida por nivel de experiencia (novatos vs. expertos) y por tipo de tarea (dentro vs. fuera de la frontera de la IA). Entregue una herramienta imperfecta pero funcional a un grupo pequeño y mida la reacción semanalmente, en vez de esperar el producto perfecto.
- Decida con la cifra, no con el entusiasmo. Si el KPI mejoró de forma causal, escale. Si no, mátelo sin culpa: acaba de ahorrarse el presupuesto que Daniel perdió. Un experimento que “falla” en pequeño es un éxito de gestión.
Y un consejo de ecosistema: no tiene que hacerlo solo. Microsoft estudió la adopción de su Copilot con más de 7.000 empleados de 66 firmas junto a académicos, y Grab colabora con investigadores de Harvard e INSEAD [2]. Si usted es una pyme, la versión latinoamericana de eso es unirse a un gremio o a una universidad local para compartir datos y costos de experimentación. Hablaremos de ello en el último punto.
9. ¿Cómo se mide el ROI real de la IA generativa?
El ROI de la IA generativa se mide comparando el valor capturado (horas ahorradas, errores evitados, ingresos adicionales) contra el costo total de propiedad (licencias, implementación y tiempo de adopción), y se valida con el experimento del paso 8. La fórmula es simple; lo difícil —y lo que casi nadie hace— es alimentarla con datos del grupo de control en lugar de con percepciones. Sin ese contraste, usted no está midiendo el efecto de la IA: está midiendo el optimismo de su equipo.
El ROI, en su forma más honesta, es:
ROI (%) = (Beneficio anual capturado − Costo total anual) ÷ Costo total anual × 100. Y el período de recuperación (payback) = Inversión inicial ÷ Ahorro mensual neto.
El error más común es contar solo la licencia y olvidar el resto del costo —y olvidar restar la “Curva J”, esa caída inicial mientras el equipo aprende—. La siguiente tabla ordena qué medir de cada lado:
| Lado de la ecuación | Componente | Cómo cuantificarlo (ejemplo pyme) |
|---|---|---|
| Costos | Licencias | USD/usuario/mes × nº de usuarios × 12 |
| Costos | Implementación y formación | Horas de TI + capacitación + integración |
| Costos | Curva J (caída inicial) | Horas de productividad perdidas durante la adopción |
| Costos | Supervisión y control de calidad | Tiempo de revisar/corregir salidas de la IA |
| Beneficios | Horas ahorradas | (Horas tarea sin IA − con IA) × costo/hora × volumen |
| Beneficios | Calidad / errores evitados | Reprocesos o reclamos evitados × costo unitario |
| Beneficios | Capacidad liberada | Ingresos por atender más clientes con el mismo equipo |
| Beneficios | Retención de talento | Menor rotación (efecto documentado en soporte) [5] |
Un ejemplo numérico, deliberadamente conservador y marcado como ilustrativo (no es un dato medido): una empresa con 10 personas que ahorran 5 horas semanales gracias a la IA en tareas dentro de su frontera, a un costo laboral de $20.000/hora, libera unas 50 horas semanales ≈ $4.000.000 al mes en capacidad. Si las licencias y la supervisión cuestan $1.200.000 al mes, el ahorro neto ronda los $2.800.000 mensuales y el payback de una inversión inicial de $6.000.000 sería de poco más de dos meses. La advertencia metodológica es la clave: esos “5 horas ahorradas” deben venir de comparar contra un grupo de control, no de preguntarle a la gente cuánto cree que ahorró. Sin grupo de control, el ROI es ficción contable; con él, es un caso de negocio. Ese es exactamente el puente entre “experimentar” y “rentabilizar” que le faltaba a Daniel.
10. ¿Qué deben hacer las pymes de Colombia y Latinoamérica para rentabilizar la IA?
Las pymes latinoamericanas rentabilizan la IA compitiendo por velocidad de aprendizaje, no por poder de cómputo: experimentos pequeños, métricas claras y costo de experimentación compartido con gremios y universidades. El contexto regional obliga a ser estratégico: América Latina y el Caribe representa apenas el 1,56% de la demanda global de IA, y la CEPAL señala que la adopción —el corazón de la transformación digital— avanza lento por baja inversión en capital intangible y escasez de talento calificado [12]. La brecha interna es aún más dura: en un estudio de la CEPAL sobre Brasil, el 41% de las grandes empresas usa IA frente a solo el 11% de las pymes [12]. Si no se actúa, la IA ampliará la desigualdad entre grandes y pequeñas en vez de cerrarla.
La buena noticia es que la palanca que importa —aprender barato y rápido— está al alcance de una pyme. Cuatro movimientos concretos:
- Empiece por una sola tarea dolorosa y frecuente. No “implemente IA”: resuelva la cotización lenta, el soporte saturado o el informe que nadie quiere escribir. Una tarea, un experimento, un KPI.
- Mida con grupo de control desde el primer día, aunque sea con un despliegue escalonado entre dos sucursales o dos turnos. Es gratis y es lo que separa el dato del deseo.
- Apueste a sus juniors. La evidencia dice que ahí está el mayor retorno [5]: forme a su gente menos experimentada, que es donde la IA nivela y multiplica.
- Comparta el costo de experimentar. Únase a su gremio, a una cámara de comercio o a una universidad regional para correr experimentos conjuntos y comparar resultados. Lo que Microsoft hace con Harvard [2], una pyme de Bucaramanga puede hacerlo con la UIS o con su gremio sectorial. El costo de aprender, dividido entre muchos, se vuelve asumible.
La ventaja competitiva de 2026 no será tener la mejor IA, sino tener la mejor capacidad de aprender de ella con rigor. Y esa capacidad no la monopolizan las grandes empresas: la democratiza el método. Mientras una multinacional debate su estrategia global en una sala de juntas, una pyme colombiana disciplinada puede correr tres experimentos, fallar barato en dos y escalar el tercero con un caso de negocio en la mano. Esa es, para mí, la verdadera promesa social de la IA en la región: no que las máquinas piensen por nosotros, sino que el conocimiento para competir —antes reservado a quien podía pagar grandes consultoras— quede al alcance de cualquiera dispuesto a medir en lugar de adivinar. La pregunta para Daniel, y para usted, ya no es “¿qué IA compro?”, sino “¿qué voy a aprender esta semana, y cómo lo voy a medir?”.
Preguntas frecuentes (FAQ)
¿Cuál es la diferencia entre un piloto de IA y un experimento organizacional? Un piloto suele carecer de grupo de control y se basa en el feedback de usuarios entusiastas, lo que casi garantiza un resultado positivo engañoso. Un experimento organizacional usa una hipótesis medible y un grupo de control (asignación aleatoria o despliegue escalonado) para aislar el efecto causal real y saber no solo si funciona, sino para quién y en qué tareas.
¿Por qué la IA generativa baja la productividad al principio? Por la “Curva J”: la IA es una tecnología de propósito general que exige inversiones complementarias intangibles —rediseñar procesos, formar personas— que cuestan al inicio y no se ven en las cuentas, antes de que llegue el repunte [8]. Es el mismo patrón que tuvo la electricidad en la industria.
¿Cuánto aumenta realmente la productividad con IA generativa? Depende de la tarea: alrededor de 14% en promedio en soporte al cliente [5], 21%-55% en desarrollo de software [1][4] y 25% más rápido con 40% más calidad en consultoría dentro de la frontera de la IA [7]. Pero fuera de esa frontera puede empeorar los resultados [7], por eso el promedio aislado no sirve para decidir.
¿La IA reemplazará a mis empleados? La evidencia sugiere que, bien implementada, los empodera más de lo que los reemplaza: en la fábrica de Siemens en Erlangen los técnicos terminaron sintiéndose más seguros en sus empleos tras usar el asistente [1][2]. La IA tiende a nivelar el talento, beneficiando más a los trabajadores menos experimentados [5].
¿Necesito contratar académicos o científicos de datos para experimentar? No es indispensable. Empresas como Microsoft colaboran con universidades, pero cualquier organización puede aplicar los principios básicos —hipótesis, grupo de control, KPIs claros— capacitando a su propio equipo. Una pyme puede compartir el costo uniéndose a un gremio o a una universidad local.
¿Cómo calculo el ROI de la IA generativa en mi empresa? Reste al beneficio capturado (horas ahorradas, errores evitados, capacidad liberada) el costo total de propiedad (licencias + implementación + Curva J + supervisión) y divida por ese costo. El payback es la inversión inicial sobre el ahorro mensual neto. Lo decisivo es que las “horas ahorradas” provengan de comparar contra un grupo de control, no de percepciones.
¿Cuánto tarda la IA en volverse rentable? No hay un plazo fijo; depende de la velocidad con la que la organización aprenda a rediseñar sus procesos, no de la potencia del modelo. Por eso una pyme ágil puede rentabilizar antes que una gran empresa lenta.
¿Por dónde debe empezar una pyme con presupuesto limitado? Por una sola tarea dolorosa y frecuente, con un experimento pequeño y un grupo de control, priorizando a los empleados junior (donde el retorno es mayor) y compartiendo el costo de experimentar con su gremio o una universidad regional.
Transparencia: las ilustraciones de este artículo fueron generadas con inteligencia artificial (ChatGPT) y curadas por el autor. El contenido fue investigado y redactado con asistencia de IA, con verificación de fuentes primarias y bajo la supervisión y responsabilidad editorial de Jhon Mosquera. Conoce en detalle cómo creo el contenido y uso la IA.
Referencias
[1] Berndt, J., Englmaier, F., Sadun, R., Tamayo, J. & von Hesler, N. (2026). A Systematic Approach to Experimenting with Gen AI. Harvard Business Review, vol. 104, no. 1 (enero-febrero 2026), pp. 66-75. https://hbr.org/2026/01/a-systematic-approach-to-experimenting-with-gen-ai (artículo backbone; texto completo tras muro de pago — afirmaciones internas verificadas vía [2] y ancladas a fuentes primarias [4][5][6][7]).
[2] Chandra, V. (2026). Síntesis pública del artículo “A Systematic Approach to Experimenting with Gen AI” (reproduce frases textuales del artículo HBR: 21%-55% GitHub/Google, Siemens, Microsoft Copilot en 7.000+ empleados de 66 firmas, Grab con Harvard/INSEAD, P&G). LinkedIn. https://www.linkedin.com/pulse/generative-ai-systematic-approach-experimenting-gen-vishal-chandra-qrfrc
[3] McKinsey & Company (QuantumBlack) (2025, noviembre). The State of AI in 2025: Agents, innovation, and transformation. 88% de organizaciones usa IA en ≥1 función (vs. 78% el año previo); 39% atribuye algún impacto en EBIT a la IA (la mayoría menos de 5%); el impacto significativo en ganancias “sigue siendo raro”. https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai
[4] Peng, S., Kalliamvakou, E., Cihon, P. & Demirer, M. (2023). The Impact of AI on Developer Productivity: Evidence from GitHub Copilot. arXiv:2302.06590. El grupo con Copilot completó la tarea (servidor HTTP en JavaScript) 55,8% más rápido que el control. https://arxiv.org/abs/2302.06590
[5] Brynjolfsson, E., Li, D. & Raymond, L. (2023). Generative AI at Work. NBER Working Paper No. 31161. Con 5.179 agentes de soporte: +14% de productividad en promedio, +34% en novatos/menos calificados, impacto mínimo en expertos; mejora del sentimiento del cliente y de la retención. https://www.nber.org/papers/w31161
[6] Dell’Acqua, F., Ayoubi, C., Lifshitz-Assaf, H., Sadun, R., Mollick, E., Mollick, L., Han, Y., Goldman, J., Nair, H., Taub, S. & Lakhani, K. R. (2025, marzo). The Cybernetic Teammate: A Field Experiment on Generative AI Reshaping Teamwork and Expertise. NBER Working Paper No. 33641 / HBS Working Paper 25-043. 776 profesionales de P&G; la IA rompió silos I+D-Marketing y los individuos con IA igualaron a equipos sin IA. https://www.nber.org/papers/w33641
[7] Dell’Acqua, F., McFowland III, E., Mollick, E., Lifshitz-Assaf, H., Kellogg, K., Rajendran, S., Krayer, L., Candelon, F. & Lakhani, K. R. (2023, septiembre). Navigating the Jagged Technological Frontier: Field Experimental Evidence of the Effects of AI on Knowledge Worker Productivity and Quality. HBS Working Paper 24-013. 758 consultores de BCG: dentro de la frontera +12,2% tareas, 25,1% más rápido, 40% más calidad; fuera de la frontera, ~19 pp peor. https://www.hbs.edu/faculty/Pages/item.aspx?num=64700
[8] Brynjolfsson, E., Rock, D. & Syverson, C. (2018/2021). The Productivity J-Curve: How Intangibles Complement General Purpose Technologies. NBER Working Paper No. 25148; publicado en American Economic Journal: Macroeconomics, vol. 13 (2021), pp. 333-372. Fundamento de la “Curva J”: las inversiones intangibles complementarias hacen subestimar la productividad al inicio y sobreestimarla después. https://www.nber.org/papers/w25148
[9] EY Colombia (2026, 16 de febrero). IA en Colombia: alta adopción, baja transformación empresarial (encuesta EY Work Reimagined). 92% de los trabajadores en Colombia usa herramientas de IA; solo 28% de las organizaciones a nivel global logra impacto transformador del negocio. https://www.ey.com/es_co/newsroom/2026/02/ia-colombia-adopcion-transformacion-empresarial
[10] Deloitte (2026, marzo). Pulso AI: empresas colombianas en la frontera cognitiva (vía ImpactoTIC). 55% de las organizaciones colombianas implementó IA; solo 21% (≈2 de cada 10) alcanzó mayoritaria o totalmente los beneficios proyectados; 62% sigue en pruebas de concepto. https://impactotic.co/inteligencia-artificial/inteligencia-artificial-generativa-empresas-colombia/
[11] IDC InfoBrief comisionado por Deel (2025, noviembre; vía El Tiempo). La IA en el trabajo (5.500 líderes en 22 mercados). 66% de las empresas colombianas superó la etapa inicial de integración de IA (41% intermedia, 26% avanzada). https://www.eltiempo.com/tecnosfera/novedades-tecnologia/estudio-revela-que-el-66-de-las-empresas-colombianas-superaron-la-etapa-inicial-de-adopcion-de-inteligencia-artificial-3509789
[12] CEPAL (2025, 29 de julio). Impacto económico de la inteligencia artificial en América Latina (nota y publicación 81909/81911). ALC representa el 1,56% de la demanda global de IA; barreras: baja inversión en capital intangible y escasez de talento; en Brasil, 41% de las grandes empresas usa IA frente a 11% de las pymes. https://www.cepal.org/es/notas/segun-la-cepal-la-inteligencia-artificial-ya-impulsa-la-productividad-america-latina-caribe