cover

WebMCP: el nuevo idioma entre la web y la inteligencia artificial

author photo

Héctorbliss

@hectorbliss

Febrero 2026


El problema silencioso

Los agentes de IA llevan meses fingiendo ser humanos

Hay algo un poco absurdo en la forma en que los agentes de inteligencia artificial interactúan hoy con las páginas web. Claude, ChatGPT, Gemini y otros sistemas capaces de razonar sobre problemas complejos se ven obligados a tomar capturas de pantalla de un sitio web, pasarlas por un modelo de visión, adivinar dónde está un botón y simular un clic. Si el diseño cambia cinco píxeles, todo se rompe. Si un formulario tiene dos campos con nombres parecidos, el agente puede equivocarse. En la práctica, estamos obligando a sistemas extraordinariamente sofisticados a interactuar con internet como si estuvieran vendados, tanteando a ciegas una interfaz diseñada exclusivamente para ojos humanos. Este método, además de frágil, es caro: cada intento consume tokens de modelos multimodales y genera latencias que se acumulan con rapidez. Ha funcionado hasta ahora porque no había alternativa. Eso acaba de cambiar.


La propuesta

WebMCP le da voz a los sitios web para que hablen directamente con la IA

El 10 de febrero de 2026, el equipo de Chrome publicó discretamente un anuncio que puede redefinir la relación entre las páginas web y la inteligencia artificial. Se llama WebMCP, abreviatura de Web Model Context Protocol, y es un estándar propuesto ante el W3C desarrollado en conjunto por ingenieros de Google y Microsoft. La idea central es elegante: en lugar de que un agente de IA adivine qué puede hacer en un sitio web, el propio sitio le dice exactamente qué funciones están disponibles, qué parámetros aceptan y qué devuelven. El mecanismo técnico es una nueva API del navegador llamada navigator.modelContext, donde los desarrolladores registran herramientas con un nombre, una descripción en lenguaje natural y un esquema JSON que define las entradas. Un sitio de viajes, por ejemplo, podría exponer una herramienta llamada "buscarVuelos" que acepta origen, destino y fecha, y devuelve resultados estructurados. El agente ya no necesita navegar menús desplegables, hacer scroll ni interpretar píxeles. Hace una sola llamada y recibe datos limpios.


La confusión de nombres

WebMCP no es el MCP de Anthropic, aunque se complementan

El nombre genera una confusión comprensible. El MCP original, el Model Context Protocol de Anthropic, es un protocolo de backend que conecta plataformas de IA con servicios externos a través de servidores dedicados. WebMCP, en cambio, vive enteramente dentro del navegador, del lado del cliente. No sigue la especificación JSON-RPC que usa el MCP de Anthropic ni requiere infraestructura de servidores adicional. Una forma útil de pensarlo: el MCP de Anthropic es para cuando ningún humano está mirando, automatizaciones de servidor a servidor; WebMCP es para cuando el usuario está presente, observando y colaborando con el agente en tiempo real. Lo interesante es que no compiten entre sí. Una empresa de comercio electrónico podría mantener un servidor MCP tradicional para integraciones directas con plataformas de IA, y al mismo tiempo implementar herramientas WebMCP en su sitio web para que los agentes de navegador interactúen con su flujo de compra dentro de la sesión activa del usuario. Son dos capas de una misma arquitectura emergente.


El estado real

Es una promesa temprana, no una herramienta lista para producción

Conviene ser claros sobre dónde estamos. WebMCP está disponible únicamente en Chrome 146 Canary, detrás de un flag experimental llamado "Experimental Web Platform Features". La especificación es un borrador de grupo comunitario del W3C, no un estándar aprobado. Firefox, Safari y Edge participan en el grupo de trabajo, pero no han implementado nada aún. El modelo de seguridad tiene preguntas abiertas importantes: cómo prevenir que un sitio malicioso exponga herramientas engañosas, cómo evitar la exfiltración de datos cuando un agente opera en múltiples pestañas, cómo garantizar que las acciones destructivas requieran confirmación genuina del usuario. Google ha adoptado un enfoque de permisos donde el navegador actúa como mediador y el agente no puede ejecutar una herramienta sin consentimiento explícito, pero los detalles de implementación siguen en desarrollo. Para los desarrolladores curiosos, este es el momento ideal para experimentar y construir prototipos. Para decisiones de infraestructura en producción, es prudente esperar.


Lo que viene

Productos inmediatos, productos posibles y el horizonte largo

Los casos de uso más cercanos son los que menos fricción requieren. Un formulario de contacto, un buscador de productos, un localizador de tiendas: agregar atributos HTML declarativos a estos elementos es trabajo de minutos y convierte cualquier sitio en algo que un agente puede entender sin adivinar. Un paso más allá están los flujos de trabajo complejos, como un sistema de reservas donde el agente consulta disponibilidad, selecciona opciones y completa un pago, todo a través de llamadas estructuradas en lugar de simulación visual. En el horizonte largo, WebMCP podría habilitar ecosistemas donde los agentes comparan servicios de múltiples sitios en tiempo real, donde las empresas compiten no solo por SEO sino por ser las más accesibles para la inteligencia artificial, y donde la automatización del navegador deja de depender de scripts frágiles que se rompen con cada rediseño. Las estimaciones de eficiencia tempranas hablan de una reducción del 67% en costo computacional y mejoras cercanas al 89% en consumo de tokens respecto a los métodos basados en capturas de pantalla.


La perspectiva

Estamos viendo nacer la segunda interfaz de la web

Durante tres décadas, la web ha tenido una sola audiencia: las personas. Los navegadores tradujeron HTML en experiencias visuales, y todo el diseño, la accesibilidad, la optimización, giró alrededor de los ojos y las manos humanas. Los lectores de pantalla fueron una primera excepción honrosa: una interfaz paralela para usuarios con necesidades distintas. WebMCP introduce una tercera audiencia, los agentes de inteligencia artificial, y propone que los sitios web aprendan a hablar también con ellos. No es un reemplazo de nada que exista hoy. Es una capa nueva. Si Schema.org les dio a los motores de búsqueda los sustantivos de la web, una estructura para entender qué significan las cosas, WebMCP aspira a darles los verbos: una forma de entender qué acciones se pueden realizar. El estándar es joven, el camino es largo y las preguntas de seguridad son serias. Pero el hecho de que Google y Microsoft estén co-escribiendo código, que el W3C provea el marco institucional, y que Chrome 146 ya ejecute una implementación funcional detrás de un flag, sugiere que la dirección está definida. Para quienes construyen en la web, vale la pena empezar a prestar atención.

meta cover

Aprende en 5 minutos qué es HTML y cuando utilizar cada una de sus etiquetas

Checa este otro Post

meta cover

3 razones de por qué deberías aprender a programar en 2023 y cambiar de carrera

Checa este otro Post

¡Nuevo curso!

Animaciones web con React + Motion 🧙🏻