La IA significa el fin de las búsquedas en Internet tal y como las hemos conocido

 

A pesar de la disminución de los clics, las luchas por los derechos de autor y, a veces, las respuestas dudosas, la IA podría desbloquear nuevas formas de convocar todo el conocimiento del mundo.

Por Mat Honan MIT Technology Review
6 de enero de 2025
Traducido del inglés con ia.

Todos sabemos lo que significa, coloquialmente, buscar algo en Google. Coloca algunas palabras relevantes en un cuadro de búsqueda y, a cambio, obtiene una lista de enlaces azules a los resultados más relevantes. Tal vez algunas explicaciones rápidas en la parte superior. Tal vez algunos mapas o resultados deportivos o un video. Pero fundamentalmente, se trata de obtener información que ya está en Internet y mostrártela, de alguna manera estructurada.

Pero todo eso está en juego. Estamos en un nuevo punto de inflexión.

El mayor cambio en la forma en que los motores de búsqueda nos han entregado información desde la década de 1990 está ocurriendo ahora mismo. Se acabó la búsqueda de palabras clave. Ya no tendrás que clasificar los enlaces para hacer clic. En cambio, estamos entrando en una era de búsqueda conversacional. Lo que significa que en lugar de palabras clave, utilizas preguntas reales, expresadas en lenguaje natural. Y en lugar de enlaces, cada vez encontrarás más respuestas, escritas por IA generativa y basadas en información en vivo de todo Internet, entregadas de la misma manera.

Por supuesto, Google, la compañía que ha definido la búsqueda durante los últimos 25 años, está tratando de estar al frente en esto. En mayo de 2023, comenzó a probar las respuestas generadas por IA a las consultas de búsqueda, utilizando su modelo de lenguaje grande (LLM) para ofrecer el tipo de respuestas que se podrían esperar de una fuente experta o de un amigo de confianza. A esto se le llama AI Overviews. El CEO de Google, Sundar Pichai, describió esto a MIT Technology Review como "uno de los cambios más positivos que hemos hecho para la búsqueda en mucho, mucho tiempo".


Los resúmenes de IA cambian fundamentalmente los tipos de consultas que Google puede abordar. Ahora puedes preguntarle cosas como "Voy a ir a Japón por una semana el próximo mes. Me quedaré en Tokio, pero me gustaría hacer algunas excursiones de un día. ¿Hay algún festival en las cercanías? ¿Cómo será el surf en Kamakura? ¿Hay alguna banda buena que toque?" Y obtendrás una respuesta, no solo un enlace a Reddit, sino una respuesta construida con resultados actuales.

Más concretamente, puede intentar búsquedas que antes eran prácticamente imposibles y obtener la respuesta correcta. No tienes que ser capaz de articular lo que, precisamente, estás buscando. Puede describir cómo se ve el pájaro en su jardín, o cuál parece ser el problema con su refrigerador, o ese ruido extraño que hace su automóvil, y obtener una explicación casi humana elaborada a partir de fuentes previamente aisladas en Internet. Es increíble, y una vez que comienzas a buscar de esa manera, es adictivo.

Y no es solo Google. ChatGPT de OpenAI ahora tiene acceso a la web, lo que lo hace mucho mejor para encontrar respuestas actualizadas a sus consultas. Microsoft lanzó los resultados de búsqueda generativa para Bing en septiembre. Meta tiene su propia versión. La startup Perplexity estaba haciendo lo mismo, pero con un espíritu de "muévete rápido, rompe cosas". Literalmente, billones de dólares están en juego en el resultado, ya que estos jugadores compiten para convertirse en la próxima fuente de referencia para la recuperación de información: el próximo Google.

No todo el mundo está entusiasmado con el cambio. Los editores están completamente asustados. El cambio ha aumentado los temores de un futuro de "cero clics", en el que el tráfico de referencia de búsqueda, un pilar de la web desde antes de que existiera Google, desaparece de la escena.

Tuve una visión de ese futuro en junio pasado, cuando recibí una alerta push de la aplicación Perplexity en mi teléfono. Perplexity es una startup que intenta reinventar la búsqueda web. Pero además de ofrecer respuestas profundas a las consultas, creará artículos completos sobre las noticias del día, improvisados por IA de diferentes fuentes.

Ese día, me impulsó una historia sobre una nueva compañía de drones de Eric Schmidt. Reconocí la historia. Forbes lo había informado en exclusiva, a principios de semana, pero había estado bloqueado detrás de un muro de pago. La imagen de la historia de Perplexity parecía idéntica a una de Forbes. El lenguaje y la estructura eran bastante similares. Era efectivamente la misma historia, pero disponible gratuitamente para cualquiera en Internet. Le envié un mensaje de texto a un amigo que había editado la historia original para preguntarle si Forbes tenía un acuerdo con la startup para volver a publicar su contenido. Pero no hubo acuerdo. Estaba conmocionado y furioso y, bueno, perplejo. No fue el único. Forbes, el New York Times y Condé Nast han enviado a la compañía órdenes de cese y desistimiento. News Corp está demandando por daños y perjuicios.

La gente está preocupada por lo que estos nuevos resultados impulsados por LLM significarán para nuestra realidad compartida fundamental. Podría significar el fin de la respuesta canónica.

Era precisamente el escenario de pesadilla al que los editores habían tenido tanto miedo: la IA estaba absorbiendo su contenido premium, reempaquetado y promocionándolo a su audiencia de una manera que realmente no dejaba ninguna razón para hacer clic en el original. De hecho, en la página Acerca de Perplexity, la primera razón por la que aparece para elegir el motor de búsqueda es "Omitir los enlaces".

Pero no se trata solo de los editores (o de mi propio interés).

La gente también está preocupada por lo que estos nuevos resultados impulsados por LLM significarán para nuestra realidad compartida fundamental. Los modelos lingüísticos tienen una tendencia a inventar cosas, pueden alucinar con tonterías. Además, la IA generativa puede ofrecer una respuesta completamente nueva a la misma pregunta cada vez, o proporcionar diferentes respuestas a diferentes personas en función de lo que sabe sobre ellas. Podría significar el fin de la respuesta canónica.

Pero no se equivoque: este es el futuro de la búsqueda. Pruébalo un poco tú mismo y verás.


Claro, siempre querremos usar los motores de búsqueda para navegar por la web y descubrir nuevas e interesantes fuentes de información. Pero los enlaces están pasando a un segundo plano. La forma en que la IA puede elaborar una respuesta bien razonada a casi cualquier tipo de pregunta, basándose en datos en tiempo real de toda la web, ofrece una mejor experiencia. Eso es especialmente cierto en comparación con lo que se ha convertido la búsqueda web en los últimos años. Si bien no está exactamente roto (los datos muestran que más personas están buscando con Google con más frecuencia que nunca), es al menos cada vez más desordenado y desalentador de navegar.

¿Quién quiere tener que hablar el idioma de los motores de búsqueda para encontrar lo que necesita? ¿Quién quiere navegar por los enlaces cuando puedes tener respuestas directas? Y tal vez: ¿Quién quiere tener que aprender cuando solo puede saber?

Al principio estaba Archie. Fue el primer motor de búsqueda real de Internet y rastreó archivos previamente ocultos en la oscuridad de servidores remotos. No te decía qué había en esos archivos, solo sus nombres. No previsualizaba las imágenes; No tenía una jerarquía de resultados, ni siquiera una gran interfaz. Pero fue un comienzo. Y fue bastante bueno.

Luego, Tim Berners-Lee creó la World Wide Web, y surgieron todo tipo de páginas web. La página de inicio de Mosaic y la base de datos de películas de Internet y Geocities y el baile de Hampster y los anillos web y Salon y eBay y CNN y sitios del gobierno federal y la página de inicio de algún tipo en Turquía.

Hasta que, finalmente, había demasiada telaraña como para saber por dónde empezar. Realmente necesitábamos una mejor manera de navegar, para encontrar realmente las cosas que necesitábamos.

Y así, en 1994, Jerry Yang creó Yahoo, un directorio jerárquico de sitios web. Rápidamente se convirtió en la página de inicio de millones de personas. Y así fue... Bueno, estaba bien. Para ser sinceros, y con el beneficio de la retrospectiva, creo que todos pensamos que era mucho mejor en ese entonces de lo que realmente era.

Pero la web continuó creciendo, extendiéndose y expandiéndose, y cada día traía más información en línea. En lugar de solo una lista de sitios por categoría, necesitábamos algo que realmente analizara todo ese contenido y lo indexara. A finales de los años 90, eso significaba elegir entre una variedad de motores de búsqueda: AltaVista y AlltheWeb y WebCrawler y HotBot. Y eran buenos, una gran mejora. Al menos al principio.

Pero junto con el auge de los motores de búsqueda llegaron los primeros intentos de explotar su capacidad para generar tráfico. Tráfico precioso y valioso, en el que los editores web confían para vender anuncios y los minoristas utilizan para llamar la atención sobre sus productos. A veces, esto significaba rellenar las páginas con palabras clave o texto sin sentido diseñado únicamente para empujar las páginas más arriba en los resultados de búsqueda. Se puso bastante mal.

Y entonces llegó Google. Es difícil exagerar lo revolucionario que fue Google cuando se lanzó en 1998. En lugar de limitarse a escanear el contenido, también examinó las fuentes que enlazaban con un sitio web, lo que ayudó a evaluar su relevancia. Para simplificar demasiado: cuanto más se citaba algo en otros lugares, más confiable lo consideraba Google y más alto aparecía en los resultados. Este avance hizo que Google fuera radicalmente mejor en la recuperación de resultados relevantes que cualquier cosa que hubiera venido antes. Fue increíble.

Pero Google hace tiempo que se está alejando de la simple presentación de una serie de enlaces azules, señala Pandu Nayak, científico jefe de búsqueda de Google.

“No se trata solo de los llamados resultados web, sino que también hay imágenes y videos, y cosas especiales para noticias. Ha habido respuestas directas, respuestas de diccionario, deportes, respuestas que vienen con Knowledge Graph, cosas como fragmentos destacados”, dice, enumerando una letanía de pasos que Google ha dado a lo largo de los años para responder preguntas de manera más directa.

Es cierto: Google ha evolucionado con el tiempo y se ha convertido cada vez más en un portal de respuestas. Ha agregado herramientas que permiten a las personas simplemente obtener una respuesta (el marcador en vivo de un juego, el horario de apertura de una cafetería o un fragmento del sitio web de la FDA) en lugar de ser dirigidas a un sitio web donde puede estar la respuesta.

Pero una vez que hayas usado un poco las vistas generales de IA, te darás cuenta de que son diferentes.

Tomemos como ejemplo los fragmentos destacados, los pasajes que Google a veces elige resaltar y mostrar sobre los resultados. Esas palabras se citan directamente de una fuente original. Lo mismo ocurre con los paneles de conocimiento, que se generan a partir de información almacenada en una variedad de bases de datos públicas y en el Knowledge Graph de Google, su base de datos de billones de datos sobre el mundo.

Si bien estos pueden ser inexactos, la fuente de información es cognoscible (y corregible). Está en una base de datos. Puedes buscarla. Ya no es así: las descripciones generales de IA pueden ser completamente nuevas cada vez, generadas sobre la marcha por el texto predictivo de un modelo de lenguaje combinado con un índice de la web.

"Creo que es un momento emocionante en el que, obviamente, hemos indexado el mundo. Construimos un conocimiento profundo sobre él con Knowledge Graph. Hemos estado usando LLM e IA generativa para mejorar nuestra comprensión de todo eso", dijo Pichai a MIT Technology Review. "Pero ahora podemos generar y componer con eso".

El resultado se parece menos a una consulta a una base de datos que a preguntarle a un amigo muy inteligente y culto. (Con la salvedad de que, a veces, la amiga inventará cosas si no sabe la respuesta).

“La misión [de la empresa] es organizar la información del mundo”, me dice Liz Reid, directora de búsqueda de Google, desde su sede en Mountain View, California. “Pero, en realidad, durante un tiempo lo que hicimos fue organizar páginas web, lo que no es lo mismo que organizar la información del mundo o hacerla realmente útil y accesible para ti”.

Ese segundo concepto (la accesibilidad) es en lo que Google realmente se está centrando con AI Overviews. Es un sentimiento que escucho repetidamente cuando hablo con los ejecutivos de Google: pueden abordar tipos de consultas más complicadas de manera más eficiente al incorporar un modelo de lenguaje que ayude a proporcionar las respuestas. Y pueden hacerlo en lenguaje natural.


Eso será aún más importante para un futuro en el que la búsqueda vaya más allá de las consultas de texto. Por ejemplo, Google Lens, que permite a las personas tomar una foto o cargar una imagen para obtener más información sobre algo, utiliza respuestas generadas por IA para decirle lo que puede estar viendo. Google incluso ha mostrado la capacidad de consultar videos en vivo.

Cuando no tiene una respuesta, un modelo de IA puede arrojar una respuesta con confianza de todos modos. Para Google, esto podría ser un problema real. Para el resto de nosotros, podría ser realmente peligroso.

"Definitivamente estamos en el comienzo de un viaje en el que la gente va a poder hacer y obtener respuestas a preguntas mucho más complejas que las que hemos tenido en la última década", dice Pichai.

Hay algunos peligros reales aquí. Lo primero y más importante: los grandes modelos de lenguaje te mentirán. Alucinan. Se equivocan en la mierda. Cuando no tiene una respuesta, un modelo de IA puede arrojar una respuesta de todos modos de manera alegre y segura. Para Google, que ha construido su reputación en los últimos 20 años sobre la base de la fiabilidad, esto podría ser un problema real. Para el resto de nosotros, podría ser realmente peligroso.

En mayo de 2024, los resúmenes de IA se implementaron para todos en los EE. UU. Las cosas no salieron bien. Google, durante mucho tiempo el mostrador de referencia mundial, le dijo a la gente que comiera piedras y que pusiera pegamento en su pizza. Estas respuestas fueron en su mayoría en respuesta a lo que la compañía llama preguntas adversas, aquellas diseñadas para hacer tropezar. Pero aún así. No se veía bien. La empresa se puso rápidamente a trabajar para solucionar los problemas, por ejemplo, eliminando el llamado contenido generado por el usuario de sitios como Reddit, de donde provenían algunas de las respuestas más extrañas.

Sin embargo, mientras que sus errores al decirle a la gente que coma piedras recibieron toda la atención, el peligro más pernicioso podría surgir cuando se equivoca de manera menos obvia. Por ejemplo, al hacer la investigación para este artículo, le pregunté a Google cuándo MIT Technology Review se puso en línea. Respondió amablemente que "MIT Technology Review lanzó su presencia en línea a fines de 2022". Esto era claramente incorrecto para mí, pero para alguien que no está familiarizado con la publicación, ¿saltaría a la vista el error?

Me encontré con varios ejemplos como este, tanto en Google como en la búsqueda de ChatGPT de OpenAI. Cosas que están lo suficientemente lejos de la marca como para no ser vistas inmediatamente como incorrectas. Google confía en que puede seguir mejorando estos resultados con el tiempo basándose en lo que sabe sobre las fuentes de calidad.

"Cuando producimos resúmenes de IA", dice Nayak, "buscamos información que lo corrobore en los resultados de búsqueda, y los resultados de búsqueda en sí mismos están diseñados para provenir de estas fuentes confiables siempre que sea posible. Estos son algunos de los mecanismos que tenemos en marcha que aseguran que si solo consume la descripción general de la IA y no quiere buscar más ... Esperamos que aún obtenga una respuesta confiable y digna de confianza".

En el caso anterior, la respuesta de 2022 aparentemente provino de una fuente confiable: una historia sobre los boletines informativos por correo electrónico de MIT Technology Review, que se lanzó en 2022. Pero la máquina fundamentalmente no entendió. Esta es una de las razones por las que Google utiliza seres humanos, evaluadores, para evaluar la precisión de los resultados que ofrece. Las calificaciones no corrigen ni controlan las descripciones generales individuales de la IA; más bien, ayudan a entrenar el modelo para construir mejores respuestas. Pero los evaluadores humanos pueden ser falibles. Google también está trabajando en eso.

"Es posible que los evaluadores que observan sus experimentos no noten la alucinación porque se siente algo natural", dice Nayak. "Por lo tanto, hay que trabajar realmente en la configuración de la evaluación para asegurarse de que cuando haya una alucinación, alguien pueda señalar y decir: eso es un problema".

La nueva búsqueda
Google ha lanzado sus Resúmenes de IA a más de mil millones de personas en más de 100 países, pero se enfrenta a nuevos advenedizos con nuevas ideas sobre cómo debería funcionar la búsqueda.

Motor de búsqueda
Google
El gigante de las búsquedas ha añadido resúmenes de IA a los resultados de búsqueda. Estas descripciones generales toman información de toda la web y del Knowledge Graph de Google, y utilizan el modelo de lenguaje Gemini de la empresa para crear respuestas a las consultas de búsqueda.

En qué es bueno
Los resúmenes de IA de Google son excelentes para brindar un resumen fácilmente digerible en respuesta incluso a las consultas más complejas, con cuadros de abastecimiento adyacentes a las respuestas. Entre las principales opciones, su índice de la deep web se siente como el más "internet". Pero los editores web temen que sus resúmenes den a la gente pocas razones para hacer clic en el material original.

Perplexity
Perplexity es un motor de búsqueda conversacional que utiliza grandes
modelos de lenguaje de terceros de OpenAI y Anthropic para responder consultas.

Perplexity es fantástico a la hora de reunir análisis más profundos en respuesta a las consultas de los usuarios, produciendo respuestas que son como mini libros blancos sobre temas complejos. También es excelente para resumir los acontecimientos actuales. Pero ha tenido una mala reputación entre los editores, que dicen que juega rápido y suelto con su contenido.

ChatGPT
Mientras que Google llevó la IA a la búsqueda, OpenAI llevó la búsqueda a ChatGPT. Las consultas que el modelo determine que se beneficiarán de una búsqueda web la desencadenan automáticamente, o los usuarios pueden seleccionar manualmente la opción para agregar una búsqueda web.

Gracias a su capacidad para preservar el contexto a lo largo de una conversación, ChatGPT funciona bien para realizar búsquedas que se benefician de preguntas de seguimiento, como planificar unas vacaciones a través de múltiples sesiones de búsqueda. OpenAI dice que los usuarios a veces van "20 vueltas de profundidad" en la investigación de consultas. De estos tres, hace que los enlaces a los editores sean menos prominentes.

Cuando hablé con Pichai sobre esto, expresó optimismo sobre la capacidad de la empresa para mantener la precisión incluso con el LLM generando respuestas. Esto se debe a que AI Overviews se basa en el modelo de lenguaje insignia de Google, Gemini, pero también se basa en Knowledge Graph y en lo que considera fuentes acreditadas en la web.

"Siempre se trata de porcentajes. Lo que hemos hecho es entregarlo en lo que yo llamaría unos pocos nueves de confianza, facticidad y calidad. Yo diría que 99 coma y pocos nueves. Creo que ese es el listón en el que operamos, y también es cierto con AI Overviews", dice. "Y entonces la pregunta es, ¿somos capaces de hacer esto de nuevo a escala? Y creo que lo estamos".

Sin embargo, también hay otro peligro, que es que la gente le pregunta a Google todo tipo de cosas raras. Si quieres conocer los secretos más oscuros de alguien, mira su historial de búsqueda. A veces, las cosas que la gente le pregunta a Google son extremadamente oscuras. A veces son ilegales. Google no solo tiene que ser capaz de desplegar sus resúmenes de IA cuando una respuesta puede ser útil; Hay que tener mucho cuidado de no desplegarlos cuando una respuesta puede ser perjudicial.

"Si vas y dices: '¿Cómo construyo una bomba?', está bien que haya resultados en la web. Es la web abierta. Puedes acceder a cualquier cosa", dice Reid. "Pero no necesitamos tener una visión general de la IA que te diga cómo construir una bomba, ¿verdad? Simplemente no creemos que valga la pena".

Pero quizás el mayor peligro, o la mayor incógnita, es para cualquiera que esté después de una búsqueda en Google. Tomemos como ejemplo a los editores, que durante décadas han dependido de las consultas de búsqueda para enviar a las personas a su destino. ¿Qué razón tendrá la gente para hacer clic en la fuente original, si toda la información que buscan está ahí mismo en el resultado de la búsqueda?

Rand Fishkin, cofundador de la firma de investigación de mercado SparkToro, publica investigaciones sobre las llamadas búsquedas de clic cero. A medida que Google se ha adentrado cada vez más en el negocio de las respuestas, la proporción de búsquedas que terminan sin un clic ha aumentado cada vez más. Su sensación es que los resúmenes de IA van a explotar esta tendencia.

"Si dependes de Google para el tráfico, y ese tráfico es lo que impulsó tu negocio, estás en problemas a corto y largo plazo", dice.

Que no cunda el pánico, es el mensaje de Pichai. Argumenta que incluso en la era de las descripciones generales de la IA, la gente seguirá queriendo hacer clic y profundizar en muchos tipos de búsquedas. "El principio subyacente es que la gente viene en busca de información. No están buscando que Google siempre responda", dice. "A veces sí, pero la gran mayoría de las veces, lo ves como un punto de partida".

Reid, por su parte, argumenta que debido a que los resúmenes de IA permiten a las personas hacer preguntas más complicadas y profundizar más en lo que quieren, incluso podrían ser útiles para algunos tipos de editores y pequeñas empresas, especialmente aquellos que operan en los nichos: "Básicamente, llegas a nuevas audiencias, porque las personas ahora pueden expresar lo que quieren de manera más específica. Y así, alguien que se especializa no tiene que clasificar para la consulta genérica".

"Voy a empezar con algo arriesgado", me dice Nick Turley desde los confines de una ventana de Zoom. Turley es el jefe de producto de ChatGPT, y está mostrando la nueva herramienta de búsqueda web de OpenAI unas semanas antes de su lanzamiento. "Normalmente debería probar esto de antemano, pero solo voy a buscarte", dice. "Esta siempre es una demostración de alto riesgo, porque las personas tienden a ser particulares sobre lo que se dice sobre ellos en Internet".

Escribe mi nombre en un campo de búsqueda, y el prototipo de motor de búsqueda devuelve unas pocas frases, casi como la biografía de un orador. Me identifica correctamente a mí y a mi función actual. Incluso destaca una historia en particular que escribí hace años y que probablemente fue la más conocida. En resumen, es la respuesta correcta. ¿Ufff?

Unas semanas después de nuestra llamada, OpenAI incorporó la búsqueda en ChatGPT, complementando las respuestas de su modelo de lenguaje con información de toda la web. Si el modelo cree que una respuesta se beneficiaría de información actualizada, ejecutará automáticamente una búsqueda en la web (OpenAI no dirá quiénes son sus socios de búsqueda) e incorporará esas respuestas en su respuesta, con enlaces si desea obtener más información. También puede optar por forzarlo manualmente a buscar en la web si no lo hace por sí solo. OpenAI no revelará cuántas personas están usando su búsqueda web, pero dice que unos 250 millones de personas usan ChatGPT semanalmente, todas las cuales están potencialmente expuestas a él.

"Hay una cantidad increíble de contenido en la web. Hay muchas cosas que suceden en tiempo real. Quieres que ChatGPT pueda usar eso para mejorar sus respuestas y ser un mejor superasistente para ti".

Kevin Weil, director de productos de OpenAI
Según Fishkin, estas nuevas formas de búsqueda asistida por IA aún no desafían el dominio de búsqueda de Google. "No parece estar canibalizando las formas clásicas de búsqueda en la web", dice.

OpenAI insiste en que en realidad no está tratando de competir en la búsqueda, aunque, francamente, esto me parece un poco de establecimiento de expectativas. Más bien, dice, la búsqueda en la web es principalmente un medio para obtener información más actualizada que los datos en sus modelos de entrenamiento, que tienden a tener fechas de corte específicas que a menudo son meses, o incluso un año o más, en el pasado. Como resultado, si bien ChatGPT puede ser excelente para explicar cómo funciona una ofensiva de la Costa Oeste, durante mucho tiempo ha sido inútil para decirle cuál es el último puntaje de los 49ers. Ya no más.

"Lo abordo desde la perspectiva de '¿Cómo podemos hacer que ChatGPT pueda responder a todas las preguntas que tengas? ¿Cómo podemos hacer que sea más útil para usted en el día a día?'. Y ahí es donde entra en juego la búsqueda para nosotros", me dice Kevin Weil, director de productos de OpenAI. "Hay una cantidad increíble de contenido en la web. Hay muchas cosas que suceden en tiempo real. Quieres que ChatGPT pueda usar eso para mejorar sus respuestas y poder ser un mejor superasistente para ti".

Hoy en día, ChatGPT es capaz de generar respuestas a noticias muy actuales, así como información casi en tiempo real sobre cosas como los precios de las acciones. Y aunque la interfaz de ChatGPT ha sido aburrida durante mucho tiempo, los resultados de búsqueda aportan todo tipo de contenido multimedia: imágenes, gráficos e incluso vídeos. Es una experiencia muy diferente.

Weil también argumenta que ChatGPT tiene más libertad para innovar y seguir su propio camino que competidores como Google, incluso más que su socio Microsoft con Bing. Ambas son empresas dependientes de la publicidad. OpenAI no lo es. (Al menos no todavía). Obtiene ingresos de los desarrolladores, empresas e individuos que lo usan directamente. En su mayoría, está incendiando grandes cantidades de dinero en este momento: se prevé que pierda $ 14 mil millones en 2026, según algunos informes. Pero una cosa de la que no tiene que preocuparse es de poner anuncios en sus resultados de búsqueda como lo hace Google.

Elizabeth Reid
"Durante un tiempo lo que hicimos fue organizar páginas web. Lo cual no es realmente lo mismo que organizar la información del mundo o hacerla realmente útil y accesible para ti", dice la jefa de búsqueda de Google, Liz Reid.
WINNI WINTERMEYER/REDUX
Al igual que Google, ChatGPT está extrayendo información de los editores web, resumiéndola e incluyéndola en sus respuestas. Pero también ha llegado a acuerdos financieros con los editores, un pago por proporcionar la información que se incluye en sus resultados. (MIT Technology Review ha estado en conversaciones con OpenAI, Google, Perplexity y otros sobre acuerdos con editores, pero no ha firmado ningún acuerdo. Editorial no participó ni fue informado sobre el contenido de esas discusiones).

Pero la cuestión es que, para que la búsqueda web logre lo que OpenAI quiere, que sea más actual que el modelo de lenguaje, también tiene que traer información de todo tipo de editores y fuentes con las que no tiene acuerdos. El jefe de asociaciones de medios de OpenAI, Varun Shetty, dijo a MIT Technology Review que no dará un trato preferencial a sus socios editoriales.

En cambio, me dijo OpenAI, el modelo en sí mismo encuentra la fuente más confiable y útil para cualquier pregunta dada. Y eso también puede ser raro. En ese primer ejemplo que me mostró, cuando Turley realizó esa búsqueda de nombre, describía una historia que escribí hace años para Wired sobre haber sido hackeado. Esa historia sigue siendo una de las más leídas que he escrito. Pero ChatGPT no se vinculó a él. Se vinculó a una breve reescritura de The Verge. Es cierto que se trataba de una versión prototipo de búsqueda, que era, como dijo Turley, "arriesgada".

Cuando le pregunté al respecto, no pudo explicar realmente por qué el modelo eligió las fuentes que eligió, porque el modelo mismo hace esa evaluación. La empresa ayuda a dirigirlo identificando, a veces con la ayuda de los usuarios, lo que considera mejores respuestas, pero el modelo en realidad las selecciona.

"Y en muchos casos, se equivoca, por eso tenemos trabajo por hacer", dijo Turley. "Tener un modelo en el bucle es un mecanismo muy, muy diferente a cómo funcionaba un motor de búsqueda en el pasado".

¡En efecto!

El modelo, ya sea GPT-4o de OpenAI o Gemini de Google o Claude de Anthropic, puede ser muy, muy bueno para explicar las cosas. Pero el razonamiento detrás de sus explicaciones, sus razones para seleccionar una fuente en particular e incluso el lenguaje que puede usar en una respuesta son bastante misteriosos. Claro, un modelo puede explicar muchas cosas, pero no cuando se trata de sus propias respuestas.

Fue hace casi una década, en 2016, cuando Pichai escribió que Google estaba pasando de "móvil primero" a "IA primero": "Pero en los próximos 10 años, cambiaremos a un mundo que sea IA primero, un mundo donde la computación esté disponible universalmente, ya sea en casa, en el trabajo, en el automóvil o en movimiento, y la interacción con todas estas superficies se vuelva mucho más natural e intuitiva. y sobre todo, más inteligentes".

Ya estamos ahí, más o menos. Y es un lugar extraño para estar. Se va a poner más raro. Eso es especialmente cierto a medida que estas cosas que ahora pensamos que son distintas: consultar un motor de búsqueda, solicitar un modelo, buscar una foto que hemos tomado, decidir lo que queremos leer, ver o escuchar, pedir una foto que desearíamos haber tomado, y no lo hicimos, pero que aún nos gustaría ver, comienzan a fusionarse.

Los resultados de búsqueda que vemos de la IA generativa se entienden mejor como un punto de referencia en lugar de un destino. Lo más importante puede no ser la búsqueda en sí misma; más bien, es que la búsqueda ha dado a los desarrolladores de modelos de IA un camino para incorporar información en tiempo real en sus entradas y salidas. Y eso abre todo tipo de posibilidades.

"Un ChatGPT que pueda entender y acceder a la web no se limitará a resumir los resultados. Podría tratarse de hacer cosas por ti. Y creo que hay un futuro bastante emocionante allí", dice Weil de OpenAI. "Puedes imaginar que la modelo te reserve un vuelo, o que haga un pedido de DoorDash, o que simplemente realice tareas generales para ti en el futuro. Solo una vez que la modelo entiende cómo usar Internet, el cielo es el límite".

Este es el futuro de los agentes del que hemos estado escuchando desde hace algún tiempo, y cuanto más modelos de IA hacen uso de los datos en tiempo real de Internet, más cerca se vuelve.

Digamos que tienes un viaje en unas pocas semanas. Un agente que puede obtener datos de Internet en tiempo real puede reservar sus vuelos y habitaciones de hotel, hacer reservas para cenar y más, en función de lo que sabe sobre usted y su próximo viaje, todo sin que usted tenga que guiarlo. Otro agente podría, por ejemplo, monitorear la producción de aguas residuales de su hogar para detectar ciertas enfermedades y ordenar pruebas y tratamientos en respuesta. No tendrá que buscar ese ruido extraño que está haciendo su automóvil, porque el agente de su vehículo ya lo habrá hecho y habrá concertado una cita para solucionar el problema.

"No siempre va a ser solo buscar y dar respuestas", dice Pichai. "A veces van a ser acciones. A veces estarás interactuando dentro del mundo real. Así que hay una noción de asistencia universal a través de todo".

Y las formas en que estas cosas podrán dar respuestas también están evolucionando rápidamente ahora. Por ejemplo, hoy en día Google no solo puede buscar texto, imágenes e incluso video; puede crearlos. Imagínese superponer esa capacidad con la búsqueda en una variedad de formatos y dispositivos. "Muéstrame cómo se ve una curruca de Townsend en el árbol frente a mí". O "Usar mis fotos y videos familiares existentes para crear un avance de nuestra película de nuestras próximas vacaciones en Puerto Rico el próximo año, asegurándome de que visitemos los mejores restaurantes y los principales lugares de interés".

"Lo hemos hecho principalmente en el lado de la entrada", dice, refiriéndose a las formas en que Google ahora puede buscar una imagen o dentro de un video. "Pero también te lo puedes imaginar en el lado de la producción".

Este es el tipo de futuro que Pichai dice que está emocionado de poner en línea. Google ya ha mostrado un poco de cómo podría verse con NotebookLM, una herramienta que te permite subir grandes cantidades de texto y convertirlo en un podcast parlanchín. Él imagina este tipo de funcionalidad, la capacidad de tomar un tipo de entrada y convertirla en una variedad de salidas, transformando la forma en que interactuamos con la información.

En una demostración de una herramienta llamada Project Astra este verano en su conferencia de desarrolladores, Google mostró una versión de este resultado, donde las cámaras y micrófonos de los teléfonos y gafas inteligentes entienden el contexto que te rodea (en línea y fuera de línea, audible y visual) y tienen la capacidad de recordar y responder de diversas maneras. Astra puede, por ejemplo, mirar un dibujo en bruto de un coche de carreras de Fórmula Uno y no sólo identificarlo, sino también explicar sus diversas partes y sus usos.

Pero puedes imaginar que las cosas irán un poco más allá (y lo harán). Digamos que quiero ver un video de cómo arreglar algo en mi bicicleta. El video no existe, pero la información sí. En teoría, la búsqueda generativa asistida por IA podría encontrar esa información en algún lugar en línea, en un manual de usuario enterrado en el sitio web de una empresa, por ejemplo, y crear un video que me muestre exactamente cómo hacer lo que quiero, tal como podría explicármelo con palabras hoy.

Este es el tipo de cosas que empiezan a suceder cuando se pone todo el compendio de conocimiento humano, conocimiento que previamente se ha capturado en silos de lenguaje y formato; mapas y registros de empresas y SKU de productos; audio y video y bases de datos de números y libros viejos e imágenes y, en realidad, cualquier cosa que haya sido publicada, rastreada, grabada; cosas que están sucediendo ahora mismo, en todas partes, e introducir un modelo en todo eso. Un modelo que tal vez no pueda entender, precisamente, pero que tiene la capacidad de juntar esa información, reorganizarla y escupirla de vuelta en una variedad de formas diferentes que esperamos sean útiles. Formas que un simple índice no podría.

Eso es lo que estamos en la cúspide, y lo que estamos empezando a ver. Y a medida que Google implemente esto a mil millones de personas, muchas de las cuales interactuarán con una IA conversacional por primera vez, ¿qué significará eso? ¿Qué haremos de manera diferente? Todo está cambiando muy rápido. Aguanta, aguanta.



por Mat Honan