La IA significa el fin de las búsquedas en
Internet tal y como las hemos conocido
A pesar de la
disminución de los clics, las luchas por los derechos de autor y, a
veces, las respuestas dudosas, la IA podría desbloquear nuevas
formas de convocar todo el conocimiento del mundo.
Por Mat Honan MIT Technology Review
6 de enero de 2025
Traducido del inglés con ia.
Todos sabemos lo que significa, coloquialmente, buscar algo en
Google. Coloca algunas palabras relevantes en un cuadro de búsqueda
y, a cambio, obtiene una lista de enlaces azules a los resultados
más relevantes. Tal vez algunas explicaciones rápidas en la parte
superior. Tal vez algunos mapas o resultados deportivos o un video.
Pero fundamentalmente, se trata de obtener información que ya está
en Internet y mostrártela, de alguna manera estructurada.
Pero todo eso está en juego. Estamos en un nuevo punto de inflexión.
El mayor cambio en la forma en que los motores de búsqueda nos han
entregado información desde la década de 1990 está ocurriendo ahora
mismo. Se acabó la búsqueda de palabras clave. Ya no tendrás que
clasificar los enlaces para hacer clic. En cambio, estamos entrando
en una era de búsqueda conversacional. Lo que significa que en lugar
de palabras clave, utilizas preguntas reales, expresadas en lenguaje
natural. Y en lugar de enlaces, cada vez encontrarás más respuestas,
escritas por IA generativa y basadas en información en vivo de todo
Internet, entregadas de la misma manera.
Por supuesto, Google, la compañía que ha definido la búsqueda
durante los últimos 25 años, está tratando de estar al frente en
esto. En mayo de 2023, comenzó a probar las respuestas generadas por
IA a las consultas de búsqueda, utilizando su modelo de lenguaje
grande (LLM) para ofrecer el tipo de respuestas que se podrían
esperar de una fuente experta o de un amigo de confianza. A esto se
le llama AI Overviews. El CEO de Google, Sundar Pichai, describió
esto a MIT Technology Review como "uno de los cambios más positivos
que hemos hecho para la búsqueda en mucho, mucho tiempo".
Los resúmenes de IA cambian fundamentalmente los tipos de consultas
que Google puede abordar. Ahora puedes preguntarle cosas como "Voy a
ir a Japón por una semana el próximo mes. Me quedaré en Tokio, pero
me gustaría hacer algunas excursiones de un día. ¿Hay algún festival
en las cercanías? ¿Cómo será el surf en Kamakura? ¿Hay alguna banda
buena que toque?" Y obtendrás una respuesta, no solo un enlace a
Reddit, sino una respuesta construida con resultados actuales.
Más concretamente, puede intentar búsquedas que antes eran
prácticamente imposibles y obtener la respuesta correcta. No tienes
que ser capaz de articular lo que, precisamente, estás buscando.
Puede describir cómo se ve el pájaro en su jardín, o cuál parece ser
el problema con su refrigerador, o ese ruido extraño que hace su
automóvil, y obtener una explicación casi humana elaborada a partir
de fuentes previamente aisladas en Internet. Es increíble, y una vez
que comienzas a buscar de esa manera, es adictivo.
Y no es solo Google. ChatGPT de OpenAI ahora tiene acceso a la web,
lo que lo hace mucho mejor para encontrar respuestas actualizadas a
sus consultas. Microsoft lanzó los resultados de búsqueda generativa
para Bing en septiembre. Meta tiene su propia versión. La startup
Perplexity estaba haciendo lo mismo, pero con un espíritu de "muévete
rápido, rompe cosas". Literalmente, billones de dólares están en
juego en el resultado, ya que estos jugadores compiten para
convertirse en la próxima fuente de referencia para la recuperación
de información: el próximo Google.
No todo el mundo está entusiasmado con el cambio. Los editores están
completamente asustados. El cambio ha aumentado los temores de un
futuro de "cero clics", en el que el tráfico de referencia de
búsqueda, un pilar de la web desde antes de que existiera Google,
desaparece de la escena.
Tuve una visión de ese futuro en junio pasado, cuando recibí una
alerta push de la aplicación Perplexity en mi teléfono. Perplexity
es una startup que intenta reinventar la búsqueda web. Pero además
de ofrecer respuestas profundas a las consultas, creará artículos
completos sobre las noticias del día, improvisados por IA de
diferentes fuentes.
Ese día, me impulsó una historia sobre una nueva compañía de drones
de Eric Schmidt. Reconocí la historia. Forbes lo había informado en
exclusiva, a principios de semana, pero había estado bloqueado
detrás de un muro de pago. La imagen de la historia de Perplexity
parecía idéntica a una de Forbes. El lenguaje y la estructura eran
bastante similares. Era efectivamente la misma historia, pero
disponible gratuitamente para cualquiera en Internet. Le envié un
mensaje de texto a un amigo que había editado la historia original
para preguntarle si Forbes tenía un acuerdo con la startup para
volver a publicar su contenido. Pero no hubo acuerdo. Estaba
conmocionado y furioso y, bueno, perplejo. No fue el único. Forbes,
el New York Times y Condé Nast han enviado a la compañía órdenes de
cese y desistimiento. News Corp está demandando por daños y
perjuicios.
La gente está preocupada por lo que estos nuevos resultados
impulsados por LLM significarán para nuestra realidad compartida
fundamental. Podría significar el fin de la respuesta canónica.
Era precisamente el escenario de pesadilla al que los editores
habían tenido tanto miedo: la IA estaba absorbiendo su contenido
premium, reempaquetado y promocionándolo a su audiencia de una
manera que realmente no dejaba ninguna razón para hacer clic en el
original. De hecho, en la página Acerca de Perplexity, la primera
razón por la que aparece para elegir el motor de búsqueda es "Omitir
los enlaces".
Pero no se trata solo de los editores (o de mi propio interés).
La gente también está preocupada por lo que estos nuevos resultados
impulsados por LLM significarán para nuestra realidad compartida
fundamental. Los modelos lingüísticos tienen una tendencia a
inventar cosas, pueden alucinar con tonterías. Además, la IA
generativa puede ofrecer una respuesta completamente nueva a la
misma pregunta cada vez, o proporcionar diferentes respuestas a
diferentes personas en función de lo que sabe sobre ellas. Podría
significar el fin de la respuesta canónica.
Pero no se equivoque: este es el futuro de la búsqueda. Pruébalo un
poco tú mismo y verás.
Claro, siempre querremos usar los motores de búsqueda para navegar
por la web y descubrir nuevas e interesantes fuentes de información.
Pero los enlaces están pasando a un segundo plano. La forma en que
la IA puede elaborar una respuesta bien razonada a casi cualquier
tipo de pregunta, basándose en datos en tiempo real de toda la web,
ofrece una mejor experiencia. Eso es especialmente cierto en
comparación con lo que se ha convertido la búsqueda web en los
últimos años. Si bien no está exactamente roto (los datos muestran
que más personas están buscando con Google con más frecuencia que
nunca), es al menos cada vez más desordenado y desalentador de
navegar.
¿Quién quiere tener que hablar el idioma de los motores de búsqueda
para encontrar lo que necesita? ¿Quién quiere navegar por los
enlaces cuando puedes tener respuestas directas? Y tal vez: ¿Quién
quiere tener que aprender cuando solo puede saber?
Al principio estaba Archie. Fue el primer motor de búsqueda real de
Internet y rastreó archivos previamente ocultos en la oscuridad de
servidores remotos. No te decía qué había en esos archivos, solo sus
nombres. No previsualizaba las imágenes; No tenía una jerarquía de
resultados, ni siquiera una gran interfaz. Pero fue un comienzo. Y
fue bastante bueno.
Luego, Tim Berners-Lee creó la World Wide Web, y surgieron todo tipo
de páginas web. La página de inicio de Mosaic y la base de datos de
películas de Internet y Geocities y el baile de Hampster y los
anillos web y Salon y eBay y CNN y sitios del gobierno federal y la
página de inicio de algún tipo en Turquía.
Hasta que, finalmente, había demasiada telaraña como para saber por
dónde empezar. Realmente necesitábamos una mejor manera de navegar,
para encontrar realmente las cosas que necesitábamos.
Y así, en 1994, Jerry Yang creó Yahoo, un directorio jerárquico de
sitios web. Rápidamente se convirtió en la página de inicio de
millones de personas. Y así fue... Bueno, estaba bien. Para ser
sinceros, y con el beneficio de la retrospectiva, creo que todos
pensamos que era mucho mejor en ese entonces de lo que realmente
era.
Pero la web continuó creciendo, extendiéndose y expandiéndose, y
cada día traía más información en línea. En lugar de solo una lista
de sitios por categoría, necesitábamos algo que realmente analizara
todo ese contenido y lo indexara. A finales de los años 90, eso
significaba elegir entre una variedad de motores de búsqueda:
AltaVista y AlltheWeb y WebCrawler y HotBot. Y eran buenos, una gran
mejora. Al menos al principio.
Pero junto con el auge de los motores de búsqueda llegaron los
primeros intentos de explotar su capacidad para generar tráfico.
Tráfico precioso y valioso, en el que los editores web confían para
vender anuncios y los minoristas utilizan para llamar la atención
sobre sus productos. A veces, esto significaba rellenar las páginas
con palabras clave o texto sin sentido diseñado únicamente para
empujar las páginas más arriba en los resultados de búsqueda. Se
puso bastante mal.
Y entonces llegó Google. Es difícil exagerar lo revolucionario que
fue Google cuando se lanzó en 1998. En lugar de limitarse a escanear
el contenido, también examinó las fuentes que enlazaban con un sitio
web, lo que ayudó a evaluar su relevancia. Para simplificar
demasiado: cuanto más se citaba algo en otros lugares, más confiable
lo consideraba Google y más alto aparecía en los resultados. Este
avance hizo que Google fuera radicalmente mejor en la recuperación
de resultados relevantes que cualquier cosa que hubiera venido
antes. Fue increíble.
Pero Google hace tiempo que se está alejando de la simple
presentación de una serie de enlaces azules, señala Pandu Nayak,
científico jefe de búsqueda de Google.
“No se trata solo de los llamados resultados web, sino que también
hay imágenes y videos, y cosas especiales para noticias. Ha habido
respuestas directas, respuestas de diccionario, deportes, respuestas
que vienen con Knowledge Graph, cosas como fragmentos destacados”,
dice, enumerando una letanía de pasos que Google ha dado a lo largo
de los años para responder preguntas de manera más directa.
Es cierto: Google ha evolucionado con el tiempo y se ha convertido
cada vez más en un portal de respuestas. Ha agregado herramientas
que permiten a las personas simplemente obtener una respuesta (el
marcador en vivo de un juego, el horario de apertura de una
cafetería o un fragmento del sitio web de la FDA) en lugar de ser
dirigidas a un sitio web donde puede estar la respuesta.
Pero una vez que hayas usado un poco las vistas generales de IA, te
darás cuenta de que son diferentes.
Tomemos como ejemplo los fragmentos destacados, los pasajes que
Google a veces elige resaltar y mostrar sobre los resultados. Esas
palabras se citan directamente de una fuente original. Lo mismo
ocurre con los paneles de conocimiento, que se generan a partir de
información almacenada en una variedad de bases de datos públicas y
en el Knowledge Graph de Google, su base de datos de billones de
datos sobre el mundo.
Si bien estos pueden ser inexactos, la fuente de información es
cognoscible (y corregible). Está en una base de datos. Puedes
buscarla. Ya no es así: las descripciones generales de IA pueden ser
completamente nuevas cada vez, generadas sobre la marcha por el
texto predictivo de un modelo de lenguaje combinado con un índice de
la web.
"Creo que es un momento emocionante en el que, obviamente, hemos
indexado el mundo. Construimos un conocimiento profundo sobre él con
Knowledge Graph. Hemos estado usando LLM e IA generativa para
mejorar nuestra comprensión de todo eso", dijo Pichai a MIT
Technology Review. "Pero ahora podemos generar y componer con eso".
El resultado se parece menos a una consulta a una base de datos que
a preguntarle a un amigo muy inteligente y culto. (Con la salvedad
de que, a veces, la amiga inventará cosas si no sabe la respuesta).
“La misión [de la empresa] es organizar la información del mundo”,
me dice Liz Reid, directora de búsqueda de Google, desde su sede en
Mountain View, California. “Pero, en realidad, durante un tiempo lo
que hicimos fue organizar páginas web, lo que no es lo mismo que
organizar la información del mundo o hacerla realmente útil y
accesible para ti”.
Ese segundo concepto (la accesibilidad) es en lo que Google
realmente se está centrando con AI Overviews. Es un sentimiento que
escucho repetidamente cuando hablo con los ejecutivos de Google:
pueden abordar tipos de consultas más complicadas de manera más
eficiente al incorporar un modelo de lenguaje que ayude a
proporcionar las respuestas. Y pueden hacerlo en lenguaje natural.
Eso será aún más importante para un futuro en el que la búsqueda
vaya más allá de las consultas de texto. Por ejemplo, Google Lens,
que permite a las personas tomar una foto o cargar una imagen para
obtener más información sobre algo, utiliza respuestas generadas por
IA para decirle lo que puede estar viendo. Google incluso ha
mostrado la capacidad de consultar videos en vivo.
Cuando no tiene una respuesta, un modelo de IA puede arrojar una
respuesta con confianza de todos modos. Para Google, esto podría ser
un problema real. Para el resto de nosotros, podría ser realmente
peligroso.
"Definitivamente estamos en el comienzo de un viaje en el que la
gente va a poder hacer y obtener respuestas a preguntas mucho más
complejas que las que hemos tenido en la última década", dice Pichai.
Hay algunos peligros reales aquí. Lo primero y más importante: los
grandes modelos de lenguaje te mentirán. Alucinan. Se equivocan en
la mierda. Cuando no tiene una respuesta, un modelo de IA puede
arrojar una respuesta de todos modos de manera alegre y segura. Para
Google, que ha construido su reputación en los últimos 20 años sobre
la base de la fiabilidad, esto podría ser un problema real. Para el
resto de nosotros, podría ser realmente peligroso.
En mayo de 2024, los resúmenes de IA se implementaron para todos en
los EE. UU. Las cosas no salieron bien. Google, durante mucho tiempo
el mostrador de referencia mundial, le dijo a la gente que comiera
piedras y que pusiera pegamento en su pizza. Estas respuestas fueron
en su mayoría en respuesta a lo que la compañía llama preguntas
adversas, aquellas diseñadas para hacer tropezar. Pero aún así. No
se veía bien. La empresa se puso rápidamente a trabajar para
solucionar los problemas, por ejemplo, eliminando el llamado
contenido generado por el usuario de sitios como Reddit, de donde
provenían algunas de las respuestas más extrañas.
Sin embargo, mientras que sus errores al decirle a la gente que coma
piedras recibieron toda la atención, el peligro más pernicioso
podría surgir cuando se equivoca de manera menos obvia. Por ejemplo,
al hacer la investigación para este artículo, le pregunté a Google
cuándo MIT Technology Review se puso en línea. Respondió amablemente
que "MIT Technology Review lanzó su presencia en línea a fines de
2022". Esto era claramente incorrecto para mí, pero para alguien que
no está familiarizado con la publicación, ¿saltaría a la vista el
error?
Me encontré con varios ejemplos como este, tanto en Google como en
la búsqueda de ChatGPT de OpenAI. Cosas que están lo suficientemente
lejos de la marca como para no ser vistas inmediatamente como
incorrectas. Google confía en que puede seguir mejorando estos
resultados con el tiempo basándose en lo que sabe sobre las fuentes
de calidad.
"Cuando producimos resúmenes de IA", dice Nayak, "buscamos
información que lo corrobore en los resultados de búsqueda, y los
resultados de búsqueda en sí mismos están diseñados para provenir de
estas fuentes confiables siempre que sea posible. Estos son algunos
de los mecanismos que tenemos en marcha que aseguran que si solo
consume la descripción general de la IA y no quiere buscar más ...
Esperamos que aún obtenga una respuesta confiable y digna de
confianza".
En el caso anterior, la respuesta de 2022 aparentemente provino de
una fuente confiable: una historia sobre los boletines informativos
por correo electrónico de MIT Technology Review, que se lanzó en
2022. Pero la máquina fundamentalmente no entendió. Esta es una de
las razones por las que Google utiliza seres humanos, evaluadores,
para evaluar la precisión de los resultados que ofrece. Las
calificaciones no corrigen ni controlan las descripciones generales
individuales de la IA; más bien, ayudan a entrenar el modelo para
construir mejores respuestas. Pero los evaluadores humanos pueden
ser falibles. Google también está trabajando en eso.
"Es posible que los evaluadores que observan sus experimentos no
noten la alucinación porque se siente algo natural", dice Nayak. "Por
lo tanto, hay que trabajar realmente en la configuración de la
evaluación para asegurarse de que cuando haya una alucinación,
alguien pueda señalar y decir: eso es un problema".
La nueva búsqueda
Google ha lanzado sus Resúmenes de IA a más de mil millones de
personas en más de 100 países, pero se enfrenta a nuevos advenedizos
con nuevas ideas sobre cómo debería funcionar la búsqueda.
Motor de búsqueda
Google
El gigante de las búsquedas ha añadido resúmenes de IA a los
resultados de búsqueda. Estas descripciones generales toman
información de toda la web y del Knowledge Graph de Google, y
utilizan el modelo de lenguaje Gemini de la empresa para crear
respuestas a las consultas de búsqueda.
En qué es bueno
Los resúmenes de IA de Google son excelentes para brindar un resumen
fácilmente digerible en respuesta incluso a las consultas más
complejas, con cuadros de abastecimiento adyacentes a las respuestas.
Entre las principales opciones, su índice de la deep web se siente
como el más "internet". Pero los editores web temen que sus
resúmenes den a la gente pocas razones para hacer clic en el
material original.
Perplexity
Perplexity es un motor de búsqueda conversacional que utiliza
grandes
modelos de lenguaje de terceros de OpenAI y Anthropic para responder
consultas.
Perplexity es fantástico a la hora de reunir análisis más profundos
en respuesta a las consultas de los usuarios, produciendo respuestas
que son como mini libros blancos sobre temas complejos. También es
excelente para resumir los acontecimientos actuales. Pero ha tenido
una mala reputación entre los editores, que dicen que juega rápido y
suelto con su contenido.
ChatGPT
Mientras que Google llevó la IA a la búsqueda, OpenAI llevó la
búsqueda a ChatGPT. Las consultas que el modelo determine que se
beneficiarán de una búsqueda web la desencadenan automáticamente, o
los usuarios pueden seleccionar manualmente la opción para agregar
una búsqueda web.
Gracias a su capacidad para preservar el contexto a lo largo de una
conversación, ChatGPT funciona bien para realizar búsquedas que se
benefician de preguntas de seguimiento, como planificar unas
vacaciones a través de múltiples sesiones de búsqueda. OpenAI dice
que los usuarios a veces van "20 vueltas de profundidad" en la
investigación de consultas. De estos tres, hace que los enlaces a
los editores sean menos prominentes.
Cuando hablé con Pichai sobre esto, expresó optimismo sobre la
capacidad de la empresa para mantener la precisión incluso con el
LLM generando respuestas. Esto se debe a que AI Overviews se basa en
el modelo de lenguaje insignia de Google, Gemini, pero también se
basa en Knowledge Graph y en lo que considera fuentes acreditadas en
la web.
"Siempre se trata de porcentajes. Lo que hemos hecho es entregarlo
en lo que yo llamaría unos pocos nueves de confianza, facticidad y
calidad. Yo diría que 99 coma y pocos nueves. Creo que ese es el
listón en el que operamos, y también es cierto con AI Overviews",
dice. "Y entonces la pregunta es, ¿somos capaces de hacer esto de
nuevo a escala? Y creo que lo estamos".
Sin embargo, también hay otro peligro, que es que la gente le
pregunta a Google todo tipo de cosas raras. Si quieres conocer los
secretos más oscuros de alguien, mira su historial de búsqueda. A
veces, las cosas que la gente le pregunta a Google son
extremadamente oscuras. A veces son ilegales. Google no solo tiene
que ser capaz de desplegar sus resúmenes de IA cuando una respuesta
puede ser útil; Hay que tener mucho cuidado de no desplegarlos
cuando una respuesta puede ser perjudicial.
"Si vas y dices: '¿Cómo construyo una bomba?', está bien que haya
resultados en la web. Es la web abierta. Puedes acceder a cualquier
cosa", dice Reid. "Pero no necesitamos tener una visión general de
la IA que te diga cómo construir una bomba, ¿verdad? Simplemente no
creemos que valga la pena".
Pero quizás el mayor peligro, o la mayor incógnita, es para
cualquiera que esté después de una búsqueda en Google. Tomemos como
ejemplo a los editores, que durante décadas han dependido de las
consultas de búsqueda para enviar a las personas a su destino. ¿Qué
razón tendrá la gente para hacer clic en la fuente original, si toda
la información que buscan está ahí mismo en el resultado de la
búsqueda?
Rand Fishkin, cofundador de la firma de investigación de mercado
SparkToro, publica investigaciones sobre las llamadas búsquedas de
clic cero. A medida que Google se ha adentrado cada vez más en el
negocio de las respuestas, la proporción de búsquedas que terminan
sin un clic ha aumentado cada vez más. Su sensación es que los
resúmenes de IA van a explotar esta tendencia.
"Si dependes de Google para el tráfico, y ese tráfico es lo que
impulsó tu negocio, estás en problemas a corto y largo plazo", dice.
Que no cunda el pánico, es el mensaje de Pichai. Argumenta que
incluso en la era de las descripciones generales de la IA, la gente
seguirá queriendo hacer clic y profundizar en muchos tipos de
búsquedas. "El principio subyacente es que la gente viene en busca
de información. No están buscando que Google siempre responda",
dice. "A veces sí, pero la gran mayoría de las veces, lo ves como un
punto de partida".
Reid, por su parte, argumenta que debido a que los resúmenes de IA
permiten a las personas hacer preguntas más complicadas y
profundizar más en lo que quieren, incluso podrían ser útiles para
algunos tipos de editores y pequeñas empresas, especialmente
aquellos que operan en los nichos: "Básicamente, llegas a nuevas
audiencias, porque las personas ahora pueden expresar lo que quieren
de manera más específica. Y así, alguien que se especializa no tiene
que clasificar para la consulta genérica".
"Voy a empezar con algo arriesgado", me dice Nick Turley desde los
confines de una ventana de Zoom. Turley es el jefe de producto de
ChatGPT, y está mostrando la nueva herramienta de búsqueda web de
OpenAI unas semanas antes de su lanzamiento. "Normalmente debería
probar esto de antemano, pero solo voy a buscarte", dice. "Esta
siempre es una demostración de alto riesgo, porque las personas
tienden a ser particulares sobre lo que se dice sobre ellos en
Internet".
Escribe mi nombre en un campo de búsqueda, y el prototipo de motor
de búsqueda devuelve unas pocas frases, casi como la biografía de un
orador. Me identifica correctamente a mí y a mi función actual.
Incluso destaca una historia en particular que escribí hace años y
que probablemente fue la más conocida. En resumen, es la respuesta
correcta. ¿Ufff?
Unas semanas después de nuestra llamada, OpenAI incorporó la
búsqueda en ChatGPT, complementando las respuestas de su modelo de
lenguaje con información de toda la web. Si el modelo cree que una
respuesta se beneficiaría de información actualizada, ejecutará
automáticamente una búsqueda en la web (OpenAI no dirá quiénes son
sus socios de búsqueda) e incorporará esas respuestas en su
respuesta, con enlaces si desea obtener más información. También
puede optar por forzarlo manualmente a buscar en la web si no lo
hace por sí solo. OpenAI no revelará cuántas personas están usando
su búsqueda web, pero dice que unos 250 millones de personas usan
ChatGPT semanalmente, todas las cuales están potencialmente
expuestas a él.
"Hay una cantidad increíble de contenido en la web. Hay muchas cosas
que suceden en tiempo real. Quieres que ChatGPT pueda usar eso para
mejorar sus respuestas y ser un mejor superasistente para ti".
Kevin Weil, director de productos de OpenAI
Según Fishkin, estas nuevas formas de búsqueda asistida por IA aún
no desafían el dominio de búsqueda de Google. "No parece estar
canibalizando las formas clásicas de búsqueda en la web", dice.
OpenAI insiste en que en realidad no está tratando de competir en la
búsqueda, aunque, francamente, esto me parece un poco de
establecimiento de expectativas. Más bien, dice, la búsqueda en la
web es principalmente un medio para obtener información más
actualizada que los datos en sus modelos de entrenamiento, que
tienden a tener fechas de corte específicas que a menudo son meses,
o incluso un año o más, en el pasado. Como resultado, si bien
ChatGPT puede ser excelente para explicar cómo funciona una ofensiva
de la Costa Oeste, durante mucho tiempo ha sido inútil para decirle
cuál es el último puntaje de los 49ers. Ya no más.
"Lo abordo desde la perspectiva de '¿Cómo podemos hacer que ChatGPT
pueda responder a todas las preguntas que tengas? ¿Cómo podemos
hacer que sea más útil para usted en el día a día?'. Y ahí es donde
entra en juego la búsqueda para nosotros", me dice Kevin Weil,
director de productos de OpenAI. "Hay una cantidad increíble de
contenido en la web. Hay muchas cosas que suceden en tiempo real.
Quieres que ChatGPT pueda usar eso para mejorar sus respuestas y
poder ser un mejor superasistente para ti".
Hoy en día, ChatGPT es capaz de generar respuestas a noticias muy
actuales, así como información casi en tiempo real sobre cosas como
los precios de las acciones. Y aunque la interfaz de ChatGPT ha sido
aburrida durante mucho tiempo, los resultados de búsqueda aportan
todo tipo de contenido multimedia: imágenes, gráficos e incluso
vídeos. Es una experiencia muy diferente.
Weil también argumenta que ChatGPT tiene más libertad para innovar y
seguir su propio camino que competidores como Google, incluso más
que su socio Microsoft con Bing. Ambas son empresas dependientes de
la publicidad. OpenAI no lo es. (Al menos no todavía). Obtiene
ingresos de los desarrolladores, empresas e individuos que lo usan
directamente. En su mayoría, está incendiando grandes cantidades de
dinero en este momento: se prevé que pierda $ 14 mil millones en
2026, según algunos informes. Pero una cosa de la que no tiene que
preocuparse es de poner anuncios en sus resultados de búsqueda como
lo hace Google.
Elizabeth Reid
"Durante un tiempo lo que hicimos fue organizar páginas web. Lo cual
no es realmente lo mismo que organizar la información del mundo o
hacerla realmente útil y accesible para ti", dice la jefa de
búsqueda de Google, Liz Reid.
WINNI WINTERMEYER/REDUX
Al igual que Google, ChatGPT está extrayendo información de los
editores web, resumiéndola e incluyéndola en sus respuestas. Pero
también ha llegado a acuerdos financieros con los editores, un pago
por proporcionar la información que se incluye en sus resultados.
(MIT Technology Review ha estado en conversaciones con OpenAI,
Google, Perplexity y otros sobre acuerdos con editores, pero no ha
firmado ningún acuerdo. Editorial no participó ni fue informado
sobre el contenido de esas discusiones).
Pero la cuestión es que, para que la búsqueda web logre lo que
OpenAI quiere, que sea más actual que el modelo de lenguaje, también
tiene que traer información de todo tipo de editores y fuentes con
las que no tiene acuerdos. El jefe de asociaciones de medios de
OpenAI, Varun Shetty, dijo a MIT Technology Review que no dará un
trato preferencial a sus socios editoriales.
En cambio, me dijo OpenAI, el modelo en sí mismo encuentra la fuente
más confiable y útil para cualquier pregunta dada. Y eso también
puede ser raro. En ese primer ejemplo que me mostró, cuando Turley
realizó esa búsqueda de nombre, describía una historia que escribí
hace años para Wired sobre haber sido hackeado. Esa historia sigue
siendo una de las más leídas que he escrito. Pero ChatGPT no se
vinculó a él. Se vinculó a una breve reescritura de The Verge. Es
cierto que se trataba de una versión prototipo de búsqueda, que era,
como dijo Turley, "arriesgada".
Cuando le pregunté al respecto, no pudo explicar realmente por qué
el modelo eligió las fuentes que eligió, porque el modelo mismo hace
esa evaluación. La empresa ayuda a dirigirlo identificando, a veces
con la ayuda de los usuarios, lo que considera mejores respuestas,
pero el modelo en realidad las selecciona.
"Y en muchos casos, se equivoca, por eso tenemos trabajo por hacer",
dijo Turley. "Tener un modelo en el bucle es un mecanismo muy, muy
diferente a cómo funcionaba un motor de búsqueda en el pasado".
¡En efecto!
El modelo, ya sea GPT-4o de OpenAI o Gemini de Google o Claude de
Anthropic, puede ser muy, muy bueno para explicar las cosas. Pero el
razonamiento detrás de sus explicaciones, sus razones para
seleccionar una fuente en particular e incluso el lenguaje que puede
usar en una respuesta son bastante misteriosos. Claro, un modelo
puede explicar muchas cosas, pero no cuando se trata de sus propias
respuestas.
Fue hace casi una década, en 2016, cuando Pichai escribió que Google
estaba pasando de "móvil primero" a "IA primero": "Pero en los
próximos 10 años, cambiaremos a un mundo que sea IA primero, un
mundo donde la computación esté disponible universalmente, ya sea en
casa, en el trabajo, en el automóvil o en movimiento, y la
interacción con todas estas superficies se vuelva mucho más natural
e intuitiva. y sobre todo, más inteligentes".
Ya estamos ahí, más o menos. Y es un lugar extraño para estar. Se va
a poner más raro. Eso es especialmente cierto a medida que estas
cosas que ahora pensamos que son distintas: consultar un motor de
búsqueda, solicitar un modelo, buscar una foto que hemos tomado,
decidir lo que queremos leer, ver o escuchar, pedir una foto que
desearíamos haber tomado, y no lo hicimos, pero que aún nos gustaría
ver, comienzan a fusionarse.
Los resultados de búsqueda que vemos de la IA generativa se
entienden mejor como un punto de referencia en lugar de un destino.
Lo más importante puede no ser la búsqueda en sí misma; más bien, es
que la búsqueda ha dado a los desarrolladores de modelos de IA un
camino para incorporar información en tiempo real en sus entradas y
salidas. Y eso abre todo tipo de posibilidades.
"Un ChatGPT que pueda entender y acceder a la web no se limitará a
resumir los resultados. Podría tratarse de hacer cosas por ti. Y
creo que hay un futuro bastante emocionante allí", dice Weil de
OpenAI. "Puedes imaginar que la modelo te reserve un vuelo, o que
haga un pedido de DoorDash, o que simplemente realice tareas
generales para ti en el futuro. Solo una vez que la modelo entiende
cómo usar Internet, el cielo es el límite".
Este es el futuro de los agentes del que hemos estado escuchando
desde hace algún tiempo, y cuanto más modelos de IA hacen uso de los
datos en tiempo real de Internet, más cerca se vuelve.
Digamos que tienes un viaje en unas pocas semanas. Un agente que
puede obtener datos de Internet en tiempo real puede reservar sus
vuelos y habitaciones de hotel, hacer reservas para cenar y más, en
función de lo que sabe sobre usted y su próximo viaje, todo sin que
usted tenga que guiarlo. Otro agente podría, por ejemplo, monitorear
la producción de aguas residuales de su hogar para detectar ciertas
enfermedades y ordenar pruebas y tratamientos en respuesta. No
tendrá que buscar ese ruido extraño que está haciendo su automóvil,
porque el agente de su vehículo ya lo habrá hecho y habrá concertado
una cita para solucionar el problema.
"No siempre va a ser solo buscar y dar respuestas", dice Pichai. "A
veces van a ser acciones. A veces estarás interactuando dentro del
mundo real. Así que hay una noción de asistencia universal a través
de todo".
Y las formas en que estas cosas podrán dar respuestas también están
evolucionando rápidamente ahora. Por ejemplo, hoy en día Google no
solo puede buscar texto, imágenes e incluso video; puede crearlos.
Imagínese superponer esa capacidad con la búsqueda en una variedad
de formatos y dispositivos. "Muéstrame cómo se ve una curruca de
Townsend en el árbol frente a mí". O "Usar mis fotos y videos
familiares existentes para crear un avance de nuestra película de
nuestras próximas vacaciones en Puerto Rico el próximo año,
asegurándome de que visitemos los mejores restaurantes y los
principales lugares de interés".
"Lo hemos hecho principalmente en el lado de la entrada", dice,
refiriéndose a las formas en que Google ahora puede buscar una
imagen o dentro de un video. "Pero también te lo puedes imaginar en
el lado de la producción".
Este es el tipo de futuro que Pichai dice que está emocionado de
poner en línea. Google ya ha mostrado un poco de cómo podría verse
con NotebookLM, una herramienta que te permite subir grandes
cantidades de texto y convertirlo en un podcast parlanchín. Él
imagina este tipo de funcionalidad, la capacidad de tomar un tipo de
entrada y convertirla en una variedad de salidas, transformando la
forma en que interactuamos con la información.
En una demostración de una herramienta llamada Project Astra este
verano en su conferencia de desarrolladores, Google mostró una
versión de este resultado, donde las cámaras y micrófonos de los
teléfonos y gafas inteligentes entienden el contexto que te rodea
(en línea y fuera de línea, audible y visual) y tienen la capacidad
de recordar y responder de diversas maneras. Astra puede, por
ejemplo, mirar un dibujo en bruto de un coche de carreras de Fórmula
Uno y no sólo identificarlo, sino también explicar sus diversas
partes y sus usos.
Pero puedes imaginar que las cosas irán un poco más allá (y lo harán).
Digamos que quiero ver un video de cómo arreglar algo en mi
bicicleta. El video no existe, pero la información sí. En teoría, la
búsqueda generativa asistida por IA podría encontrar esa información
en algún lugar en línea, en un manual de usuario enterrado en el
sitio web de una empresa, por ejemplo, y crear un video que me
muestre exactamente cómo hacer lo que quiero, tal como podría
explicármelo con palabras hoy.
Este es el tipo de cosas que empiezan a suceder cuando se pone todo
el compendio de conocimiento humano, conocimiento que previamente se
ha capturado en silos de lenguaje y formato; mapas y registros de
empresas y SKU de productos; audio y video y bases de datos de
números y libros viejos e imágenes y, en realidad, cualquier cosa
que haya sido publicada, rastreada, grabada; cosas que están
sucediendo ahora mismo, en todas partes, e introducir un modelo en
todo eso. Un modelo que tal vez no pueda entender, precisamente,
pero que tiene la capacidad de juntar esa información, reorganizarla
y escupirla de vuelta en una variedad de formas diferentes que
esperamos sean útiles. Formas que un simple índice no podría.
Eso es lo que estamos en la cúspide, y lo que estamos empezando a
ver. Y a medida que Google implemente esto a mil millones de
personas, muchas de las cuales interactuarán con una IA
conversacional por primera vez, ¿qué significará eso? ¿Qué haremos
de manera diferente? Todo está cambiando muy rápido. Aguanta,
aguanta.
por Mat Honan