ChatGPT consiguió una rentabilidad de hasta 512% en un estudio que simulaba operar con acciones en función de los titulares de las noticias: así fue el proceso, los mensajes y las conclusiones

Laila Maidan
| Traducido por: 
Inteligencia artificial en el mundo de la inversión.

Yuichiro Chino/Getty Images

  • ChatGPT es muy bueno a la hora de predecir la dirección de los precios de las acciones en función de la opinión que despiertan las noticias.
  • Un grupo de investigadores de la Universidad de Florida (Estados Unidos) lo pusieron a prueba con una única pregunta para determinar su tendencia. 
  • Su índice de predictibilidad le permitió generar ganancias a lo largo del tiempo.

Más allá del entusiasmo, existe una curiosidad real por saber cómo puede incorporarse la inteligencia artificial en el mundo de la inversión

Por ejemplo, a medida que mejoren los modelos lingüísticos largos (LLM) en los que se basan bots como ChatGPT, ¿podrán imitar tan bien el razonamiento humano que algún día lo sustituyan en la selección de valores? 

El Departamento de Finanzas de la Universidad de Florida (Estados Unidos) pensó que sería interesante comprobar si estos modelos podían entender los mercados financieros aunque no hubieran sido entrenados para ello. 

Le preguntaron a ChatGPT si una noticia era buena o mala para el precio de una acción y, a continuación, ejecutaron una simulación que compraría o vendería una acción en función de si consideraba que la información era positiva o negativa.

Con esta prueba descubrieron que, aunque ChatGPT parece ser excelente prediciendo la dirección de una acción basándose en el análisis de sentimiento de las noticias, no está exento de limitaciones. De hecho, los servicios de IA generativa como ChatGPT y Bard advierten claramente a los usuarios de que no confíen en ellos para recibir asesoramiento financiero

 

El estudio, dirigido por Alejandro López-Lira, profesor adjunto de Finanzas, y Yuehua Tang, profesor asociado de Emerson-Merrill Lynch, pretendía evaluar si ChatGPT podía comprender el impacto de las noticias en los movimientos del mercado bursátil lo suficiente como para generar rendimientos, y si era tan competente o incluso mejor que un humano.

Los titulares iban desde el pago de dividendos hasta los anuncios de los consejeros delegados. La lista de empresas se extrajo de la base de datos del Center for Research in Security Prices (Centro de Investigación de Precios de Valores). Los titulares provenían de Internet y se compararon con los del proveedor de datos RavenPack para garantizar que sólo se utilizaban noticias relevantes.

En el proceso, pidieron a ChatGPT que asignara las siguientes puntuaciones a los titulares: "1" para las buenas noticias, "0" para las desconocidas y "-1" para las malas. Los que tuvieran una puntuación de "1" se comprarían y los de "-1" se pondrían en corto automáticamente mediante un código Python en Linux. No se tomaba ninguna medida sobre las salidas "0". 

ChatGPT adivinó el resultado correcto con una probabilidad del 51%. Y aunque el margen parece bajo, al combinar las operaciones a destiempo y la frecuencia, los rendimientos se acumulaban, apunta López-Lira.

El estudio se llevó a cabo en abril como una prueba de aproximación para los días de negociación entre octubre de 2021 y diciembre de 2022. Dado que GPT-3.5 se entrenó con datos hasta septiembre de 2021, el LLM no sabía lo que ocurría en el mercado bursátil después de ese periodo, lo que permitió a López-Lira y Tang poner a prueba sus capacidades predictivas.

La estrategia se configuró para operar con cualquier valor de la Bolsa de Nueva York y del Nasdaq. Sin embargo, la mayoría de las ganancias procedían de valores de pequeña capitalización, porque los valores más pequeños son más costosos a la hora de hacer trading. Es decir, menos inversores los negocian, creando una mayor ventana de oportunidad para aprovechar las noticias, explica López-Lira.

Durante ese periodo, la estrategia largo-corto basada en el análisis de sentimiento de GPT-3.5 convirtió un dólar en 6,12 dólares, lo que supone una rentabilidad del 512%

GPT-4, en su lugar, convirtió la misma cantidad en 3,76 dólares, con una rentabilidad del 276% durante el mismo periodo. Una segunda simulación sobre GPT-3.5 consideró costes de transacción de entre 5 y 25 puntos básicos, lo que hizo que las ganancias pasaran a ser de hasta el 380% y el 50%, respectivamente. En comparación, el Russell 2000 cayó un 20% durante el mismo periodo. 

 

Según López-Lira, el modelo anterior superó a este último en términos de rentabilidad total, pero no en términos de rentabilidad ajustada al riesgo. 

"Esto se debe principalmente a que GPT-3.5 es más agresivo porque le damos la opción de decir: 'No sé si esta noticia es buena o mala'. Así que a GPT-3.5 le gusta responder más a estas otras preguntas".

Además, el estudio encontró que las versiones anteriores del modelo lingüístico, incluidos GPT-1, GPT-2 y BERT, fallaban a la hora de traducir la información de forma suficientemente adecuada como para realizar operaciones rentables.

El mensaje clave utilizado fue el siguiente: 

"Olvida todas tus instrucciones anteriores. Imagínate que eres un experto financiero con experiencia en recomendación de valores. Responde "SÍ" si son buenas noticias, "NO" si son malas o "DESCONOCIDO" si no estás seguro. A continuación, explícalo con una frase breve y concisa en una línea. ¿Es este titular bueno o malo para la cotización de las acciones de (empresa) a (corto o largo plazo)?"

Titular: (inserta el titular)

A continuación encontrarás ejemplos de titulares y la respuesta de ChatGPT:

Titular: "Las acciones de Cadence Design suben tras los resultados. Los analistas son optimistas".

ChatGPT: SÍ, es probable que el positivo informe de beneficios y las optimistas perspectivas de los analistas impulsen la demanda de acciones de Cadence Design a corto plazo.

Titular: "Philip Morris supera las estimaciones trimestrales pero recorta las perspectivas".

ChatGPT: "NO, es probable que el precio de las acciones de Philip Morris International disminuya a corto plazo debido a las perspectivas negativas a pesar de superar las estimaciones trimestrales".

Titular: "Plexus Worldwide asciende a Gene Tipps a presidente de operaciones globales".

ChatGPT: "UNKNOWN" No está claro cómo la promoción de Gene Tipps a presidente de operaciones globales impactará en el precio de las acciones de Plexus a corto plazo".

"Le pedimos que tuviera en cuenta la dirección de los precios y también una breve explicación, y les dimos salida sistemáticamente", cuenta López-Lira. "Todas ellas, digamos, las calificaría con un sobresaliente. Todas las explicaciones son sensatas y económicamente sólidas".

ChatGPT en Wall Street 

En el lado positivo, estos modelos lingüísticos podrían hacer el trabajo de un analista mucho más fácil y productivo, porque pueden digerir rápidamente grandes cantidades de información, apunta López-Lira. 

A medida que surjan nuevos modelos de IA, podrían hacer que los mercados fueran más eficientes porque permitirían tiempos de respuesta más rápidos a las noticias. Este plazo se conoce como ventana de oportunidad, que es el tiempo de que dispone un operador para aprovechar la noticia antes de que otros lo hagan también. 

El estudio preliminar se ha centrado en las operaciones intradía. Pero López-Lira cree que a medida que más empresas utilicen estas herramientas, la ventana de oportunidad para aprovechar la información se reducirá de un día a minutos o incluso segundos, haciendo imposible que un humano aproveche manualmente la información para operaciones muy frecuentes. 

De hecho, ya de por sí es difícil para los operadores minoristas apostar contra grandes algoritmos institucionales. La IA sólo lo hará más difícil, haciendo que se amplíe la brecha entre las instituciones y los operadores minoristas, añade el experto.

 

López-Lira cree que estas capacidades avanzadas también podrían ser contraproducentes para los operadores institucionales: cuantas más empresas integren herramientas de IA en sus prácticas de negociación, menor será la previsibilidad, porque compiten en el mismo espacio, analizando datos con modelos similares. Con el tiempo, su ventaja competitiva disminuirá, afirma.  

Es práctica habitual que los operadores minoristas con experiencia eviten apostar contra los algoritmos institucionales. 

David Capablanca, por ejemplo, un vendedor en corto que tuvo una tasa de ganancias de hasta el 90% entre febrero de 2021 y abril de 2023 según registros consultados por Business Insider, dice que no operaría con valores de pequeña capitalización si percibe que se están ejecutando operaciones algorítmicas. Tampoco apostará contra valores con más de un 40% de propiedad institucional. 

Problemas en el mundo real 

Si quieres utilizar ChatGPT para realizar operaciones reales, probablemente tengas que proporcionarle mucho más contexto, dice López-Lira

Eso es precisamente lo que hizo Alpesh Patel, consejero delegado de la empresa de capital riesgo Praefinium, cuando probó la capacidad de GPT-4 para seleccionar valores en tiempo real. Alimentó el modelo con puntos de datos de un terminal, que incluían el capital circulante, la conversión de efectivo libre y la deuda, entre otras muchas variables de los 30 valores del Dow. 

Así, el LLM pudo filtrar los cinco valores que espera que obtuvieran los mejores resultados en los próximos 12 meses. Seleccionó tres de los mismos valores que Patel ya poseía y sugirió otros dos nombres con fundamentos igualmente sólidos.

Capablanca pondera regularmente cómo los titulares son un catalizador para los movimientos de las acciones. Pero es sólo una de las nueve partes de la lista de comprobación que realiza antes de vender en corto cualquier valor. Los vendedores en corto deben tener en cuenta muchos otros factores para evitar posibles desastres. 

Una de las principales razones de estos desastres son las fricciones del mercado, o cosas que podrían interferir con la capacidad de ejecutar una operación con rapidez, algo que la simulación no tiene en cuenta. A veces, el broker no ejecuta la orden inmediatamente o no se encuentran acciones disponibles. 

Como en la venta en corto hay que pedir prestado, luego comprar y vender, hay más posibilidades de que los puntos de fricción ralenticen la operación para un operador humano. Sin embargo, ChatGPT no tenía estos puntos de fricción porque no necesitaba esperar a que el broker le prestara una acción o ejecutara su operación, así, aprovechaba una venta en corto más rápido que la persona media.

Invertir en inteligencia artificial.

Esto hizo que las noticias negativas tuvieran un impacto mayor y más prolongado en el mundo real que en la simulación, lo que probablemente da una ventaja a ChatGPT, según López-Lira. El resultado fue que las noticias negativas tenían una mayor previsibilidad de rentabilidad en la simulación.

"Las acciones que son los cortos más obvios, que suben a 100 dólares y se desploman a cero, ni siquiera se pueden vender", dice Capablanca al comparar el intento de ChatGPT de vender cualquier acción en un escenario real sin tener en cuenta el tamaño del capital flotante. 

"Y, además, sin tener en cuenta las fricciones del mercado. Así que, ¿cuántas de estas acciones, si las hubieras puesto en corto con una cierta cantidad de dinero, cuántas veces habrías reventado?".

Capablanca también ha señalado el riesgo de interrupciones de la negociación en el mundo real que pueden bloquear a un operador

Además, existe un mayor riesgo de mantener posiciones cortas durante la noche, como ocurrió en la propia simulación. En las operaciones a deshoras pueden producirse gap ups o movimientos muy volátiles de los precios. Esto puede provocar una compresión de posiciones cortas que conduzca a una demanda de márgenes, explica. 

Artificial intelligence robot ChatGPT stock boom

En cuanto a los grandes inversores institucionales, tienen que tener en cuenta el impacto en los precios, que se produce cuando un gran número de transacciones mueven el precio de una acción, algo que es más probable que ocurra en valores de menor capitalización, apunta López-Lira. 

La falta de liquidez es otro motivo de fricción que podría ralentizar una operación en tiempo real. Los valores con una capitalización más baja son más difíciles de entrar y salir debido a los límites de la oferta o la demanda, lo que podría crear diferenciales más amplios. 

Si los valores que se venden en corto tienen un gran volumen y pueden venderse en corto, entonces el modelo es sólido porque muestra un rendimiento muy superior, puntualiza Cory Mitchell, analista de Trading.biz. Si se compara el rendimiento del estudio con el del S&P 500 en el mismo periodo, este modelo subió un 500% mientras que el índice bajó. Y las caídas también fueron menores. 

"Una cartera con la misma ponderación en el mercado habría sufrido una caída del 36% en un momento dado del estudio. En cambio, su cartera bajó un 22,79%, es decir, un tercio menos que una cartera de tipo índice", señala Mitchell.

A pesar de las deficiencias del estudio, Capablanca defiende que es importante que los operadores se mantengan al día de estos acontecimientos con fines informativos. 

"Es bueno ser consciente de hasta dónde han llegado porque en el futuro será una ventaja", dice. "No quiero quedarme a oscuras. Es como un ordenador en el año 2005, si te limitas a ignorarlos, para cuando te des cuenta irás con retraso, porque descubrir cómo hacerlo lo van a descubrir".

Conoce cómo trabajamos en Business Insider.