
-
El Kremlin advierte contra precipitar las conversaciones sobre Ucrania
-
Qué se sabe de la muerte del papa, su funeral y el cónclave
-
Los reyes de España asistirán al funeral del papa Francisco
-
La presidencia de Trump desafía el Estado de derecho en EEUU
-
Trump o el desorden mundial
-
El Departamento de Educación de EEUU retomará la cobranza compulsiva de préstamos estudiantiles
-
España elevará este año su gasto militar al 2% del PIB, afirma Pedro Sánchez
-
Una delegación de Hamás viaja a Egipto para discutir "nuevas ideas" para una tregua en Gaza
-
El medio oficial del Vaticano relata las últimas horas del papa Francisco
-
Roche anuncia inversión de USD50.000 millones ante incertidumbre por guerra comercial
-
El papado en cifras
-
El cónclave, manual de instrucciones
-
Los Pistons rematan esta vez a los Knicks en su primer triunfo en playoffs desde 2008
-
El pianista Igor Levit dará un concierto de más de 16 horas en Londres
-
Legisladores de EEUU prometen seguir lucha por retorno de salvadoreño deportado por error
-
EEUU imputa a 27 presuntos miembros de banda venezolana Tren de Aragua
-
La Defensa Civil de Gaza reporta 25 muertos por ataques israelíes
-
Escuelas filipinas se adaptan al calor con vacaciones adelantadas y más ventiladores
-
¿Puede la familia más rica de Europa crear una rivalidad en el fútbol parisino?
-
Los aranceles de Trump incendian las relaciones con China
-
El oro cotiza a un máximo histórico por encima de los 3.500 dólares, en la carrera por comprar activos seguros
-
El funeral del papa Francisco tendrá lugar el sábado
-
Los lugares clave del cónclave: de la Basílica de San Pedro a la Capilla Sixtina
-
El Vaticano publica primeras imágenes del papa Francisco fallecido
-
El léxico de la elección del nuevo papa
-
El Vaticano, el Estado más pequeño del mundo
-
La defensa de la Amazonía, la gran batalla del papa Francisco
-
Un plan alimentario de Indonesia amenaza con una "deforestación masiva"
-
Feria de Shanghái muestra la nueva frontera de la competencia de autos eléctricos
-
Un Vaticano de duelo prepara el funeral del papa Francisco
-
Gobierno mexicano pide retirar de TV anuncio antimigración pagado por EEUU
-
Duplantis, Biles, Yamal y el Real Madrid galardonados en los premios Laureus
-
Maduro dice que Bukele viola DDHH y exige liberación incondicional de deportados
-
Universidad de Harvard demanda al gobierno de Trump por recortes en financiación
-
Argentina recuerda al niño travieso y al hombre sencillo que fue el papa Francisco
-
Gobierno mexicano pide retirar de TV anuncio contra la migración pagado por EEUU
-
Trump respalda al jefe del Pentágono pese a nuevo escándalo de chats de Signal
-
Trump, el presidente "no cristiano" a ojos del papa Francisco
-
El papa Francisco, un activista de la lucha contra el cambio climático
-
"Cónclave", "Amén" o "Los dos papas": cuando el Vaticano inspira al cine
-
El jefe del Pentágono niega haber compartido información militar con su esposa
-
Los últimos días del papa Francisco
-
El jefe del servicio de inteligencia interior de Israel acusa a Netanyahu de haberle exigido lealtad personal
-
El club de fútbol San Lorenzo despide al papa, su hincha más célebre
-
Francisco, un papa en la era de las redes sociales y la IA
-
Más de 30 muertos por disparos de artillería en el oeste de Sudán
-
Leverkusen admite un "acuerdo" tácito con Xabi Alonso en caso de oferta de algún exequipo
-
Putin refuerza la represión legal de la disidencia
-
Conmoción y tristeza entre fieles y turistas en Notre Dame de París por la muerte del papa
-
El gobierno mexicano, aún sin acuerdo con Trump sobre los aranceles al acero y los autos

El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema
Los modelos de inteligencia artificial (IA) se abastecen sin parar de datos generados por la propia IA, lo que desemboca en la creación de contenidos cada vez más incoherentes, un problema que ya han señalado varios estudios científicos.
Los modelos en los que se basan las herramientas de IA generativa, como ChatGPT, que permiten crear todo tipo de contenidos con simples preguntas, necesitan ser ejercitados con un nombre colosal de datos.
Estos datos a menudo vienen de internet, que cada vez contiene más imágenes y textos creados por la propia IA.
Esta autoalimentación de la IA lleva a un deterioro de los modelos, que producen respuestas que van siendo cada vez menos originales y pertinentes y acaban por no tener ningún sentido, según un artículo publicado a finales de julio por la revista científica Nature.
Con el uso de este tipo de datos, llamados "datos sintéticos" porque están generados artificialmente, la muestra en la que se basan los modelos de IA para dar respuestas va perdiendo calidad.
- Como las vacas locas -
Investigadores de las Universidades de Rice y de Stanford, en Estados Unidos, llegaron a la misma conclusión analizando los modelos de IA generadores de imágenes Midjourney, Dall-E y Stable Diffusion.
Los estudios mostraron que las imágenes generadas eran cada vez menos originales e iban incorporando elementos incoherentes a medida que se añadían datos "artificiales" en el modelo, y compararon este fenómeno con la enfermedad de las vacas locas.
Esta epidemia, surgida en el Reino Unido, empezó con el uso para alimentar a los bovinos de harinas animales, obtenidas a partir de partes no consumidas de restos vacunos o de cadáveres de animales contaminados.
Las empresas del sector de la IA utilizan a menudo "datos sintéticos" para alimentar a sus programas debido a su fácil acceso, su abundancia y el bajo coste, comparado con datos creados por humanos.
Estas "fuentes de datos humanos sin explotar, de alta calidad" son cada vez más minoritarias, explica a AFP Jathan Sadowski, investigador especializado en las nuevas tecnologías de la Universidad de Monash, en Australia.
"Sin ningún control durante varias generaciones", la peor hipótesis sería que la degradación de los modelos "envenene la calidad y la diversidad de los datos en todo internet", advierte Richard Baraniuk, uno de los autores del artículo de la Universidad de Rice, en un comunicado.
Así como la crisis de las vacas locas hundió la industria cárnica en los años 1990, un internet repleto de contenidos hechos con IA y de modelos descontrolados podría amenazar el futuro del sector, en pleno auge, según los científicos.
"La verdadera pregunta para los investigadores y las empresas que construyen los sistemas de IA es: ¿cuándo el uso de los datos sintéticos es demasiado?", dice Sadowski.
- "Basura" -
Para otros especialistas, no obstante, el problema es exagerado.
Anthropic y Hugging Face, dos líderes del sector que afirman tener en cuenta el lado ético de la tecnología, confirman a AFP utilizar datos generados por la IA.
El artículo de la revista Nature presenta una perspectiva teórica interesante, pero poco realista, según Anton Lozhkov, ingeniero en aprendizaje automático en Hugging Face.
"El entrenamiento [de los modelos] en varias series de datos sintéticos es algo que simplemente no se hace en realidad", asegura.
Lozhkov admite sin embargo que los expertos de la IA se sienten frustrados ante la situación en que se encuentra internet.
"Una gran parte de internet es una basura", dice, y agrega que su empresa ha hecho grandes esfuerzos para limpiar este tipo de datos, suprimiendo a veces hasta un 90% de contenido.
C.Kreuzer--VB