- La española Ribera, protagonista de una tormenta política en la UE
- El diario sueco Dagens Nyheter también dejará de publicar en X
- España cierra el principal canal de 'streaming' pirata para ver fútbol
- El gobernador del Banco de Inglaterra pide "reconstruir" los lazos con la UE
- La justicia francesa ordena la liberación de un activista propalestino en prisión desde 1984
- Trump promete terminar con las guerras con un "ejército fuerte"
- La nueva jefa de inteligencia de EEUU genera división y preocupación
- Un avión militar ruso detectado "cerca" del espacio aéreo del Reino Unido, según un ministerio británico
- La red social Bluesky, una alternativa a X, gana 1 millón de usuarios en 24 horas
- Las variadas voces de la izquierda buscan hacerse oír ante el G20 en Rio
- El reto de ser joven y buscar una vivienda en Ciudad de México
- El G20, cita de las potencias económicas ante un mundo en crisis
- "La IA no aporta ningún beneficio a la sociedad", afirma la activista ecologista Sage Lenier
- EEUU destinará 6.600 millones de dólares para una planta del gigante taiwanés TSMC en Arizona
- Cuarenta detenidos en el partido Francia-Israel, sin incidentes graves
- Hamás dice estar "dispuesto" a una tregua en Gaza y pide a Trump "presionar" a Israel
- La Cumbre Iberoamericana llega a su sesión final de mandatarios... carente de ellos
- La salida de diarios de la red X es el "síntoma del fracaso" en la regulación de las plataformas, según RSF
- La Comisión Europea proyecta una ligera recuperación económica de la eurozona en 2025
- EEUU y China abren una cumbre APEC expectante por la nueva era Trump
- El posible impacto del acuerdo UE-Mercosur en la agricultura europea
- EEUU y China abren cumbre APEC expectante por la nueva era Trump
- El crecimiento del Reino Unido se ralentiza al 0,1% en el tercer trimestre
- Una activista mexicana alerta ante la ONU sobre los feminicidios en su país
- El presidente regional admite "fallos" en la gestión de las inundaciones en Valencia
- Sismo de magnitud 6,6 frente a la costa de Papúa Nueva Guinea
- Saquon Barkley domina el juego terrestre en el triunfo de los Eagles sobre los Commanders
- La policía argentina captura a uno de los fugitivos por la asonada en Brasil
- A la espera de Trump, un G20 dividido busca diálogo en Rio de Janeiro
- Ecuador golea a Bolivia lejos de la altura y marcha firme rumbo al Mundial de 2026
- Un ataque "masivo" de Rusia deja un muerto y a miles sin calefacción en el sur de Ucrania
- La relatora de la ONU expresa preocupación por la situación del exvice de Ecuador Jorge Glas
- El 73% de las armas recuperadas en el Caribe pueden proceder de EEUU
- EEUU impone sanciones a más de 350 policías de Nicaragua
- Detienen a un periodista en Nicaragua tras informar sobre alzas de precios
- El crecimiento económico de Japón cae al 0,2% en el tercer trimestre
- Desde Florida, Milei califica el triunfo de Trump como "el mayor regreso" de la historia
- Bolivia autoriza a privados a importar y comercializar combustibles ante la escasez
- Musk se reunió con un funcionario iraní para apaciguar las tensiones con EEUU
- Las muertes por sobredosis de drogas bajan de 100.000 en EEUU
- Milei suspende la asignación vitalicia a Kirchner, quien lo tilda de "dictadorzuelo"
- Nueva York revive el peaje en Manhattan antes de que llegue Trump a la Casa Blanca
- El líder norcoreano ordena una "producción en masa" de drones explosivos
- Los diputados mexicanos amplían la lista de delitos con prisión preventiva
- Sin "cábalas" ante Dinamarca, asegura De la Fuente
- El Senado francés rechaza prohibir las corridas de toros a los menores de 16 años
- El excepcional reloj Patek Philippe de John Lennon sí pertenece a Yoko Ono
- El australiano Brett Robinson, nuevo presidente de World Rugby
- Proyecto inmobiliario en un terreno de un excampo de concentración nazi en Austria
- Biden y Xi están en Lima para una cumbre APEC previa a su cita bilateral
El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema
Los modelos de inteligencia artificial (IA) se abastecen sin parar de datos generados por la propia IA, lo que desemboca en la creación de contenidos cada vez más incoherentes, un problema que ya han señalado varios estudios científicos.
Los modelos en los que se basan las herramientas de IA generativa, como ChatGPT, que permiten crear todo tipo de contenidos con simples preguntas, necesitan ser ejercitados con un nombre colosal de datos.
Estos datos a menudo vienen de internet, que cada vez contiene más imágenes y textos creados por la propia IA.
Esta autoalimentación de la IA lleva a un deterioro de los modelos, que producen respuestas que van siendo cada vez menos originales y pertinentes y acaban por no tener ningún sentido, según un artículo publicado a finales de julio por la revista científica Nature.
Con el uso de este tipo de datos, llamados "datos sintéticos" porque están generados artificialmente, la muestra en la que se basan los modelos de IA para dar respuestas va perdiendo calidad.
- Como las vacas locas -
Investigadores de las Universidades de Rice y de Stanford, en Estados Unidos, llegaron a la misma conclusión analizando los modelos de IA generadores de imágenes Midjourney, Dall-E y Stable Diffusion.
Los estudios mostraron que las imágenes generadas eran cada vez menos originales e iban incorporando elementos incoherentes a medida que se añadían datos "artificiales" en el modelo, y compararon este fenómeno con la enfermedad de las vacas locas.
Esta epidemia, surgida en el Reino Unido, empezó con el uso para alimentar a los bovinos de harinas animales, obtenidas a partir de partes no consumidas de restos vacunos o de cadáveres de animales contaminados.
Las empresas del sector de la IA utilizan a menudo "datos sintéticos" para alimentar a sus programas debido a su fácil acceso, su abundancia y el bajo coste, comparado con datos creados por humanos.
Estas "fuentes de datos humanos sin explotar, de alta calidad" son cada vez más minoritarias, explica a AFP Jathan Sadowski, investigador especializado en las nuevas tecnologías de la Universidad de Monash, en Australia.
"Sin ningún control durante varias generaciones", la peor hipótesis sería que la degradación de los modelos "envenene la calidad y la diversidad de los datos en todo internet", advierte Richard Baraniuk, uno de los autores del artículo de la Universidad de Rice, en un comunicado.
Así como la crisis de las vacas locas hundió la industria cárnica en los años 1990, un internet repleto de contenidos hechos con IA y de modelos descontrolados podría amenazar el futuro del sector, en pleno auge, según los científicos.
"La verdadera pregunta para los investigadores y las empresas que construyen los sistemas de IA es: ¿cuándo el uso de los datos sintéticos es demasiado?", dice Sadowski.
- "Basura" -
Para otros especialistas, no obstante, el problema es exagerado.
Anthropic y Hugging Face, dos líderes del sector que afirman tener en cuenta el lado ético de la tecnología, confirman a AFP utilizar datos generados por la IA.
El artículo de la revista Nature presenta una perspectiva teórica interesante, pero poco realista, según Anton Lozhkov, ingeniero en aprendizaje automático en Hugging Face.
"El entrenamiento [de los modelos] en varias series de datos sintéticos es algo que simplemente no se hace en realidad", asegura.
Lozhkov admite sin embargo que los expertos de la IA se sienten frustrados ante la situación en que se encuentra internet.
"Una gran parte de internet es una basura", dice, y agrega que su empresa ha hecho grandes esfuerzos para limpiar este tipo de datos, suprimiendo a veces hasta un 90% de contenido.
C.Cassis--PC