Lo advirtió Elon Musk que aseguró que la escasez de datos para entrenar modelos de IA supone un punto de inflexión histórico y el uso de datos sintéticos es una alternativa no exenta de riesgos
Buenos Aires-(Nomyc)-La Inteligencia Artificial (IA) está cerca de agotar todos los datos disponibles en Internet para su entrenamiento, según sostuvo alguien que conoce bien esta industria: Elon Musk, propietario de X y CEO de xAI, entre otras empresas y para solucionar esto, propone cruzar el “Rubicón” del entrenamiento de modelos: utilizar datos sintéticos, es decir, que “la propia IA genere los datos con los que aprenderá”.
Importancia: la escasez de datos para entrenar modelos marcará el punto de inflexión en el desarrollo de la IA, por lo que se podría ralentizar el ritmo de avance tecnológico tal y como lo conocemos tras los últimos años.
Contexto: los grandes modelos de lenguaje necesitan enormes cantidades de datos e información para mejorar su rendimiento y el agotamiento de estos “datos reales” disponibles, generados por humanos mediante las vías tradicionales, fuerza a la industria a buscar “alternativas válidas” con las que continuar con la mejora de productos como los chatbots o los generadores de imágenes.
En relación a ¿cuál es la diferencia con lo que plantea Musk?, ésta se relaciona con que el uso de datos sintéticos ha sido hasta ahora un “complemento a datos reales, no un reemplazo total” y según él, “pronto serán la única fuente de entrenamiento posible”.
Entre líneas: no es la primera señal similar que envía un peso pesado de la industria, ya que Ilya Sutskever, excientífico jefe de OpenAI, hizo una advertencia muy parecida en diciembre cuando señaló “Hemos alcanzado el pico de datos y no habrá más”.
Nomyc-10-1-25