El New York Times demanda a OpenAI y Microsoft por infracción de derechos de autor


Nueva York
cnn

El New York Times ha demandado a OpenAI y Microsoft por infracción de derechos de autor, alegando que la tecnología de IA de las empresas copió ilegalmente millones de artículos del Times para entrenar a ChatGPT y otros servicios para proporcionar a las personas acceso instantáneo a la información, tecnología que ahora compite con… Veces.

La queja es El último de una serie de demandas Lo que busca limitar el uso del supuesto scraping de grandes franjas de contenido en línea -sin compensación- para entrenar los llamados modelos de inteligencia artificial en grandes lenguajes. actores, Escritores, periodistas y otros tipos creativos. Quienes publican su trabajo en línea temen que la inteligencia artificial aprenda de su material y les proporcione chatbots competitivos y otras fuentes de información sin una compensación adecuada.

Pero la demanda del Times es la primera entre los principales editores de noticias que compiten con OpenAI y Microsoft, las dos marcas de IA más conocidas. microsoft (MSFT) tiene un asiento en la junta directiva de OpenAI y una inversión multimillonaria en la empresa.

En una denuncia presentada el miércoles, el Times dijo que tenía el deber de informar a sus suscriptores, pero que «el uso ilegal del trabajo del Times por parte de Microsoft y OpenAI para crear productos de inteligencia artificial que compitan con él amenaza la capacidad del Times para proporcionar ese servicio». El periódico señaló que OpenAI y Microsoft utilizaron otras fuentes para la “copia a gran escala”, pero “dieron un enfoque especial al contenido del Times” buscando “aprovechar la enorme inversión del Times en su periodismo usándolo para construir alternativas”. productos sin permiso ni prima”.

«Respetamos los derechos de los creadores y propietarios de contenidos y estamos comprometidos a trabajar con ellos para garantizar que se beneficien de la tecnología de inteligencia artificial y de los nuevos modelos de ingresos», dijo OpenAI en un comunicado de la portavoz Lindsey Held. «Nuestras conversaciones en curso con The New York Times han sido productivas y han avanzado de manera constructiva, por lo que estamos sorprendidos y decepcionados por este desarrollo. Esperamos encontrar una manera mutuamente beneficiosa de trabajar juntos, como lo hacemos con muchos otros editores».

READ  ¿Qué es un tensor de correa? El CEO de Cisco planea un aumento del presupuesto de $ 1 mil millones para retener a los empleados - Información

Microsoft no respondió a una solicitud de comentarios sobre la demanda.

En su denuncia, el Times dijo que se opuso cuando descubrió hace meses que su trabajo se había utilizado para entrenar grandes modelos de lenguaje corporativo. El Times dijo que comenzó en abril. Negociar con OpenAI y Microsoft para obtener una compensación justa y determinar los términos del acuerdo.

Pero The Times afirma que no ha podido llegar a una solución con las empresas. Microsoft y OpenAI afirman que las obras del Times califican como «uso justo», lo que les otorga la posibilidad de utilizar material protegido por derechos de autor para «fines transformadores», afirma la denuncia.

El Times cuestionó firmemente esta afirmación, diciendo que ChatGPT y el chatbot Bing de Microsoft (también conocido como «copilot») podrían proporcionar un servicio similar al del New York Times.

«No hay nada 'transformador' en utilizar el contenido del Times sin compensación para crear productos que reemplacen al Times y le roben audiencia», dijo el periódico en su denuncia. «Debido a que los resultados de los modelos GenAI de los demandados compiten con los insumos utilizados para entrenarlos y los imitan estrechamente, copiar el Times funciona para este propósito no es un uso legítimo».

El Times se encuentra entre varias redacciones importantes, incluida CNN, que a principios de este año Código añadido a su sitio web. Lo que impide que el rastreador web de OpenAI, GTBot, escanee sus plataformas en busca de contenido.

En demandas separadas pero relacionadas a principios de este año, la comediante Sarah Silverman y dos autores fueron acusados. Presentar una demanda contra Meta y OpenAI En julio, alegó que los modelos de lenguaje de IA de las empresas fueron entrenados en material protegido por derechos de autor escrito por ella sin su conocimiento o consentimiento. Ninguna de las empresas hizo comentarios sobre la demanda. Juez en noviembre fue rechazado La mayoría de las reclamaciones judiciales.

Un grupo de escritores de ficción famosos se unió al Authors Guild para presentar una demanda por separado. Demanda judicial Contra OpenAI en septiembre, Por motivos de tecnología de la empresa. Utiliza ilegalmente sus obras protegidas por derechos de autor.

READ  Los futuros de Dow se vislumbran, el bitcoin rebota a 20.000 dólares; Cuidado con el mercado bajista

El Times alega en su demanda que los conjuntos de datos utilizados para entrenar los últimos grandes modelos de lenguaje de OpenAI, que impulsan sus herramientas de inteligencia artificial, «probablemente habrían sido utilizados por millones de empresas propiedad del Times». En una instantánea en inglés de 2019 de uno de esos conjuntos de datos, llamado Common Crawl y conocido como “una copia de Internet”, el sitio web del New York Times es la tercera fuente de información más representativa, después de Wikipedia y la base de datos de documentos de patentes de EE. UU. según la denuncia.

El Times afirma que debido a que sus herramientas de inteligencia artificial están entrenadas en su contenido, pueden “generar resultados que leen el contenido del Times palabra por palabra, lo resumen detalladamente e imitan su estilo expresivo, como lo demuestran docenas de ejemplos… Estas herramientas también falsamente atribuir información falsa al Times”, afirma la denuncia.

En un caso citado en la denuncia, ChatGPT proporcionó a un usuario los primeros tres párrafos del artículo ganador del Premio Pulitzer de 2012 «Snow Fall: The Avalanche at Tunnel Creek», después de que el usuario se quejara en el chat de haber sido golpeado por un muro de pago en Los tiempos. Y no poder leerlo.

El medio de comunicación también afirma que el motor de búsqueda Bing de Microsoft, que fue Fue ascendido a principios de este año. Utilizando la tecnología OpenAI, «transcribe y clasifica» el contenido del Times para producir respuestas más largas y detalladas que los motores de búsqueda tradicionales.

«Al hacer que el contenido del Times esté disponible sin permiso o autorización del Times, los demandados socavan y dañan la relación del Times con sus lectores y privan al Times de suscripciones, licencias, publicidad e ingresos de afiliados», dice la demanda.

Pero luchar contra la IA es como meter un dedo en una presa. Está por llegar, y editores como The New York Times saben que tendrán que abrazar el futuro. Sólo quieren asegurarse de que en el futuro reciban una compensación justa, dijo el New York Times.

READ  ¿Cambiará Elon Musk a Alemania?

«Reconocemos el potencial», dijo la vicepresidenta ejecutiva y asesora general del New York Times, Diane Brighton, al personal del periódico en un memorando el miércoles por la mañana. [generative AI] Al público y a la prensa”.

«Pero al mismo tiempo, creemos que el éxito de GenAI y las empresas que lo desarrollan no debe producirse a expensas de las organizaciones de noticias», según el memorando obtenido por CNN. «El uso de nuestro trabajo para crear herramientas GenAI debe contar con un permiso y un acuerdo que refleje el valor justo de ese trabajo, como lo establece la ley».

En su demanda, el periódico pide miles de millones de dólares en daños y perjuicios, pero no especifica la compensación que busca por la supuesta infracción de sus materiales protegidos por derechos de autor. También busca una orden judicial permanente que impida a Microsoft y OpenAI continuar con la supuesta infracción. El Times también busca «destruir» GPT y cualquier otro modelo de inteligencia artificial o conjunto de datos de entrenamiento que incluya su periodismo.

La demanda del Times podría, en última instancia, sentar un precedente para la industria en general, porque la cuestión de si el uso de materiales protegidos por derechos de autor para entrenar modelos de IA viola la ley es una cuestión legal sin resolver, según Dina Blichstein, socia del Grupo de Práctica de Inteligencia Artificial y Aprendizaje Profundo. En el despacho de abogados Heinz Bohn.

“Creo que saldrán muchos de estos tipos de trajes, creo que con el tiempo [the issue will] «Al llevarlo a la Corte Suprema, en ese momento tendremos alguna jurisprudencia específica», dijo Blichstein, y agregó que en este momento «no hay nada específico para los grandes modelos de lenguaje y la IA simplemente porque es muy nuevo».

Esta historia se ha actualizado con desarrollos y contexto adicionales.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *