Deepseek acaba de derribar el sinopsis AI a valenza de la fuente abierta, y la ironía para OpenAi y Anthrope es colosal


Deepseek, la startup china de IA, sorprendió al mundo posteriormente de presentar un maniquí de IA la semana pasada que rivaliza con modelos como Openi's O1, al tiempo que afirma que costó mucho menos desarrollarse y requirió muchas menos fichas de Nvidia, y regalándolo de forma gratuita. Las Fallout enviaron las acciones de Nvidia desplomadas hoy y dejó a los observadores preguntándose: ¿qué significa para las startups de IA más profundas, OpenAi y Anthrope, que venden sus modelos a consumidores y empresas, así como competidores en gran medida financiados como Mistral y Cohere?

El momento contemporáneo es profundamente irónico, dijo el desarrollador y consejero de IA con sede en Toronto Reuven Cohen Fortuna. Deepseek lanzó su maniquí de IA como código libre, lo que significa que la compañía permitió a los investigadores, desarrolladores y otros usuarios aceptar al código subyacente y sus “pesos” (que determinan cómo el maniquí procesa la información) usar, modificar o mejorar. Eso se parece mucho a lo que Operai dijo que haría cuando se fundó en 2015 como una compañía sin fines de provecho que compartió su investigación y técnicas abiertamente (como su nombre lo indica). Pero Operai ahora es “con mucho, el más cerrado de todas las formas posibles”, dijo Cohen.

Aunque Deepseek no lanzó los datos que utilizó para entrenar su maniquí R1, hay indicios de que puede suceder usado horizontes de Openi's O1 para iniciar el entrenamiento de las habilidades de razonamiento del maniquí. Este proceso de exploración y estudios de los resultados de otro maniquí a veces se conoce como “ingeniería inversa”.

Los desarrolladores de código libre han sido modelos OpenAI de ingeniería inversa como O1 durante meses, dijo Cohen. Los esfuerzos de Deepseek dejan en claro que los modelos pueden mejorar al instruirse de otros modelos lanzados por OpenAi, antrópico y otros, lo que pone en aventura los modelos comerciales existentes de esas compañías, estructuras de costos y supuestos tecnológicos.

“El problema es que las compañías tienen ventajas momentáneas pero no han construido fosas duraderas”, dijo Patrick Moorhead, fundador de Moor Insights & Strategy. “Las empresas con inclinaciones propietarias necesitan una escalera, tiempo de mercado, costo o preeminencia de servicios de 5X para tener éxito. Tanto Operai como Anthrope están siendo superados por Open [source AI]. “

Muchos proponentes de IA de código libre han predicho durante mucho tiempo la mercantilización de los modelos de IA. “Si estos modelos resultan ser asaz capaces, lo que positivamente se ven, y son muy baratos, entonces hay un mundo donde las empresas dejan de usar OpenAi a escalera”, dijo William Falcon, CEO de Lightning Ai, una plataforma de software Eso permite a los usuarios entrenar e implementar modelos de IA de código libre, incluidos Deepseek's.



W2M">Source link

Leave a Comment