Deepseek, la startup china de IA, sorprendió al mundo posteriormente de presentar un maniquí de IA la semana pasada que rivaliza con modelos como Openi's O1, al tiempo que afirma que costó mucho menos desarrollarse y requirió muchas menos fichas de Nvidia, y regalándolo de forma gratuita. Las Fallout enviaron las acciones de Nvidia desplomadas hoy y dejó a los observadores preguntándose: ¿qué significa para las startups de IA más profundas, OpenAi y Anthrope, que venden sus modelos a consumidores y empresas, así como competidores en gran medida financiados como Mistral y Cohere?
El momento contemporáneo es profundamente irónico, dijo el desarrollador y consejero de IA con sede en Toronto Reuven Cohen Fortuna. Deepseek lanzó su maniquí de IA como código libre, lo que significa que la compañía permitió a los investigadores, desarrolladores y otros usuarios aceptar al código subyacente y sus “pesos” (que determinan cómo el maniquí procesa la información) usar, modificar o mejorar. Eso se parece mucho a lo que Operai dijo que haría cuando se fundó en 2015 como una compañía sin fines de provecho que compartió su investigación y técnicas abiertamente (como su nombre lo indica). Pero Operai ahora es “con mucho, el más cerrado de todas las formas posibles”, dijo Cohen.
Aunque Deepseek no lanzó los datos que utilizó para entrenar su maniquí R1, hay indicios de que puede suceder usado horizontes de Openi's O1 para iniciar el entrenamiento de las habilidades de razonamiento del maniquí. Este proceso de exploración y estudios de los resultados de otro maniquí a veces se conoce como “ingeniería inversa”.
Los desarrolladores de código libre han sido modelos OpenAI de ingeniería inversa como O1 durante meses, dijo Cohen. Los esfuerzos de Deepseek dejan en claro que los modelos pueden mejorar al instruirse de otros modelos lanzados por OpenAi, antrópico y otros, lo que pone en aventura los modelos comerciales existentes de esas compañías, estructuras de costos y supuestos tecnológicos.
“El problema es que las compañías tienen ventajas momentáneas pero no han construido fosas duraderas”, dijo Patrick Moorhead, fundador de Moor Insights & Strategy. “Las empresas con inclinaciones propietarias necesitan una escalera, tiempo de mercado, costo o preeminencia de servicios de 5X para tener éxito. Tanto Operai como Anthrope están siendo superados por Open [source AI]. “
Muchos proponentes de IA de código libre han predicho durante mucho tiempo la mercantilización de los modelos de IA. “Si estos modelos resultan ser asaz capaces, lo que positivamente se ven, y son muy baratos, entonces hay un mundo donde las empresas dejan de usar OpenAi a escalera”, dijo William Falcon, CEO de Lightning Ai, una plataforma de software Eso permite a los usuarios entrenar e implementar modelos de IA de código libre, incluidos Deepseek's.
“Eso igualmente pone en duda la valoración de todas estas compañías”, dijo, aunque señaló que OpenAi, que a octubre de 2024 estaba valorado en $ 157 mil millones, y antrópico, que actualmente está recaudando cuartos en una valoración de $ 60 mil millones, Do Do Do Tener miles de millones en ingresos y son menos especulativos que otras nuevas empresas como Cohere y Mistral, que según él “van a ser las que más afectan por esto”.
Adicionalmente, el éxito de Deepseek muestra que los desarrolladores de código libre ni siquiera tienen que descubrir toda la fórmula secreta creada por una compañía de modelos cerrados como OpenAi, agregó Falcon. Solo necesitaban algunas técnicas mejoradas para hacer que la capacitación del maniquí sea más válido.
Esas mejoras, agregó, serán implementadas rápidamente por otras compañías, incluidas OpenAI, Anthrope, Meta y Google. “Me sorprendería si, desde el viernes, no lo hubieran sujeto, lo implementaran, y probablemente ya lo aplicaron”, dijo.
Sin requisa, si acertadamente este es definitivamente un momento para ser introspectivo sobre por qué los principales investigadores de IA de EE. UU. No descubrieron estas técnicas por su cuenta, no significa que toda la posición de mercado de Estados Unidos sobre la IA positivamente se deshace, o el futuro de Openi o Anthrope es inestable.
“Soy escéptico de que vamos a ir [billions of Nvidia chip commitments] Desde Microsoft y todos los demás hasta, oh, solo necesitamos cientos para capacitar a estos modelos fronterizos ”, dijo Daniel Newman, CEO y analista de The Futurum Group, y agregó que OpenAi y otros investigarán la precisión de las técnicas de profundidad y arriesgarse si Sus resultados se pueden replicar e implementar.
Vaibhav Srivastav, un investigador de la plataforma de código libre que abraza la cara, enfatizó que no creía que OpenAi, Anthrope y otras compañías maniquí estén en problemas profundos. “Creo que el foso actual está en la capa de aplicación”, dijo, lo que significa que el valencia para estas compañías radica no solo en la creación de modelos sino en cómo esos modelos se integran en las aplicaciones. Sin requisa, agregó: “Creo que Deepseek debe ser un momento humillante para ellos”.
Sin requisa, los expertos en IA de código libre dicen que no hay SchadenFreude. De hecho, dijo Falcon, se proxenetismo de mover la pelota AI alrededor de delante, incluido con OpenAi. Si OpenAi no se hubiera “ido vago” en términos de compartir su investigación abiertamente desde el divulgación de ChatGPT, dijo, los Estados Unidos probablemente estarían más allí en cuanto a capacidad, ya que la colaboración de código libre impulsa el progreso.
“Pero, por supuesto, Openai no habría sido una compañía tan prócer”, dijo. “Y China estaría tan por delante”.
Pero hay un construcción irónico más irónico en la novelística de Deepseek, dijo Cohen. ¿Qué pasa con Meta, que ha pasado los últimos dos primaveras promocionando Fogosidad, su comunidad de modelos de IA abiertos gratuitos? Posteriormente de todo, Meta se ha posicionado como la antítesis de OpenAi y antrópico, sin requisa, Deepseek ha surgido de repente como el real interruptor de código libre. Según los informes, Meta ha reunido cuatro “salas de supresión” de ingenieros para objetar a los posibles desarrollos de IA de Deepseek.
“Operai puede ser costoso y patentado, pero siguen siendo la plataforma más utilizada por órdenes de magnitud”, dijo. “De todos modos, les irá acertadamente por un tiempo”. La verdadera pregunta es, dijo: “¿Qué demonios está haciendo Meta? Esto era suyo para perder “.
Esta historia apareció originalmente en fortune.com