Posicionado, como muchos otros en este momento, en la burbuja del mercado de Genai, chino Veterano Adelante. Por lo tanto, el inicio ha presentado R1, una versión de código abierto de su modelo de lenguaje grande (LLM) capaz de razonamiento complejo, incluidos 671 mil millones de parámetros y reclamando un rendimiento mayor que O1 de OpenAI en criterios clave. "Deepseek-R1 alcanza un puntaje de 79.8 % de pase@1 fuera del Aime 2024, que excede ligeramente OpenAI-O1-1217", dijo la compañía En un documento técnico. “En Math-500, alcanzó un puntaje impresionante del 97.3 %, con actuaciones equivalentes a las de OpenAI-O1-1217 y claramente superior a las de otros LLM. Para las tareas de codificación, Deepseek-R1 obtuvo una nota ELO de 2.029 en el código CodefoCes y superó el 96.3 % de los participantes humanos durante una competencia, agregó la compañía.
“Para las tareas relacionadas con la ingeniería, Deepseek-R1 es un poco más eficiente que Deepseek-V3 [un autre modèle de l'entreprise]lo que podría ayudar a los desarrolladores en tareas reales ", dijo el proveedor chino. R1 está disponible en la plataforma de desarrollo de la licencia del MIT que abraza el MIT, lo que permite el uso inútil comercial. La compañía también ofrece versiones de su modelo, que van desde 1.5 mil millones a 70 mil millones de parámetros, el más pequeño puede operar en una computadora portátil. La versión completa de R1, que requiere más eficiente equipo, a través de un costo de costo a 95 % capaz de operar en una computadora portátil. El modelo de razonamiento, R1 en sí verifica sus resultados, lo que reduce los errores actuales en otros modelos.
Un retraso chino para llenarse contra Estados Unidos
La carrera por la construcción de modelos de idiomas se ha intensificado, en particular debido a la evolución de las realidades geopolíticas. "Si Operai y otras compañías con sede en los Estados Unidos, sin duda, tienen la ventaja de la primera llegada, China ha invertido mucho en IA para fortalecer sus capacidades y ocupar el segundo lugar en el podio", dijo Sharath Srinivasamurthy, vicepresidente de IDC. En aplicaciones corporativas reales, el rendimiento de Deepseek-R1 en medidas clave se traduce en capacidades de razonamiento matemático mejorado, resolución de problemas y tareas de codificación.
Rendimiento comparativo de Deepseek-R1 contra otros LLM. (Crédito: Deepseek)
"Aunque esto sugiere que Deepseek-R1 podría superar el O1 de OpenAI en escenarios prácticos que requieren estas habilidades específicas, el resultado final aún depende de varios factores dentro del ecosistema IA más amplio, como la preparación de datos, el soporte para los trapos y los agentes, la integración de las herramientas de Modelopus y DevOps, el soporte para la infraestructura de la nube y la gobernanza AI", dijo Charlie Dai, Vivesides, y el analista de Infraestructura de la Cloud, y el Vivesides de la Cloud. Si el rendimiento más alto anunciado por R1 es atractivo, su eficiencia real sigue siendo incierta debido a la falta de claridad sobre los conjuntos de datos en los que se formó ", los modelos solo valen los datos sobre los que se han capacitado", dijo SrinivasMhy. El potencial radica en el procesamiento de múltiples modalidades, como el texto y las imágenes.
Un potencial de uso por parte de las empresas
La licencia del MIT de Deepseek-R1, que ofrece uso y personalización comercial sin restricción, así como sus costos reducidos, lo convierte en una opción atractiva y rentable para una adopción en las empresas. Sin embargo, es posible que tengan que tener en cuenta los costos adicionales asociados con la licencia MIT, como la personalización, la ajuste fina y la adaptación del modelo para satisfacer las necesidades específicas de la compañía para obtener un mejor retorno de la inversión, según Mansi Gupta, analista principal de Everest Group.
Las empresas ubicadas fuera de China también pueden ser reacias a usar sus datos para formar el modelo o integrarlos en sus operaciones debido a los desafíos regulatorios que afectan la adopción de IA. "Las empresas deben evaluar cuidadosamente los riesgos geopolíticos vinculados al uso de la IA, en particular para las operaciones mundiales", dijo el Sr. Gupta. “Estos incluyen navegar las regulaciones chinas y llevar a cabo evaluaciones de cumplimiento y análisis de riesgo en profundidad. Al final, la adopción de R1 dependerá de la capacidad de las empresas para optimizar el compromiso entre su potencial retorno de la inversión y estos desafíos geopolíticos y regulatorios. »»
Otras noticias que te pueden interesar