Modelo gratuito Deepsek-V3-0324 lanzado

Startups con sede en China Deepseek liberado Su último modelo de idioma, Deepseek-V3-0324. Está autorizado en el MIT y está disponible para descarga gratuita en Huging Face. El modelo está abierto para uso personal y comercial.

Deepseek-v3-0324: un modelo potente pero accesible

Deepseek-v3-0324 es el tamaño de 641 gigabytes. Funciona de manera eficiente en el hardware del consumidor, incluido Mac Studio con el Ultra M3 M3 de Apple. El modelo tiene 685 mil millones de parámetros, lo que lo convierte en uno de los modelos más grandes en código abierto.

El investigador de AI Xeophon cree que puede competir con Claude Sonet 3.5 de antrópico. A diferencia del soneto, que requiere una suscripción paga, Deepseek-V3-0324 es completamente gratuito. Esto le da una gran ventaja en la accesibilidad.

Inteligente y más eficiente con la arquitectura MOE

Deepseek-V3-0324 utiliza la mezcla de arquitectura de un experto (MOE). En lugar de activar todos los parámetros simultáneamente, usa solo los más relevantes. De 685 mil millones de parámetros, solo 37 mil millones están activos en cualquier momento.

Esto reduce las solicitudes computacionales mientras mantiene el rendimiento. En las pruebas, se ha realizado Deepseek-V3-0324 y modelos con activaciones importantes. Esto lo hace más rápido y eficiente.

Nuevas características para un mejor rendimiento

El modelo presenta dos innovaciones clave:

  1. Atención latente de múltiples pruebas (MLA): esto mejora la forma en que el modelo mantiene el contexto en textos largos.
  2. Predicción múltiple (MTP): esto le permite generar más token al mismo tiempo.

Con estas características, la velocidad de salida del modelo aumenta en un 80%. El investigador de Apple Awni Hannun informó que las pruebas de Mac Studio mostraron una velocidad de 20 tokens por segundo.

Un cambio en el estilo de comunicación

Los usuarios notaron un cambio de tono. Antes de los modelos de Deepseek tenía un estilo de conversación similar al hombre. La nueva versión es más formal y técnica. Esto lo hace ideal para la investigación, la codificación y el uso comercial.

El impacto de Deepseek en la competencia AI

Deepseek-V3-0324 aumenta la competencia en el sector de IA. Al ofrecer una alternativa poderosa y gratuita a los modelos basados ​​en suscripción, Deepseek está remodelando el paisaje.

¿Qué opinas de este nuevo modelo? ¡Comparte tus pensamientos a continuación!

Descargo de responsabilidad: Podríamos ser compensados ​​por algunas de las compañías de las que hablamos de los productos, pero nuestros artículos y reseñas siempre son nuestras opiniones honestas. Para obtener más detalles, puede consultar nuestras pautas editoriales y saber cómo utilizamos enlaces de afiliación.

Compruebe también

Asus Vivobook Pro 15 debuta con Intel Core Ultra 9, RTX 4050 y OLED por $ 1500

ASUS ha lanzado Vivobook Pro 15 (N6506CU), una computadora portátil de 15.6 pulgadas dirigida a …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *