La información de Apple enseñó los nuevos modelos de IA: 4 notas interesantes

Durante el WWDC25, Apple anunció nuevas copias de sus modelos de construcción. Ahora han publicado, han publicado cómo estos modelos aprendieron el informe técnico. Y el informe consiste en algunas cargas en tiempo real de las clases de edad de la edad.

En un documento completo «Modelos de Apple – Informe tecnológico 2025«La compañía está caminando a través de numerosos aspectos de los nuevos modelos, incluida su arquitectura, capacitación preliminar, estudios de libros de texto, optimización, desarrollo, optimización, desarrollo, optimización, desarrollo, optimización, desarrollo, optimización, desarrollo, optimización y herramienta de etiquetado.

Modelado de modelos de Apple Models. Imagen: manzana

Es muy técnicamente, pero muy valioso si desea ingresar a las tuercas y pernos. Aquí hay algunos de especial particularmente interesantes especialmente.

El modelo local se dividió en dos bloques

Ya sabíamos que el modelo de Apple de Apple (un desarrollador) alcanza los 3 mil millones de parámetros. Ahora la compañía ahora se detalla que este modelo en realidad se divide en dos bloques:

«El bloque 1 62.5% tiene la longitud total de las capas del transformador, mientras que el bloqueo del 2 37.5% tenía capas de ejecución de ejecución de ejecución clave, pero tenía predicciones y valor clave».

En la práctica, esto significa que el modelo local requiere menos del 37.5% para los primeros caracteres (principalmente, la sección de la palabra). Sin embargo, el Sparit de Apple ha construido el Sparit de modo que en la forma en que dice la actividad general del modelo y la calidad del producto.

VS Apple Internet vs modelos externos sobre los conceptos básicos de representación. Imagen: manzana

Como nota, hace unos años, se publicó Apple Este entrenamientoEsas son partes muy impresionantes de Lolla entre RAM y Almacenamiento Flash, que necesitaban obtener el modelo local, que está en la memoria del dispositivo.

Cuando Apple finalmente consiguió el otro lado, marcando diferentes formas locales de ofrecer un buen rendimiento local, incluso se probaron los dispositivos más productivos.

Happy Cloud Model tiene una arquitectura creativa

Para su modelo de servidor, Apple, Apple está hecha de una arquitectura personalizada hecha para el combutador de cercanías de Apple Clainate. Se llama por el seguimiento de trackel paralelo (PT-MOE) y cuánto trabajo es muy bueno.

En una gota (y a riesgo de dejar caer cosas), una mezcla de expertos se divide en lugar de un gran modelo de IA (o expertos), solo cuando la tarea está relacionada con algo, solo están activos cuando la tarea es activa … buena, experta.

Entonces, si está cocinando para usted, solo se activan los expertos, mientras que otros están inactivos. El resultado sigue siendo un gran ejemplo, pero el diseño de su módulo le permite funcionar en relación con cada solicitud.

Aquí hay una mezcla de expertos IBM, en caso de 8 minutos para la copia de seguridad.

https://www.youtube.com/watch?v=sdlvyvyjyn4

Apple ha construido un nuevo tipo de transformador invitado al transformador paralelo y luego lo ha expandido con una mezcla de expertos (MF). Estos caminos son muy complejos pero el gest es:

Transformadores tradicionales procesaron personajes procesados a través de un solo almacén de capas, uno tras otro. En lugar de usar este enfoque único para calcular cada signo, el diseño de Apple divide el modelo en múltiples tratados, paralelo. Cada canciones siguen de forma independiente y solo se pueden coordinar en algunos puntos.

Luego, dentro de cada ruta, reemplazó la otra capa de transformadores con una capa MF, mientras que el resto activará más de unos pocos expertos. Y debido a que cada una de sus tribus tiene sus expertos locales, el modelo evita la complejidad de que todo debe coordinarse en todo el sistema.

Además del conjunto sabio, que equilibra la base local con una gran comprensión (nombre, que es muy sustancial, eficiente y escala, pero hay un delgado.

Apple ha alcanzado el 275%

Uno de los más grandes del mayor rollo principal de Apple (pero sin embargo limitado del inglés). Con sus nuevos modelos, Apple amplió el soporte del idioma y el documento se utiliza para realizar esto.

Según el documento, Apple aumentó en un 8% a 30%. Esto incluye contenido orgánico y sintético.

El tokenizador de manzana también aumentó (en su mayoría diccionario modelo modelo) 50%. Esto significa que su modelo ahora conoce la cantidad de signos diferentes de 100 personas.

La compañía dice estos cambios en «logros significativos» en el desempeño de indicadores anormales, especialmente después del fortalecimiento.

En el departamento, Apple explica que la evaluación de otros discursos de los otros contornos y el modelo suena en la precisión local. Si esto sonaba, lea la cobertura de esta investigación del estudio de Apple.

En la práctica, todos significan que las características como las herramientas deben funcionar más en los detenidos.

¿De dónde vino su fuente?

Al igual que sus primeros modelos, la mayoría de los datos educados provienen de la edición web. Pero Apple dice Applebot Applebles robots.txt La gente significa que si el sitio web no quiere que Apple Stab deje su contenido, solo puede dejarlo y dejarlo solo.

Dijo aquí, dice que fue activado para sus nuevos modelos:

  • Información pública al sitio: Aunque Apple no define la cantidad o proporciones, dice la mayoría de su información educativa de Applebot en el sitio web de las páginas web. Apple usó capas de filtro para eliminar el bajo contenido, los textos peligrosos, peligrosos o con pechugas, o el texto o el formato rotos.
  • Información permitida: Apple no detalla en detalle, pero aprueba que algunos datos de capacitación tenían licencia. Informes anteriores se ofrecieron a ser Apple con Capé Nast, «Periodistas y parques y parques) para al menos algunos artículos.
  • Información sintética: Se incluyen modelos pequeños y tuberías personalizadas, especialmente para regular las matemáticas, el código y las tareas de copia de seguridad. Mientras que la compañía también muestra que esta cantidad de datos marca que los datos sintéticos han jugado un papel importante en los pasos clave, como la configuración, el estudio de manera sostenible, el estudio sostenible y un apoyo de varios días. Y si se pregunta qué información sintética significa «el elemento hecho construido», explicamos por qué no lo es.
  • Datos visuales: Para apoyar la comprensión de la imagen, Apple ha reunido más de 10 mil millones de imágenes, incluidas capturas de pantalla con OCR y notas manuscritas. También utilizó sus modelos para generar titulares adicionales. El pasado se informó que Apple ha realizado una negociación de licencias con la estrella, por lo que este material también lo ha hecho en él.

9to5mac

No hubo escasez del drama interior de Apple, no había combinación del dispositivo interno de Apple y la capacidad de requerir muchos horarios.

Sin embargo, el hecho de que la Apple no incluya el hecho de que la Apple es el siguiente, no significa que la compañía todavía esté en pie. Este informe proporciona una idea interesante de las calificaciones subterráneas (y deficiencias) de los últimos minutos, los últimos modelos ACLE, junto con un enfoque generalizado de la privacidad, donde las empresas están trabajando.

FTC: Utilizamos el ingreso de enlaces atractivos. Más.

Fuente