Artículos y Reviews . MICROPROCESADORES . Intel Prescott P4 2.8e Ghz

Intel Prescott P4 2.8e Ghz

Empresa:
Intel Corp
Modelo:
Prescott P4 2.8e Ghz
Autor:
Eagle
Fecha:
17-02-2004

Al fin llegó el tan esperado Prescott a los laboratorios de MaximoPC, como muchos ya sabrán, este es el nuevo procesador de Intel, basado en la tecnología Pentium 4 que introduce ciertos cambios a la arquitectura que le permitirán trabajar a velocidades más altas, este nuevo procesador de Intel se encuentra fabricado con la tecnología de 90 nm (nanometers) y promete ser sumamente interesante para los fanáticos del overclock, la versión que disponemos es la de 2.8Ghz y junto al motherboard Intel 875PBZ utilicé todo el conjunto de benchmarks a mi disposición para mostrarles a ustedes que tan bien funciona este nuevo juguete de Intel.

Para los que aún no saben que es Prescott pueden leer nuestro artículo anterior: "Presentación Intel Prescott".

Algunos Conceptos Básicos:

Antes de introducirme de lleno en el Review en cuestión, me gustaría exponer de la manera más sencilla posible lo que la palabra Pipeline significa en un procesador, como funcionan los Pipelines del mismo y en que se diferencian las distintas arquitecturas, ya que es fundamental para comprender al funcionamiento del Prescott.

Los pipelines en un procesador son el equivalente a, digamos, una receta de cocina, cuando escuchamos decir que un procesador tiene x cantidad de pipelines, lo que se está haciendo referencia es a las etapas de operación que el mismo tiene que pasar para leer una instrucción, decodificarla, ejecutarla, guardar los resultados, etc, que es básicamente todo lo que hace un procesador, ejecutar instrucciones y devolver resultados.

Si volvemos al ejemplo de cocina, digamos, que queremos cocinar Hamburguesas, sabemos que las hamburguesas constan de varias etapas: lechuga, tomate, huevos, etc, entonces, para cocinarlas dividimos en etapas el proceso:

  1. Cortar Lechuga y Tomate
  2. Cocinar Huevos
  3. Cocinar Hamburguesa
  4. Cortar el Huevo
  5. Unir el tomate, huevo, lechuga y hamburguesa
  6. Aplicar condimentos.

Sabemos entonces que con estos 6 puntos a seguir, se arma una hamburguesa (para el que no sepa como, después le paso la receta completa), en este caso, lo que estamos describiendo en comparación a un procesador sería uno de 6 etapas, pero, digamos que yo quisiera hacer más cosas en cada etapa, para así poder ahorrarme tiempo, podría distribuír la receta de la siguiente manera.

Ejemplo1
  1. Cortar Lechuga, Tomate y poner los Huevos
  2. Cocinar Hamburguesa
  3. Cortar el huevo
  4. Unir el tomate, huevo, lechuga, hamburguesa y aplicar condimentos.

En este caso, nos ahorramos 1 etapa, ya que el trabajo se encuentra distribuído entre las etapas restantes, trabajaríamos mas agitados, eso sí. También podríamos separar las etapas cada vez más.. de esta forma haríamos mucho menos trabajo por etapa y la receta se haría mas larga, así:

Ejemplo2
  1. Cortar Lechuga
  2. Cortar Tomate
  3. Cocinar Hamburguesa
  4. Cortar el Huevo
  5. Unir el Tomate
  6. Unir el Huevo
  7. Unir la Lechuga
  8. Unir Hamburguesa con el resto.
  9. Aplicar Condimentos.

En este caso, la receta, como pueden ver si hizo enormemente más larga.. pero a su vez, son menos las cosas que hacemos por cada punto, por ende trabajamos con más margen.

Ahora, dejando de lado la cocina (que ya me dió mucha hambre), que significa todo esto en el mundo de los procesadores?, como ya habrán podido imaginar, todo.

Los procesadores como AthlonXP, Athlon64 disponen de muy pocas etapas de pipeline, mientras que los Pentium 4 disponen de muchas, la diferencia radical entre ambos es la velocidad medida en Mhz y la cantidad de instrucciones que ejecutan por cada ciclo de reloj, si siguieron bien mi ejemplo de la receta de cocina, ahora entenderán perfectamente la diferencia entre ambas arquitecturas.

Imagínense al AthlonXP/Athlon64 como un procesador que sigue el Ejemplo1, esta arquitectura, tiene muchas cosas cosas que hacer en cada paso de su pipeline, como tal, tiene una mayor cantidad de eficiencia por clock, ya que se encuentra más ocupado entre cada etapa, pero, debido a que justamente posee cientos de cosas que hacer, no dispone del suficiente tiempo como para hacerlo más rápido (esto es un ejemplo bien sencillo, pero que es efectivo para comprender las limitaciones), ya que este procesador se encuentra mucho más ocupado, necesita de menos clock para realizar las mismas operaciones, pero no puede hacerlo a velocidades más altas, ya que su pipeline se saturaría facilmente.

Ahora, pasemos al Ejemplo2, Este sería el caso de un procesador Pentium 4 (no por las 9 etapas, ya que posee 20, sinó porque posee más etapas que una arquitectura AMD), en este caso, el procesador se encuentra mucho más relajado, ya que cada etapa de su pipeline ofrece menos trabajo por clock, por ende, el procesador no es tan eficiente como en el ejemplo anterior, ya que debe hacer las cosas mas rápido para obtener una performance similar, pero, gracias a que su pipeline se divide en más etapas, puede correr a velocidades mas altas sin saturar la arquitectura.

La diferencia como puede apreciarse entre las dos arquitecturas es de Velocidad y Operaciones por clock, gracias a las distintas formas de utilizar el Pipeline, es de común sabido que a más etapas de pipeline posee un procesador, más velocidad final (en Mhz) puede obtener, ya que es menos el trabajo que ejecutará por cada ciclo de reloj en los mismos y por ende tiene más libertad para subir el clock, pero por desgracia, esta implementación tiene sus consecuencias, ya que si el pipeline es lo suficientemente largo, caemos en problemas serios de performance, ya que si no se aplican las optimizaciones correctas en cada etapa de la arquitectura, el procesador puede bien desperdiciar enormes cantidades de tiempo, ya que su pipeline debe estar constamente lleno para que su operación sea eficiente.

Como se puede observar claramente, a más etapas de Pipeline se agregan, más difícil es mantener al procesador todo el tiempo trabajando.

La regla de oro es: el procesador va a ser tan rápido como lo sea su etapa de pipeline más lento, es por esto que es extremadamente delicado incrementar su Pipeline, ya lo vemos en la actualidad, AMD tiene problemas en subir su clock a más de 2400 Mhz de operación, gracias a su arquitectura, Intel decidió tomar otro camino y creó el Prescott.

El Prescott amplía el pipeline interno del Pentium 4 desde 20 a 32 etapas!!, este incremento enorme le traería consecuencias devastadoras si no fuera porque Intel se tomó la molestia de implementar ciertas optimizaciones en su arquitectura para que esto no suceda, los beneficios de este incremento se verán pura y exclusivamente en su capacidad de correr a velocidades de Clock más elevadas (por el ejemplo antes explicado) pero, le cuestan una cantidad de operaciones por clock incluso inferiores al ya conocido Northwood, esto quiere decir, que a menos que las optimizaciones sean lo suficientemente buenas, el procesador debería ser más lento que un Northwood de velocidad similar.

Veamos de que mejoras consta el mismo..

Cambios en la Arquitectura Prescott:

Improved Branch Predictor:

En todo procesador actual, existe una unidad especial encargada de determinar con precisión cual será el siguiente curso de una función determinada, los Branch Predictors generalmente trabajan con funciones if-then, predecir con éxito este tipo de comandos le permite al procesador ganar tiempo valioso en su ejecución final y por ende aumentar su eficiencia, generalmente las unidades de Branch Prediction constan de un cierto "buffer" donde se almacenan todas las condiciones if-then, un cambio lógico sería aumentar el tamaño del buffer y así poder almacenar más direccciones estáticas de predicción, sin embargo, el tamaño permanece igual en ambos (4kb), la diferencia entonces se refiere exclusivamente al método en el cual el Prescott maneja las predicciones que difiere sutilmente del método que utiliza el Northwood.

Cache L1:

Una de las muchas técnicas que Intel recurrió para mantener la performance del Prescott competitiva con el Northwood es ampliar el Cache L1 de datos de 8k a 16k de esta manera poder mantener más instrucciones residentes en el cache del CPU y poder levantar el nivel de trabajo de toda la estructura, recuerden que el Prescott necesita más que nunca todas las optimizaciones posibles para mantener con información la mayor parte del tiempo a sus pipelines si es que quiere obtener una performance aceptable, sin embargo, el incremento del Cache de Datos a 16k también aumentó la asociatividad a 8 y le trae al prescott una latencia ligeramente más alta que el NW.

Cache L2:

El caché L2 del Prescott se incrementó de 512k a 1024k, por desgracia, el aumento viene con un desagradable extra, posee una mayor latencia que en su hermano menor, en este caso, la latencia es considerablemente mayor que en el caso del L1 lo cual no es muy bueno que digamos.

Otras mejoras que el procesador posee se refieren al Scheduler y a las unidades de ejecución, si bien las mismas permanecen idénticas, se agregaron funciones extras que le permiten al procesador tener un mejor control sobre ciertas funciones aritméticas como Rotar y Multiplicar Números Enteros.

A pesar de que todas estas mejoras parezcan darle al procesador más performance, no se dejen engañar, estas mejoras tan solo sirven para "alivianar" el peso de tener que cargar con una etapa de Pipeline mucho más larga y por ende sirven exclusivamente para mantener un nivel de performance similar al Northwood.

Ahora sí, suficiente teoría por el momento ! pasemos a las fotos !!


Comentarios (1) | RSS 2.0

Páginas: 1 2 3 4 5 6 7 8 9 | Siguiente »

login

encuesta

¿Que procesador tiene tu PC?

  • AMD
  • Intel
  • Otros

Ver resultados

Ver encuestas anteriores