Lo nuevo de Intel

Review Intel Core 2 Duo (Parte 1)

14 de Julio de 2006

Conjuntamente con el lanzamiento oficial por parte de Intel de su nueva gama de procesadores "Core 2 Duo" basadas en Conroe, MaximoPC tuvo el gran honor de realizar un review sumamente intensivo sobre estas nuevas tecnologías. En la primera parte podrá ver la teoría detrás de la arquitectura y algunos resultados interesantes.

Presentación:

Se sabe que todo aquel que puede aprender de sus errores se hace más sabio. Esto puede aplicarse a las personas como así también a las compañías, ¿por qué no? Intel durante todo el año pasado vino sufriendo golpe tras golpe por parte de AMD y sus Athlon64. Cuando AMD sacó al mercado sus procesadores Dual-Core no quedaron dudas: la arquitectura NetBurst se encontraba en sus límites, no había nada que Intel pudiera hacer para salir de la situación bien parado. Pero, como bien dije al principio del texto, aquel que puede aprender de sus errores aprende lecciones muy importantes y fundamentales. En todos los puntos donde Intel falló en su serie NetBurst, es donde hizo hincapié en esta nueva arquitectura. E así como, basado en un diseño que hizo popular a Intel en su época, nace el Conroe, un procesador que viene a revindicar a Intel y que trae aparejado todo el beneficio del conocimiento que la empresa vino aprendiendo en todos estos años.

Un Poco de Historia:

Para los que no recuerdan cóomo sucedio la historia, paso a hacer una breve reseña de cómo llegamos a la época actual.

En el cuadro se pueden apreciar todas las microarquitecturas que se derivan de la actual arquitectura x86. Este juego de instrucciones es el que lleva de la mano a estos procesadores Intel como así también a los procesadores AMD ya que ejecutan código compatible. Mientras que el NetBurst (arquitectura original del Pentium4) se encuentra separada de la arquitectura P6 nace más tarde el Banias (el primer procesador eficiente para computadoras portátiles). Es exactamente de esta línea donde nace el conocido Pentium M. Es en este procesador donde Intel aprendió muchísimas cosas respecto del manejo de energía y todo ese aprendizaje sumado a la innumerable cantidad de investigaciones llevan luego a la creación de la arquitectura "Core", como la llama Intel. Esta "Core Architecture" es la base en la cual se encuentran formados todos los procesadores Core 2 Duo que vemos en la actualidad, entre ellos, el famoso Conroe.

Así es que, como ven, el Conroe tiene un largo camino de descendencia familiar y un largo trayecto de mejoras, lo que lo convierte en una arquitectura más perfeccionada que lo que el NetBurst pudo ser jamás. Ahora sí, luego de esta presentación, veremos a continuación qué tipos de modelos hay en la familia Core 2 Duo para luego adentrarnos de lleno en el análisis de la Arquitectura del "Core" de Intel. Vayan preparando la taza de café ya que éste será un análisis exhaustivo que espero deje satisfecho incluso al más exigente.

Core 2 Duo Desktop Family:

A continuación les dejo en esta tabla (es claro que todos se encuentran basados en la tecnología de 65nm así que no consideré necesario incluírlo en la tabla).

Procesador	Frecuencia	Codename	FSB	Multiplicador
Core 2 Duo E4200	1600 MHz	Allendale	800 MT/s	8x
Core 2 Duo E6300	1866 MHz	Allendale	1066 MT/s	7x
Core 2 Duo E6400	2133 MHz	Allendale	1066 MT/s	8x
Core 2 Duo E6600	2400 MHz	Conroe	1066 MT/s	9x
Core 2 Duo E6700	2667 MHz	Conroe	1066 MT/s	10x
Core 2 Extreme X6800	2933 MHz	ConroeXE	1066 MT/s	11x
Core 2 Extreme X6900	3200 MHz	ConroeXE	1066 MT/s	12x

Lo primero que puede notarse en la tabla es que existen modelos para Entry Level basados en la arquitectura denominada Allendale. Bien, la única diferencia para los que sean curiosos entre estos y los Conroe es su tamaño de Cache reducido a 2Mb compartidos y su velocidad de 800MT/s para el modelo 4200. Todo lo demás permanece similar, los modelos E6600 y E6700 basados en Conroe están orientados al Rango Medio, mientras que los modelos basados en ConroeXE están orientados al mercado High End.

Todos estos procesadores son Socket LGA775. Si bien en teoría es posible utilizarlos en los ya existentes motherboards con Chipset 975 para Pentium4 y Pentium D, el único impedimento es una pequeña modificación en la etapa de regulación del Motherboard por lo cual sólo aquellos motherboards basados en 975 que se lancen en estos días serán compatibles con Conroe. Por otra parte, el nuevo Chipset de Intel, 965 es totalmente compatible con Conroe ya que fue diseñado para el mismo y es más recomendado por Intel por sobre el 975 a la hora de armar un equipo exclusivo para este procesador.

Así es que Intel introduce hoy toda una gama de procesadores nuevos al mercado, junto a Woodcrest y Merom.

Aquí vemos en qué mercado se ubica cada uno.

Aquí vemos al Conroe, dedicado al Escritorio o lo que conocemos como el gran público en general.

El Meron que hace su debut en las computadoras portátiles.

Y finalmente el Woodcrest, que será el que se ubique en la posición de procesadores para Servidores.

Estos procesadores, como vimos en el mapa de arquitecturas, no tienen ningún parentesco con los procesadores Pentium4, Pentium D y Pentium EE que vimos anteriormente y se basan en el diseño del Banias. Por consiguiente, vamos a adentrarnos ahora de lleno en la microarquitectura de esta nueva generación de procesadores de Intel para ver qué es lo que realmente lo separa de la generación anterior.

Analisis de Arquitectura:

Enfrentados a todos los problemas y limitaciones que la arquitectura NetBurst les dió en los últimos dos años, los ingenieros de Intel se propusieron dos metas fundamentales en esta nueva arquitectura: una es una mayor performance por clock que la arquitectura anterior y la otra es un menor consumo de energía. Son 2 metas que curiosamente van en contra de lo que Intel nos estuvo mostrando en sus últimos procesadores Presler, por ejemplo. Aquí es donde vemos cómo las falencias en la arquitectura NetBurst no fueron tomadas como una derrota por parte de Intel sinó como una forma de poder mejorarse y es justamente por eso que las metas que se impusieron esta vez fueron bien claras y muy exigentes.

En cualquier diseño de procesadores, hay ciertas variables matemáticas que se deben respetar, ya que son éstas las bases para lograr una arquitectura eficiente. Estas son, "C dynamic", Voltaje y Frecuencia. Estas 3 variables dictan el consumo, frecuencia y movimiento de bits a lo largo de una arquitectura determinada. Debido a que estas variables se encuentran conectadas entre sí cualquier modificación a una, afecta a la otra.

Lo primero que vemos es que la relación Voltaje x Frecuencia es 2 veces mayor. Esto quiere decir que por cada vez que el procesador sube linealmente su frecuencia de operación, aumenta de forma cuadruple su consumo de energía, esto es perfectamente válido en Overclocking, ya que aplicamos el concepto opuesto para la misma ecuación, cuando un procesador llega a su límite de clock, es necesario subir el voltaje para permitirle obtener un clock más alto. Pero, como bien vemos en la ecuación, es necesario cuadruplicar el voltaje necesario para apenas subir linealmente su frecuencia. Al ver estos valores, se hizo claro para Intel que elevar su frecuencia de operación no es una opción, como tampoco jugar con el voltaje. La otra forma de elevar la performance de un procesador es claro está aumentando la cantidad de unidades de ejecución que conlleva en general, a aumentar la eficiencia, esto es, la cantidad de instrucciones por ciclo de reloj que un procesador puede realizar, pero es aquí donde aparece la siguiente limitación.

El valor que todavía no mencionamos es el "C dynamic", explicar el funcionamiento de esta variable digamos que no es muy fácil, y es por eso que voy a intentar expresarlo en castellano, para que pueda ser entendido. C dynamic es el valor que expresa el producto de un área de actividad de bits, o lo que es lo mismo que decir "cuantos bits" existen en un momento dado en nuestra área determinada, para este caso, el procesador. La cantidad de bits que en un momento determinado se mueven en el procesador determina el érea total del "C dynamic". Como pueden ver, es un área no definida por un espacio físico ni por silicio, sinó más bien por "bits activos" en la arquitectura. El problema con esta variable es que a mayor número de bits activos existe, claro está, mayor energía, y por ende, se eleva nuevamente el voltaje del procesador, negando toda posibilidad de lograr una arquitectura con bajo consumo.

Para elevar efectivamente la performance, se deben aumentar la cantidad de unidades de ejecución, esto conlleva a una mayor cantidad de transistores y por ende, potencialmente mayor cantidad de bits activos en un momento dado en el procesador. Esto directamente nos lleva a un aumento en el nivel de energía que el procesador consume y por ende, aparece nuestro dilema.

El problema se evidencia en procesadores como el Presler, donde una excesiva cantidad de transistores y su largo Pipeline de Ejecución provocan una gran cantidad de "bits activos" combinado esto con la baja eficiencia de instrucciones por segundo y con una alto clock elevan el consumo de energía a niveles desproporcionados, es por esto que el proceso de manufactura no afecta ni contribuye automáticamente a una mejor eficiencia en el procesador ni en el consumo, ya que el area de "C dynamic" no se encuentra definida por un proceso de miniaturización.

Aquí Intel se enfrenta a su segundo dilema, ya que debe lidiar con el problema de mejorar la arquitectura por medio de una mejor unidad de ejecución sin que esto introduzca una mayor carga de "bits activos", para lo cual recurrió a una serie de "trucos" por así decirlo que aprendió a lo largo del tiempo y por sobre todo con sus últimos procesadores Pentium-M. Acompañenme en el análisis de la arquitectura y descubramos que es exactamente lo que hizo Intel con su "Core Arquitecture"

Las Cinco Claves para el Exito:

En base a esta descripción, vamos a analizar punto por punto para investigar porque esta nueva arquitectura es mas eficiente y consume menos energía.

Aquí vemos un diagrama de la arquitectura completa, con sus 4 unidades de ejecución, el Cache compartido de 2M/4M dependiendo del modelo de procesador, la unidad de ejecución fuera de orden, el Scheduler y el Instruction Fetch y PreDecode, vamos a analizar cada punto por separado.

Intel Wide Dynamic Execution:

Como expliqué anteriormente, una de las claves para mejorar la eficiencia de la arquitectura es la inclusión de una unidad de ejecución mas amplia, en este caso, se trata de 4 unidades y viendo que su Pipeline de operación es bastante corto con 14 estados (recuerden que uno de los primeros Pentium4 ya tenían mas de 20 stages), esto le permite al Conroe obtener una mejor performance por Clock que sus hermanos basados en NetBurst, sin embargo, una unidad de ejecución mas amplia no garantiza automáticamente un procesador eficiente por lo cual Intel introduce algunas capacidades extras a la arquitectura Core

La nueva arquitectura ahora puede manejar hasta 4 instrucciones por ciclo de reloj, esto implica que puede hacer un "fetch", "dispatch", "execute" y "retire" de hasta 4 instrucciones completas por ciclo de reloj, esto le da una ventaja con respecto a procesadores AMD como también los propios Pentium4/D que tan solo pueden manejar 3 por ciclo de reloj, además de esto, Intel perfecciona la unidad de "decode" de la siguiente manera.

La nueva característica se denomina "Macro-Fusion", como funciona, primero veamos como se realiza la ejecución de instrucciones en una arquitectura moderna. Para que una instrucción sea exitosamente ejecutada, debe pasar primero por la unidad de "decodificación" que se encarga de convertir esa instrucción a una denominada "micro-op" que en pocas palabras es una micro operación que puede ser entendida por la unidad de ejecución. Todas las intrucciones que llegan al procesador son entonces convertidas a "matro-ops" antes de ser ejecutadas. Ahora bién, cuando Intel se encontraba investigando como mejorar la efectividad, descubrió que ciertas instrucciones tenían cierta afinidad con otras y que podrían "fundirse" para abreviar el trabajo y así mejorar el rendimiento, a esta técnica la denominó "Macro-Fusion".

Cuando 2 instrucciones que son candidato a ser fundidas se encuentran, estas se mandan a la unidad de decodificación que determina la "fusión" de estas instrucciones que luego le permitiran ser representadas por una simple "micro-op", por lo tanto, una vez que esta micro-op llega a la unidad de ejecución, la misma es vista como una instrucción simple, esta abreviación no solo elimina una enorme cantidad de datos que le permiten aumentar el rendimiento de las unidades de ejecución, sinó que al fundir instrucciones, reduce considerablemente la cantidad de micro-ops que debe ejecutar por ende aumentar la efectividad del procesador, dándole la apariencia de tener una unidad de ejecución mucho mas ámplia y a su vez bajando el valor de la variable "C dynamic" que vimos anteriormente gracias a que ahora hay muchos menos "bits" en un momento dado. Aumenta la simplicidad, baja el tiempo de ejecución y mantiene el consumo en un nivel bajo.

Podemos ver como se indica un 15% de reducción en cantidad de instrucciones lo cual implica un 10% de reducción en la cantidad de micro-ops que son enviadas a las unidades de ejecución.

Intel Advanced Digital Media Boost:

Aquí tenemos otro de los cambios interesantes que Intel implementa en esta nueva arquitectura, se trata de la adición de unidades de decodificación de operaciones SSE que permiten procesar bloques completos de a 2 pares, lo que implica 64bit + 64bit, anteriormente, el máximo disponible en todo momento para ejecutar instrucciones SSE era de 64bits.

Intel descubrió que en muchos programas de Encoding de Media, sobre todo Video Encoding, el CODEC encargado del encoding manda numerosas cantidades de instrucciones en grupos de 4, esto se debe a que principalmente un Encoder de Video, tal como el DivX o H264 basa sus algoritmos de compresibilidad en el analisis de la imagen por "bloques" de 4 coordenadas, estos bloques que generalmente son de 8x8, como tambien de 4x4 y 16x16 dependiendo de la compleijdad del Codec y del nivel de presición con el que esté encodeando, son recibidos por el procesador como conjuntos de operaciónes y datos en grupos de 4, este tipo de agrupación es tan común que Intel decidió implementar una unidad exclusiva para operaciones SSE (que afectan también SSE2, SSE3) y que permiten en un solo ciclo de reloj procesar 128bits (lo que equivale a este grupo de 4 datos, 32+32+32+32).

Anteriormente se debía sacrificar un ciclo de reloj para poder correr estos grupos de 4 y así utilizar 2 ciclos de reloj por cada grupo.

Ahora, tengan en cuenta, que el Core 2 Duo no dispone de 1 procesador, sinó 2, lo que implica que en el caso de un Codec de compresión de video, el Core 2 Duo "Conroe" es capaz de ejecutar (con Multithreading presente) hasta 128 bits por procesador o lo que es lo mismo que 256bits de instrucciones SSE o lo que también es lo mismo que decir hasta 8 instrucciones SSE en un solo ciclo de reloj !.

Intel Smart Memory Access:

Lo que Intel denomina como Smart Memory Access es conocido mejor entre sus Ingenieros como "Hardware-Based Memory Disambiguator"

Lo que ocurre aquí es lo siguiente, recuerden que estamos lidiando con un procesador que ejecuta instrucciones fuera de orden "Out of Order Execution", este tipo de ejecución le permite decidir con libertad que tipo de instrucciones son ejecutadas y con que orden. Sin embargo, existen ciertas condiciones que deben cumplirse. El ejemplo que usa Intel es muy claro y divertido a la vez, supongamos que nos levantamos a la mañana y nos queremos poner las medias, que medias les parece que podría uno ponerse primero, la del pié izquierdo o el pie derecho? que diferencia hay !, por supuesto que ninguna, siempre y cuando no exista una condición mayor que invalide nuestra libertad de elección, como lo es... "que pasa si quiero ponerme los zapatos", esto implica, que existen ciertas reglas, no puedo ponerme la media izquierda y el zapato derecho si no cumpli primero con la condición de finalizar con las medias primero, mientras mi condición no se vea afectada por una condición siguiente en la cual me vea obligado a finalizar la primera, el orden no necesariamente tiene que ser respetado.

El ejemplo de las medias y los zapatos se aplican entonces a lo que en idioma de procesadores se conoce como "Load" y "Store"

slide_11_460

El ejemplo de Load y Store es un ejemplo en donde una regla debe respetarse bajo la condición de que un evento debe cumplirse previamente al siguiente, por ejemplo, para que una carga se produzca, se deben haber almacenado "store" previamente todos los valores, para evitar "conflictos" de datos, porque puede darse el caso de que se desee cargar un dato que se almacenó previamente, así es que no se puede permitir "saltear" el store, esto presentó un problema para los Ingenieros de Intel, porque se da en muchos casos que en efecto, sería muy efectivo dejar que un Load salteara un Store, para evitar cuellos de botella en el procesamiento, pero sencillamente no sería posible, porque no habría manera de saber en que dirección se realizará el "store" hasta el momento que se ejecute, por consiguiente este es un problema que se mantuvo a lo largo de todo el desarrollo de la arquitectura x86 hasta ahora, ya que Intel desarrolló un mecanismo para "predecir antes de tiempo" si efectivamente un Load conflictuará con "store" y así poder permitir que este lo saltee, esto les permitió poder mejorar el tiempo de ejecución y exceptuando algunos casos donde a pesar de que la predicción no indique problema, en efecto se produzca una colisión, el mecanismo permite "recrear" el escenario para volver a ejecutar el Store y Load para evitar que esa colisión se produzca. Como estos casos de colisión son mucho menores a los casos en donde la predicción es correcta y tiene éxito, el procesador gana eficiencia al saltear stores que permiten liberar el flujo de instrucciones que de otra manera crearían paradas de espera en la ejecución.

Nuevamente, como se evitan una gran cantidad de "store" que de otra forma serían forzados, se reduce la cantidad de acciones y por consiguiente bits en movimiento que reducen el consumo de energía.

Intel Intelligent Power Capability:

Debido a que el consumo de energía es el punto mas importante para Intel en esta nueva arquitectura, se tomaron pasos intensivos para llegar al nivel incluso mas pequeño en lo que respecta a control de la energía que se administra a cada parte del procesador.

Como dicen los Ingenieros de Intel, el acercamiento que emplearon es el mismo que el de la Ley hacia las personas, "Ninguna parte del procesador es digna de ser utilizada hasta que demuestre lo contrario", y así es, la arquitectura Core utiliza un nivel muy refinado de desactivación a nivel "gating" que le permite desactivar prácticamente enormes cantidades del procesador cuando no se usan y deberán realmente demostrar una necesidad de utilización para re-activarse, esto salva una enorme cantidad de energía que no se utilizará bajando el consumo y la generación de calor.

Existen varios modos de Sleep incluso hasta el modo que intel denomina "Deep Sleep", lo interesante de esta tecnología es la parte de "Intelligent", como su nombre lo indica, existen momentos donde en general, el procesador no se encuentra haciendo demasiadas cosas, imaginen un escenario, donde un procesador Dual Core, se encuentran en la pantalla inicial de Windows con tan solo un programa de Mensajeria y un navegador abierto, en este tipo de casos e incluso cuando nos encontramos jugando con algun juego que no utiliza Multithreading, es común que uno de los Cores (e incluso gran parte de tiempo del otro) no se utilicen, en este caso, la tecnología de ahorro de energía es capaz de desactivar enormes porciones de sistemas del procesador en desuso, incluso al nivel de dejarlo casi en standby, lo interesante es que no solo se realiza mediante Speed-steep (reducción del multiplicador) sinó que se realiza a nivel muy interno (como vemos en el gráfico) a nivel transistores, lo cual le permite tener un control casi absoluto de que es lo que hace cada parte de la arquitectura y que partes pueden desactivarse, esta tecnología se encuentra "fínamente" perfeccionada desde el Pentium-M, recuerden que su antecesor fué un procesador para computadoras portatiles donde el ahorro de energía es absolutamente importante.

Intel Advanced Smart Cache:

Como su nombre lo indica, el SmartCache tiene una gran peculiaridad, es un Cache Compartido.

Debido a que el Cache se encuentra compartido entre ambos Cores en la arquitectura (observen los puntos de conexión indicados con un símbolo de sol) ambos procesadores son capaces de compartir la misma información, esto tiene 2 ventajas principales.

Primera y principal, al ser información compartida, una vez que un procesador almacena una información necesitada en el Cache, el otro procesador automáticamente puede hacer uso de la información y la segunda ventaja es, que se evita un acceso al sistema lo cual aumenta el ancho de banda disponible sin caer en la memoria principal con su mayor latencia, esta reducción de busqueda al bus principal de la memoria trae aparejado el efecto de mejorar la performance del sistema, ya que al recurrir menos al BUS se reduce considerablemente el trafico.

Muchos preguntarán en este punto final del analisis, porque Intel decidió no implementar un controlador de memoria interno y creo que la respuesta es mas que obvia a estas alturas, la incorporación de un controlador interno ocuparía un espacio extra y consumiría recursos que de otra forma pudieron utilizarse para mejorar la arquitectura a un nivel que se hace muy poco dependiente del controlador de memoria, ya que debe acceder a el con muy poco menos frecuencia, el resultado es una arquitectura que puede seguir sostenciendose bajo el concepto de Front Side Bus con el controlador de memoria residiendo en el Chipset. Como pueden observar, las ventajas que pueda tener una arquitectura AMD64 con respecto al controlador de memoria son facilmente oscurecidas por la cantidad de accesos que deben realizar al sistema, ya que sus Cache L2 de procesador no se comparten.

Ya pueden apreciar la cantidad de cosas que Intel hizo en su nueva arquitectura para bajar el consumo de energía a la vez que se sube la eficiencia, es notable ver lo bien que se eligieron cuidadosamente las capacidades de esta nueva arquitectura, es justo decir que es "Revolucionaria", no porque estemos hablando de una arquitectura que se diseño desde 0, sinó porque a criterio de lo que puede hacerse en un procesador para mejorar su desempeño, absolutamente todo lo que hizo Intel esta bien hecho, es curioso, como antes hubiera podido criticar los cambios introducidos en uno de sus modelos Pentium4 y como ahora debo hacer lo mismo pero con una critica muy positiva, si en la serie NetBurst cometieron muchos errores que llevaron a una falta de eficiencia, aqui todo lo que pudieron hacer lo hicieron bien y el producto es una arquitectura que debería ser ahora mucho mas balanceada y permitir una mejor operacion con niveles de consumo que no requerirían las soluciones exageradas que requerían sus procesadores anteriores. Eso de por si es un logro fenomenal.

Bien, esto finaliza nuestro analisis de la arquitectura Conroe, espero les haya gustado y en obsequio les dejo la primera parte de la evaluación de Benchmarks, para los que no gustan de la teoría.

Evaluación de Procesadores: (Allendale - Conroe)

Tenemos el gran honor de no sólo recibir un Conroe, sinó también un Allendale, los modelos que Intel nos envió para análisis son los siguientes:

Intel Core 2 Duo "Allendale" E6300 de 1.8Ghz / 2Mb Cache Shared (DDR2-667) - 1066Mhz FSB.
Intel Core 2 Duo "Conroe" E6700 de 2.66Ghz / 4Mb Cache Shared (DDR2-800) - 1066Mhz FSB

Debido a que esta primera parte ya se hizo de por si muy extensa y ademas ustedes conocen nuestro estilo de dejar lo mejor para el final, vamos a terminar el análisis mostrandoles primero como resultó en nuestras pruebas el procesador concerniente al rango "entry-level" de la mano del Allendale, en nuestra proxima parte, vamos a someter al Conroe a todo tipo de torturas (ya que tuvimos mayor oportunidad de trabajar con el) así es que pueden esperar el doble de tests que los que verán ahora.

Packaging:

Antes de pasar a la evaluación, veamos como luce el Allendale.

La caja en la que se nos entregó el procesador.

Aquí vemos al procesador, que luce exactamente igual a un Pentium D

Tanto de frente como de atrás, el procesador puede ser fácilmente confundido con un PentiumD o Pentium 4 sin embargo, dispone de prácticamente el doble de capacitores en la parte trasera, probablemente debido a la mayor cantidad de Cache incluído en el CPU.

Máquina de Prueba:

La máquina de prueba donde se analizó el procesador es la siguiente:

Intel DG965RY (965 Chipset)
2x Corsair XMS8500 DDR2-1066 ( @DDR2-667)
MSI Geforce 7900GT
PowerCooler 550W-XP
HD 80Gb Hitachi SATA2

Evaluación:

Programas Informativos:

CPU-Z
Sandra 2007 Lite

Tests Sintéticos:

3DMark2001
CPU RightMark Lite
ScienceMark 2.0: Primordia

Timedemos Juegos:

Quake4 "Beginning" Timedemo
F.E.A.R. Performance Test

Realtime:

Need for Speed: Most Wanted

Programas Informativos

CPU-Z

Antes de ver al Core2Duo, veamos la competencia mas cercana, un X2 3800+

Ahora sí, veamos como luce el nuevo Core 2 Duo de la mano del Allendale

El procesador corre a 1.8Ghz, lo que vemos aqui es al procesador utilizando SpeedStep, la tecnología que le permite cambiar el multiplicador para llevar al procesador al mínimo, idéntica a la tecnología que usa AMD en su Cool n' Quiet con la inclusión de las mejoras que ya vimos en la arquitectura, hubieramos preferido desactivar esta opción, pero no pudimos encontrar ninguna forma en el BIOS así es que tuvimos que correr los test de esta manera, de todas formas, la performace final no parece haber sido afectada en lo mas mínimo.

Observamos, tratándose de un Allendale que dispone de 2Mb de Cache, recuerden que son los Conroe los que disponen de 4Mb, ambos modelos utilizan la misma tecnología de SmartCache.

Aquí vemos los datos del nuevo motherboard/chipset de Intel que fué diseñado con el Conroe en mente.

El Allendale trabaja en default con memorias DDR2-667.

Sandra 2007 Lite

Veamos con más detenimiento el Sandra...

El Core2Duo se identifica correctamente con el modelo E6300

Nuevamente vemos al motherboard y su información técnica.

El primer resultado que pudimos obtener ya es impresionante, observen como el Core2Duo de la mano del Allendale logra obtener un resultado que es competitivo con el X2 4800+ pero tan solo a 1.8Ghz de operación, lo cual evidencia su eficiencia en la ejecución de código.

Las optimizaciones internas de MacroFusion sumadas a una mayor eficiencia en su arquitectura le permiten obtener un puntaje abismal, sobre todo en SSE2 que es donde emplea una unidad de ejecución de 128bits.

Sin embargo, debido a que no dispone de un controlador de memoria integrado, la performance final de memoria sufre, de todas maneras, hay que evaluar si esto afecta negativamente el resultado en otras aplicaciones, recuerden que la mayor parte del trabajo en esta arquitectura se realiza mediante la utilización del SmartCache por lo cual, la performance final de RAM no debería afectar los resultados significativamente.

Tests Sintéticos

3DMark2001SE

Veamos primero como sale el X2 3800+ en esta prueba

Nada mal.

Pero observen como fácilmente un Allendale corriendo a tan solo 1.8Ghz obtiene un mucho mejor resultado

Aquí incluso le da un golpe a su hermano mayor corriendo a no menos de 3.4Ghz, demostrando que todo lo que vimos en teoría se cumple a la perfección en la práctica, la eficiencia de esta arquitectura realmente es sorprendente.

CPU RightMark Lite

El CPU RightMark es ideal para probar el poder de procesamiento ya que hace uso intensivo del CPU

Aquí tenemos casi un empate con una ligera ventaja para el X2 3800+ con muy poca diferencia para el Allendale.

ScienceMark 2.0: Primordia

Pasemos a un test mas científico, aquí tenemos el ScienceMark que es intensivo en lo que respecta a uso de CPU

Así luce nuestra plataforma X2 3800+

Y así luce nuestra plataforma Core2Duo Allendale a 1.8Ghz

Un buen resultado por parte del X2 3800+

Apenas pisando los talones al X2 3800+ se encuentra el Allendale dandole una dura pelea, la razón de un resultado ligeramente inferior es su muy baja velocidad de Clock, esta plataforma necesita decididamente mas clock para poner a prueba su eficiencia al máximo.

Timedemos Juegos

Quake4: "Beginning" Timedemo

Pasemos ahora al sector juegos.

Tan pronto como cargamos el Quake4 el Allendale se hizo dueño de la victoria superando ampliamente a sus rivales con apenas 1.8Ghz, a ustedes les toca imaginarse lo que podrán hacer sus hermanos Conroe a 2.6Ghz de velocidad y mas.

F.E.A.R. Performance Test

Pero el F.E.A.R. que es extremádamente intensivo en el uso de FPU es el que definirá si en efecto este procesador es bueno para el Gaming.

Nuevamente, los resultados hablan por si solos y demuestran definitivamente que todas las optimizaciones y nuevas adiciones de este procesador realmente pagan su precio con una performance en Gaming que sobrepasa lo espectacular, casi 30 FPS de diferencia demuestran que este procesador esta muy por arriba de la competencia, adonde ha quedado el procesador de AMD en esta tabla? y por sobre todo, cuanto mas eficiente es que un Pentium4 es lo que mas asombra, con 1600Mhz menos que el Pentium4, pudo superarlo ampliamente con un resultado que es facilmente 1.5 veces mejor, con una temperatura final de operación que es facilmente 2 veces mejor, absolutamente increíble!!

Need for Speed: Most Wanted

Para finalizar esta primera parte, les dejo el resultado de RealTime del Need for Speed

Se ve claramente como este procesador esta perfectamente bien capacitado para armar los sistemas de Gaming mas poderosos por el mejor precio, no es así? Observen cláramente como la línea es recta en el X2 3800+ mientras que en el Allendale esta linea se hace casi plana sobre el "Max y Promedio" de FPS lo cual indica cláramente que en situaciónes de intenso estres puede manejar las cosas con mucho mejor eficiencia, logrando un Max FPS que es mucho mas cercano al promedio y así obtener una mucho mejor experiencia de Gaming.

Conclusión:

Después de tanta información técnica, espero no haberlos mareado demasiado. Lo importante aquí es que ésta es una de las pocas veces en el mundo del hardware que puedo decir que una arquitectura nueva supera muy ampliamente mis expectativas. La serie de adiciones que hizo Intel en esta nueva arquitectura realmente merece mencionarlas como "Revolucionarias" por varios factores: primero, lograron duplicar e incluso triplicar la performance de su antecesor, el Pentium4, claro está con otra arquitectura, pero con igual o mayor mérito, ya que pudieron aprender de sus propios errores y lo más importante es que lo hicieron a expensas de bajar considerablemente el consumo de energía, cosa dificil de hacer, muy dificil, pero que han demostrado posible, jugando con variables y aplicando todos los trucos aprendidos en el Pentium-M. Todo esto tuvo sus frutos en un Procesador que es increíblemente eficiente, sumamente fresco en operación y que tiene amplias posibilidades y un gran futuro por delante. Todo lo que se puede pedir!

Es imposible no quedar asombrado por estos números, pero si todavía quieren asombrarse más, esperen a la próxima parte donde pondremos a prueba a su hermano mayor, el Core 2 Duo (Conroe) E6700 de 2.66Ghz que pasará los tests más intensivos y dificiles para ver si realmente este es el nuevo Rey de los Procesadores. Intel ha vuelto y esta vez tienen un Diamante entre sus manos.