AMD Quad FX e o Intel Skulltrail

No final de 2006, depois de esgotar as possibilidades de aumento de clock com o Athlon X2 de 0.09 micron, a AMD passou a trabalhar em uma plataforma quad-core para entusiastas, baseada em componentes da linha para servidores. Surgiu então a plataforma Quad FX, que foi lançada pela AMD em dezembro de 2006.

Diferente do que teríamos mais tarde com o Phenom X4, a plataforma Quad FX não era uma plataforma quad-core nativa, mas sim um sistema dual-CPU, resultado da combinação de dois processadores da série FX, espetados na mesma placa-mãe e ligados através de um link HyperTransport:

Inicialmente foram lançadas três versões, o FX-70 (2x 2.6 GHz), FX-72 (2x 2.8 GHz) e FX-74 (2x 3.0 GHz). Todas era baseadas no core Windsor (0.09 micron), com dois núcleos e 2x 1 MB de cache L2 por processador.

Para permitir a inclusão de um barramento adicional, necessário para fazer a interligação entre os dois processadores, a AMD adotou o uso do soquete F, utilizado também pelo Opteron. Assim como o soquete 775 da Intel, o soquete F utiliza o sistema LGA (Land Grid Array), onde os pinos de contato são movidos do processador para o soquete, criando uma "cama" de contatos, sobre a qual o processador é firmemente preso:

A principal diferença é que o soquete F possui um número brutalmente maior de contatos, nada menos do que 1207. Esse número absurdo é necessário, pois além do controlador de memória integrado, o processador passa a dispor de três barramentos HyperTransport independentes. Um deles é utilizado para ligar o processador ao chipset, outro para permitir a comunicação entre os dois processadores e o terceiro fica disponível para a inclusão de recursos adicionais.

No caso dos Opterons, o terceiro link pode ser utilizado para criar sistemas com 4 processadores. Isto seria dispendioso demais em um PC doméstico e não ofereceria grandes benefícios sobre o uso de apenas dois. Em vez de simplesmente deixar o link sem uso, a nVidia o utilizou para ligar um segundo chipset ao processador, criando a plataforma nForce 680a SLI:

O objetivo dessa combinação é dobrar o número de linhas PCI Express e outras interfaces, criando uma placa-mãe monstruosa, com 4 slots PCI Express 16x (dois deles com 16 linhas completas, dois com 8 linhas), 12 interfaces SATA e até 4 placas de rede onboard. Ou seja, você poderia montar um sistema quad-SLI, com 4 (ou mais) HDs SATA em RAID e ainda teria várias interfaces disponíveis.

Como cada processador utilizava seu próprio controlador de memória dual-channel, era necessário utilizar um total de 4 módulos: dois para cada processador. Isso trouxe outro problema, que era o fato de cada processador ter acesso direto a apenas metade da memória instalada. A solução foi o NUMA (Non-Uniform Memory Architecture) que trouxe o uso de uma tabela de endereços unificada, permitindo que cada processador enxergasse toda a memória disponível e fosse capaz de acessar dados na metade controlada pelo outro processador através do link HyperTransport que os interligava.

Embora seja bom no papel, o uso do NUMA aumenta os tempos de latência do acesso à memória, já que aproximadamente metade dos acessos são feitos aos módulos do processador vizinho, fazendo todo o caminho através do barramento HyperTransport, em vez de de irem diretamente do módulo ao controlador de memória local.

Como em 2006 existiam poucos aplicativos desktop otimizados para o uso de 4 núcleos, a perda causada pelo aumento da latência no acesso à memória anulava grande parte do benefício proporcionado pelos dois núcleos adicionais, fazendo com que mesmo o FX 74 tivesse dificuldades em oferecer ganhos tangíveis sobre um X2 6000+, que também operava a 3.0 GHz.

Para completar, a plataforma Quad FX era muito dispendiosa. Em junho de 2007, uma ASUS L1N64-SLI WS (baseada no nForce 680a SLI) custava US$ 350 e cada processador FX-74 custava mais US$ 480 (preços dos EUA), totalizando mais de 1300 dólares, apenas pela placa e processadores. Adicionando os módulos de memória, coolers, gabinete, placas de vídeo, monitor e periféricos, você passaria facilmente dos US$ 4000.

Como era de se esperar, os preços fizeram com que as vendas fossem muito baixas, o que faz com que a AMD abandonasse a plataforma no final de 2007. Concentrando os esforços no Phenom.

Uma tentativa similar foi feita pela Intel em 2008, na forma do Skulltrail, uma plataforma octo-core, também baseada no uso de componentes para servidores, combinando dois processadores quad-core da série Core 2 Extreme.

Assim como o Quad FX da AMD, ele acabou tendo uma vida curta, já que o alto custo fez com que a procura fosse muito pequena, mas ela não deixou de ser um capítulo interessante da história dos processadores Intel.

O centro da plataforma era a Intel D5400XS, uma placa dual-CPU baseada no chipset 5400, para servidores que oferecia quatro slots PCIe x16 e oferecia tanto suporte a CrossFire quanto SLI, o que oferecia uma grande flexibilidade na configuração das placas de vídeo:

Embora a Intel não tenha adotado um chipset nVidia (como fez a AMD no Quad FX), ela incorporou dois bridges PCIe nForce 100 MCP da nVidia para criar a configuração quad-slot, o que foi suficiente para ganhar a chancela para uso do SLI.

A placa fazia par com dois processadores Core 2 Extreme QX9775 de 3.2 GHz (baseado na arquitetura de 45 nm e com 6 MB de cache L2), que na época era o que existia de mais rápido dentro da linha da Intel. Ele era uma versão levemente modificada do QX9770, que utilizava o soquete LGA-771 (o mesmo usado pelos modelos do Xeon baseados na plataforma Core) em vez do LGA-775, uma mudança necessária para manter a compatibilidade com o Intel 5400.

Assim como outros processadores da linha Extreme, o QX9775 vinha com o multiplicador destravado, o que era uma carta branca para aumentar o desempenho do sistema ainda mais via overclock, atingindo 3.8 ou mesmo 4.0 GHz com estabilidade. Isso fez com que o Skultrail se tornasse um benchmark de desempenho, com recordes que só viriam a ser quebrados anos mais tarde. Caso esteja curioso, você pode ver alguns benchmarks no: http://www.anandtech.com/showdoc.aspx?i=3216&p=11

Outra concessão foi o uso de memórias FB-DIMM, novamente necessárias devido à escolha do chipset. Os módulos FB-DIMM incluem um controlador dedicado, chamado AMB (Advanced Memory Buffer) que funciona como um intermediário entre o controlador de memória e os chips de memória. O AMB é o responsável por toda a comunicação entre os chips e o controlador de memória, incluindo a verificação dos dados e correção de erros:

Em servidores, o uso de módulos FB-DIMM permite reduzir o volume de erros de transmissão (o que aumenta a confiabilidade) e possibilita o uso de um número maior de módulos de memória, uma necessidade no caso dos servidores, que muitas vezes utilizam 16 ou 32 módulos. No caso do Skultrail entretanto, os módulos FB-DIMM serviram apenas para aumentar os custos da plataforma.

Pages

Labels

domingo, 17 de janeiro de 2010