O PROCESSADOR ATHLON DA AMD

Por Ricardo Zelenovsky e Alexandre Mendonça

Desde seu lançamento, em junho de 1999, a CPU Athlon está cumprindo as promessas feitas pela AMD e, ao mesmo tempo, realizando um sonho, pelo menos para nós que valorizamos a concorrência: no momento, a CPU mais veloz do mercado não é fabricada pela Intel ! Nada temos contra a Intel, aliás, ela tem o mérito de ter inventado o mercado de microcomputadores, porém só conseguiremos comprar bons computadores a preços razoáveis enquanto houver concorrência. Quanto mais concorrência, computadores melhores e mais baratos.

Como já dissemos em artigos anteriores, o principal objetivo de um fabricante de CPU não é o de entregar CPUs rápidas e baratas, mas sim o de gerar lucro para seus acionistas. No começo dos anos 90, havia vários fabricantes de CPU disputando o mercado e surgiram outros ao longo da década. Mas agora, ao iniciarmos o ano 2000, devemos nos preocupar um pouco com a concorrência, pois restaram apenas dois fabricantes de CPUs de alto desempenho: Intel e AMD.

Athlon de 1 GHz

A AMD iniciou o ano 2000 rompendo, pela primeira vez no mundo dos microcomputadores, a significativa barreira dos 1.000 MHz. No dia 6 de janeiro, a equipe formada por AMD, Compaq e Kryo Tech apresentou uma máquina Presario, "motorizada" com um processador Athlon trabalhando a 1 GHz. É claro que esse computador é um mero protótipo de laboratório e tal velocidade só foi alcançada graças às técnicas de refrigeração fornecidas pela Kryo Tech. Mas não deixa de ser um grande feito e, por isso, vamos analisá-lo um pouco.

O principal problema para uma CPU rodar com um relógio elevado é o seu aquecimento. Quanto maior a velocidade, maior a quantidade de calor gerado no interior do semicondutor. Se for providenciado um mecanismo eficiente para remoção deste calor, então é possível atingir altas velocidades. E é exatamente isso que foi feito com esse computador onde, é claro, só a CPU roda em 1 GHz, todo o resto trabalha nas velocidades usuais.

Emprego do Cobre

Uma das maneiras de minimizar o calor gerado no interior da CPU é a diminuição do seu tamanho e o emprego de condutores mais eficientes, como, por exemplo, o cobre. Todo condutor se aquece na presença de corrente elétrica; porém, quanto melhor o condutor, menos calor ele gera. Nas CPUs atuais, todas as conexões metálicas são feitas com alumínio. O cobre era um sério candidato a fazer essas conexões pois ele tem melhores propriedades condutoras que o alumínio; todavia, problemas tecnológicos impediam seu emprego dentro de CI. Com a solução desses problemas, o cobre está passando a ser usado de forma intensa, possibilitando o uso de relógios mais rápidos. A atual versão do Athlon é fabricada em Austin, Texas, no que a AMD chama de Fab 25. Ela usa tecnologia de 0,18 micron para integrar 22 milhões de transistores num "die" de 102 mm2 de área. Por volta da metade deste ano, usando a Fab 30, que fica em Dresden - Alemanha, a AMD deverá começar a entregar o Athlon com tecnologia de interconexão usando cobre.

Velocidade e Preço

O Athlon, nome comercial para o K7, na época do seu lançamento, operava na velocidade de 500 MHz. Logo em seguida, observou-se uma escalada de velocidade (MHz) a preços ainda razoáveis: 500 MHZ ($209), 550 ($279), 600 ($419), 650 ($519), 700 ($699), 750 ($799) e atualmente 800 MHz ($849). É interessante olhar a relação desses preços com a velocidade, como mostrado na figura 1. Pode ser notado que a variação de preço entre 750 e 800 MHz é muito pequena, quando comparado com o que se paga para subir de 650 MHz para 700 MHz. Há, notoriamente, a preferência para se venderem CPUs com determinadas velocidades. Isso fica muito claro na figura 2, que mostra o quanto se paga para aumentar 50 MHz na velocidade do Athlon.

Figura 1: Relação entre MHz e US$ usado pela AMD para
vender a CPU Athlon, em lotes de 1.000 unidades.

Figura 2: Quanto custa aumentar 50 MHz numa CPU Athlon.
Por exemplo, para passar de uma CPU de 500 MHz para
uma de 550 MHz, é necessário pagar mais US$ 70,00.

Desempenho

A AMD está realmente oferecendo processadores que ultrapassam o desempenho dos Pentium III. Quando se trata de desempenho, não basta comparar os relógios, também é necessário verificar como está a velocidade da unidade de inteiros e a da unidade de ponto-flutuante. Além disso, é importante ver o desempenho global do processador, por exemplo, em aplicações Windows e, por curiosidade, em alguns jogos. A seguir, são exibidos quatro quadros comparativos que mostram o desempenho do Athlon em um ambiente Windows (figura 3), em jogos (figura 4), no processamento de inteiros (figura 5) e, finalmente, no processamento de números representados em ponto-flutuante (figura 6). Todas essas informações foram obtidas junto à "Home-Page" da AMD e, por isso, não devem ser aceitas como verdades absolutas. Quem nunca caiu em um "papo de vendedor" ? É prudente desconfiar um pouco do que eles nos afirmam. Chamamos ainda a atenção para o fato de que, em todas as comparações, o relógio usado com o Athlon foi superior ao usado com o Pentium III.

Figura 3. Desempenho comparativo do Athlon em processamento windows.


Figura 4. Desempenho comparativo do Athlon em jogos.

Figura 5. Desempenho comparativo do Athlon em processamento de números inteiros.

Figura 6. Desempenho comparativo do Athlon em processamento
de números representados em ponto-flutuante.

Próximos Lançamentos

Para o ano 2000, a AMD planeja introduzir diferentes versões do processador Athlon. Essas versões estão baseadas em três novos núcleos ("cores") de processamento: Thunderbird, Spitfire e Mustang.

O núcleo Thunderbird está sendo projetado para ser uma versão de alto desempenho do processador Athlon, com um cache L2 integrado dentro do chip e trabalhando na mesma velocidade da CPU. Serão oferecidas implementações tanto para Soquete como para Slot. O Thunderbird terá por alvo o mercado de computadores de mesa e estações de trabalho.

O núcleo Spitfire está sendo projetado para ser uma versão evoluída do processador Athlon, também com um cache L2 integrado dentro do chip e trabalhando na mesma velocidade de CPU. Com esse processador, pretende-se premiar a relação custo-benefício. Ele virá apenas na implementação com Slot A e terá como alvo o mercado de computadores de mesa.

O núcleo Mustand será um aperfeiçoamento do Thunderbird, oferecendo um tamanho de CI reduzido, baixo consumo de energia e até 2 MB de cache L2, integrado dentro do mesmo chip e trabalhando na mesma velocidade da CPU. Serão oferecidas versões em Slot e em Soquete. Serão implementadas muitas versões deste núcleo, visando aos mercados das estações de trabalho, computadores de mesa, computadores com boa relação custo-desempenho e computadores portáteis.

Com essa descrição, percebe-se que o próximo passo, na disputa do mercado de CPUs, será a integração do cache L2 junto com a pastilha da CPU. Isso porque a velocidade do cache L2 está ficando pequena quando comparada com a da CPU. Na verdade, a velocidade das memórias (externas), usadas nos caches L2, já está no limite permitido pelo custo.

A Microarquitetura

Segundo afirmações da AMD, a CPU Athlon traz, pela primeira vez em plataforma x86, uma unidade de ponto-flutuante usando pipeline superescalar, o que permite grande desempenho e a torna competitiva com processadores RISC usados em estações de trabalho, pois, com relógio de 800 MHz, oferece 3,2 Gflops (precisão simples). Essa CPU usa o que a AMD chama de superpipeline, com nove elementos simultâneos (superescalar), otimizados para trabalhar em altas freqüências. Em palavras mais simples, são nove pipelines (de execução) em paralelo:

Como acontece com todas as CPUs modernas (da família x86), as complexas instruções x86 são traduzidas em instruções RISC que, no caso da AMD, são chamadas de "Micro-Ops". Essas instruções RISC são mais simples e têm tamanho fixo, o que facilita o controle e a execução de várias delas ao mesmo tempo. A figura 7 apresenta um diagrama em blocos dessa CPU, onde devem ser notadas as nove unidades de execução que trabalham em paralelo e o bloco denominado "decodificadores de instruções", além do cache L1 que está dividido em dois blocos, um para instruções e outro para dados, perfazendo 128 KB.
 
 

Figura 7: Diagrama em blocos da arquitetura do processador Athlon.

Enhanced 3Dnow

O primeiro fabricante a oferecer a tecnologia MMX para ponto-flutuante foi a AMD, sob o nome 3DNow, que era incorporada nas suas CPUs K6-III. Essa tecnologia 3DNow, com suas 21 instruções, oferece SIMD ("Single Instruction Multiple Data") com ponto-flutuante e, para ser incorporada ao o Athlon, sofreu um incremento de 24 novas instruções, assim agrupadas:

· 12 instruções para melhorar os cálculos com números inteiros usados em operações multimídia, tais como reconhecimento de voz e processamento de vídeo;

· 7 instruções que aceleram as transferências de dados, permitindo gráficos mais detalhados e novas funcionalidades para os "browsers" Internet;

· 5 instruções DSP que melhoram as operações envolvidas nos aplicativos de comunicações tais como soft modem, soft ADSL, Dolby Digital e MP3.
 

A Arquitetura do Cache

Essa CPU inclui o maior cache L1 de sua classe, com um total de 128 KB, dividido em 64 KB para dados e 64 KB para dados, como já foi observado na figura 1. O cache L1 está integrado dentro do chip da CPU e trabalha com barramento de 64 bits. Para o cache L2, que está "fora" do chip, foi construído um barramento traseiro (BSB-"Back Side Bus") de 72 bits, sendo 64 bits de dados e 8 bits para correção de erros, onde é possível conectar um cache que pode variar de 512 KB até 8 MB. Esse barramento BSB é rápido e é capaz de tirar proveito da alta velocidade das modernas memórias.

O Chipset

No lançamento de CPUs de alto desempenho, não é raro encontrarmos problemas de atrasos na produção de seus chipsets. O chipset é um item muito importante, pois ele traz consigo todo o resto do computador. Usando uma comparação extremamente simples com um carro, dizemos que a CPU é o motor desse carro, enquanto que todo o "resto" é chamado de chipset. Além do motor potente, um carro precisa de uma excelente suspensão, chassis, sistema de freios, etc.. No momento, a AMD oferece para o Athlon o chipset 750, cujo diagrama está mostrado na figura 8. Apesar deste conjunto de CIs trazer algumas novidades, como o "super bypass" que reduz em 25% o tempo latência para os acessos à memória principal, sabe-se que ainda há muito espaço para desenvolvimento. Esperam-se, num futuro próximo, o AGP 4X e os recursos para o emprego de várias CPUs (multi-processamento). A AMD está em contato com outras empresas que operam no mercado de chipsets, tais como VIA Technologies, SiS, Acer Laboratories, Inc (ALI) e Triden, para que, através de soluções próprias, se consiga mais flexibilidade e variedade na oferta de chipsets.

Figura 8. Diagrama do Athlon conectado ao chipset AMD 750.

O Barramento do Sistema

Graças à adoção da tecnologia de barramento Alpha EV6, desenvolvida pela Digital Equipment Corp., a AMD pode oferecer o primeiro barramento de 200 MHz em plataformas x86 e ainda existem promessas para esse barramento operar até 400 MHz. Trabalhando com 64 bits em 200 MHz, essa CPU oferece uma taxa de comunicação de 1,6 GB/s, que é um valor grande (ganho de 45%) quando comparado com os 1,1 GB/s do Pentium III que opera em 133 MHz.

O Slot A

O novo barramento de 200 MHz, que pretende chegar a 266 MHz ainda este ano, e a simplicidade que se obtém ao colocar a memória cache L2 próximo ao chip da CPU, levaram a AMD a abandonar o soquete Super 7 e a criar o denominado Slot A. Esse slot A é mecanicamente igual ao Slot 1 da Intel, mas eletricamente distinto. Por isso, a CPU Athlon é entregue em um cartucho parecido com o do Pentium II ou III, mas esse cartucho só pode ser usado nos Slots A. Com a evolução dos mercados, a AMD pretende oferecer CPUs Athlon para soquetes, mas essas versões sempre serão destinadas a computadores de baixo custo e desempenho inferior, enquanto que o Slot A será sempre usado para o computadores de alto desempenho.

Finalizando

Ao terminar este artigo é interessante fazermos uma análise síntese dos principais recursos do Athlon em comparação com os do Pentium III. Isso é visto na tabela a seguir.
 
 

Características

Athlon

(Slot A)

Pentium III

(Slot 1)

Operações por ciclo de relógio
9
5
Pipeline de Inteiros
3
2
Pipeline de Ponto-Flutuante
3
1
Decodificadores x86 (completos)
3
1
Tamanho do cache L1
128 KB
32 KB
Tamanho do cache L2
512BK – 8MB
256 KB (interno)
512KB-2MB (externo)
Velocidade do barramento
200 MHz
66 ou 133 MHz
Banda passante do barramento
1,6 GB/s
533 MB/s ou 1,1 GB/s
Número de transistores
22 milhões
9,5 – 28 milhões

O mercado está aquecido e a disputa pela fatia das CPUs de alto desempenho continua acirrada e certamente a Intel tem vários recursos para lançar mão. Enquanto isso, nós os consumidores continuamos a desfrutar desses processadores que nos chegam com preços cada vez mais interessantes.

___________________________________

Ricardo Zelenovsky (zele@leblon.ime.eb.br) e Alexandre Mendonça (alexmend@aquarius.ime.eb.br) são professores do IME e autores dos livros "PC e Periféricos: um Guia Completo de Programação" e "PC: um Guia Prático de Hardware e Interfaceamento - 2a Edição" (http://www.mzeditora.com.br).