2009年12月5日土曜日

IBMのPOWER7は筋肉2倍・トランジスタ半分

POWER7について調べたので、主にIBM's 8-core POWER7: twice the muscle, half the transistorsの内容を元にまとめます。
  • プロセスルールは45nm
  • トランジスタ数12億
  • ダイサイズは567mm^2
  • 4, 6, 8coreの三種類がある
  • 4-way SMT
  • 32 socket対応(サーバ1台に32プロセッサを搭載可能)
  • 4 channelのDDR3コントローラを2つ搭載(100GB/s)
  • L3 cacheはeDRAMで32MB(SRAMで実装した場合と比較してトランジスタ数は半分)
    • 32MB-cacheのPOWER7は12億トランジスタ
    • 30MB-cacheの"Tukwila" Itaniumは20億トランジスタ
    • 24MB-cacheの8-core Nehalem EXは22億トランジスタ
  • 実行ユニットは・・・
    • Out-of-order
    • 整数演算ユニット x 2
    • load/storeユニット x 2
    • 倍精度浮動小数点数演算ユニット x 4
    • 分岐ユニット x 1
    • condition register unit (?) x 1
    • ベクタ演算ユニット x 1
    • 10進浮動小数点数演算ユニット x 1
      • 金融など精度重視の分野で使われる
  • "group dispatch"のサイズが5から6に増えた (?)

一般に、メモリの実装方法には以下の2つがあります。
  • SRAM (Static RAM): フリップフロップ回路で構成される。アクセスが速い。トランジスタ数が多い。キャッシュに使われる。
  • DRAM (Dynamic RAM): キャパシタ(コンデンサ)で構成される。アクセスが遅い。トランジスタ数が少ない。普通のメモリ(メモリモジュールとして売られてるやつ)に使われる。
eDRAM (Embedded DRAM) とは、DRAMをダイ上に実装する技術で、これによってDRAMをキャッシュとして使うことが可能になります。上記の通りDRAMで実装されたキャッシュは「ちょっと遅いけど大容量にできる」という特徴を持つため、L3 cacheに最適ですね。「ちょっと遅い」の「ちょっと」ってどれくらいだよ、というのが気になりますが。
それと、SOIチップ上でeDRAMを実現する特許をIBMが持っていたはず。

WikipediaのeDRAMのページをみたら、eDRAMを使ったプロセッサはPlayStation2, PSP, GameCube, Wii, Xbox, POWER7だそうで、PS2, PSPを除いて全部IBMですね。そして、POWER7はeDRAMを使った初の汎用プロセッサということになります。

改めてまとめてみると、POWER7はとても魅力的です。2 coreのでいいから20万円ぐらいのワークステーション出ないかな。

0 件のコメント:

コメントを投稿