2015年03月18日

"12GBって意味あるの?" "Titanというより980Ti"  GTX Titan Xの気になるあれこれ



Titanの後継は何を引き継いだのか?



 NvidiaはGTC2015で、新たなフラグシップカードGTX TITAN Xを発表した。

 海外ではさっそくレビューが氾濫しているけども、そこからどういったカードなのか?12GBのは意味あるのか?とか。個人的に気になった点を簡単に書いておきます。




Titan Xとはどういうカード? 端的にいうとGTX980の1.5倍。


 Titan Xは一言でいうとGTX980を1.5倍にしたカードだ。

 身も蓋もないのだけど、SP数は1.5倍の3072だし、ラスタライザもテッセレーションもテクスチャユニットもROPも1.5倍。それにダイサイズも同様に5割増しである。

 もっともそのおかげで、GTX970みたいにメモリが区分けられているということもない。PCperがいちいち聞いたとか。)



 Titanの後継であると同時にMaxwellフラグシップという側面もあるので当然かもしれないが、わざわざそのように強調するのには、それなりの理由があったりする。


comparation.PNG




Titan XはTitanの後継ではない。



 ”Titan Xのユニークな特徴として、その倍精度演算性能が著しく低い点が挙げられる”byレビュアー


 こんなこと殊更書かれるなんてTitan Xは嫌われてるのかもしれないけども。これがGTX980の1.5倍と強調した理由だ。


 GTX TITANといえば、スパコンにも使えるという高性能さがウリだけども、少なくともTitan Xに関してはそれは当てはまらない。


 倍精度(FP64)とはスパコンユニットの性能指標とも言える数値である。

 前世代のTitanは1.5TFLOPSのFP64性能を持っていたが、Titan Xは、192GFLOPSしかない。



 Titanとは名ばかりの高いだけのゲームカードなのである。





 以下はAnandTechの所感。




 我々は28nmに少々長い間留まっている。28nmを4年も押し通したことは様々な影響を及ぼした。究極的にはそれによってAMDとNvidiaはその場しのぎの対応をし続けることになった。製造プロセスの世代を変えるかわりにアーキテクチャの効率性を追求し、28nmでできることのすべてを絞り出している。


 それらの取り組みの一つの形が、NvidiaのMaxwellアーキテクチャである。Nvidiaの技術の総力を注いだその設計は、電力とアーキテクチャの効率性にフォーカスした作りとなっている。

 GK104の後継となるGM204は、ダイを肥大化しつつも電力効率を維持した純粋なグラフィックスチップとして仕上がった。ダイサイズは294mm2から398mm2へ増加し、トランジスタ数は35億から52億に。より大きくなったダイサイズとトランジスタバジェットのおかげで、さらに多くの数のストリーミングマルチプロセッサをより高性能な形で搭載でき、それがより高いパフォーマンスの実現につながった。

 一方GM206を搭載するGTX960では、Nvidiaは電力セーブの方にさらに傾倒した。GM204のハーフ版とも言えるそれは、GK106から大きな性能向上はなかったものの電力使用量とコストをさらに抑えている。


 しかし、ビッグMaxwell(TitanX)ではどうか? Nvidiaにはいずれの選択肢も残されていなかった。Gk110は551mm2の時点ですでに巨大なGPUだ。GM204のように3割もダイサイズを大きくするのは現実的ではない。

 では、おおよそ同じダイサイズでMaxwell版GK110を作るというのは?しかし、その方法で得られる性能向上は限られている。


 そこでNvidiaは第三の選択肢を採った。これがGM200を面白くしている点だ。GM200でNvidiaが採った手段とは、倍精度浮動小数点数演算性能を思いきって切ったことだ。


 ビッグKeplerは、それ自体はグラフィックスエンジンのかたまりであったものの、 そのダイの一部にFP64用のCUDAコアや、演算機能を搭載していた。これによりNvidiaはひとつのGPUコアで、用途のことなる製品を展開できることができた。しかしそれはGK110が中途半端であることも意味している。

 結果として、28nmの繰り返しに直面し、Maxwellのグラフィックリソースでの電力セーブに注力したことで、NvidiaはビッググラフィックスGPUを開発できた。


 GM200は、GK110の後継というより、むしろGM204のビッグバージョンである。




Anandより一部引用要約       


NVIDIA Big GPUs
 ダイサイズNative FP64 レート
GM200 (Big Maxwell)601mm21/32
GK110 (Big Kepler)551mm21/3
GF110 (Big Fermi)520mm21/2
GT200 (Big Tesla)576mm21/8
G80484mm2N/A




ゲームベンチマーク。大容量の12GBは果たして活きるのか?


 TiitanXの特徴といえばその大容量だけども、それが実行性能に与える影響どれほどのものなのか。


 以下は気になったベンチマーク。





 基本的に 4GBのカード勢に対してそのアドバンテージを感じる場面はほとんどない。どのベンチでも、デュアルGPU>TITAN X>その他シングルGPUといった結果。




BF41920x1080.PNG

BF44K.PNG

 TitanXの性能自体は前世代から3〜5割り増しと非常に高い。





 しかし、若干気になる傾向を見せたのがメモリ殺しのゲームShadow of Mordorのベンチ。

 ここでは4GB一番手のGTX980SLIが珍しく苦戦。安定したTitan Xに対して、解像度が上がるごとにみるみるスコアを落としていく。


SoM.PNG




こっちは最低フレーム

SoMmin.PNG

こちらでは最終的にTitanXが抜き返している。

ただしデュアルGPU構成が最適化されていない場合こういうことがよくある。

いすれにしろGTX980に対してはメモリの優位性を見せたとは言えるかもしれない。




今後メモリ負荷の大きいゲームが増えれば、12GBが強みになる?



かとおもいきや、



こちらでは解像度が上がると逆にR9 295X2に抜き返されている。
Unigine.PNG

ドライバの最適化等も考えられるが、GPUの性能が先に限界に来たのかもしれない。





ちなみに演算性能のベンチ。

7.0TFLOPSにもなる単精度浮動小数点数演算性能は現時点でトップクラスなだけに、FP32のベンチマークでも高い結果を残している。


TITANXSP1.png



TITANXSP2.png




ただし倍精度は低い。低すぎる。
二世代前のFermiにすら劣る。

DP64.png

いちおう単精度のプロユースもあることはあるけど。あと擬似倍精度とか。






雑感

 とにかく色んな意味で高いゲームカードです。

 ただスパコンに使えないのは良いとしても、自慢の大容量は活かせるゲームは現時点ではあまりなく、将来的に活かせる時期が来たとしても、ベンチはGPUの性能が頭打ちになる可能性も示唆している

 メモリが意味ないのだったら、980TI(メモリ削減版)みたいなの待った方がいい気も。


 まあ価格がやっぱ問題だろうけど。ゲームに10万も20万も出せるかどうか。


 ちなみに海外レビューは総じて前向きな評価です。


posted by 日々さか@海外 at 12:41| Comment(6) | TrackBack(0) | Nvidia | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
「今まで680SLI使ってたんだけど壊れちゃった」
「690使ってたんだけど(ry」

そんな人には乗り換え対象として見てもらえるかもしれないけどいずれにしろ980SLIとの力関係が悩ましい、そんなカード
Posted by at 2015年03月19日 19:40
あと300$安ければと思いまよね。
やっぱ倍精度低いのに価格高いのは海外でも関心事になってるみたいです。

デュアルに関しては、DX12での最適化をあえてしないことで差別化を図る。なんてのもどうでしょう。
Posted by ひびさか at 2015年03月21日 01:44
DX12での最適化をあえてしないというより出来ないような気がします。
そもそもDX11の最適化のようにより高速なシェーダーに置き換えること等やめるのもローレベルAPI、プログラム側が細かく管理することの目的だったはず。

ドライバで機能制限させると問題が発生しそうですし、ドローコール削減の抑制も難しくこれも問題がでそうです。
ただしゲーム側でわざと性能が出ないように仕込ませたり、ゲーム側の最適化パッチを適用させないようにすることなら問題は少ないと思います。
手間とバグが増え建設的ではなく嫌がられるでしょうけど。
Posted by アキ at 2015年03月22日 14:46
DirectX12になればハードウェアとのマッチングがしやすくなるみたいですが、デュアルに関してはまだ不透明なのでなんとも判断がつきませんね。
Posted by ひびさか at 2015年03月23日 13:36
ハードのマッチングという意味での最適化でしたか、性能向上での最適化と勘違いしていたようです失礼しました。

異なるコアでのマッチングは管理可能だとしてもいろいろ問題はありそうですし、デュアルも最終的にアプリ側がどこまで個別に面倒を見るかなので、差別化を売りにすることは効果も含めて不透明で難しいと思います。
たとえ何々が出来るようになる、とカードレベルで謳っても恩恵は少ないように思います。
より簡単にサポートが行えるはずのTureAudioでも恩恵は非常に少ないですし・・・。
DX12はCPUネックの解消でオブジェクト数やジオメトリ系の表現アップやタブレット・ノート向けとしてはリソース管理をしっかり行うことが前提で期待していいかなと思います。
Posted by アキ at 2015年03月23日 14:36
曖昧な表現使ってるのは自分なので、スイマセン。

DX12は説明通りであれば、開発者にとって夢のようなAPIなんですが、懐疑的なデベロッパーもいるみたいですね。DX12大好きなスタードックが周りがやる気ないのをボヤいてたような。
Posted by ひびさか at 2015年03月24日 13:49
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

この記事へのトラックバックURL
http://blog.seesaa.jp/tb/415827934

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。