GPU Round-Robin Benchmark

新旧34種類のGPU(グラフィックボード)性能を一気に比較!! 気になるベンチマーク結果は？

【新装第1回/通算第13回】現行世代はこれで一段落。今の勢力図を総まとめ text by “KTU”加藤勝明

“KTU”加藤勝明

2024年6月7日 13:05

　2024年冬号をもって休刊となった「DOS/V POWER REPORT」誌で不定期連載していた「GPU Round-Robin Benchmark」を、ここAKIBA PC Hotline!でリブートすることとなった。目的はズバリ現行GPU性能を横並びで一斉に比較するというもの。新GPU登場時のファーストレビューではせいぜい5〜6種類程度のGPUに絞らざるを得ないが、本連載は比較対象をできるだけ広げ比較することを志向している。

　物理媒体だとページという制約からオミットせざるを得ない情報が出てきてしまうが、Web媒体になることでその制約からも逃れることができる。今後も定期的(気になるデータが得られたときは随時！)にGPUのアップデートを取り込みつつ継続していきたい。

【記事目次】

　・GPUの現在位置(2024年6月初旬)
　・今回の検証環境は？
　・定番ベンチ「3DMark」
　・RTX 40シリーズが強い「Blender」
　・動画エンコード速度はメモリバス幅と関連が深い？
　・AI系の処理では意外やIntelが健闘
　・単純な殴り合いではGeForceが強い「オーバーウォッチ 2」
　・「Starfield」ではDLSS FGが謎の壁にブチ当たる
　・「F1 23」でもAFMFの恩恵が大きい
　・GPUの消費電力
　・今回の総評：次世代GeForce＆Radeonの登場が待ち遠しい

新旧GPU34製品一斉比較をライブ配信で解説！【6月7日(金)21時より】

新旧GPU34製品一斉比較の結果を、検証を担当した加藤勝明さんがライブ配信で解説します。本稿に書ききれなかった裏話が飛び出してくるかも！？

【新旧GPU 34製品一斉比較！上から下まで性能丸分かり。GeForce RTX 40/30、Radeon RX 7000/6000大激突！あなたが買うべきモデルはこれだ！！】

GPUの現在位置(2024年6月初旬)

　まず現状のGPUの状況をざっくりと振り返ると、AMDは「Radeon RX 7000シリーズ」、NVIDIAは「GeForce RTX 40シリーズ」、そしてIntelは「Arc Aシリーズ」をこれまでに投入してきたが、2024年春で最新世代の新製品投入が一段落。突発的に旧世代のバリアントモデル(RX 6500 XTの8GB版など)が出てくるが、最新世代に新型番のGPUを出すのを止め、次世代GPUの立ち上げに軸足を移している様子だ。これまではゲーム性能のみならずAIで圧倒的な人気を誇る(そのせいでなかなか値段も下がらない)GeForce勢に対し、価格で勝負のRadeon勢、AV1エンコードが優秀なもののゲーム性能にクセの強いArc勢といった棲み分けだった。

　だが2024年に入りAMDが無料で使えるフレーム生成「AMD Fluid Motion Frames」ことAFMFがRadeonドライバーに正式実装されたことで状況が一変。AFMFはフレームレートを倍増させる一方でE-Eシステムレイテンシーが増大する(詳細は別記事の前編および後編を参照)というデメリットはあるものの、ライバルの「DLSS FG(Frame Generation)」よりもハード/ゲーム側の縛りが小さく、RX 6000/RX 7000シリーズのユーザーなら無償で使えることからPCゲームにおけるRadeonの価値を劇的に高めた。Arc Aシリーズはドライバーの熟成と新たなパートナー(Sparkleなど)の獲得で価格も下がり、エントリー寄りのビデオカード市場において地盤を形成しつつある。

今回の検証環境は？

　今回の検証では、新旧合わせ34種類のGPUを用意した。最新世代とその前世代前がターゲットだが、前世代に関してはさまざまなリソースの制約から隙間モデルを中心に省略しているものもある(例：RTX 3070 TiやRX 6750 XTなど)。また、GeForce系によくあるバリアントモデル(例：RTX 3050の6GB版など)も省略している。

　さらに旧世代代表としてDirectX 12 Ultimateに対応した最初の世代代表としてRTX 2060を、レイトレーシング非対応世代の低価格カード代表といてGTX 1650(GDDR6)も評価に加えた。使用したカードは以下のとおりとなる。

【ベンチマークに使用したビデオカード】
GPU	使用した製品	実売価格 (参考)
GeForce RTX 4090	NVIDIA GeForce RTX 4090 Founders Edition	¥300,000
GeForce RTX 4080 SUPER	NVIDIA GeForce RTX 4080 SUPER Founders Edition	¥200,000
GeForce RTX 4080	NVIDIA GeForce RTX 4080 Founders Edition	¥180,000
GeForce RTX 4070 Ti SUPER	ZOTAC GAMING GeForce RTX 4070 Ti SUPER Trinity OC	¥150,000
GeForce RTX 4070 Ti	ZOTAC GAMING GeForce RTX 4070 Ti Trinity OC	¥130,000
GeForce RTX 4070 SUPER	NVIDIA GeForce RTX 4070 SUPER Founders Edition	¥110,000
GeForce RTX 4070	NVIDIA GeForce RTX 4070 Founders Edition	¥100,000
GeForce RTX 4060 Ti (16GB)	ASUS ROG STRIX GeForce RTX 4060 Ti OC Edition 16GB GDDR6	¥70,000
GeForce RTX 4060 Ti (8GB)	NVIDIA GeForce RTX 4060 Ti (8GB) Founders Edition	¥60,000
Geforce RTX 4060	MSI GeForce RTX 4060 VENTUS 2X BLACK 8G OC	¥50,000
GeForce RTX 3090	NVIDIA GeForce RTX 3090 Founders Edition	¥230,000
GeForce RTX 3080	NVIDIA GeForce RTX 3080 Founders Edition	¥100,000
GeForce RTX 3070	NVIDIA GeForce RTX 3070 Founders Edition	¥70,000
GeForce RTX 3060 Ti	NVIDIA GeForce RTX 3060 Ti Founders Edition	¥70,000
GeForce RTX 3060 (12GB)	ZOTAC GAMING GeForce RTX 3060 Twin Edge OC	¥50,000
GeForce RTX 3050 (8GB)	GIGABYTE GeForce RTX 3050 GAMING OC 8G	¥35,000
GeForce RTX 2060	NVIDIA GeForce RTX 2060 Founders Edition	¥45,000
GeForce GTX 1650	ZOTAC GAMING GeForce GTX 1650 OC GDDR6	¥30,000
Radeon RX 7900 XTX	AMD Radeon RX 7900 XTX リファレンスカード	¥190,000
Radeon RX 7900 XT	AMD Radeon RX 7900 XT リファレンスカード	¥140,000
Radeon RX 7900 GRE	ASRock AMD Radeon RX 7900 GRE Steel Legend 16GB OC	¥100,000
Radeon RX 7800 XT	AMD Radeon RX 7800 XT リファレンスカード	¥90,000
Radeon RX 7700 XT	ASRock AMD Radeon RX 7700 XT Challenger 12GB OC	¥80,000
Radeon RX 7600 XT	ASRock AMD Radeon RX 7600 XT Steel Legend 16GB OC	¥60,000
Radeon RX 7600	AMD Radeon RX 7600 リファレンスカード	¥45,000
Radeon RX 6950 XT	TUL PowerColor Red Devil AMD Radeon RX 6950 XT 16GB GDDR6	¥120,000
Radeon RX 6800 XT	AMD Radeon RX 6800 XT リファレンスカード	¥100,000
Radeon RX 6800	AMD Radeon RX 6800 リファレンスカード	¥90,000
Radeon RX 6700 XT	AMD Radeon RX 6700 XT リファレンスカード	¥60,000
Radeon RX 6600 XT	ASRock AMD Radeon RX 6600 XT Phantom Gaming D 8GB OC	¥40,000
Radeon RX 6500 XT (4GB)	Sapphire PULSE AMD RADEON RX 6500 XT	¥30,000
Arc A770	Intel Arc A770 Limited Edition	¥50,000
Arc A580	ASRock Intel Arc A580 Challenger 8GB OC	¥30,000
Arc A380	ASRock Intel Arc A380 Challenger ITX 6GB OC	¥20,000

　ここに含まれる価格は、表中の製品自体の価格ではなく、“同じGPUを搭載したカード”の標準的な実売価格を調べたもの(6月頭時点)。ハイエンドのファクトリーOCモデル〜エントリーモデルまで一緒くたにした価格であり、流通量が少なく(流通量が少ない、すでに製造されていない、など)プレミア的な価格になっているものも含まれる。GPUの“格付け”を検討する目安の一つ、という程度に考えていただきたい。

最新モデルというわけではないが、今回の検証のため新たにASRockのAMD Radeon RX 7600 XT Steel Legend 16GB OC(写真左)とIntel Arc A580 Challenger 8GB OC(同右)をそれぞれ用意した

　また、GPU以外の検証環境は以下のとおりとなる。Secure Boot、Resizable BAR、メモリ整合性やHDRなどは一通り有効としている。また、本稿の検証時期は4月中旬〜5月初旬となっており、その関係でドライバーもその時期ものを利用している。すなわちGeForceはGameReady 552.12、RadeonはAdrenalin 24.3.1、Arcは31.0.101.5444となる。

【検証環境】
CPU	AMD Ryzen 7 7800X3D(8コア/16スレッド、最大5GHz)
マザーボード	ASUS ROG STRIX X670E-F GAMING WIFI(AMD X670E、BIOS 1905)
メモリ	Micron CP2K16G56C46U5(PC4-44800 DDR5 SDRAM 16GB×2、DDR5-5200で使用)
ストレージ	Micron T700 CT2000T700SSD3 ［M.2(PCI Express 4.0 x4)、2TB、システム用］+ Silicon Power SP002TBP34A80M28 ［M.2(PCI Express 4.0 x4)、2TB、ゲーム用］×3
CPUクーラー	NZXT Kraken Elite 360 (簡易水冷、36cmクラス)
CPUクーラー	NZXT Kraken Elite 360 (簡易水冷、36cmクラス)
電源ユニット	Super Flower LEADEX PLATINUM SE 1000W-BK (1,000W、80PLUS Platinum)
OS	Windows 11 Pro(23H2)

定番ベンチ「3DMark」

　では定番の「3DMark」で検証をスタートしよう。Fire Strikeなどのラスタライズ系テストと、Port Royalなどのレイトレーシング系テストでグラフを分けている。先日のアップデートでTime Spyにかわる新DirectX 12ベースのテスト(Steel Nomad)が実装されたが、テスト実施時点では未実装だったのでTime Spyを試用している。

　なお本稿のグラフはいずれもかなり長大なので、内容は拡大画像でご確認いただきたい。

3DMark/ラスタライズ系テストの計測結果

3DMark/レイトレーシング系テストの計測結果。GTX 1650はこのテストが動作しなかったため計測不可

　2024年に登場した新GPUはGeForceならRTX 4080 SUPER〜RTX 4070 SUPER、RadeonならRX 7900 GREとなる。このうちRTX 4080 SUPERやRTX 4070 Tiはそのすぐ下のモデル(RTX 4080/RTX 4070 Ti)と比較してスコア差の伸びが小さいが、特に負荷の低いFire Strikeにおいて、誤差程度の差しか出ていない。一方Speed Wayのような負荷のきわめて高いテストでは見て分かるほどには差が出ている、という点に注目。一方RX 7900 GREはRX 7900 XTとRX 7800 XTの隙間を埋めるモデルとして、実に絶妙な位置に着地を決めていることが分かる。

　また、Arc AシリーズのうちA770とA580はGeForceなら50〜60番台、Radeonなら600番台あたりの性能を出しているが、エントリークラスのA380はGTX 1650相当程度と大きな差が付いている。

　GeForceとRadeonの比較で言えば現行のRTX 40シリーズはPort Royal/Speed Wayといったレイトレーシング系テストでとにかく強く、RX 7000シリーズはRTX 30シリーズは越えたもののRTX 40シリーズには追い付けない。AFMFの利用で実ゲームでの差がどこまで縮められるか、後で検証するとしよう。

RTX 40シリーズが強い「Blender」

　ゲームの検証に入る前に、軽くクリエイティブ系のベンチマークをすませておこう。今回は3DCG作成アプリ「Blender」をベースにした「Blender Benchmark」のGUI版を利用した。Blenderのバージョンは4.1.0とし、各シーンのスコアを比較する。

Blender(バージョン4.1.0)のベンチマーク計測結果。“計測不可”のものは動かない、またはエラーが出てしまったGPU

　ゲームグラフィックスの文脈におけるレイトレーシング性能(前掲の3DMark)ではRadeon勢はRTX 30シリーズを同等〜それ以上の性能であったが、3DCGの文脈ではまったく異なる傾向が見られた。RTX 40シリーズ、特にRTX 4070より上のモデルのスコアが高い(特にmonsterにおいて)。これにRTX 30シリーズのRTX 3090やRTX 3080が続いてからRX 7900 XTXなどのハイエンドRadeonが入る。このテストにおけるRX 7900 GREの性能はRTX 3060 Tiと同レベルといったところ。しかしRX 6000シリーズに比べるとレイトレーシング性能改善に力を入れ始めたRX 7000シリーズはスコアが上がっている。

動画エンコード速度はメモリバス幅と関連が深い？

　続いては「UL Procyon」を用いたテストだ。まず1つめは「Premiere Pro」による動画エンコード速度をみる“Video Editing Benchmark”だ。フルHD(H.264)および4K(H.265)の動画4本をエンコードする時間をスコアに変換する。長らくCPUでエンコードされてきたテストだが、GPU側でエンコード可能になったのでテストに組み込んだ。

UL Procyon Video Editing Benchmarkの計測結果

　スコアで見ると5万ポイント以上、3〜4万ポイント、2万〜3万ポイントといった感じの層に分かれており、ここでも安定してRTX 4070 Ti SUPER以上が高スコアを出している。RTX 4070 TiとRTX 4070 Ti SUPERで分かりやすい差が付いていることから、AD104とAD103が境目になっていることは明らかだ。RTX 4060 Tiより下のモデルでさらにもう1段スコアが下がのも、コアの差(AD104とAD106)が関係している。

　一方Radeonは、RX 7900 XTより上がRTX 4070 Ti SUPERと同格、RX 7900 GRE〜RX 7700 XTがRTX 4070 Ti〜RTX 4070クラスに近いスコアを出すなど、世代間で性能が割と近いことも分かる。

　そしてArc A770やA580はゲームグラフィックスにおける描画性能はRTX 4060 Ti〜RTX 4060辺りだが、GPUのハードウェアエンコーダーを利用した動画エンコード性能では1ランク上、RTX 4070に近いパフォーマンスが出せていることが分かる。

UL Procyon Video Editing Benchmarkにおける平均エンコード時間

　上のグラフはVideo Editing Benchmarkの総合スコアから4本の動画をエンコードするのに要した平均時間を逆算したものだ。処理時間が短いほど高スコアになるよう計算されているだけなのだが、平均時間で見ると総合スコアが4万ポイント以上のGPUは処理時間の差も非常に小さい。ただし4万ポイント以上と3万ポイント未満のGPUで10秒近い差が付いていることが分かる。

　現行世代のGPUはデュアルエンコーダー仕様なのが強みだが、実際は負荷が一定以上上がるとデュアルとシングルの差が狭まってくる。この結果が示しているのはエンコーダーの数よりもメモリバス幅の太さのほうがエンコード時間短縮に関係が強いことが分かる。特に処理時間の長いRX 6500 XT(64bit幅)やA380(96bit幅)はメモリバスを絞ったモデルであることからもそれが裏付けられる。

　また、GTX 1650が旧世代ローエンドのわりに健闘しているのはメモリバス幅が128bitであるためと考えられる。

AI系の処理では意外やIntelが健闘

　UL ProcyonはAI系のベンチマークもカバーしている。まずは“AI Computer Vision Benchmark”だ。このテストはこれまで“AI Inference Benchmark for Windows”と呼ばれていたもので、テスト内容はそのままより実態に即した名称に変更されたものだ。GPUごとのベストの性能を見るため、推論エンジンもGPUごとに変えている。具体的にはGeForce系はTensorRT、Radeon系はWindows ML、Arc系はOpenVINOを利用した。また、GPU側の演算精度はFP16としている(デフォルトのFP32利用時よりわずかにスコアが上がる程度)。

UL Procyon AI Computer Vision Benchmarkのスコア計測結果

　RTX 4080 SUPERやRX 7900 GREのようにところどころ下位モデルに逆転されている部分はあるものの、GPUシリーズ全体としては一応整合性のあるスコアにはなっている。GeForceにおいてはRTX 40シリーズ、特にRTX 4060のスコアがRTX 3070に迫るなど旧世代RTX 30シリーズに比してAI系の処理性能が大きく引き上げられたことが再確認できた。

　一方RadeonはWindows MLだからか全体にスコアが低迷しており、最速のRX 7900 XTXですらRTX 3050の推論性能にはおよばない。RX 6000シリーズよりもスコアは向上しているが、まだまだ改善の余地がありそうだ。このベンチマークでも推論エンジンにWindow MLでなくROCm(WSL2経由だが)を利用することが可能になればもっと改善する可能性はあるが、残念ながらUL Procyonにはテスト実施時点で未実装だ。

　そしてこのテストでもっとも注目すべきはArc A770とA580がRX 7000シリーズ以上のスコアをあげているという点だ。OpenVINO経由である点も有利に働いている可能性も高いが、ゲームグラフィックスにおけるパフォーマンスにクセが強い一方で、汎用的な処理性能においてはArc Aシリーズは十分評価できる完成度である、と言える“かもしれない”。

UL Procyon AI Computer Vision Benchmarkにおける推論回数のうち、2テスト分の結果を抜粋したもの

　このAI Computer Vision BenchmarkではさまざまなAI処理における推論回数がスコア算出の基準となっている。テストは全部で6種類あるが、ここでは物体検出であるYOLO V3および超解像処理であるReal-ESRGANにおける推論回数を抜粋した。グラフを2本に絞ったのは単にデータが多過ぎて全部を表示しても視認性が低くなるだけだか、このグラフだけでも全体の力関係は総合スコアの傾向とほぼ同じである。

　RTX 40シリーズが強いのは同じ処理でも推論をよく回せる(＝時間あたりの処理性能が高い)からであり、RX 7000シリーズその点非常に弱いことが分かる。ただReal-ESRGANテストの推論回数に関して言えばRX 7000シリーズも健闘しており、RX 7900 XTXはRTX 4070 SUPERのやや下、RX 7600はRTX 4060のやや下程度にまで迫っている。Real-ESRGANにおける処理がたまたまRadeonでよく回ったからに過ぎないかもしれないが、このような得意とする処理を増やしていくことが、今後のAI市場におけるRadeonの価値に影響するであろうことは間違いない。

　AIと言えば生成系AIを避けて通るわけにはいかないが、UL ProcyonにはStable Diffusion 1.5やStable Diffusion XL(SDXL)を利用したベンチマーク“AI Image Generation Benchmark”も搭載されている。解像度1024×1024ドットの画像を1枚ずつ合計16枚出力するというSDXLベースのテストを実施したが、これは今後より強力なGPUが出現することを考えてのことだ。ここでも推論エンジンはGeForce系はTensorRT、Radeon系はONNX、Arc系はOpenVINOをそれぞれ使用している。

UL Procyon AI Image Generation Benchmarkのスコア。“計測不可”部分はエラーなどで完走できなかったことを示す

　ここでもRTX 40シリーズ、とりわけRTX 4090のスコアが飛び抜けて高い。最低でも30万円程度の投資が必要なGPUだが、突き抜け方を考えると高止まりするのも止むなしか、と感じることだろう。RTX 4060 Ti (16GB)やRTX 3060 (12GB)といったVRAM搭載量が10GBを超えているものはそれなりのスコアが出せているが、8GBより下だとスコアが一気に落ちる。

　このベンチマークではSDXLを利用した場合のVRAMはTensorRT使用時で10GB以上、そのほかのAPIだと16GB以上という過酷な条件であるため、下位GPUでは手も足も出なくなる。ただVRAM 8GBの新旧GeForceを比較すると、RTX 30シリーズのほうが辛うじて動いているケースがある。RTX 3050がRTX 3060 Tiを上回っているように、直感に反した結果を出している部分もある。

　一方RadeonはGeForce勢よりもスコアが低いというのは前のテストでも観測されたことだが、特にRX 6000シリーズではVRAM搭載量が多くても安定しない。逆にRX 7000シリーズはRX 7700 XTのようにVRAMが12GBであっても(ONNXでは16GB推奨)しっかりスコアが出ているのが興味深い。この差どこから来るかと言えば、RDNA 3より実装されたAI処理に特化したAI Matrix Acceleratorの存在に到達する。

　RX 6000シリーズはゲームではまだ選択肢に入るかもしれないが、AIを考えるとRX 7000シリーズに完全に遅れを取ってしまうようだ。

UL Procyon AI Image Generation Benchmarkにおける画像1枚あたりの平均生成時間

　上のグラフはAI Image Generation Benchmark実施時にスコアとともに提示される画像1枚あたりの生成時間を比較したものだ。生成時間が短いほど高スコアという単純なものだが、RTX 4060やRTX 3060 Tiなど、スコアが100ポイントを下回るGPUにおいては、1枚出力するのに15〜20分程度要している。

単純な殴り合いではGeForceが強い「オーバーウォッチ 2」

　ここから先はゲームによる検証となる。まずは「オーバーウォッチ 2」では、画質“エピック”、レンダースケール100％、フレームレート上限600fps、さらにDLSSやFSRは無効。マップ“Eichenwalde”におけるBotマッチを観戦中のフレームレートを「CapFrameX」で計測した。解像度はフルHD/WQHD/4Kの3通りで検証している。

オーバーウォッチ 2/解像度別の平均フレームレート

　この検証ではアップスケーラーやフレーム生成系の技術は一切使わないドット等倍表示における力比べになっているが、RTX 4090の化物具合がよく分かる。Radeon勢よりもGeForce勢のほうが全体としてフレームレートがやや高く出る傾向にあり、GeForce勢の中でもRTX 40シリーズの上位、特にRTX 4070 Ti寄り上はほぼRTX 30シリーズを上回るなど、RTX 40シリーズの強さが再確認できた。

　Radeon勢もRX 6000シリーズよりもRX 7000シリーズが上回っているが、RTX 40シリーズ上位ほどの伸びはない。そして3DMarkでまあまあのスコアを出していたArc Aシリーズは実ゲームではやや減速。最上位のA770でRTX 3060 (12GB)と同程度、A580ではRTX 3050やRTX 2060に近いなど、エントリー寄りの結果にとどまっている。

「Starfield」ではDLSS FGが謎の壁にブチ当たる

　続いては「Starfield」を利用する。4月頃のアップデートからFSR 3のサポートや異方性フィルタリングの設定が変更になるなど、リリース当初に比べグラフィックスまわりの扱いが徐々にではあるが変化してきている。まずは画質“ウルトラ”、かつアップスケーラーはのない、レンダースケール(RS)100％設定で検証する。都市マップ“ニューアトランティス”のMAST地区を移動する際のフレームレートを「CapFrameX」で計測した。ちなみに、解像度はデスクトップの解像度を直接変更することで対応している。

Starfield/解像度別の平均フレームレート

　RTX 2060やRX 6500 XT (4GB)といったエントリークラスのGPUではかなり厳しいが、GeForceは70番台、Radeonなら700番台より上でフルHDでも割となめらかに動く(60fps〜)ようになる。しかし4Kで60fpsを出すにはRTX　4080やRX 7900 XTXといったエンスージアスト向けGPUが必要だ。

　こういう重いゲームはアップスケーラーの力を借りて負荷を下げ、フレーム生成を使ってさらになめらかにするのが今の技術的トレンドだ。次の検証はRTX 40シリーズはDLSS“バランス”かつDLSS FGを有効に、そのほかのGPUはFSR 3のフレーム生成をオン、レンダースケール58％(つまり“バランス”相当のスケール)に設定。そのほかの条件は先の検証と同じである。

Starfield/解像度別の平均フレームレート(アップスケーラー/フレーム生成技術併用)

　先のグラフよりもRadeon勢においてフレームレートが大きく伸びている。むしろDLSS FGが使えて有利なはずのRTX 40シリーズにおいては、166fps近辺でなんらかのソフトウェア的なキャップがかかっているようだ(検証環境は144Hzディスプレイ＆V-SyncOFF)。今回RTX 30シリーズもFSR 3のフレーム生成を使っているが、RTX 3090でもRX 7800 XTにわずかに負けているためDLSSとFSR 3のフレーム生成の優劣と言うよりも、RadeonとStarfieldの描画処理の相性がよい。AMDとの独占パートナーシップの賜物と言えるのかもしれない。

AFMFでRadeon＆レイトレーシングに光が差した「サイバーパンク2077」

　ここから先はレイトレーシング処理を含めたグラフィックスパフォーマンスを検証する。ここで利用する「サイバーパンク2077」では、画質“レイトレーシング：ウルトラ”をベースに、アップスケーラー(DLSS/FSR2/XeSS)を明示的にオフに設定。ゲーム内ベンチマーク再生中のフレームレートを「CapFrameX」で計測した。

サイバーパンク2077/解像度別の平均フレームレート。GTX 1650はレイトレーシング設定が通らないため計測不可とした

　前掲の3DMarkの検証結果と同様に、GeForce特にRTX 40シリーズのフレームレートは優秀。フルHDであればRTX 4070より上、WQHDであればRTX 4080より上が60fpsを出すための基準となる。ただ4Kはアップスケーラーもフレーム生成もなしでは厳しく、RTX 4090ですら40fps台だった。

　Radeon勢に関してはRX 7000シリーズでRTX 30シリーズに追い付いた感じだが、特にWQHDや4Kといった高解像度領域においてRTX 30シリーズよりも高いフレームレートを出している。RX 7000シリーズではVRAM搭載量の多いモデルが多いことやInfinity Cacheを利用して実質的メモリ帯域を増やしているなどの理由が考えられる。

　Starfieldと同様にアップスケーラーやフレーム生成技術を利用したときのフレームレートも比較しよう。RTX 40シリーズはDLSS“バランス”にDLSS FGとRR(レイ再構築：DLSS 3.5の一部)を有効化。RTX 30シリーズはDLSS“バランス”とRRを有効化。Radeon勢はFSR 2“バランス”とAFMFを有効化。Arc勢はXeSS“バランス”設定とした。画質や計測方法については先の検証と同一だが、AFMFを利用するRadeonだけはGPUドライバーのフレームレート計測機能を利用している。

サイバーパンク2077/解像度別の平均フレームレート(アップスケーラー/フレーム生成技術併用)

　アップスケーラーなしの設定ではRadeon勢、特にRX 6000シリーズはかなり厳しい結果だが、FSR 2で負荷を下げ、AFMFでフレーム生成を挟むことでフレームレートが著しく改善。フルHDならばRX 6600 XT以上、WQHDならRX 6700 XT以上でも十分高いフレームレートが期待できる。4KプレイともなるとRX 7900 GREより上が必要になるが、レイトレーシング処理が苦手というRadeonの欠点を覆い隠してしまうAFMFの力はすごいとしか言いようがない。E-Eシステムレイテンシーが増加するため“動きに違和感を覚える”人も出てしまうが、AFMF登場以降のRadeon RX 6000シリーズ以降は重量級ゲームもぐっと攻めやすくなったと言える。

　Starfieldでは謎の壁に阻まれてしまったGeForce勢だが、サイバーパンク2077ではDLSS FGがしっかりとフレームレートを伸ばした。RTX 4070 Ti以上であれば4Kでのプレイも可能だ。DLSS FGに対応しないRTX 30シリーズはRadeonに比べると厳しい状況だが、RTX 3070より上であればWQHDでのプレイが視野に入ってくる。

　最後にArc Aシリーズだが、こちらもフレーム生成技術がなく、かつサイバーパンク2077自体もFSR 3に対応する気配がないため、Arc A770やA580でプレイしたいのであれば、レイトレーシングなしのウルトラ設定あたりにとどめておく必要があるだろう。

「F1 23」でもAFMFの恩恵が大きい

　最後に試すゲームは「F1 23」となる。先日新シーズン(F1 24)に切り換わったばかりだが、検証時期の関係でF1 23である点はご容赦戴きたい。画質“超高”をベースに異方性フィルタリングを16x、アンチエイリアスをTAA＆FidelityFXに設定。ゲーム内ベンチマーク再生中のフレームレートを「CapFrameX」で計測した。

F1 23/解像度別の平均フレームレート

　このゲームもレイトレーシングを利用するため、アップスケーラーもフレーム生成もない状況ではGeForce系が有利だが、特にRTX 40シリーズ上位(RTX 4070 SUPERより上、つまりAD103以上)がとにかく強い。レイトレーシング処理がサイバーパンク2077ほど重くないためRX 6800 XTなどでもフルHDに限定すればフレームレートも出しやすいが、RX 7000シリーズ、特にRX 7800 XTより上が優秀であると再認識。

　ではF1 23でもアップスケーラーとフレーム生成を利用した際のフレームレートを比較しよう。RTX 40/RTX 30シリーズはDLSS“バランス”のみ、RX 7000/RX 6000シリーズはFSR 2“バランス”にAFMFも併用、Arc AシリーズはXeSS“バランス”設定とした。そのほかの条件は先の検証と同一としている。

F1 23/解像度別の平均フレームレート(アップスケーラー/フレーム生成技術併用)

　このテストではフレーム生成の封じられたGeForce勢に対し、AFMFのおかげでゲーム側の対応に関係なくフレーム生成が受けられるRadeon勢の比較である。DLSSで負荷を抑えてやればフレーム生成がなくとも4Kプレイが可能な程度のフレームレートは出せるが、それが可能なのはRTX 4070以上、あるいはRTX 3080以上とハードルもそれなりに高い。

　AFMFを使えばフレームレートが伸びるが、特にフルHD〜WQHDでのフレームレートはRX 7700 XTがRTX 4080を上回るなど、割安のRX 7000シリーズによるジャイアントキリングが見られておもしろい。

GPUの消費電力

　最後にGPUの消費電力について検証していこう。今回の検証では、HWBusters「Powenetics v2」を利用し、電源ユニットの各ケーブルから引き出される電力を直接計測している。

　まずはアイドル時および高負荷時の消費電力をシステム全体およびビデオカード単体という2つの視点から計測する。アイドル時とは文字どおりアイドル状態で3分放置した場合の平均値を、高負荷時とは消費電力は3DMarkの“Time Spy - Graphics Test 2"における開始から終了までの消費電力を指すが、高負荷時はシーン再生中の平均値および99パーセンタイル点、さらに瞬間最大値をそれぞれ比較する。また、Powenetics v2で計測できる電力とは、以下のとおりである。

・ビデオカードの消費電力：PCI Expressスロット+PCI Express 8ピンコネクター×最大3の合計値(GeForceの12/16ピンは変換ケーブルを利用)
・システム全体の消費電力：ATXメインパワー+EPS12V×2＋ビデオカードの消費電力

システム全体の消費電力。99％ileとは99パーセンタイル点を示す

ビデオカード単体の消費電力(Total Board Power/TBP)

　システム全体としての消費電力で群を抜いて高いのは平均値も最大値も高いRTX 3090。カタログスペックではもっとも消費電力の高い(450W)なRTX 4090は瞬間的には高いものの、平均値でみればRX 6950 XTに次ぐ3番手にとどまった(それでも大きいが)。

　RTX 4070 Ti〜RTX 4080 SUPERクラスのRTX 40シリーズはRX 7000シリーズ(特にRX 7800 XT辺り)に比べると消費電力が大きいというイメージを持ちやすいが、RTX 4070 SUPER〜RTX 4060は対応するRadeonと消費電力的に大きな差がない。

　そしてArc Aシリーズは性能のわりに消費電力が大きく、特にアイドル時の消費電力がやたらと大きいという欠点が再確認できた。

　だがこの消費電力データはあくまでベンチマークツールという枠内での話であり、実ゲームでは話が違ってくる。CPUがゲーム上の処理するためにGPUが待たされることもあるからだ。ここから先は先に検証した4本(+アップスケーラー/フレーム生成有効時でさらに3本)のフレームレートを計測した際に、Powenetics v2で観測された平均Total Board Power、すなわちビデオカード単体の平均消費電力の比較となる。画質設定、アップスケーラーおよびフレーム生成の条件も先の検証と同様としている。

Total Board Powerの平均値/オーバーウォッチ 2

Total Board Powerの平均値/Starfield

Total Board Powerの平均値/Starfield(アップスケーラー/フレーム生成併用)

Total Board Powerの平均値/サイバーパンク2077

Total Board Powerの平均値/サイバーパンク2077(アップスケーラー/フレーム生成併用)

Total Board Powerの平均値/F1 23

Total Board Powerの平均値/F1 23(アップスケーラー/フレーム生成併用)

　消費電力の大きかったRTX 4090を筆頭に、RTX 40シリーズの上位陣においては、解像度が低くなるとその分消費電力が低くなることが多い一方で、RTX 30シリーズやRadeon勢/Arc Aシリーズにおいては解像度が変わっても消費電力がほとんど変化しないことが多い。

　特にRX 7000シリーズは解像度に関係なくほぼフラットな消費電力特性を示している。なぜRTX 40シリーズは解像度によってここまで差があるかだが、これはAda Lovelace世代のGeForceでは巨大な2次キャッシュを抱えており、これがRadeonのInfinity Cache以上にVRAMへのアクセスを抑制しているためと考えられている。アップスケーラーを有効にするとさらにVRAMへのアクセスもさらに絞れるため、アップスケーラー使用時はさらに消費電力が低くなる、という塩梅だ。

　StarfieldにおけるRTX 40シリーズでは、フレーム生成利用時に謎の166fpsキャップが出現しているが、消費電力を見る限りGPUは仕事をしているものの、なんらかの理由でフレームレートに反映されていないのではないかと考えられる。

今回の総評：次世代GeForce＆Radeonの登場が待ち遠しい

　以上で検証は終了となる。AFMFの実装によりゲームにおけるRadeonの輝きが増した一方で、GeForce系(特にRTX 40シリーズ)は価格以外の弱点がないということも見えてきた。2024年はNVIDIAのRTX 50シリーズが登場間近と噂されているほか、AMDのRDNA 4世代のGPUもなんらかの動きを見せることが期待されている。次回の検証は新世代のGPUが登場した後になるだろう。おたのしみに！

【新旧GPU 34製品一斉比較！上から下まで性能丸分かり。GeForce RTX 40/30、Radeon RX 7000/6000大激突！あなたが買うべきモデルはこれだ！！】