GeForce RTX 5060、旧世代に動画エンコードやAIの強さを見せつける

今回筆者が入手したASUS製ファクトリーオーバークロック(以下、OC)モデル「DUAL-RTX5060-O8G」。販売解禁前日の段階でも店頭販売価格は謎のままだ……
2025年5月20日、NVIDIAは「GeForce RTX 5060」(以降、RTX 5060)の国内販売を解禁する(価格は5万5800円より)。今回は開封の儀を通り越してプレビュー記事を出すという異例の展開となったが、ようやくフルレビューが可能になったのでお届けしよう。
今回もレビューは前後編の2本立てである。前編である本稿では、基本性能やクリエイティブ系アプリ、AIにおけるパフォーマンスを検証し、ゲーミング性能は後編にて検証する(ギリギリまで作業をしすぎて筆者が力尽きただけだ)。
なお、筆者がRTX 5060のテスト用カードを手にできたのは純粋に運が良かっただけなのだが、スケジュールはいつも以上に薄氷を踏むような展開であった。
それでもRTX 2060(2019年1月発売)以降に登場したxx60番台のGeForceとRTX 5060を比較することで、GeForce RTXシリーズが6年でどの程度強くなったのか検証できるだけのデータは確保できたと確信している。

テスト用に確保したRTX 5060搭載ビデオカードの情報を「GPU-Z」を利用して取得。ファクトリーOCモデルのため、ブーストクロックは2535MHzに設定されている(リファレンス仕様では2497MHz)。また、CPUとのリンクはPCI Express 5.0x8接続となる
歴代のxx60番台GeForceと対決
検証環境はプレビュー記事からまったく変わっていない。歴代のxx60番台GeForce対決といったところか。RTX 50シリーズとRTX 40シリーズのスペックを比較した時、描画性能のカギを握るSM(Streaming Multiprocessor)数が最も増加したGPUは、RTX 5090(RTX 4090の1.33倍)だが、RTX 5060の増加率はこれに次ぐ(RTX 4060の1.25倍)。
もちろん、ほとんど増えていないモデルでも、動作クロックやTGP、メモリー帯域などでバランスを取っているので、SM数の増加率だけで評価をすることはできない。しかし、RTX 5060 TiとRTX 4060 Tiの対比(6%増)を考えると、RTX 5060の25%増はなかなかに良い強化のように思える。今回はそこに注目していきたい。
GPUドライバーはRTX 5060のみGameReady 576.46、それ以外のGPUについてはGameReady 576.40を使用している。Resiazble BARやSecure Boot、メモリー整合性およびカーネルモードのハードウェア適用スタック保護、HDRなどはひと通り有効化。ディスプレーのリフレッシュレートは144Hzに設定した。
また、これまでRTX 50シリーズのレビューでは消費電力を計測する「Pownetics v2」を利用する関係でCPUとGPUのリンク速度をPCI Express 4.0(Gen 4)に絞っていたが、今回はPCI Express 5.0(Gen 5)でリンクさせている。
これはRTX 5060 Ti 8GBのレビューを通じ、VRAM使用量が8GBを大幅に上回る状況下では、PCI Expressのトラフィック増がフレームレートに強い影響を及ぼす場合もあると判明したためである。ゆえに、今回の検証においては、PCI Expressのリンク速度がボトルネックとなるような状況ではない。
RTX 4060から最大40%の性能向上を果たす
まずは「3DMark」の結果を見なければ、GPUの比較ははじまらない。ラスタライズ系テストとレイトレーシング系テストでグラフを分割している。

3DMarkのスコアー(ラスタライズ系)

3DMarkのスコアー(レイトレーシング系)
今回準備したRTX 5060 Ti 8GBはファクトリーOCモデルだ。そのため、リファレンス仕様のRTX 5060 16GBよりもクロックが若干高いためスコアーが上になった。3DMarkではVRAM使用量が8GBで十分足りるからだ。
肝心のRTX 5060に目を向けよう。RTX 5060 Ti 8GBから見ると10〜20%下のスコアーになるが、その一方でRTX 4060基準で考えるとスコアーは30〜44%も伸びている。
RTX 4060からRTX 5060の進化点は主にSM(Streaming Mutiprocessor)数の増加とメモリー帯域の拡大、TGP(Total Graphics Power)の増量にある。SM数の増分がRTX 4060の1.25倍であることを考えると、メモリー帯域などの強化もRTX 5060のスコアーアップに貢献していると思われる。
続いては消費電力を比較しよう。3DMarkのSteel Nomad実行中の消費電力をPownetics v2で計測した。なお、図中の「アイドル時」はアイドル状態で3分間放置した際の平均値。「高負荷時」はSteel Nomad実行中の値だが、平均値と99パーセンタイル点、最大値の3種類の観点で集計した。

システム全体の消費電力。ATXメインパワーとEPS12v、ビデオカードの補助電源の16ピン(あるいは8ピン)、PCI Express x16スロットを流れる電力の合算となる

Total Board Power(TBP)。上のグラフのデータから16ピン(あるいは8ピン)とPCI Express x16スロットを流れる電力のみを抽出したもの
RTX 5060のTBPは平均151W、瞬間的な最大値でも160W(テストしたカードのPower Limitの限界値に等しい)であった。RTX 3060 12GBやRTX 2060と比べると大きく下がっている。
それでいて、3DMarkのスコアーは57〜71%(RTX 3060 12GB基準)あるいは79〜128%(RTX 2060基準)伸びている。そのため、ワットパフォーマンス的にも申し分ない。RTX 3060を運用できるPCであれば、電源ユニットの買い換えを心配せずにRTX 5060に移行できるだろう。
いつもなら消費電力検証はここで終わりだが、今回は追加でPCI Express x16スロットを流れる電力にも注目してみよう。ここは平均値のみを比較している。

TBPからPCI Express x16スロットを流れる電力のみを抽出したもの
PCI Express x16スロットからどの程度の電力を取得するかはカードの回路設計に依存する。そのため、このグラフのデータだけで良い・悪いを判定することはできない。
ただし、今回テストしたカードについては高負荷時に平均36〜61WもPCI Express x16スロットから取得している。ゆえに、後日ゲームにおけるワットパフォーマンスを論じる上で、PCI Express x16スロットからの消費電力を無視することはできないという認識を新たにした。
ちなみに、今回はPownetics v2の電力測定用ライザーカードを装着しても、PCI Express 5.0でリンクできた。以前はドライバーを読み込んだ時点でOSが固まるといった不具合があったのだが……。どのような理由でPCI Express 5.0動作できたのかは完全に解明できていないが、今回は動作に問題はないと判断した
クリエイティブ系アプリでも順当進化
ここからはクリエイティブ系アプリの検証となる。まずはCGレンダリング系のテストからはじめよう。
「Blender Benchmark」
Blender Benchmarkではバージョン「v4.4.0」を指定した。レンダリングデバイスは当然ながらGPUである。

Blender Benchmarkのスコアー
GPUごとの優劣は3DMarkと同じ傾向だが、ここではRTX 5060が旧世代、特にRTX 2060やRTX 3060 12GBに対して大きな差(55〜138%増)をつけている点に注目してほしい。
RTX 5060 Ti 8GBやRTX 4060との差は17〜20%と、あまり大きくないような印象を受ける。ちょうどRTX 5060は両者のほぼ中間に着地したイメージだ。
「V-Ray Benchmark」
V-Ray Benchmarkは2種類のGPUレンダラー(RTXとCUDA)を使用する。どちらも5分間動かした後のスコアーを比較した。

V-Ray Benchmark:スコアー
V-Ray BenchmarkではBlender BenchmarkよりもRTX 5060 Ti 8GBとRTX 5060の差が小さく、逆にRTX 4060との差のほうが大きい。RTコアの世代が古いRTX 3060 12GBやRTX 2060との差はBlender Benchmarkよりもさらに拡大している。
「UL Procyon」 (Premiere Pro)
続いては動画エンコード系の検証だが、まずはUL Procyonに収録されている「Video Editing Benchmark」を使用する。これは「Premiere Pro」を実際に操作し、4種類の動画(再生時間は1分前後)をH.264やH.265のMP4にエンコードする速度を見るというものである。エンコードデバイスはGPUを明示的に指定している。

UL Procyon:Video Editing Benchmarkの総合スコアー

UL Procyon:Video Editing Benchmarkにおけるエンコード時間その1。コーデックはH.264を利用

UL Procyon:Video Editing Benchmarkにおけるエンコード時間その2。コーデックはH.265を利用
RTX 5060を含む上位3モデルの総合スコアーはほぼ横並び。このテストの処理中はCUDAコアも使う(タスクマネージャーで3Dの負荷が上下する)ため、CUDAコア数も関係するのではと考えていたが、RTX 5060クラスのGPUでは影響が少ないようだ。
一方で、旧世代はRTX 5060より確実に処理時間が長い。NVEncの仕様で言えば、RTX 2060よりもRTX 4060のほうが新しい(AV1対応)のだが、Premiere Proではまったくふるわなかった。
RTX 4060はRTX 3060 12GBやRTX 2060よりもメモリー帯域が劣っており、その点が処理時間に悪影響を及ぼしていると考えられる。ちなみに、RTX 2060のほうがRTX 3060 12GBよりもわずかにエンコード時間が短い点に関しては、次のテストでも確認できている。
「HandBrake」
再生時間約3分の4K@60fps動画(H.264)に対し、プリセットの「H.265 NVEnc 2160p 4K」で再エンコードする時間を比較した。なお、各種パラメーターの設定はプリセットのままだ。

Handbrake:エンコード時間
先のVideo Editing Benchmarkと同じく、RTX 5060 Ti 16GB〜RTX 5060でまったく差が出なかった。しかし、RTX 4060はRTX 5060との差をかなり縮めている。
対して、RTX 3060 12GBはRTX 5060から20秒以上遅れるだけでなく、RTX 2060より微妙に遅くなっている。凝った編集をせずNVEncを使ったシンプルなエンコード速度だけ考えた場合、RTX 3060などからRTX 5060に移行するメリットはあるかもしれない。
「DaVinci Resolve Studio」
これまでRTX 50シリーズで追加された4:2:2 10bitカラーフォーマット対応のNVEnc検証には、NVIDIAから提供された特別なビルドを利用していたが、現在公開中のDaVinci Resolve Studioのv20(パブリックβ)でようやく本流に組み込まれる模様だ。
4K動画のプロジェクト(再生時間32秒)をCBR 80MbpsのH.265で出力する時間を計測。RTX 50シリーズではH.265のプロファイルに「Main 10 4:2:2 10bit」を指定することで新カラーフォーマットでエンコードできるようになるが、旧世代のGeForceとの比較用に4:2:0 10bitの「Main10」プロファイルを使用した場合のテストも実施した。

DaVinci Resolve Studio:エンコード時間
DaVinci Resolve StudioでもRTX 5060 TiとRTX 5060の間に明確な差はなく、RTX 4060より下のGPUとは一線を画す性能を示した。RTX 5060はVRAMが8GBなので、DaVinci Resolve Studioで本格的な作り込みをするにはあまり向いていないが、エンコード性能はVRAM搭載量の多いRTX 5060 Ti 16GBと遜色ないものを備えていると言えるだろう。
AIパフォーマンスでも存在感を示す
「UL Procyon」(LLM)
ここから先はAI系の検証となる。まずはUL Procyonに収録されている「AI Text Generation Benchmark」だ。4種類のLLMに対し、7つのテキスト生成課題を出し、出力されるトークン生成スピードおよび最初のトークンまでの待ち時間からスコアーを算出するというものだ。

UL Procyon:AI Text Generation Benchmarkのスコアー。学習モデルはPhi-3.5-mini-instructからLLama-2-13Bまで。バーが短いものほど重い

UL Procyon:AI Text Generation Benchmarkにおける最初のトークンまでの時間。バーが短いほど思考時間が短縮され、応答性が良好になる

UL Procyon:AI Text Generation Benchmarkにおけるトークン生成スピード。バーが長いほど文章をすばやくアウトプットしていることを示す
まず、学習モデルが大きいLLama-2-13Bを実行できたGPUはRTX 5060 Ti 16GBとRTX 3060 12GBの2GPUのみ。RTX 5060 Ti 8GBやRTX 5060に関してはVRAM不足からLLama-2-13Bは完走できなかったのだ。また、RTX 2060は全学習モデルにおいて完走できず敗退となった。
総合スコアーだけを見ると、RTX 3060 12GBはまだまだ使えるGPUのように見えるが、RTX 5060が実行できる学習モデルでは大敗している。また、RTX 4060は応答速度に関して言えば、RTX 5060と僅差(0.5秒未満)だが、トークン生成スピードにおいては大差で負けている。
「MLPerf Client」
お次は「MLPerf Client」によるLLMパフォーマンスの検証だ。4つの課題(Content Generation、Creative Writing、Summarization, Light、Summarization, Moderate)を出し、その際のトークン生成スピードや最初のトークンまでの時間を計測するものである。
最初のトークンまでの時間およびトークン生成スピードについて、全4課題すべての平均値のほかに、最も軽い課題と重い課題のデータも見てみよう。

MLPerf Client:最初のトークンまでの時間(全テスト平均)

MLPerf Client:トークン生成スピード(全テスト平均)

MLPerf Client:4つのお題のうち最も軽いContent Generationにおける最初のトークンまでの時間

MLPerf Client:Content Generationにおけるトークン生成スピード

MLPerf:4つのお題のうち最も重いSummrization, Moderateにおける最初のトークンまでの時間

MLPerf:Sumamrization, Moderateにおけるトークン生成スピード
先のUL ProcyonではRTX 2060が脱落してしまったが、このMLPerf Clientではすべて完走した。ただし、RTX 5060と比較するとかなり見劣りする。
ここでもRTX 3060 12GBとRTX 4060は僅差になったが、RTX 5060に対してはトークン生成スピードにおいて25%程度遅い(Summarization, Moderate基準)という結果となった。
「UL Procyon」(Stable Diffusion 1.5)
最後に、画像生成に関しても軽く検証しておこう。ここではUL Procyonに収録されている「AI Image Generation Benchmark」を使用した。
このテストでは3種類のテストを選択できるが、VRAM 8GB環境でも実行でき、かおかつ現実的な時間内で終了する「Stable Diffusion 1.5 (FP16)」を選択した。テスト内容は512×512ドットの画像を4枚ずつ、合計16枚生成するというものである。

UL Procyon:AI Image Generation Benchmarkのスコアー

UL Procyon:AI Image Generation Benchmarkにおける1枚あたりの生成時間
RTX 5060 Ti 8GBとRTX 5060の差よりも、RTX 5060とRTX 4060の差にほうが大きくなった。生成スピードにおいて1.36倍も長い。RTX 5060 Tiに関しては、VRAM搭載量の差が生成時間に影響していないが、これはテストの条件がVRAM 8GBにターゲットを合わせているためである。
RTX 5060 Ti 16GBを輝かせたいならば、Stable Diffusion XLを利用したテストのほうが好適だが、そうなるとVRAM 8GB仕様のGPUでは処理時間が苦痛になるほど長くなるため断念している。
RTX 5060のVRAMは8GBのため、画像生成においても比較的ライトな処理に限定されるが、それでも前世代の同格モデルよりしっかりと高速化されているようだ。
気になるゲームのパフォーマンスは後編で
RTX 5060のレビュー前編はここで終了である。RTX 5060は明らかにゲーマー向けの製品なのに、ここまでクリエイティブ系やAI系アプリで検証する必要があるのか? と自問自答しながら執筆していたが、RTX 5060というGPUの全貌を知るには必要なことだ。
後編はRTX 5060 Ti 8GBレビューの時と同様、VRAM 8GB仕様に厳しい攻めた画質設定と、優しいマイルドな画質設定の2パターンでテストしてゆく。お楽しみに。