HSReplayの各統計量について考える

導入

この記事では、Mulligan WR,Drawn WR \cdotsなどの統計量について、具体例とともにそれが何を表すのかを探る。


知識の整理

すでに知られていることについて、簡単に振り返る。

各統計量

Mulligan WR

最初に手札にあったときの勝率。マリガンの意思決定に活用できる。

  • キープ率が低く、WRの高いものは、1.サンプル不足 2.セットキープ で高くなることなどが代表的には考えられる(他にもいろいろある)。どちらかを見極めてマリガンを改善できる。
  • キープ率の高いものは、そのデッキの勝率に近づいていく。つまり、WRの順番で並べたとき、そのカードが実際の有効性に比して弱く見えるときがある。

Drawn WR

そのカードを引いたときの勝率。カードの総合的なパフォーマンスの指標として用いられることがある。

  • 後でも述べるが、これもよくキープされるものなど、引きやすいカードはデッキの勝率に近づく。
  • ナーフされるカードは、これが高いカードが多い。つまり、運営もDrawn WRに近い指標でカードの強さを評価していると考えられる。

Played WR

そのカードが使われたときの勝率。リーサルを取るためのカードが高くでたり、除去札が低くでたりとくせがある。(勝つときにつかうカードはPlayed WRが高くでるし、劣勢のときにつかう除去札はPlayed WRが低くでるというのは直感に適うはず。)

  • 個別のカード統計では、ターン毎のPlayed WRを見ることができる。*1

TIPS(小さなトピックをいくつか紹介)

\bigcirc損失の偏りとMulligan WR

Mulligan WRは、高ければキープすべきで、低ければキープしないほうがよいという単純な論理ではない。プレイヤーの意思決定の平均がMulligan WRに影響して、例えば不利なマッチでキープされやすいカードはその有効性に関係なくそもそも不利マッチなので低く出てしまう。このように、利得、損失がプレイヤーの意思決定を介して一部のカードに偏ることがある。(利得の偏りはセットキープされるカードなどが考えられる。)

[09/15 22:30 追記]利得とは、対象の勝率(ex:Drawn WR,Played WRなど文脈依存)を高める効果を指し、損失は、対象の勝率を下げる効果を指す。対象の勝率は\frac{n_w}{n_{w+l}}のように条件を満たす回数とその内の勝利数の比で書けるから、分母、分子を変化させることに相当する。

\bigcircドローの無作為性とDrawn WR

Drawn WRは、引いた回数が効いてくるから、サーチカードのおかげで引く可能性が他より高いカードは、Drawn WR=\frac{\text{(引いて勝った回数)}}{\text{(引いた回数)}}の分母の引いた回数が、測定試合数に近くなっている。つまり、そのデッキの勝率に近づいていく(規定の動きとしてそれを引く試合数が多くなるため)。Drawn WRをカードの強さの比較として用いるとき、これを注意する必要がある。他にも、例えばマリガンでキープされやすいカードは、引く回数が他のカードより高くなるので、Drawn WR,Mulligan WRは勝率に近づく。*2

参考

自分がよく参考にしている記事。個人的に訳したものはJ_Alexanderによる「HSReplayの統計の理解と解釈について」 - sylvester_hsのBlog。 この記事の目的の一つに、これが天下り的に書いている内容を実際に確かめるというのがある。

docs.google.com

考察

以下、考察を行う。まず比較のために相違点を確認し、そこから具体例とともに議論する。考察はその章のタイトルの内容について行う。

    トピックのまとめ
  • 各統計量の相違点
  • Drawn WRとは何か?
  • ドローカードとDrawn WR
  • デッキタイプとDrawn WRの色
  • 引かないほうが強いカード

各統計量の相違点

各統計量の違い

上に、状況別に各統計量に加算されるかをまとめた。例えば、ドロー勝率に含まれて、マリガン勝率に含まれないのは、初手の手札になく、試合の途中で引いた場合とわかる。

Drawn WRとは何か?

Drawn WRという指標は「そのカードを引いたときの勝率」ということで、直感的になにを指し示すのかわかりづらい。上の表で考えれば、Drawn WRはPlayed WRで数えられる場合に加えて、引き込んだがプレイせずに試合を終えた場合を含んでいる。

  • Drawn WRの高いカードは、それを引いたことが勝利に貢献する。

  • Drawn WRの低いカードは、引いても他より勝ちにつながらない弱いカードである。

のような、解釈ができそうな気もする。もう少し、詳しく考えてみる。

ラクロンドの使徒、無限のムロゾンドのカード統計を下に示した。*3

ラクロンドの使徒の統計

無限のムロゾンドの統計

まずは、ガラクロンドの使徒について見てみる。下側の使用ターン別勝率のグラフの概形に注目する。これを見ると、1,2ターン目と、15,16ターン目にピークがある。*4

一方、15,16ターン目にガラクロンドの使徒を出すことは、試合を決定しうるほどのパワーのある動きとはいえない。ここにピークがあるのは、ここまで試合を引き伸ばした時点で、プリースト側の勝率が高いからである。

つまり、ガラクロンドの使徒をプレイしたことそれ自体が試合に及ぼした影響が大きいのは、1,2ターン目のピークにあらわれている方である。このグラフは、デッキの強さと個別のカードの強さを重ね合わせたグラフになっているということがわかった。

これを念頭に、無限のムロゾンドの方を見てみる。こちらは、ガラクロンドの使徒とは異なり、比較的平坦な曲線になっている。当たり前だが、1~6ターン目にはプレイできないので、このカードが試合に影響するのは7ターン目以降である。プリーストが10ターン前後で試合を終わらせるデッキであることを考慮すると、このカードが試合に寄与できるターンはせいぜい3,4ターンで、それ以降はガラクロンドの使徒同様、単に試合が長引いてプリーストが自動的に有利になっているにすぎない。

以上から、Played WRとDrawn WRの違いをある程度認識できるようになる。Played WRは、使ったことが前提なので、試合が短い、出している余裕がないなどの理由で使えなかったことによる損失を考慮しない。一方、Drawn WRは、引いたことが前提なので、そういう損失が損失として計上される。これは、Played WRが高い順に並べると、コストの高いカードが上に並ぶことからも確認できる。

Drawn WRは、そのカードの試合全体での強さを与えることがわかる。そういう意味で、Drawn WRはPlayed WRよりもカードの強さの指標に適している。

参考

統計からメタを読み解く③:個別のカード統計からデッキの勝利曲線を読み解く: Hearthchoccocci

ドローカードとDrawn WR

ドローカードはDrawn WRが低くなる傾向があると言われている。これについて考える。

まず、欠片デーモンハンターを例にとる。ドローカードは、霊視力と、グルダンの髑髏の2つ。

これらは、デッキの中でDrawn WRが低いカードのうちの一つである。少なくとも、グルダンの髑髏は書いてあること自体は強い。しかし、ドローカードは、有利なときに使われ、不利なときは使う余裕がない。つまり、勝てそうな試合では他のカードに更にアクセスしやすくし、負けそうな試合では引く枚数を抑制する。この場合、山札に残ったカードを引きにくくし、それらのDrawn WR=\frac{\text{(引いて勝った回数)}}{\text{(引いた回数)}}の分母を増やさないという結果を生んでいる。(前のTIPSでも同じような構造の話がある。)TIPSの表現を借りるなら、損失はドローカードが優先的に負い、利得はデッキ全体で分配するようになると言える。

現環境のデッキで代表的なカードについて簡単にまとめる。

  • Drawn WRの高いカード

  • Drawn WRの低いカード

    • 一夜漬け(スモールスペルメイジ)
    • 狂瀾怒濤(激怒ウォリアー)
    • 霊視力,グルダンの髑髏(欠片デーモンハンター)

これらを見ると、低コストで大量にドローできるカードや、比較的打ちやすいシチュエーションが訪れやすいデッキでは、ドローカードでもDrwan WRは高い。一方で、不利な盤面で使いにくいドローカードの代表の狂瀾怒濤などは低いことが確認でき、上の推論がおおむね正しいことがわかる。*5ちなみに、ドローカードであるトワイライトランナー自体はDrawn WRが低いが、実質的に守護獣の効果に付随した存在で、守護獣はDrawn WRが極めて高い。(これについては、後の「引かないほうが強いカード」の節を参照。)

難しいのは、Drawn WRが低いことは、カードが弱いことを必ずしも意味しないということで、おそらく、グルダンの髑髏や狂瀾怒濤をデッキから外して他の適当なカードに入れ替えても、デッキは強くならない。*6

デッキタイプとDrawn WRの色

いくつかのデッキをHSReplay上で見ると、Drawn WRの色がそれぞれ違うことがわかる。守護獣ドルイドや欠片デーモンハンターは緑系が多いし、フェイスハンターや隠れ身ローグは赤や黄色系が多い。

代表的なアーキタイプで、Drawn WRの中央値を比較してみる。*7

比較用の図

上の図は横軸を平均ターン、縦軸を(Drawn WRの中央値)-(デッキの勝率)でプロットした。相関係数は0.4なので、サンプルが少ない等はおいておくとするなら、弱い正の相関があることが確認できる。

つまり、平均ターンが長いデッキほど、Drawn WRは、勝率よりも大きい値を取りやすい。

これは、カードを引く枚数に起因している。平均ターンの長いデッキは、勝つときはカードをたくさん引いて、負けるときは引かずに負けてしまうことが多い。それにより、あるカードを引くときの勝敗に注目したとき、勝ったときに引く回数のほうが高くなっていると考えられる。

引く枚数が少ないデッキの代表は、アグロデッキで、ZOOのような強力なドローがないアグロデッキは概して赤系になっている。逆に、コントロールデッキや、デッキを回すデッキは緑系になる。

Drawn WRの大小でカードの強さを比較するときは、他のデッキと比べるのではなく、デッキ内や同じアーキタイプの似たリストと比べるべきだとわかる。そのとき、サンプルバイアスに注意する必要がある。

引かないほうが強いカード

例えば、守護獣ドルイド、マリゴスドルイドの獣ミニオン、フェイスハンターの秘策カード、トートランメイジの幻影ポーション*8など、手札から使うよりも、他のカードで踏み倒したほうが強いカードは、他のカードとは違い、引かないほうが強いカードである。実際、Drawn WRや、(詠唱等使用するカードで踏み倒さないなら)Played WRは低くなる。

このとき、そのカードの強さは、「踏み倒したときの強さ」+「素で引いたときの強さ」になり、前者は Drawn WRが低いほど強いと考えられるし、後者はDrawn WRが高いほど強いと考えられる。成分の比較として後者はPlayed WRの高低に顕著に現れる。

このように、場合によってはDrawn WRだけを評価軸にするのではなく、カードごとの特性に応じて評価軸を変える必要がある。*9

終わりに

とりあえず、ここ数日で調べたり、考えたりしたことはまとめ終えた。また、気になったことがあればここに付け足すか、新たに記事を書くかもしれない。


追加考察

作為的なドローのDrawnWRに対する影響

上でも何度か無作為に使われないカードは統計指標にバイアスがかかることを指摘していたが、ここではDrawnWRに作為的な影響を及ぼす典型的な例であるポルケルトを見ていく。

(公式サイトより)

ポルケルトが入っているデッキとして、ガラクロンドローグに注目する。

ラクロンドローグの統計

場合に分けて考えると、

  1. ポルケルトを使って引いた高コストのカード(DrawnWRを上昇)
  2. 普通に引く高コストのカード(平均)
  3. ポルケルトを使って引きにくくなった低コストのカード(DrawnWRに寄与しない)
  4. 普通に引く低コストのカード(平均)

ポルケルトのPlayedWRが最大であることを加味すると、高コストのカードはDrawnWRが高くなることが予測でき、統計データも同様の傾向を示している。*10


*1:[09/15 13:00 補足]複数のアーキタイプで使われていると、個別のデッキの統計として活用することは難しいが、単一アーキタイプで使われるカードに絞って考えると、有用な情報を得られることがある。

*2:最たる例は、クエスト。

*3:これを例に取った根拠は色々あるけど、基本的に似たアーキタイプでしか採用されないことが理由として大きい。

*4:15,16ターン目にこれを使う回数を考えればサンプル数の問題も考えられるが、ここではそれは無視する。

*5:今の環境は、ドローカードのうちのいくらかが強力すぎる節があり、それらは割と引いたら勝つ可能性が急激に上がるカードも多く、これらはDrawn WRが当然高い。

*6:つまり、前項でDrawnWRがカードの試合全体における強度を示すという話をしたけれども、現実的には必ずしもDRawnWRの高さが強さの序列にはならない。これがこの項で伝えたい重要な認識。

*7:生データは下記のURLwww.dropbox.com

*8:ナーフされて、ここで述べている動きはできなくなった。もともとは、山札の呪文を発見し、それをコピーして使っていた。知らなかった方向けに動画URL:https://youtu.be/iGRUnzVkzQs

*9:結局、カードを個別に観察する上では、各論的な議論が必要になるということ。どの程度の解像度で統計を眺める必要があるのかによって、一般論的な見方と、各論的な見方が必要になってくる。

*10:2020/11/01 追記