ゴール難易度アルゴリズムは、ボールが打たれた瞬間に測定された、ゴールの得点難易度をランク付けする方法です。シュート位置、守備のプレッシャー、ゴールキーパーの位置、身体部位、ボールの動き、シュート前のタッチ数、ビルドアップの複雑さ、試合状況の8つの入力をスコア化します。確率を測定する期待ゴール(xG)とは異なり、フィニッシュ自体の技術的難易度を測定します。
2005年以降のあらゆる「年間最優秀ゴール賞」は間違っていました。
間違った選手が勝ったという意味ではありません。問いそのものが適切に立てられたことが一度もなかったという意味です。プスカシュ賞、BBCシーズン最優秀ゴール賞、FIFAの様々な年間リスト。それらはすべて、評論家がゴールをランク付けする方法でゴールをランク付けしています。視覚的なスペクタクル。感情的な瞬間。選手の物語。部族的な記憶。バイシクルキックはソロランを上回ります。決勝はグループステージを上回ります。有名選手のゴールはそれ以外の選手のゴールを上回ります。
それらの重みはどれも、ゴールの得点が実際にどれだけ難しかったかとは何の関係もありません。
この記事は、それを修正するための公開方法論を示しています。望むならご自身で構築してください。計算はここにあります。
「偉大なゴール」が実際に意味するもの
「偉大なゴール」というフレーズの中には二つの問いが隠れています。
一つ目は:その状況において、そのシュートがゴールに結びつくことがどれほど起こりにくかったか? それが期待ゴール(xG)であり、サッカー分析においては2012年頃から解決済みの問題です。主要なOptaやStatsBombの派生データにはすべてそのバージョンがあります。無人のゴール正面6ヤードからのヘディングは高いxGです。2人のディフェンダーが迫る25ヤードからのボレーは低いxGです。xGは確率を測ります。
難易度は測りません。
二つ目の問い、誰も運用化していない問いは:接���の瞬間に選手が置かれていた制約の下で、世界にそのシュートを打てた選手が何人いたか? それが難易度の問いであり、期待ゴールと、10年後に覚えているゴールを分けるものです。
ペナルティキックはサッカーにおいて最も難易度が低い。背後にディフェンダーを背負った18ヤードからのバイシクルキックは最も高い部類に入ります。xGはそれを教えてくれません。以下の方法論がそれを可能にします。
8つの入力
ゴール難易度スコアは、ボールが打たれた瞬間の8つの入力を取得します。
シュート位置。 ゴールまでの距離と角度、フィート単位で最も近い値まで測定。これはあらゆるxGモデルの背骨であり、ここでも基盤です。より近く、より中央であるほど簡単です。関係は非線形で、20ヤードから30ヤードへの10ヤードの追加は、6ヤードから16ヤードへの同じ距離の追加よりもはるかに難易度を増します。
守備のプレッシャー。 シュート時にボールから3ヤード以内にいるディフェンダーの数に加え、最も近いディフェンダーが積極的にブロックに向かっていたかどうかの二値フラグ。ゴールへ��クリアな視界は一つのこと。センターバックがコースに入り込んでいるクリアな視界は別のことです。
ゴールキーパーの位置。 シュート時のラインからの距離に加え、キーパーの構えを考慮した、ゴールフレームのうち実際にガードされていなかった割合の測定。ポジションを外したキーパーは難しいシュートを無人のゴールに変えます。セットされて正対したキーパーはターゲットを半分に縮めます。
身体部位とコンタクトタイプ。 逆足、ヘディング、バイシクル、スコーピオン、アウトサイド。それぞれ歴史的なコンバージョン率(得点率)に対して較正された難易度係数が与えられます。バイシクルキックは、同等の位置からの通常の右足シュートの約5分の1の率でゴールになります。その比率が係数です。
シュート時のボールの速度と動き。 速く、ハーフボレーで、落ちながら、または回転しながら来るボールは、静止したボールや転がるボールよりもクリーンに打つのが難しい。トラッキングデータはこれを捉えます。トラッキングが利用できない場合の注意深いビデオレビューも同様です���
シュート前のタッチ数。 コミットしたディフェンダーに対する複数タッチのソロランは、カットバックからのダイレクトフィニッシュよりも根本的に難しい。どちらも素晴らしいものになり得ます。個人での創造難易度を持つのは一方だけです。
ビルドアップの複雑さ。 これはチームレベルの入力です。シークエンス内のパス数、突破した相手のプレッシング強度、カバーした縦の距離。ハイプレスを15本のパスで切り裂いて生まれたゴールは、ターンオーバーからの一撃とは異なる種類の難易度を持ちます。どちらも偉大なゴールのリストに載るに値します。異なる理由でそこに値するのです。
試合状況。 スコア、残り時間、大会ステージ、相手の質。これが唯一の文脈入力です。これはゴールの得点難易度を変えるのではなく、そのゴールがどれだけ重要だったかを変えます。両者は別々にスコア化され、その後組み合わされます。
評論家抜きの重み付け
ほとんどのランキングが陥る罠は、パネル投票による重み付けです。委員会を選び、スプレッドシートを渡し、議論するのを見る。出���はゴールではなく委員会を反映します。
防御可能な方法論は、各入力を、同等の状況でゴールが生まれないことをどれだけ予測するかによって重み付けします。過去のデータセットを走らせます。各入力のコンバージョン率に対する限界寄与を見つけます。その限界寄与が重みです。
ゴールからの距離は、コンバージョンに最も強い経験的効果を持つため、最も重い重みを持ちます。身体部位(バイシクル、ヘディング、逆足)は意味のある、しかしより小さい重みを持ちます。ビルドアップの複雑さは、生の難易度では小さい重みを持ち、試合状況を含む複合的な「記憶に残る度」スコアではより大きな重みを持ちます。
重みは主観的ではありません。データに適合され、新しいデータが到着するたびに更新されます。
検証
すべてのメッシのソロランが史上最高のゴールだと言うモデルは、有用な形で壊れています。それは真のパターンを明らかにします。すべてのペナルティキックが素晴らしいと言うモデルは、無用な形で壊れています。検証はあなたがどちらの種類の壊れ方をしているかを教え���くれます。
正直な検証は前方盲検的です。カットオフ日より前に得点されたゴールでモデルを構築します。モデルが見たことのないテスト期間のすべてのゴールをスコア化します。3つのものと比較します。存在する場合はブックメーカーのプロップ市場、収束する場合は専門家のコンセンサス、そしてトレーニングセットをブートストラップした際のモデル自身の内的安定性。この3つすべてを上回るか、さもなければモデルは飾りです。
適用すると何が変わるか
評論家が好まないであろういくつかのことが変わります。
メッシのカタログは、ハイライトリールが示唆するのとは異なる形で支配します。難易度で見た彼のトップゴールは、弱い相手に対する有名なソロランではありません。それらは、2人のディフェンダーが迫るセットされた守備に対する狭角のフィニッシュであり、カメラがそれを愛さないために誰もクリップしないゴールです。
いくつかの象徴的なゴールは下落します。2002年チャンピオンズリーグ決勝のジダンのボレーは偉大なゴールです。純粋な難易度では、過去20年のトップ50に���入りません。技術は卓越していました。守備のプレッシャーは最小限で、ゴールキーパーは深くセットされていました。それが象徴的である理由はその瞬間です。方法論はこれら二つを分離し、別々にスコア化します。
いくつかの忘れられたゴールは上昇します。ばかげた条件下で生まれた、重要度の低いリーグ戦の一握りのゴールが、有名な決勝戦の決勝点を上回ります。それらは決してクリップされることはありません。アルゴリズムはそれでもそれらを見つけます。それが要点です。
方法論は公開されています
完全な入力リスト、重み付けアプローチ、検証フレームワークは上記の通りです。トラッキングデータと、作業を行う意志があれば、誰でもこのバージョンを構築できます。公開の場では誰もやっていません。なぜなら、サッカーメディアにおけるインセンティブは方法論ではなく物語と部族的な同調に報いるからです。
方法論はオープンなレイヤーです。データパイプライン、ライブのランキング、長期にわたって維持されるモデル。それは別の問いです。この記事は、次の「年間最優秀���ール」議論が少なくとも共通の基盤の上で議論できるように存在しています。
ここまで読んで、この方法論が生み出すランキングを見たいと思われたなら、それらはシリーズの残りにあります。最初のものはメッシ対ロナウドの問題で、2023年に決着がつき、それ以来無視されています。
よくある質問
ゴール難易度アルゴリズムとは何ですか?
ゴール難易度アルゴリズムは、見た目の良さではなく、どれだけ得点が難しかったかでゴールをランク付けします。接触の瞬間におけるシュート位置、守備のプレッシャー、ゴールキーパーの位置、身体部位を含む8つの入力を測定し、各入力を、同等の状況でゴールが生まれなかったことをどれだけ強く予測するかによって重み付けします。
ゴール難易度は期待ゴール(xG)と同じですか?
いいえ。期待ゴールは、特定の位置からのシュートがゴールになる確率を測定します。ゴール難易度は、選手が直面した制約の中でフィニッシュを実行するのがどれだけ難しかったかを測定します。ペナルティキックはxGが高く、難易度は低い。プレッシャー下でのバイシクルキックはxGが低く、難易度は高い。これらは異なる問いに答えるものです。
ゴール難易度スコアはどのように計算されますか?
8つの入力のそれぞれは、同等のシュートが外れるかどうかに対する限界寄与によって重み付けされます。ゴールからの距離は、コンバージョン(得点率)に最も強い経験的効果を持つため、最も重い重みを持ちます。身体部位と視界の妨害は意味のある重みを持ちます。試合状況は、ゴールの得点難易度ではなく、そのゴールがどれだけ重要だったかを変えるため、別個にスコア化されます。
最高のゴールを客観的にランク付けできますか?
接触の瞬間の測定可能な入力を用いて、ゴールの得点難易度を客観的にランク付けすることはできます。どれだけ記憶に残るか、どれだけ重要だったかを客観的にランク付けすることはできません。それらは文脈と感情に依存す���からです。ほとんどの「最高のゴール」リストはこれら二つを混同しています。ゴール難易度アルゴリズムはそれらを分離し、難易度のみをスコア化します。
ほとんどの「年間最優秀ゴール」賞が偏っている理由は何ですか?
FIFAプスカシュ賞のような賞は、一般投票とパネル選考で決まりますが、それらは難易度ではなく人気を測っています。広く放送されるリーグで生まれたゴールは、より多くの人が見て共有するため、より頻繁に受賞します。フリーキックや長距離シュートは、写真映えがするためより頻繁に受賞しますが、密集を抜けた狭角のフィニッシュよりも容易であることがよくあります。