毎度のことながらFootball LABさんからデータを拝借しました。また今回もELGOLAZOさんからもデータを拝借しました。

双方のデータに攻守の切り替えに関するデータがありましたので比較しました。

初めにELGOLAZOさんのデータです。

ELGOLAZOさんのデータには、攻→守の指標として「5秒未満にボールを奪い返した回数(1試合平均)」、守→攻の指標として「奪ってからシュートまでの平均時間(秒)」がありました。結果は上表の通りです。チームによりかなりバラツキがみられます。


次はFootball LABさんのデータです。数字は偏差値で表されています。

攻撃→守備の定義は「ボールを奪われた後の3秒間における縦方向(相手ゴールラインから味方ゴールライン)のチーム走行距離が10m以上で、かつ相手チーム走行距離の1.5倍以上の場合」です。

守備→攻撃の定義は「ボールを奪った後の3秒間における縦方向(味方ゴールラインから相手ゴールライン)のチーム走行距離が10m以上で、かつ相手チーム走行距離の1.5倍以上の場合」です。

こちらもチームによりかなりバラツキがみられます。


両方ともに攻守の切り替えに関するデータではありますが、定義が異なります。この異なった定義がどのような結果になるのか比較します。


双方の数値単位が異なるため統一します。今回は基準値に計算し直します。結果は下表の通りです。

上表の数値を散布図にします。

まずはELGOLAZOさんのデータです。

札幌が飛び抜けています。

決定係数は0.3241ではあるものの、正の相関関係になっています。


次はFootball LABさんのデータです。

こちらでは湘南が飛び抜けて良い結果になっています。ELGOLAZOさんのデータとは反対に札幌の評価が低いです。清水は双方ともに低い評価になっています。優勝した川崎Fの位置はほぼ同じであり、同等の評価になっています。決定係数は0.3988であるものの、正の相関関係になっています。


同じ攻守の切り替えのデータであっても、定義が少し異なるだけで評価が大きく変わることが分かりました。改めてデータ分析の難しさを実感しました。




2022年1月16日(日)追加資料

チーム別シーズン別平均総走行距離

鳥栖の総走行距離が長いです。