多変量解析ソフトが手元にあるので、どんな結果になるか分からないが、とりあえず因子分析をやってみた。2020シーズンJ1リーグ全試合、18チーム×34試合のデータを対象にした。因子分析の対象項目はFootball LABさんのデータにある下記36項目である。36の項目は互いに独立している項目ではないが、ごちゃまぜにしてやってみた。プロの統計家が見たら、ダメ出しする事例かも知れないが、何か面白いものが見えるかもしれない。


結果は下記の通り。36項目から11の因子が抽出された。ソフトが計算してくれるから、計算自体は楽だ。しかし解釈は非常に難しい。オレンジ色のセルが0.500以上、ピンクのセルが0.400以上0.500未満である。

簡単に解釈していくことにする。

第1因子・・・・パスによる攻撃である。パスで攻撃することによりボール支配率が高くなる。30mライン進入やペナルティエリア進入はパス攻撃との関連が強い。因子負荷量は多少低いが、クロスもパス攻撃の一部ということになる。

第2因子・・・・シュートに関する因子である。シュートを打つことがチャンス構築率アップにつながる。逆に言えば、シュートすることがチャンスということになるのだろう。シュートに行かない攻撃はチャンスではない。

第3因子・・・・得点(ゴール)の因子である。正の値で、勝点の因子負荷量が最も高いのはここである。得点こそが勝点に最も関連する。

第4因子・・・・攻撃回数因子である。どれだけ攻撃を行ったのかということ。攻撃回数が増えるとスローインも増える。因子4におけるチャンス構築率の因子負荷量は-0.240であるため、攻撃回数とチャンス構築率は正の関係にはない。攻撃してもチャンスを作れるかどうかは別問題なのだ。

第5因子・・・・ドリブルによる攻撃の因子である。スプリントの因子負荷量も0.411と比較的高い。

第6因子・・・・守備因子である。この項目は守備の質ではない。どれだけの回数守備をこなしたかということになる。よって守備因子ではクリアの因子負荷量も高い。

第7因子・・・・ボール奪取因子である。どれだけボールを奪ったかということである。ボールを奪う技術としてタックルがある。タックルの因子負荷量も0.480と比較的高い。

第8因子・・・・クロス攻撃因子である。クロスそのものはパス攻撃の因子負荷量も高いが、こちらの方が高い。クロスはクロスだ。

第9因子・・・・失点因子である。どれだけ失点したか。失点が多いほど、勝点を奪えなくなる。勝点の因子負荷量が-0.670だからだ。

第10因子・・・・総走行距離である。総走行距離は、他の因子では因子負荷量は高くなく、かなり独立している項目である。先日、「総走行距離はCBPや勝点とあまり関係性がない」ということを他のブログで記載したが、このような結果が出ると、先日記載した内容も「なるほど」と強く実感する。攻撃の場合でも、守備の場合でも総走行距離が増える場合があるから、攻撃・守備走行距離やボール保持・非保持走行距離などでデータを取らないと分析しにくいと感じる。スプリントも同様である。ベクトルを定める必要があると思う。

第11因子・・・・PKによるシュートそのものである。この項目も独立していることになる。

以上をまとめると下記の通りになる。

そして図に表すと下図のようになる。

上で記載した内容と矛盾するようなところもある気がするが、素人的にはこんなものだろう。因子を抽出することにより、自チームの強み弱みを探ることが出来るだろう。今回は36の項目を因子分析したが、分析対象となる項目をもっと増やしていけば、もっと詳細な因子を抽出できるはずである。因子をたくさん抽出できれば、強化する施策を立てやすいと思う。そして今回は2020シーズンJ1リーグ全体で因子分析したが、当然各チームごとに分析した方が詳細な分析ができるはずであり、チーム強化につながっていくことだろう。とりあえず因子分析をやったが、少しだけ面白いものが見えた。因子分析の結果を非常に簡単にまとめさせていただきました。

振り返って見ると、シュート数やドリブル数、タックル数などのローデータを統計解析して各CBPが出来上がったのだなと感じました。

毎度のことながら、Football LABさんからデータを拝借しました。