タイムの重要性 -スピード指数の活用-

 競馬に限らず、タイムは競走系競技において非常に重要な要素です。陸上競技(100m走やマラソンなど)、水泳、モータースポーツ(F1など)など、「誰が一番早くゴールに到達するか」を競う競技では、どれくらいのタイムで走れるかが勝敗を左右します。

競馬の場合、注目すべきタイムは以下のように多岐にわたります。

・各馬のスタートからゴールまでの走破タイム
・ラスト600mのタイム(上がり3F/後半3Fと呼ばれる)
・レースの先頭馬のラップタイム(ペース)
これらは非常に重要な指標ですが、競馬場のコース形態や天候などにより馬場状態が異なるため、単純比較が難しい点もあります。

例えば、砂浜を歩いた時を想像してください。湿った砂と乾燥した砂ではどちらが走りやすいでしょうか。湿った砂の方が圧倒的に走りやすいのは明白です。同様に、ダート競馬では雨で砂が締まると走りやすくなり速いタイムが出やすくなります。一方、芝の競馬では乾燥した状態の方が速いタイムが出やすく、雨で芝が湿るとタイムが遅くなりがちです。

また、同じ距離のレースでもコースの形状によってタイムが異なります。例えば、新潟競馬場の直線1000mとコーナーを含む1000mでは、直線の方が速いタイムが出やすいことが想像できるでしょう。さらに、100m走で0.1秒短縮するのと、42.195kmのマラソンで0.1秒短縮するのでは大変さが全く異なります。短い距離ほどタイムの価値が高いのです。

このように異なる条件でのタイムを1つの指標で評価する手法が、1970年代にアメリカのアンドリュー・ベイヤー(Andrew Beyer)氏によって考案された「ベイヤー指数」です。この指数は、いわゆるスピード指数と呼ばれ、シンプルな計算式で算出されます。

ベイヤー指数の計算式
  (基準タイム − 走破タイム) × 距離指数 − 馬場指数

以下、それぞれの要素を解説します。

1. 基準タイム

 基準タイムは指数を作成する人により設定方法が異なりますが、「コース×クラス別」や「コース単位」で設定する方法が一般的です。例えば、東京競馬場芝1600mでの1着馬の平均タイムは以下の通りです。

期間馬場状態対象レース1着平均
2019年~2023年全て356R1:34.5
2019年~2023年良馬場限定294R1:34.2

さらに、良馬場の294レースをクラス別に細分化すると ※年齢条件問わず
クラス対象レース1着平均
新馬56R1:36.1
未勝利84R1:34.5
1勝クラス60R1:33.7
2勝クラス36R1:33.5
3勝クラス19R1:33.0
OP4R1:32.9
G318R1:33.5
G24R1:32.5
G113R1:31.7

このように、細かく設定しようと思えば無限に設定可能ですが、馬の能力向上や馬場整備技術の進歩による影響を考慮し、一定期間ごとに見直す必要があります。ただし、年単位の変化は0.1~0.2秒程度であり、大きな誤差にはなりません。

2. 距離指数

距離指数は基準となる距離を設定して算出します。2019年~2023年のJRA平地競走16,675レースの平均距離は1,629.4mで、1600mを基準(1.0)とするのが妥当です。

例:
 1000m:1.6(1600/1000)
 3600m:0.4(1600/3600)

3. 馬場指数

馬場指数は基準タイムと走破タイムを比較し、その日の馬場状態を数値化したものです。ただし、馬場の使用頻度や天候の影響を考慮する必要があり、当日だけでなく前日や前々日の雨量も影響します。

例:

コースクラス基準タイム走破タイム差分
ダ1200m1:13.31:11.7-1.6
ダ1800m1:55.31:54.6-0.7
ダ1800m1:55.61:53.5-2.1
ダ1800m1:53.61:52.1-1.5
ダ1400m1:25.51:23.6-1.9
ダ1900m1:58.11:57.1-1.0
ダ1400m1:25.11:24.1-1.0
平均-1.4

複数のレースを分析して平均を取り、その日の馬場指数を(仮)で設定します。その後、各レース距離係数に応じて微調整を行い、確定させていきます。ただし、馬場以外にもペースの影響があるため、単純ではありません。

4. その他の影響要素

斤量:軽い斤量の方が速いタイムが出やすい。55kgを基準とし、斤量差を指数に反映します。
ペース:ペースが遅ければ遅いほど決着時計も遅くなるため、ペースも指数に反映します。
アクシデント:出遅れや馬体接触などの不利やコースロスも影響しますが、これらは指数に反映しない方針とします。

スピード指数

 こうして出来上がったのがスピード指数で、各馬の走破タイムを指数化したものになる。2024年の武蔵野Sを5走表示で並べて見ると、

こうなる。

 ちなみに、中央競馬準拠で地方競馬も同様に設定しているので、中央・地方問わずでタイムを評価できる。今回予想するレースが中央だった場合、地方のレースの指数は「*(アスタリスク)」。今回予想するレースがダートだった場合、芝のレースの指数は「グレーアウト(灰色)」にしています。テストでも「100点満点」という言葉があり、100を基準とした方がわかりやすいかと、100が基準となっています。中央競馬準拠のため地方競馬の下級条件などは、マイナスの指標になってしまうのが難点。基準を引き上げて地方のマイナス指数をなくす事も考えたのですが、この辺りは今後の改善とします。

AIの活用

 馬場指数に関しては過去に設定した馬場指数と当時の雨量、各レースの走破タイム、レース前の5走データを学習データにし、同等のデータから馬場指数を機械学習によって算出させています。もちろん、100%鵜呑みにしている訳ではないので、数値を見て微修正を加える事はありますが、これまで手で作業して時間が掛かっていた部分を大幅に短縮させる事ができました。

 各馬の勝率・連対率・3着内率を予測させるAIにはこのスピード指数の値を学習データにはあえて入れておらず、データの併用で使っています。