予想について

 馬券を買う以上、誰もが「すべての馬券を当てたい」と思うだろう。しかし、現実的にはそれは非常にハードルが高い。たとえ正確なデータ分析ができたとしても、レースには不確定要素が多いため、必ずしも思い通りにはならないからだ。たとえば、これまで一度も出遅れたことがなかった馬が突然出遅れることもあれば、スローペースで掛かったことのない馬が掛かってしまうこともある。また、馬体接触や前の馬が下がってきて行き場を失う、想定以上のスローペースで先行馬がそのまま残るなど、さまざまな要因によって想定とは異なる展開になることがある。

 すべてを当てることを最初から諦め、特定の条件下で回収率が良いデータに絞って馬券を購入するという方法も考えられる。しかし、その場合でも的中率はせいぜい20%~30%程度あれば良い方だろう。

 だからこそ、特定のデータだけに頼るのではなく、さまざまな要素を複合的に組み合わせ、多角的に予想を組み立てていきたいと考えている。

AIの予想は楽しくない

 AIが行っていることは、基本的に人間が予想するときと大体同じだ。出馬表と結果を大量に与え、このデータとこのデータが結果に相関しているので有用、といった形で「モデル」を作成する。その「モデル」に、結果が含まれていない出馬表データを見せることで、何着になりそうかを予測させている。多くのAIエンジニアは、各馬が1着になる確率(予測勝率)、2着以内になる確率(予測連対率)、3着以内になる確率(予測3着内率)を算出しているケースが多い。この際、学習データと予測に用いるデータの構造は一致している必要がある。たとえば、学習データに「前走からの馬体重の増減」を含めている場合、馬体重が発表された後でないと予測ができない、といった具合だ。

 勝率がわかれば、単勝オッズと掛け合わせることで期待値を算出し、その馬の単勝を買うべきかを判断できるようになる。また、単勝以外の馬券でも、ハーヴィルの公式などを使って馬連や3連複、3連単といった目ごとの予測的中率を出せる。その上でオッズと掛け合わせることで、どの買い目を選ぶべきかが判断でき、的中率と期待値の高い買い目を選び続ければよいということになる。

 ただ、それでは面白くない!競馬や予想の面白さは、自分で「あーでもない、こうでもない」と考え、よしこれだ!と思ってワクワクしながらレースを見るところにある。それが競馬の醍醐味だと感じている。

 予想という行為は、何かを「作る」過程に似ていると感じている。たとえば、「美味しいご飯を食べたい」と思ったとき、レストランで食べるのは予想家の予想にそのまま乗る行為、弁当屋やスーパーの惣菜を買うのはJRA-VANやnetkeibaが提供するデータをそのまま使う感覚に近い。そして、AIによる予想は、冷凍食品をひたすら食べ続けるような印象を受ける。もしかすると、冷凍食品ではなく最近出始めている家電調理器具(具材を鍋に入れれば自動でカレーを作ってくれる みたいな家電)に近いのかもしれない。

 自分でこだわって料理をする場合、レシピ通りに作るだけでなく、食材を自分で選び、下準備をし、自分なりの調理方法で料理をする。その方が楽しいし、食べたときの喜びもひとしおだ。競馬の予想も同様に、自分で考えながら組み立てていくことを大切にしたいと思っている。

予想で使用する5つのファクター

1. AIの予測勝率

 冒頭で述べた内容と矛盾を感じるかもしれないが、オーソドックスなモデルを用いて各馬の勝率・連対率・3着内率を算出している。ただし、この要素だけで予想するつもりはなく、あくまでも予想ファクターの1つとして位置付けている。
 このモデルには、後述する「スピード指数」「高レベルレース」「調教データ」「レース映像」の要素は一切含めていない。これらをモデルに組み込むと、同じデータを二重に使用することになり、さらにすべての要素を含めたモデルを作成すると、完全にAIだけの予想になってしまう。それでは面白みに欠けるため、あえてこれらのデータは除外している。

2. スピード指数

 スピード指数の詳細については、タイムの重要性 -スピード指数の活用-で解説しています。中央競馬と地方競馬を同一の評価軸で分析し、走破タイムを基にスピード指数を算出しています。また、馬場指数の算出にはAIを活用しています。
※予測対象として馬場指数を設定し、AIで算出

3. 様々なデータ

 データセクションで詳しく説明している通り、さまざまな角度からのデータを活用します。特定のレースを基準とした次走成績から出走馬レベルの高いレースを見極めたり、特定条件下でのデータを活用したりします。また、血統データや種牡馬、兄弟馬の傾向を基に、距離適性や成長型を推測します。さらに、コースデータの分析も行い、これらのデータチェックツールの作成やデータ整合性の確認にはAIを活用しています。

4. 調教データ

 「3. 様々なデータ」に含めることも可能ですが、成績データではないため、独立した項目として扱います。各馬の生涯にわたる調教タイムやパターン、追い切り本数を分析し、調子や成長具合を推測します。また、調教師ごとの好走傾向についてもデータをパターン化しています。

5. 映像データ

 近年、レーシングビュワーの普及や電子機器、インターネット回線の発達により、誰でも簡単にレース映像をチェックできる環境が整ってきました。以前はグリーンチャンネルを録画し、古くはビデオデッキの時代からDVDやHDDにデータを保存していました。その際、テレビで出遅れや馬体接触、直線での不利、直線での手応えなどを確認していました。これは昔から行っていることなので目新しさはありませんが、現在でも映像をチェックしています。

これらの5つの項目から馬券に絡む可能性の高い馬をピックアップし、オッズと照らし合わせて買い目を組み立てて行きます。
個々の細かい事については、下記よりご覧下さい。