python初学者が競馬予測をしてみたpart4(予想方法について)
こんにちは、KHnodeです。
更新が遅くなって申し訳ありません。
最近、新生活やウマ娘にはまっていて、あんまり勉強できてはいませんが切り替えて頑張っていこうと思います。
前回の続きはこちらから
kashiwapro.hatenablog.com
また、実際に予想してるブログはこちらにありますのでよろしければ見ていただけると幸いです。
keibatech.hatenablog.jp
##################################################################
今回は先に競馬予測方法を紹介して、次週にこれまで実施したデータ加工やモデル精査について書いていこうと思います。
y_pred = model.predict(pred_df) pred_df['確率'] = y_pred excel_writer = pd.ExcelWriter('output.xlsx') return pred_df.to_excel(excel_writer, 'hogefuga sheet')
"pred_df"は予測したいデータを入れる感じです。
後は確率という新たなカラムを作成して、そこに予測値を入れていきます。
このままto_excelにしてもいいのですが、何故かエラーが頻発したので今回は直接ファイル名を入れず"pd.ExcelWriter('output.xlsx')"にすることでエラーを回避しています。
シート名は適当に入れます。
実際にできたのはこんな感じ
芝ダ | 距離 | 馬場状態 | 騎手 | 父馬名 | 母父馬名 | 馬番 | 年齢 | 性別 | 人気 | オッズ比 | 確率 |
---|---|---|---|---|---|---|---|---|---|---|---|
1 | 3 | 2 | 206 | 435 | 148 | 1 | 3 | 0 | 6 | 4 | 0.130027695 |
カテゴリー変数にしているため少し見にくいですが、馬番と確率が分かれば大丈夫と思います。(カテゴリー変数を元に戻すなどをして対応した方が見やすいかも)
大体10%前後であれば3着以内に来ると予想しています。
以上予想方法についてですが、まだまだ課題が多くあります。
1つ目は、3着以内に来る確率がまだまだ低いのでせめて20%まで上げればいいなと考えています。
2つ目は、散々ブログ内でも出ていますが前処理が甘い点があります。
これに関しては、色々と本を読んで勉強中なので出来次第紹介していきたいと思います。
更新が遅くなって申し訳ありません。
なるべく頑張って更新できるように頑張ります(努力目標)