TARGET frontier 開発日誌
TARGET frontier 開発日誌




2004.2.28

血統関係のデータをいじっているキリが無いですね。機能はついにサイアーラインや牝系の展開まで行き着きました。両方同時というか複合も可能ですので、例えばある血が何代目かまでに入っている馬を探すなんてこともできます。現状では種牡馬・繁殖牝馬内でのみ検索が可能ですが、今後は産駒も全て対象にする予定です。登録されている繁殖牝馬のデータは現時点で10万頭以上いますが、シービスケット(Seabiscuit)の血が入っている馬は72頭いました。なんていうミーハーなこともわかるわけですが、実用的な利用方法としては、例えばMr.Prospectorを検索して、サイアーラインを展開すれば、その直系の種牡馬は全て一度に検索できますので、まとめてミスプロ系として一回で全馬をチェック種牡馬に登録ができたりします。とても便利です。ちなみに該当した種牡馬は本馬を含めて229頭。調子に乗ってNorthern Dancerを展開したらえらいことになってしまいました。種牡馬は現在全部で10711頭登録されているのですが、そのほぼ8%に当たる858頭がNorthern Dacnerの直系として検索されています。直系以外を含めたら、ほんど占めてしまうのではないでしょうか。ただ、その検索は諸事情でちょっと怖くてまだやっていません。機能的にはもう十分可能なんですが…。

まあまだ検索できるだけで、表示とかは工夫の余地が大有りですし、まだ他にやることがたくさんありますので、産駒対応を含めると公開当初までに完成しているかどうかは微妙ですが、使えるデータは使い切りたいというのが信条ですから、それなりに使える程度であれば一応公開すると思います。

その他では、馬データの更新作業が必要なくなったと同時に、現役と抹消の区別も正確に行なわれているはずなので、例えば調教師ごとの現役の管理馬の頭数というのもわかったりします。現在の血統検索や馬主・生産者検索での世代別の頭数の一覧の画面がありますが、あそこに調教師も含めまして、世代別の現役管理馬頭数の一覧が可能になっています。




2004.2.27

今週も機能をいくつも追加していますが、戦歴・レース検索では、集計項目を一気に8つほど増やしました。特に今回のデータ仕様の変更とは関係なかったりもしますが、以前からの課題だったことをこの機会にまとめてやってみたというところです。現バージョンでも出馬表からそのレースに騎乗する全騎手をグループとして一括して戦歴を見られるうにはなっていますが、まずはこの機能の利用範囲を広げるために、現在の騎手・調教師の一覧画面を改良し、チェック騎手・調教師の色別のタブ(ちなみに色はあと3色増えて計6色になります)を作ったり、新人騎手や2年目の騎手というようなタブも作り、それぞれから該当者全員を一括して戦歴をたどれるようになっています。同時にマーク機能も作り、マークした人だけをまとめてたどることも可能にしました。で、戦歴画面の方ですが、まずはこのチェック色別の集計、そしてチェック色グループ間での乗り替り別の集計が可能になっています。また現在の前走騎手別の集計も前走と今回の騎手二人をキーにしたものも新しく作りましたので、複数人数の騎手の戦歴データの場合でも、1回で全パターンが集計できます。

また、チェック種牡馬関係の集計も追加しまして、種牡馬、母父馬をチェックタイプ別に集計が可能になりました。同時に父と母父のタイプの組合せでのニックスの集計も可能になっています。さらにチェック種牡馬の名称の設定が出来るようになり、今後は色の変更・追加も検討しています。とりあえず戦歴はこんなところですね。

それから先週書いた未登録馬の戦歴データですが、こちらも実現できています。こんなのこんな感じですね。もちろん未登録の地方馬の場合は過去の成績は全て揃っているわけではありませんので、戦歴はデータとして登録されているものしか表示できませんが、この画面が表示できる意味は結構あって、まあハルウララの場合は馬主名が欠落していますが、調教師名が出るところがミソですね。またエスプリシーズの場合は、両方とも表示されます。もちろんここから先日の血統表も表示できますし、また未登録馬も含めて兄弟馬も一発で表示できます。ハルウララの場合はこんな感じですね。ちなみに緑色の馬名は中央未登録の地方馬で、JRA-VANのデータを普通に蓄積しても簡単には表示できなかったりするのですが、今回はなんとか実現できましたので、この馬名が表示できるところが結構画期的だったりします。以前にも書きましたが、Data Labでは産駒データというものが新しく提供されまして、これは多分日本で走る予定のサラブレッドが全て登録されているのだと思いますが、このデータの時点では馬名は決まっていませんので、その後に中央競馬で走ったりしないと馬名登録されません。地方馬で地方だけでしか出走していない馬は、血統等のデータがあるにもかかわらず、それがどんなに有名な馬であっても、馬名がわからないわけで、せっかく産駒で検索して兄弟が一覧できても、有名な馬を見過ごしてしまう可能性もあるわけです。それではデータとしての意味が半減してしまいますので、なんとかならないかと考えた末、なんとかなってしまったというところです。

さて、競馬の方ですが、今週から開催替りですね。京都→阪神というのは好きなパターンですので、いろいろと買いたいところですが、さらに開発は続きます。それから、2開催目のIPAT馬券道場が終了しましたが、今回も回収率で100%は行ったのですが、実は昇段ならずでした。というのも、投票し忘れのレースがいくつかありまして、そのために8000円までには届かなかったというところですね。配当の分散が小さい単複馬券ですから、1発狙いよりは継続することの方が成績に影響するので、投票し忘れは結構致命傷でして、このIPAT馬券道場は、馬の選択よりも継続する方が難題じゃないかという気もします。IPAT限定ですから出先ではなかなか買えませんし、参加レース数が減ると大きく不利になるという今のルールでは、この先参加者が増えるかどうかは微妙ですね。ということで、今回で私もやめようと思ったのですが、先ほど某出版関係者から今後企画になるかもしれないので続けてくれということで、とりあえず今開催も続ける羽目になりました。せめて全日ということではなく、6日間程度にしてくれれば楽になるんですが…。




2004.2.21

Data Labですが、ダウンロードとか登録が簡単になるのは、その部分をJRA-VANのJV-Linkというソフトに頼るからなのですが、逆に言うと、その部分は思いっきり他のソフトに依存しているわけですから、こちらではどうしようもない部分でもあります。ですので、セットアップの改善はやはり手ごわいです。まあセットアップはそう何回もやる作業ではありませんし、基本的にかかるのは時間だけですし、分割してもできるようにはなっていますので、妥協してもいいレベルではあるんですが…。

話はかわって先日少し紹介した血統表ですが、エスプリシーズとかハルウララとかも出るようになりました。ハルウララはまあ超有名ですが、エスプリシーズはこの間の川崎記念の勝ち馬ですね。で、先日紹介した血統表とどこが違うのかと言うと、この2頭は2頭とも中央競馬には出走したことがありませんので、中央では馬名登録されていないわけです。ですので当然皆さんが利用しているTARGETでは検索しても見つかりませんので、馬データは表示されません。ですが、地方成績の画面では未登録ながら2頭とも名前が表示されますので、新しいTARGETでは、その画面からダブルクリックすると、馬データが無いかわりにこの血統表が表示されます。未登録馬でも見られるということは、つまり、中央だけでなく地方成績でも登録・未登録に限らず全馬の血統表が見られることになります。

このデータが表示できるのは、血統データがあることはもちろん重要ですが、前回お話しした産駒データも必要で、産駒データがあるということは、基本的には地方競馬の馬も全てその中に入っているわけです。ただ、中央で馬名登録されていないと、どの馬がなんという名前かがわからないわけで、まあそれを辿る方法がデータの中にあって、そのリンクができたということですね。もともとここまでは考えていなかったのですが、少々の思いつきから作成したところ、検索速度が全く問題ないレベルでしたので搭載したというとこです。ついでに、「ハルウララ」という馬名だけでも検索できるようにすることも検討中です。また、戦歴データがある範囲でなら、ある程度の馬データ画面も表示できそうですので、そちらもやるかもしれません。例えばエスプリシーズであれば、現在22戦しているのですが、その内19戦はJRA-VANの地方成績にデータがありますので、これを辿って馬データ画面を作成できるということですね。速度的には問題なはないのですが、地方成績のデータはいろいろと不足しているところがありますので、それで問題ないかどうかというところです。




2004.2.20

JRA-VANの新サービスのData Labのページが公開されていましたので、ここからもリンクしておきます(http://www.jra-van.ne.jp/pr/datalab/)。スタートアップCD-ROMにはTARGETも収録されるのか…、って今作っているところなんですが…(笑)。料金はデータの内容を考えれば、確かに今までよりかなり安くなっていますね。まあソフトやデータの導入も確かに大幅に簡単になるわけですが、初期データのセットアップに時間が…。ここで、悲しいお知らせです。Pentium1GHz程度のマシンでの初期セットアップですが、16時間くらいはかかりそうです。確かにほとんどボタンひとつでセットアップできるので、初心者にも優しいわけですが、これはハードルが高いのか低いのか判断が難しいところです。もちろん時間短縮のために現在も鋭意改善中なのですが、データを全てスルーしてテストした場合(データの要求だけして受け取ったデータに対しては登録もなにもしなかった場合)でも、4時間くらいかかっていますので、これ以上速くなる可能性は無いわけですが。ここに各データの処理が入りますので、まあやはり最低でも8時間はかかるでしょうね。なんせデータが膨大すぎます。全部で200万件以上もあります。セットアップについては、当面必要なレース関係のデータと馬のデータの2つ、そして必要に応じて坂路調教のデータと血統関係のデータと、4つに分けて登録できるようにする予定ですので、連続16時間とかは避けられます。また、セットアップしなくてもその週のデータの登録だけで一応現在の出馬表程度は見られるようにもする予定ですので、まあ何回かに分けて登録すれば、それほどストレスは無いかと思います。ただ、ある程度のマシンのスペックは要求されますので、その点は移行後に後悔の無い様にお願いします。後からでは多分マシンの買い換え以外の選択肢がありませんので。

このデータですが、過去のデータは実はそれほど大したことが無かったりします。というのも、例えば票数であれば、以前は単複枠連しかなかったわけで、現在の数分の1の量でした。また、以前は地方馬との交流レースはほとんどありませんでしたので、地方競馬のデータというものもほぼありませんでした。現在ではこの地方競馬のデータがかなり膨大で、中央競馬の成績データの何倍かの量があります。さらに、1日2千件で週6日間ある坂路調教のデータも去年分から提供が開始されたものですので、過去には存在せず、全体としてみると、古いデータほど短時間であっさりと登録できるのですが、最近のデータを登録するにはその何倍もの時間かかってしまっています。ですので、実は登録開始が1ヶ月遅くなると、セットアップの総分数が何10分か延びるという状態で、この先がちょっと怖いですね。

また、TARGET frontierの移行のガイドラインや新規追加機能につきましては、ソフトのバージョンアップ情報のところに掲載しました。

で、実は、その開発は今年になってから本格的に開始したということで、このフェブラリSはこの時期唯一の前日発売のサンプルレースだったりします。ですので、久しぶりのG1だというのに当然本日も明日も開発中心になりそうです…。もちろん前日発売と言えどデータ的にはこれまでと大差無いとは思いますが、ただ、新しく枠順確定前の出馬表が表示できるわけで、前日発売があると、その中のひとつのレースだけ枠順が確定するという状態になりますので、その状態は結構特殊ですので、想定していないバグが出る可能性は一応ありますので。現状では枠順確定前から確定したときに取消しになった馬の馬名が表示されるようになっているのですが、この前日発売のレースが枠順確定するときに取り消しになるというサンプルが本当は欲しかったのですが、今回は取消しはありませんでしたね。




2004.2.14

東京のダートですが、内有利・前有利という以前の傾向はこのところはほとんど消えている印象です。特に上のクラスでは逆に前はむしろつらいですね。現状では、昨年の新東京コースというよりは以前の東京のイメージの方が近いと思います。ただ、今は冬ですので、凍結防止剤や実際の凍結の影響もあると思いますので、まだ元に戻ったとも断定はできないと思います。まあどのケースにしろまだまだデータ不足というところですか。

逆にJRA-VAN Data Labはデータが多すぎです。もう処理の限界を超えそうです。果たしてこんなにデータが必要なのかと悩んでしまう今日この頃なのですが、とりあえずデータとして実際に予想に使うかどうかは別にして、いつでも利用できるようにはしておきたいので、開発は明日も続きます。

昨日触れた坂路調教データですが、このデータは仕様的にちょっと問題がありますね。データの中には基本的には馬コードと調教タイム、日時くらいしか入っていないわけで、まあ調教と言えば馬が中心ですから、これでも大きな問題はありませんが、ただ調教するという意思は調教師のものですから、少なくとも調教師のコードが入っていないとデータとしての価値が下がってしまいます。もちろん馬のデータから所属を割り出すことは可能ですが、ご存知のように馬は転厩することがありますので、現時点の所属を見ても、それが実際に調教した調教師なのかどうかの保証はありません。現在は日時や馬からの検索で調教データを表示していますが、実は調教師をキーとした履歴をたどって集計をし、調教師ごとの傾向を見てみたかったのですが、これだとちょっと難しいかもしれません。成績データにはその時点での調教師のコードが入りますので、同様に調教データにも入れて欲しいところです。美浦の坂路が延長されると現在の仕様だとサイズが足りないので、その時点で仕様が変更される可能性は高いと思いますので、まあそのときに入ることを期待しておきますか。




2004.2.13

Data Lab版ですが、新しく追加されるデータの表示関係はほぼ終りました。ただ、それらの画面が他の画面からリンクされることが多いのと、そらにはそれらの画面から他の画面に行くこともかなり多いので、現在リンクを貼る作業だけで大変な量になっています。先日の血統表画面だけでも、馬名や種牡馬名が表示されているところからはほぼ直接開けますし、また、血統表画面の方からもその馬の馬データや産駒一覧、兄弟馬検索等いろいろとリンクされています。今回からインデックスの持ち方を変更しましたので、現在の産駒検索や兄弟馬、馬主の所有馬検索、生産者の生産馬検索という作業の時間がほぼかからなくなっていますので、どこからでも簡単に表示できるようになっています。これがまたリンクを増やす原因になってますね。他にも、馬名未登録馬のデータが表示できるようになっていますが、この一覧も検索が可能で、つまり、ある種牡馬から産駒を検索する場合、登録馬だけなのか未登録馬も含めるのかという選択肢も出てくるわけです。兄弟馬を検索する場合も同様ですね。

で、その未登録馬のデータですが、現時点で2歳馬のデータが8589頭いますね。毎年だいたい1万頭程度登録されるのですが、多分あとは今後来るマル外馬が追加されてくるのだと思います。これらももちろん現在の馬データ検索画面のように一覧表示ができ、現状では各種ソートが可能です。馬名はありませんので、「〜の02」という表示になっていますが、登録されれば名前は表示されますし、もちろんここから血統表も見られます。まだ対応していませんが、この時点でチェック馬への登録と馬コメントの入力もできるようにする予定です。もちろん用途はPOGとかクラブ馬主ということになりますね。今後も機能を追加する予定ですので、POGにはかなり役立つ機能だと思います。

あとは、坂路調教データの表示も対応しました。いや私が知らなかっただけかもしれませんが、坂路調教のデータって、毎日2000件ずつ増えていきますね。年間で約60万件になるわけでして、果たしてこのデータを有効に利用できるのかどうかは悩むところです。とりあえず、その日の一覧、過去1週間の一覧、過去1ヶ月の一覧、あるいはチェック馬だけとか2歳馬だけとか3歳馬だけとか、または好タイムだけとか、出馬表からは出走馬だけとかできるようにはしました。また、上記の未登録馬も調教を走っているケースがありますので、入厩していることが確認できますし、仕上がり状態もわかるかと思いますので、こちらもPOGにも使えると思います。

他にも様々な追加・改良点があるのですが、今回のJRA-VANのデータ仕様の追加・変更は、POGをしている人にとってはかなり大きな変革になるかもしれませんね。ただ、データが膨大ですので、手に余ってしまう可能性もありますが、その辺りはこちらもプログラムを改良して使いやすくしていきたいと思います。

さて、今週からは2場開催ですので、開発しながらも先週までよりは時間が取れると思いますので、締切時間には十分注意したいと思います。




2004.2.7

プログラムの方ですが、登録の処理や新しく機能を結構追加したりしていますが、今回はそれと同時に不必要な処理もかなり発生しますので、削る部分も多く、プログラムサイズ的にはむしろわずかですが縮小していたりします。JRA-VANデータの解凍・登録の部分はほぼ無くなりますし、更新処理も必要なくなります。これがかなり大きいですね。あとは抹消馬の処理も無くなります。ただこの先はまだまだ機能の追加もありますので、最終的にはサイズが大きくなるとは思います。

それはそうと、いやーやってしまいました。開催中に開発しているとこれがあるから怖いです。京都最終なんですが、◎テイエムガルチオーで○タガノインディーで締め切りを食らいましたよ。多分数秒差だったと思いますが…。テイエムガルチオーは、ここを読んでいる人であれば、3歳限定のダート戦の成績から狙える典型的なパターンでしたので、簡単に◎にできる馬だと思いますし、逆になんでこんなに人気が無いのか不思議なほどです。タガノインディーは指数のレベルは上位にもかかわらずこの人気と脚質ですから期待値的に狙える馬でした。もちろん3連複も買い目にあったわけで、この損失はちょっと大きすぎますねー。しばらくは精神的にリハビリをしないと…。




2004.2.6

開発に没頭している昨今ですが、速度改善のために何回かのインデックスの作り直しがありつつも、大きなトラブルも無く思ったよりも順調に進んでいまして、すでにほとんどの機能が見た目は正常に動作しています。あとひとつ問題が残っていたりするのですが、これも一応目処は立っていますので、サービス開始には楽に間に合いそうです。まあ早く完成したところで何の意味ありませんが、TARGETの場合、画面も機能も量がかなり多く、それぞれの機能が枝葉のように分かれているわけではなく、お互いに絡み合っていますので、末端からバグを潰していったとしても、思わぬところで問題が出たりすることもありますので、デバッグには時間がかかってしまいます。あとは、新しく追加されたデータも多く、それらの対応は無用のトラブルを避けるために、最初のバージョンを公開して安定してから行なおうかとも思ったのですが、せっかくデータが提供されているのですから、やはりある程度は利用できないと意味がありませんし、新しいデータの魅力もわからないと思いますので、とりあえず簡単な表示関係を現在作っています。

例えば血統のデータがかなりあるのですが、自動登録しているとデータベースは勝手に蓄積していきますので、どんなデータがどの程度入っているのかは、その表示関係のプログラムを作らないとわからないわけですが、とりあえずファイルサイズだけで確認したところ、血統データは12万頭分もありましたね。まあ内訳は、種牡馬が1万頭程度で、残りは繁殖牝馬ですが。で、どの程度の内容があるのかをやはり確認したいので、TARGETからの血統表の表示プログラムを作りましたので、これは標準で搭載が確定しています(こんな画面)。とりあえず馬データ画面とか出馬表等から簡単に血統表が見られるようになりました。もちろんチェック種牡馬での色分けにも対応してます。ちなみに現在は5代血統表ですが1024x768画面で6代は牡のみなら行けそうですが、データが増えて検索・表示に時間がかかってしまうと意味がありませんので、この辺でやめておきます。まあプログラムはリカーシブ処理で作成していますので、何代でも大差無いんですが、過去へのさかのぼり・戻りも自由ですので、5代でも十分かと。これでインターネットリンクの機能もあまり使わなくなるかもしれませんね。

まあ血統関係は、そのデータベース自体だけでもひとつのプログラムとして成立しますので、やり始めるとキリが無いわけですが、とりあえずインブリード表示は作成しておきました。あとは、産駒の表示くらいもやる予定です。ただ、血統関係はデータさえ揃っていれば、プログラムとしては結構単純なデータベース処理ですので、今後このJRA-VAN Data Labのデータを使ったプログラムがたくさん出てきそうな気もしますね。





TARGET,TARGET frontier(C)2004 BLITZ All right reserved.
QZE16056@nifty.ne.jp