G-Research Crypto Forecasting(コードの提出方法)

ビットコインはちょっと気になるということで、これ!

予測の提出方法がよくわからない。。ファイルではなくコードを提出するのか??ということでとりあえず、コードの提出方法試したのでその備忘録。結論はファイル提出するときとそんなにかわんないっぽい。

  1. とりあえずコード作る。 今回は主催者が用意してるBasic Submission Templateをそのまま使用。右上Save Versionを押す。

f:id:iiiiikamirin:20211224151451p:plain

  1. ノートブックを閉じて、下の画面のSubmit Predictionで提出。

f:id:iiiiikamirin:20211224151737p:plain

  • 補足メモ

test_dfにtimestampやcloseなどが入っているので、row_idをキーにsample_prediction_dfに予測したTargetを入れればよさそう。ただ、test_dfの中身をみたらtimestampが1つdatetime.datetime(2021, 6, 13, 0, 3)しかない。これは実際にはどんどん増やされていくということ??提出後の実際の市場データをもとに評価するらしいので、おそらく変わっていくのでしょう。

f:id:iiiiikamirin:20211224152727p:plain

とりあえずコンペの紹介文を和訳。

暗号化予測チュートリアル G-Research暗号予測コンペティション G-Research Crypto forecasting competitionでは、参加者は主要な暗号通貨を束ねた価格リターンを予測する課題を持っています。このチュートリアルノートでは、参加者の皆様が参加しやすいように、暗号通貨予測に関連するいくつかのコンセプトについて説明します。 このノートブックでは、暗号予測への導入、データセットの構造と要素、関連する統計的特性、いくつかのMLベースラインモデルの構築、コード送信の例を説明しています。

暗号通貨市場 まず、暗号の世界について簡単に紹介します。暗号通貨は非常に人気のある不安定な市場となっており、投資家に大きなリターン(と同時に損失も)をもたらしています。ビットコイン(BTC)、イーサ(ETH)、ドージコイン(DOGE)など、多くの人が聞いたことのある主要な暗号通貨が数千種類も誕生しています。 暗号通貨は暗号取引所で広く取引されており、CryptoCompareによると、昨年1年間に毎日平均410億ドルが取引されています(2021年7月25日現在)。 異なる暗号通貨間の価格変動は、相互に大きく関連しています。例えば、ビットコインは歴史的に暗号通貨間の価格変動の主な要因となっていますが、他のコインも市場に影響を与えています。

リターンの予測 金融モデリングの基本的な作業は、近い将来の価格がどのように動くかを予測することである。過去の価格の時系列データを学習データとして、価格が上がるか下がるか、どの程度上がるか、すなわち資産リターンを予測したいのです。 このコンペティションでは、Kagglerは14種類の人気暗号通貨のリターンを予測する機械学習モデルを、数分から数時間の時間スケールで構築することが課題となっています。あなたは、数百万行の分単位の暗号通貨取引データにアクセスすることができ、それを使って14の資産すべてについて同時に予測モデルを設計することになります。あなたの予測は、コンペティション終了後の3ヶ月間の評価期間中に収集された実際の市場データとの相関関係によって評価されます。 暗号通貨のリターン予測は、オープンかつ非常に困難な予測タスクです。資産の極端な変動、データの非定常性、市場やミーム操作、資産間の相関、非常に速く変化する市場状況を考えると、これはMLコミュニティにとって魅力的な問題領域と言えます。私たちと同じように、皆さんもこの問題を魅力的だと感じてくれることを願っています。

  • スケジュール

このコンペティションは、トレーニング期間と実際の市場データに対してモデルを実行する第2期間を設けた予測コンペティションです。 トレーニングのタイムライン 2021年11月2日~開始日

2022年1月25日 - エントリー締め切り。出場するためには、この日までに競技規則に同意する必要があります。

2022年1月25日 - チーム合併の締切。この日が、参加者がチームに参加したり、合併したりできる最終日です。

2022年2月1日 - 最終提出期限。

すべての締め切りは、特に断りのない限り、該当する日の午後11時59分(UTC)です。大会主催者は、必要と判断した場合、コンテストのスケジュールを更新する権利を有します。

予測タイムライン。 最終提出期限の後、選択されたノートブックに対して実行される市場データの更新を反映するために、リーダーボードに定期的な更新が行われます。更新はおよそ2週間おきに行われる予定です。

2022年5月3日 コンペティション終了日 - 入賞者発表