時系列データの交差検証:なぜTimeSeriesSplitを使うべきなのか
はじめに 機械学習モデルの評価において、交差検証(Cross-Validation)は不可欠です。しかし、時系列データに対して通常のK-分割交差検証(K-Fold Cross-Validation)を適用すると、未来の情...
はじめに 機械学習モデルの評価において、交差検証(Cross-Validation)は不可欠です。しかし、時系列データに対して通常のK-分割交差検証(K-Fold Cross-Validation)を適用すると、未来の情...
はじめに この記事では、あるコスト関数を最小化するための3次元回転の最適化について、リー代数の考え方を用いて理論的な背景を解説し、Pythonで実装を行います。詳細については、書籍「3次元回転(金谷健一著)」が参考になり...
はじめに 金融機関が保有する信用情報は、与信モデルの高度化や新たな金融サービスの開発において極めて価値の高い資産です。しかし、その機微性の高さから、組織を横断したデータ共有や共同研究は困難を極めます。このジレンマを解決す...
はじめに 金融市場では、複数の資産価格が互いにどのように影響しあうかを理解することが重要です。例えば、ある株が上がるとき、別の株も一緒に上がるのか、それとも下がるのか。このような関係性を分析することで、リスク管理や投資戦...
はじめに 本記事では、プライバシーを保護しながら実用的な合成データを生成するための手法を、具体的な実践を通じて解説します。特に、合成データ生成ライブラリ synthcity に実装されているADS-GAN(Adversa...
はじめに 機械学習モデルの説明可能性(Explainable AI, XAI)は、モデルの意思決定プロセスを理解し、ステークホルダーとの信頼関係を構築する上で重要な役割を果たしています。本記事では、代表的な2つの手法であ...
はじめに 混合整数計画法(Mixed Integer Programming; MIP)は、数理最適化問題の一種であり、一部の変数に整数制約を課した最適化問題を指します。線形計画問題(Linear Programming...
はじめに 本記事では、モンテカルロ法の改良版である準モンテカルロ法について解説します。モンテカルロ法は乱数を用いて数値計算や積分を行う手法ですが、準モンテカルロ法は「低不一致列」と呼ばれる特殊な数列を用いることで、より高...
はじめに 統計学には、大きく分けて頻度主義統計学とベイズ統計学の2つのアプローチが存在します。これらは確率の解釈と、それに基づく統計的推論の方法において根本的に異なります。本記事では、コイン投げという単純な例を通じて、こ...
はじめに 近年、グラフニューラルネットワーク(GNN)は、グラフ構造を持つデータの分析において大きな注目を集めています。本記事では、GNNを用いた異常検知の基本的な実装方法について、架空の取引ネットワークデータを例に解説...
はじめに この記事では、CTスキャンなどのボリュームデータから、セグメンテーションされたラベルデータの表面積を正確に計算するための「クロフトンの公式」について解説します。3次元データの表面積計算は、医用画像処理をはじめと...
はじめに 近年、機械学習モデルの訓練やデータ分析のために、元データの特徴を保ちつつプライバシーを保護する「合成データ」の活用が進んでいます。しかし、生成されたデータが本当に安全なのか、どのように評価すればよいのでしょうか...