任意の確率密度関数を持つ乱数の生成
はじめに この記事では、Pythonを用いて任意の確率密度関数に従う乱数を生成する方法について解説します。特に、三角形内部に均一に乱数を配置する問題を例に、具体的なコードと数式を用いて丁寧に説明します。累積分布関数とその...
はじめに この記事では、Pythonを用いて任意の確率密度関数に従う乱数を生成する方法について解説します。特に、三角形内部に均一に乱数を配置する問題を例に、具体的なコードと数式を用いて丁寧に説明します。累積分布関数とその...
はじめに 機械学習モデルの評価において、交差検証(Cross-Validation)は不可欠です。しかし、時系列データに対して通常のK-分割交差検証(K-Fold Cross-Validation)を適用すると、未来の情...
はじめに 近年、グラフニューラルネットワーク(GNN)は、グラフ構造を持つデータの分析において大きな注目を集めています。本記事では、GNNを用いた異常検知の基本的な実装方法について、架空の取引ネットワークデータを例に解説...
はじめに 金融機関が保有する信用情報は、与信モデルの高度化や新たな金融サービスの開発において極めて価値の高い資産です。しかし、その機微性の高さから、組織を横断したデータ共有や共同研究は困難を極めます。このジレンマを解決す...
はじめに この記事では、機械学習や統計分析において重要な、高次元データの可視化および分析のための次元削減手法について解説します。特に、PCA(主成分分析)、t-SNE、UMAPという代表的な3つの手法に焦点を当て、それぞ...
はじめに この記事では、CTスキャンなどのボリュームデータから、セグメンテーションされたラベルデータの表面積を正確に計算するための「クロフトンの公式」について解説します。3次元データの表面積計算は、医用画像処理をはじめと...
はじめに 金融市場では、複数の資産価格が互いにどのように影響しあうかを理解することが重要です。例えば、ある株が上がるとき、別の株も一緒に上がるのか、それとも下がるのか。このような関係性を分析することで、リスク管理や投資戦...
はじめに カメラキャリブレーションは、コンピュータビジョンにおいて基礎的かつ重要な技術です。実世界の3次元空間をカメラで撮影し2次元画像として取得する過程で、カメラレンズの歪みやカメラの位置・姿勢などの情報を正確に把握す...
はじめに 近年、機械学習モデルの訓練やデータ分析のために、元データの特徴を保ちつつプライバシーを保護する「合成データ」の活用が進んでいます。しかし、生成されたデータが本当に安全なのか、どのように評価すればよいのでしょうか...
はじめに 混合整数計画法(Mixed Integer Programming; MIP)は、数理最適化問題の一種であり、一部の変数に整数制約を課した最適化問題を指します。線形計画問題(Linear Programming...
はじめに 本記事では、プライバシーを保護しながら実用的な合成データを生成するための手法を、具体的な実践を通じて解説します。特に、合成データ生成ライブラリ synthcity に実装されているADS-GAN(Adversa...
はじめに 本記事では、時系列データ予測における深層学習モデルの代表格であるLSTM (Long Short-Term Memory) とTransformerを比較します。これらのモデルは、ビジネスにおける様々な課題、例...