はじめに

2023-06-26

知識と情報の整理というか置き場として使ってます。あんまり人に見られることを想定していないです… Bing AIから参照して要約させたりするためにインターネット上にあげているといっても過言ではない。

投資関連情報は以下のリンク先から取ってきています Data provided by Financial Modeling Prep

obsidian_noteのタグがついているページは、他のノートソフトからの自動変換によるページ生成なので、数式の行列が複数行が1行に崩れているなど、多少変になっています。

DeepLearningDay4

2023-06-27 カテゴリー RabbitChallenge

実施内容と得点表章タイトル要点実装演習確認テストまたは考察参考図書など関連記事レポート強化学習 ◯ ◯ AlphaGo ◯ ◯ 軽量化・高速化技術 ◯ ◯ 応用技術 ◯ ◯ ◯ ResNet ◯ ◯ ◯ EfficientNet ◯ - - ◯ 物体検知と SS 解説 ◯ - - ◯ Mask R-CNN ◯ - - ◯ FCOS ◯ - - ◯ Transformer ◯ - - ◯ BERT ◯ ◯ ◯ ◯ GPT ◯ - - ◯ 音声認識 ◯ - - ◯ CTC ◯ - - DCGAN ◯ - - ◯ Conditinal GAN ◯ - - ◯ Pix2Pix ◯ - - ◯ A3C ◯ - - Metric-Learning ◯ - - MAML ◯ - - GCN ◯ - - ◯ CAM,Grad-CAM,LIME,SHAP ◯ ◯ - Docker ◯ - - 合計：４５基準：３６

DeepLearningDay3

2023-03-29 カテゴリー RabbitChallenge

再帰型NNの概念再帰型NN→RNN 時系列データとは時間的順序を追って一定間隔ごとに観察され、相互に統計的依存関係が認められるようなデータの系列時系列データの例音声データテキストデータ RNNの全体像（講義スライドより引用） $u^t = W_{(in)}x^t + W{z^{t-1}} + b$ $z^t = f(W_{(in)}x^t + Wz^{t-1} + b)$ $v^t = W_{(out)} z^t + c$ $y^t = g(W_{(out)} z^t + c)$ $W_{(in)}$：入力層から中間層への重み $W_{(out)}$：中間層から出力層への重み u[:,t+1] = np.dot(X,W_in) + np.dot(z[:,t].reshape(1,-1),W) + b z[:,t+1] = functions.sigmoid(u[:,t+1]) v = np.dot(z[:,t+1].reshape(1,-1),W_out) y[:,t] = functions.sigmoid(v + c) ※実装上は1次元目がデータ列になるため、重みに対して左から入力を掛ける形になる。 RNNの特徴初期の状態と過去の時間t-1の状態を保持し、そこから次の時間でのtを再帰的に求める再帰構造をもつ BPTT (Back Propagation Through Time) BPの復習誤差を微分のチェインルールに従って、誤差から逆算していくことで不要な再起的計算を避けて微分を算出できる。 BPTTの数学的記述 ※（パラメータ更新と合わせて、実装例と一致するように、数式展開で確認しながら表現変えてます）誤差関数を3つの重みと２つのバイアスでそれぞれ微分する。

DeepLearningDay2

2023-03-25 カテゴリー RabbitChallenge

要点(最低100字) 勾配消失問題誤差逆伝播の復習誤差から微分を逆算していくことで不要な再帰的計算を避けて微分を算出できる確認問題１勾配消失問題の復習誤差逆伝播が入力層に進んでいくに連れて勾配がどんどん減衰していくためにパラメータ更新が入力層に近い側で進まなくなり、最適値に収束しなくなる現象微分値の絶対値が１未満になると減衰していくことになる。活性化関数の微分 $(1-sigmoid(x))\cdot sigmoid(x)$ シグモイド関数の微分は最大値が0.25であり、多層になると減衰が進んでいく。（実装ノートより引用）確認問題２（２）活性化関数による勾配消失対策 ReLU関数：勾配消失問題への対応とスパース化で貢献（講義スライドより引用）微分値は正の範囲で１，負の範囲で０重みの初期化 Xavierの初期化手法正規分布での初期化値を一つ前の層のノード数で割る。（初期の方法でLeCunが提案したもの。） →各レイヤの出力の分散は「$n_{in} \times var_{in} \times var_{out}$」となるので、出力の分散を入力ノード数で割ることで分散を一定にできる。逆伝播の方向も考慮した、入出力の平均値で割ってスケーリングするのが現在の方法 network['W1'] = np.random.randn(input_layer_size, hidden_layer_size) / np.sqrt((input_layer_size+hidden_layer_size)/2) network['W2'] = np.random.randn(hidden_layer_size, output_layer_size) / np.sqrt((hidden_layer_size+output_layer_size)/2) 対象の活性化関数 sigmoid 双曲線関数 ※Xavierの初期化は0近辺で線形近似できる前提をおいているので、ReLUには使えない。効果もともとSigmoidに対して、正規分布で初期化した際は活性化関数への入力が０から外れすぎることで出力が0か1に偏っていたのが、分散を抑制することで0~1にうまくバラける様になった。またネットワーク全体で見たときに各層の分散が一定に保たれる。 Heの初期化手法あるレイヤーを経た後の出力の分散は、ReLU を考慮すると、「1/2 × $n_{in}$ × 入力の分散 × 重みの分散」となります。そこで、Kaiming (He) 初期化では、重みをとして、標準偏差が $\sqrt{2/n_{in}}$ の正規分布によって初期化 network['W1'] = np.random.randn(input_layer_size, hidden_layer_size) / np.

project4_alpha_research_and_factor_modeling

2023-02-01 カテゴリー Udacity_AI_for_Trading

OverViews Overviews Methods Knowledge Factor Covariance Matrix $$F = \frac{1}{N-1} f \cdot f^T　\times annualization_factor$$ N：要素数 f：ファクターリターン annualization_factor:　252/days_passed Actual Retrurn $$r_p = \sum_i^N \beta_i\times f_i + s_p$$ common return ファクターリターンとファクターエクスポージャの内積ファクターリターンの計算日付をインデックスとして、ティッカーをカラムとするreturnsがあるとき from sklearn.decomposition import PCA model = PCA(n_components=num_factor) pca.fit(returns) factor_returns = pca.transform(returns) ファクターエクスポージャーの計算 from sklearn.linear_model import LinearRegression model = LinearRegression() model.fit(factor_returns,portfolio_actual_return) exposure = model.coef_ specific return 実際のリターンからコモンリターンを引いたあたいで、ファクターで説明されない部分のリターンを示す。この値は小さくしたい

DeepLearningDay1

2023-01-28 カテゴリー RabbitChallenge

要点(最低100字) 識別と生成識別：データを目的別クラスに分類する $P(C_k|x)$：条件Xが与えられた条件の元でのクラスkの確率高次元から低次元へ必要な学習データは比較的少ない応用例画像認識生成：特定クラスのデータを生成する $P(x|C_k)$：クラスｋという条件のものとでのデータCkの分布低次元から高次元へ必要な学習データが多い応用例画像の超解像テキスト生成主要なモデル識別モデル決定木ロジスティック回帰 SVM ニューラルネットワーク生成モデル隠れマルコフモデルベイジアンネットワーク VAE GAN DRAW 識別器の開発アプローチ上から順に学習コストが大→小生成モデル的アプローチベイズの定理を活用モデル化の対象各クラスの生起確率データのクラス条件付き密度データを人工的に生成できる確率的な識別識別モデル決定理論に基づき識別結果を得るデータがクラスに属する確率をモデル化確率的な識別識別関数入力値ｘを直接クラスに写像（変換）する関数f(x)を推定データの属するクラス情報のみ（確率は計算されない）決定的な識別生成モデルと識別モデルの比較生成モデルのアプローチではより複雑なデータ分布を学習しようとするので、計算量が多い。（講義ビデオより引用）識別モデルと識別関数モデルは推論結果の取り扱いを変更でき、間違いの程度も評価できるが識別関数ではそれらが出来ない。結果を一足飛びに得る。（講義ビデオより引用）深層学習の強み：万能近似定理万能近似定理：活性化関数をもつネットワークを使うことで、どんな関数でも近似できるという定理これまでの機械学習では人間が関数を設計していたノーフリーランチの定理ニューラルネットの数学的表現 (ラビットチャレンジの深層学習day1講義資料より引用) 回帰と分類の違い回帰：連続する実数値を取る関数の近似分類：離散的な結果を予想するための分析線形と非線形の違い線形な関数は以下の性質を持つが、非線形関数は持たない。加法性:$f(a+b) = f(a) + f(b)$ 斉次性$f(ka) = k\times f(a)$ 活性化関数ステップ関数 def step_func(x): if x > 0: return 1 else: return 0 問題点：線形分離可能なものしか学習出来なかった

MachineLearning

2023-01-26 カテゴリー RabbitChallenge

要点(最低100字) 機械学習モデリングプロセス問題設定データ選定前処理機械学習モデル剪定モデルの学習モデルの評価ルールベースと機械学習の比較タスクTと性能指標Pがあるときに、性能が経験Eによって改善されるとき、タスクTおよび性能指標Pに関して経験E から学習すると言われる人がプログラムするのは学習の仕方　（認識の仕方では無い）ルールベースは認識の仕方自体をプログラムする。主なモデル教師あり学習回帰線形回帰・非線形回帰：最小二乗法、尤度最適化分類ロジスティック回帰；尤度最大化最近傍・K-近傍アルゴリズム SVM：マージン最大化教師なし学習クラスタリング K-Means 次元削減主成分分析：分散最大化回帰問題入力（説明変数、特徴量）から出力（目的変数）を予測する問題一般的に、外挿問題（学習データに含まれない範囲の値域）での予測の精度が下がる。どの学習方法でも共通。線形回帰線形とは→ざっくりというと比例。　n次元の超平面の方程式直線、平面→線形回帰曲線、局面→非線形線形回帰に関連する値教師データに含まれるもの入力$\vec{x} = (x_1,x_2,\dots,x_m)^\top \in R^m$ 出力$y\in R$ 学習によって最適化していくものパラメータ$\vec{w} = (w_1,w_2,\dots,w_m)^\top \in R^m$$ 切片$w_0$ 学習の際に使う値予測値$\hat{y} = w_0 + \sum_{i=1}^n \vec{w}^\top \vec{x}$　（※データセットで考えるときは$\vec{\hat{y}} = X・\vec{w}$）誤差$\epsilon = y - \hat{y}$ 線形回帰の最適化手法(最尤法) 最小２乗誤差　$MSE = \frac{1}{n_{train}}\sum(y-\hat{y})^2$ を用いて最適化する。 $\hat{\vec{w}} = arg \min_{w \in R^m} MSE$ MSEが最小値を取るとき

はじめに

DeepLearningDay4

DeepLearningDay3

DeepLearningDay2

project4_alpha_research_and_factor_modeling

DeepLearningDay1

MachineLearning

Half-Broken Engineer