スパース性に基づく機械学習のわからないとこのメモ

機械学習助けて

タイトル通りL1ノルムとか正則化あたりを理解しようと思ったので「スパース性に基づく機械学習」という本を読んでるわからないというより日本語が理解できないところがいくつかあったのでメモとして残して、理解できた部分はここでまとめることにする。わ…

2017-12-23

線形代数のまとめ　その３(行列式について)

線形代数

その２の続きその２で写像って何だ？というとこから基底や逆行列についてメモした最後で独立の意味って何だろう？とか任意のある行列に逆行列が存在するかの判定や任意でとった基底の組が基底としての条件を満たしているかの判断はどうすればいいんだろう…

2017-12-20

線形代数のまとめ　その２(写像について)

線形代数

その１の続きその１では線形代数の授業で雰囲気で覚えていた線形空間や基底についてメモった小学校や中学校で方眼紙を使ったことがあると思うが、一つの四角のマスが長さ 1cm を表しているとしてこの方眼紙においては、一つの四角のマスの横()と縦()があ…

2017-12-19

線形代数のまとめ　その１(線形空間、基底とか)

線形代数

プログラミングのための線形代数という本で線形代数の復習をしている。4章あたりまで読んだので振り返りとしてメモを残すことにする。よく変数で配列だったりタプルだったりを使うことがある。これは複数の数値や文字列の集まりを一つのものとして見る。物…

2017-12-12

チコノフ(Tikhonov)正則化について

お久しぶりです。最近プログラミングのための線形代数という本で線形代数のやり直しをしている。基底のイメージが掴みやすくて読んでいて楽しい第二章の最後あたりにチコノフ正則化というものについて書いてあったので試してみることにしたコードはいつも…

2017-11-21

Dropoutのハイパーパラメータの決定について

機械学習

ここ1ヶ月ほど、会社のアルバイトで6クラスの画像分類モデルをTensorflowを使って作ることを任された色々詰まった、考えさせられたことがあったのでメモ画像分類だったらCNNで、ネットワークはVGG16だったりAlexNetで作りましたべろ〜んwって感じでいいと…

2017-11-03

ベイズの定理とソフトマックス関数について

機械学習

授業が始まって中々勉強に時間が取れないがちょっとだけPRML上巻を読んだ。ベイズの定理について自分なりの解釈としてのメモをかくことに中学で確率における同時確率(または結合確率)というのを習った。これは事象XとYがあるとして、XとYが同時に起こる確…

2017-10-23

KaggleのTitanicで上位10%に入った手法のまとめ

機械学習

初心者向けですが深層学習の講師を最近やりました。講義の中で実際にKaggleのコンペで腕試しをするということをしたかったので講義をやる前にチャレンジした。今回腕試しをするコンペはkaggleのチュートリアルで有名なtitanicを選んだ。 Titanic: Machine …

2017-10-13

物体検出の実装を目指す-Fast R-CNNについて

機械学習

結構間が空いたが、Fast R-CNNの論文を読んだ。適度にメモする。 SPPnetではSelectiveSearchから得た候補領域一つ一つをCNNにかけるというのを無くし、対象とする画像データ一枚からCNN(畳み込みの処理のみ)にかけて得た特徴マップから物体検出を行う手法を…

2017-10-09

SECCON Beginners2017 東京に行ってきた感想

CTF

滅多に人が来ないこのブログのアクセス数が1000超えてた。あったけえ・・・ベリベリサンクスヾ(≧∀≦)ﾉタイトル通りctf4bの東京会場行ってきた。去年の2月くらいにCicada3301という話をネットで読んですごいワクワクして謎解きみたいで面白そうと思い、その…

2017-10-02

日付データから得られる特徴量の観察

インターンの懇親会に参加したとき、「解決したい問題によっては日付のデータが重要になることもある」という助言がプロの人からぽろっと出ていた。インターンの時には日付の扱いがよくわからず使わずに終わってしまった。さりげなくどんな感じに変換して…

2017-09-28

ROC曲線や累積反応曲線について

機械学習

前回の記事で、モデルの性能評価として期待利益という値を使った。データサイエンスの基本コンセプトのひとつに「モデルの性能の比較対象となる適切な基準は何であるかを考察することは重要である」というものがあるらしい。ビジネスとしては予想精度の最大…

2017-09-25

混同行列、期待利益からのモデルの評価について

機械学習

その２で終わるはずだったが続いた。期待値としての評価をキノコの分類モデルで試して見た。コードはここ。 github.com 前回3つのモデルを作成し、性能の計測については損失関数や以下のような精度を使って評価した。精度は分類器の性能を1つの値で表すこ…

2017-09-21

Kaggleのデータセットを使って特徴量を観察するその2

機械学習

前回の続き特徴量の選択を終えたのでキノコが食用か毒ありかの判別を行うモデルを構築していくコードはここ github.com モデリング作成したモデルは Tensorflowを使ったNNのロジスティック回帰モデル決定木を用いたツリーのモデル流行りのXGboostを用い…

2017-09-20

Kaggleのデータセットを使って特徴量を観察するその1

機械学習

最近、特徴量の観察、選択がとても大事だと実感した。それもあって深層学習の勉強とは別に、データサイエンスの勉強もしようと思ってこの本を読んでいる。 www.amazon.co.jp まだ7章ほどだけどもためになることが結構書いてあっていい。自分の言語処理能力…

2017-09-14

機械学習よりのインターンに行ってきた感想と特徴量について

機械学習

タイトル通り機械学習よりのインターンに行ってきた。理由は3年生だからそろそろインターンの体験を積みたいというのが一番でかかったりする。どこのインターンに行ったのかは言えません。東京湾に沈められますからね。オフィスは綺麗でリラックマのひよこ…

2017-09-07

外れ値検出、OneClassSVMについて

機械学習

統計データにはよく外れ値なるものが含まれていることが多いそう。外れ値とはデータの分布において他の観測値から大きく外れた値のことで、異常値とやらもあるけどそれとは異なるっぽい外れ値検出、処理することは機械学習を行う上で学習の妨げをなくす大…

2017-09-04

SPPnetについてとTensorflowでの畳み込みフィルターの観察

機械学習

前回の続き SPPnetを利用した物体検出では入力画像から1回だけ畳み込みの操作を行うことで、大幅な計算時間の削減が可能ということで感動した。他のサイトの情報や、論文の内容を読み直したりして以下のような手順でSPPnetによる物体検出器を作成しているの…

2017-08-29

物体検出の実装を目指す-SPPnetについて

機械学習

RCNNに続き、次はSPPnetの理解、実装を目指す。今回も頑張って論文を読んだ。気のせいかRCNNの論文より読みやすかった。アジアの人が書いた論文だからかな。まずRCNNの問題点として以下が挙げられる。 RCNNはSelectiveSearchなどで得た候補領域の1つ1つを…

2017-08-27

深層学習5章の白色化とデノイジング自己符号化器を試してみた

機械学習

お久しぶりです。 SPPnetの論文をよみつつ深層学習の青い本も読み進めてます。青い本の5章における白色化とデノイジング自己符号化器が気になったので作って見ることにした。白色化というのは機械学習における訓練データに偏りがあると学習の妨げになる場…

2017-08-13

深層学習5章の自己符号化器をTensorflowで作ってみる

機械学習

間がかなり空いてしまった。イルカの深層学習5章にて自己符号化器なるものの説明があった。これは入力層よりノードの少ない中間層で符号化し、入力と同じノード数の出力層にて復号化を行う方法でいいのだろうか。入力のノード数より少ないノード数に落とし…

2017-08-01

深層学習4章の誤差逆伝播について

機械学習

深層学習という青いイルカさんが表紙の本がありまして最近読んでいる。重み上限など自分の知らないことが載っていてまだまだ勉強不足と感じる。 4章の誤差逆伝播について、二乗誤差の第n層の重みの更新を考えるときこんな式が載っていた。右辺の第二項の微…

2017-07-29

Tensorflowで作った学習モデルをandroidで利用する

機械学習

物体検出を勉強中です。Tensorflowにはネットワークのグラフ情報やパラメータなどを保存するcheckpointというものがありますよね。 checkpointファイルをロードすれば一旦学習をストップして、再度学習を続行することもできて非常に便利。それとは別でcheck…

2017-07-24

Tensorflowを用いて物体検出の実装を目指す-RCNN

機械学習

前回に続いて今回はRCNNです。まずは論文を頑張って読みました。個人的にまとめたスライドを上げておきます。英語が苦手なので翻訳に頼ってしまった。。BB回帰のところの実装がわからなかったので探したがなかったので今回は無しで実装することに。 RCNNで…

2017-07-21

Tensorflowを用いて物体検出の実装を目指す-テンプレートマッチング

機械学習

最近アルバイトのこともあって物体検出のことについて調べていました。有名なところではRCNNに続きFast RCNN、Faster RCNN、YOLO、最近だとSSDというのが熱い感じ？ Faster RCNNやSSDはすでにTensorflow版のがGithubで公開されてますが、自分で実装して見た…