WIP

機械学習の全体像

2017年08月09日に更新 vsanna / public machine_learning

概要

  • 機械学習とは
    • あるデータを用意し → ベクトル化して → 学習させると → 予測できるようになる
    • NNとそれ以外の主な違い
  • 大まかに2つにわけられるできること
    1. 回帰
    2. 分類
  • 取り扱うデータをベクトルに変換する手法(=素性選択)は、データ種別ごとにそろえる
    1. 画像
      • 素性選択: チャンネル × ピクセル毎のデータ
      • ここでいうチャンネルとは色のことであり、RGBであれば3チャンネルになる
      • つまり、カラーの画像であれば1枚の画像を 3 * 縦ピクセル数 * 横ピクセル数の3次元のデータとして扱う
    2. 自然言語
      • n-gram
      • bag-of-words
    3. きっと他にもあるのだろう。音、ユーザーデータなど。

分類問題

  • 手法
    • 教師なし学習 ... グルーピング
      • クラスタリング
    • 教師あり ... 仕分け
      1. ニューラルネットワーク
      2. ナイーブベイズ
      3. ...
  • 分類の種類
    1. 二値分類
      • A or NotA
      • ex: 値上がりする or しない
    2. 多クラス分類
      • A or B or C or ...
      • ref: MNIST問題
    3. クラスタリングは分類(正確には仕分け)とはちょっと違う。グルーピング。
  • NNについて
    • まずはパーセプトロンの理解
    • NNはパーセプトロンのアクティベーション関数が非線形であるものを指す
    • NNは層を重ねられる
      • input → (affine → activate) → (affine → activate) → (affine → output)
      • input → (convolutional → activate → (pooling)) → (affine → output)
    • NNの層を深くしていくとDeepLeaning
    • NNの学習方法 / 検証方法
    • 学習のコツ
      • ハイパーパラメーター, 重み初期値の設定方法など
  • クラスタリングについて
  • その他分類について
  • 応用編
    • 分類器が蓄えているカテゴリの特徴を使って、その特徴をもつデータを新たに作ったり。
  • task
      • 「xxxな特徴をもつユーザーはxxxなコンテンツを好む」データセットを用意

shareシェアする

forumコメント

まだコメントはありません!
ログインしてコメントを残す
{{comment.user.name}} on {{commentCreatedAt()}}

content_copy前後のイシュー

{{message}}