OutPutな日常

このブログは主にAIやネットワークの基本を理解できるようにブログという形でアウトプット。。たまに脱線するかもです。何かを得るヒントにしてくてくれれば幸いです。

機械学習の種類~まとめ~

こんにちは!今日も張り切っていきましょう。

今日は機械学習の種類についてざっと復習していきたいと思います!!

 機械学習の種類は主に5つに分けることができます!

 

 

1 過去のデータから未来を予測。「回帰」

「回帰」は教師あり学習の考え方で過去の莫大なデータから、特徴量(因子)を抽出して数式として求めて未知のデータに当てはめて予測するものでした。

 

利用される場面としては株化の予測や飛行機のフライトの遅延時間の予測などに利用されていると考えられます。

 

2 YesかNoか。「クラス分類」

「クラス分類」は教師あり学習の考え方で、様々な特徴量を掛け合わして判別するものでした。

 

例えば「今日の練習は中止にするべきか?」などをAIによって判別させる時、

天気や気温、降水確率などの特徴量から中止にするべきか行うべきかを

判断してくれます。

 

3 傾向を見つけ出してくる「クラスタリング

クラスタリング」は教師なし学習の考え方でした。「クラス分類」と混合してしまいがちですが明確に異なっています。

  • データから傾向やパターンを見つけてくる=クラスタリング
  • 結果だけを教えてくれる=クラス分類

 

クラスタリングの主な利用方法は商品の売り上げのデータからセットで買われやすい商品などを見つけてきて売上に貢献したりすることができます。

 

4 あなたに最適な商品を。「レコメンデーション」

「レコメンデーション」は協調フィルタリングの考え方でamazonさんなどのECサイト

で使われています。レコメンデーションには二種類存在して

  • アイテムベースレコメンデーション
  • ユーザーベースレコメンデーション

が挙げられました。

アイテムベースレコメンデーションは利用者が高評価や購入した商品と似た商品を利用者に薦めてくれるものでした。

 

ユーザーベースレコメンデーションは利用者と同じ商品を買った利用者が評価した商品を薦めてくれるものでしたね。

 

5 特徴量をできるだけ減らす。「情報圧縮(次元圧縮)」

「情報圧縮(次元圧縮)」は今後詳しく説明する予定ですがデータの特徴量をできるだけ簡単にする。つまり出力に必要な特徴量のみを抽出して余計な特徴量を排除する考え方です。

 

これは主に顔認証や計算の高速化に利用されています。

 

今日も見ていただきありがとうございました。

次回は機会が自分たちのように言葉を自在に操る方法についてOutPutしていきます。

来週もぜひ見てください!!

 

ディープラーニング (やさしく知りたい先端科学シリーズ2)

ディープラーニング (やさしく知りたい先端科学シリーズ2)

 

 

あなたはきっと欲しくなる。レコメンデーション!

みなさまこんにちは!!今日も張り切っていきましょう。

 

ところで皆さんはama〇〇nなどのECサイトを利用します??

まあほとんどの人が利用しているかと思います笑

実はここにもAIが使われているのです。。

 

何か商品を購入したら「あなたにおすすめ!」と出てきて、

この商品もいいかもと思えるような自分たちの興味がそそられる。

そんな経験があるかと思います!

 

これをレコメンデーションと言います。

 

ではama〇〇nさんはレコメンデーションをどうやってやっているのか??

実はあるアルゴリズムが隠されていて、

協調フィルタリング

 

というアルゴリズムが存在します。

このアルゴリズムは利用者の購入履歴や商品のレビュー、さらには行動履歴などにスコアをつけて利用者の嗜好を分析しそれに応じてレコメンデーションしているのです!!

 

協調フィルタリングにも種類が存在して

  • アイテムベースレコメンデーション
  • ユーザーベースレコメンデーション

この二つの方法に分類することができます。

 

:[アイテムベースレコメンデーション]

アイテムレコメンデーションとはユーザーが高い評価をつけた商品や購入する商品とよく似ている商品をオススメの候補として紹介するものです。

 

amazonで例えると「あなたにおすすめ」のところです。

かなり類似した商品が紹介されているかと思います。

 

:[ユーザーベースレコメンデーション]

ユーザーベースレコメンデーションとは利用者が高い評価をつけた商品に同様に

高評価をつけたユーザーが評価したものを紹介するものです、

 

amazonで言うと「この商品を買った人はこんな商品も買っています。」

類似している商品も紹介されますが、これも欲しくなっちゃう〜と感じることが

多いなと感じますね。

 

実際このアルゴリズムが考え出された初期の頃は新商品や新規ユーザーが追加されてしまうと推薦ができなくなる(コールドスタート問題)がありましたが

 

現在で新規ユーザーのプロフィールなどの情報を既存のユーザーとマッチさせて

推薦したり様々な改良がなされて汎用性の高いアルゴリズムを実現しています。 

 

今日も見ていただきありがとうございました。

最近投稿頻度が少なくてすみませんでした!!

大学のテスト勉強に追われてました・・

夏休みに入ったのでガンガンOutPutしていきたいと思います。

 

参考文献

 

ディープラーニング (やさしく知りたい先端科学シリーズ2)

ディープラーニング (やさしく知りたい先端科学シリーズ2)

 

 

 

 

 

 

 

 

教師あり学習のクラス分類・教師なし学習のクラスタリング???

みなさま、こんにちは!

今日も張り切っていきましょう。最近ものすごく暑いですね・・・・

みなさま体調に方には充分気をつけてくださいね。

 

さて、前回では機械学習では統計による考え方が用いられていて

ということをOutPutしました。

 

今日は教師あり学習クラス分類教師なし学習クラスタリング

これらについてOutPutしていきます。

 

見た感じ、クラス分類とクラスタリングって違いなんて特になさそうですが

明確な違いがございます。

 

教師あり学習のクラス分類とは

与えられたデータを適切なクラスに分類することです。

 

教師なし学習クラスタリングとは

答えのないデータから法則性や傾向を見つけ出して分類することです。

 

違いがわかりにくいですね・・例えば

 

クラス分類では

「あなたは金持ちかどうか?」

 

ということを様々な特徴量(年収・職業)などからその特徴量を掛け合わして

お金持ちかどうかを判別してくれます

 

このように二種類に分ける場合を2クラス分類

複数に分ける・識別することを多クラス分類と言います。

つまりお金持ちかどうかを計算して分類してくれているのです

 

 

一方で教師なし学習クラスタリングでは

「お金持ちってこんな傾向があるんじゃない?」

ということを見つけてくれるものです。

このクラスタリングを用いることによって

 

お金持ちには職業・身長などの特徴量にある一定のパターンがあるということを

お金持ちのデータから特徴量のパターンを見つけてくれるものなのです。

 

違いわかっていただけたでしょうか?

 

今日はちょっと短いですがこの辺で終わりにします。

見てくださりありがとうございます。

 

参考文献

 

ディープラーニング (やさしく知りたい先端科学シリーズ2)

ディープラーニング (やさしく知りたい先端科学シリーズ2)