今回は、クロスバリデーションという手法でモデルの妥当性を検証しました。
学習したデータに対してとても良い精度を出すモデルであっても、予測が必要な新たなデータに対する精度が非常に低い、いわゆる「 過学習 」という状態になることが良くあります。こうならないように、汎用的に良い精度になるモデルを作成するためには、妥当性の検証が必要になります。
その1手法であるクロスバリデーションに挑戦しました。
今回も Pythonによるスクレイピング&機械学習開発テクニック増補改訂 Scrapy、BeautifulSoup、scik [ クジラ飛行机] の第4章を参考にさせていただきながら、取り組んでいます。
今回は、Jupyter notebookを使って実行を行いました。
Jupyter notebookについては、以下もご参照ください。
では、振り返っていきたいと思います。
クロスバリデーションでモデルの妥当性を検証する
1. クロスバリデーションとは
クロスバリデーションとは、日本語では「交差検証」とも呼ばれます。
この手法は、データを複数のグループに分割して、学習用データと、検証用データを入れ替えていくことで少ないデータでもモデルの妥当性を評価することができる検証法になります。
例:4つのグループに分割する場合
A~Dの4つのグループにデータを分ける。
ABCを学習用データ、Dを検証法データとして精度1を求める。
ABDを学習用データ、Cを検証法データとして精度2を求める。
ACDを学習用データ、Bを検証法データとして精度3を求める。
BCD を学習用データ、Aを検証法データとして精度4を求める。
精度1~4を平均してこのモデルを評価する。
図1. クロスバリデーション概要図
2. Amazon.co.jp: 最短突破 ディープラーニングG検定(ジェネラリスト) 問題集 : 高橋 光太郎, 落合 達也: Japanese Books. 全体像
コード全体は以下の通りで、Jupyter Notebook上で実行しました。
from sklearn import svm, datasets
from del_selection import cross_val_score
X, y = datasets. load_iris(return_X_y= True)
print ( '全データ:',, )
clf = (kernel= 'linear', C= 1)
scores = cross_val_score(clf, X, y, cv= 5)
print ( "各正解率=", scores)
print ( "正解率=", ())
では、コードを順番に見ていきます。
3.
Amazon.Co.Jp: 最短突破 ディープラーニングG検定(ジェネラリスト) 問題集 : 高橋 光太郎, 落合 達也: Japanese Books
-しっかり失敗を活かしていますね! 他にオススメはありますか? -すごい。確かにとってもイマドキですね。
では、逆に役に立たなかった勉強方法やツールはどのようなものですか? -それは何か逆説的ですね
推薦図書 | 一般社団法人 日本ディープラーニング協会 Japan Deep Learning Association
-勉強方法では、他にどのようなことをされたのでしょうか? 対策勉強中に心が折れたこと
-2 ~ 3 ヶ月の勉強時間は社会人にとっては期間が長いと思うのですが、その中でモチベーションになったものはなんですか? -それはなんとなくわかります (笑)
逆に心が折れそうになったのはどのようなときでしょうか? -ちなみに、どうして心が折れなかったのでしょうか? -本当におめでとうございます! これから受験されるかたへ
-では、最後にこれから受験しようかな、と思うかたにメッセージをお願いします! 今日はありがとうございました! IT 資格の歩き方では情報処理技術者試験やベンダー資格に加えて、比較的あたらしい AWS 資格や、AI 資格、認定スクラムマスター資格など、受験された方に受験体験をインタビューしています。
OK だよ! というかたはぜひお声がけくださいませ!
1 全自動お片付けロボットシステム
トヨタ自動車株式会社/株式会社Preferred Networks 取り組み事例
・一般的な生活環境の中でロボットが自ら学習し、様々なタスクを遂行できるレベルのサービスロボット開発を目指す取り組み。
株式会社Preferred Networks 取り組み事例
2021. 04. 28
397
索引「こ」の項目 上から11行目
誤差逆伝播学習法‥‥‥‥‥‥‥71, 130, 160
誤差逆伝播法‥‥‥‥‥‥‥・・・・‥‥‥205
誤差逆伝播法‥‥‥‥‥‥‥‥‥‥71, 130, 160, 205
備
考
「誤差逆伝播学習法」の項目は削除し、この項目に掲載しているページ数は全て「誤差逆伝播法」にまとめます。
2021. 24