scikit-learnとTensorFlowによる実践機械学習p49-p50

今日覚えたこと

np.random.permutation(x) ->xを並び替える

iloc ,loc ->pandas のやつ。iloc loc は複数、または単独の要素の値を取得、変更するためのものilocは行番号、列番号、locはラベルで取得する。

import hashlib

key="hello"

hashlib.md5(key.encode())hexdigest()

->ハッシュ化するための命令

 

・データセットを作るときは、ハッシュの値を参照してtest_data, train_dataを分ける。こうすることでデータが更新されたときに以前学習に使用したデータがテストデータに混入することを防ぐ。

 

~in_test_set -> python上のチルダはビット反転,しかしpythonは上限がないため正確には~x=-(x+1)となる。

 

apply() -> DataFrameの各行・各列に適用デフォルトでは各列に対して適用される。()内の関数に引数として渡す。