scikit-learnとTensorFlowによる実践機械学習p49-p50
今日覚えたこと
np.random.permutation(x) ->xを並び替える
iloc ,loc ->pandas のやつ。iloc loc は複数、または単独の要素の値を取得、変更するためのものilocは行番号、列番号、locはラベルで取得する。
import hashlib
key="hello"
hashlib.md5(key.encode())hexdigest()
->ハッシュ化するための命令
・データセットを作るときは、ハッシュの値を参照してtest_data, train_dataを分ける。こうすることでデータが更新されたときに以前学習に使用したデータがテストデータに混入することを防ぐ。
~in_test_set -> python上のチルダはビット反転,しかしpythonは上限がないため正確には~x=-(x+1)となる。
apply() -> DataFrameの各行・各列に適用デフォルトでは各列に対して適用される。()内の関数に引数として渡す。