きょうも亀だけど

機械学習やデータサイエンスの勉強記録など

時系列分析の交差検証の方法

どうやってやるのか全くわからなかったけど以下のやり方があるとのこと。 ask.fm medium.com 最後のp日を残して検証用にするのか。 なるほど。 前処理大全にも似たようなことが書いてあった。 覚えよう。

read_csvでファイル名が日本語のcsvを読み込む

pandas.read_csvで pandas.read_csv('../日本語ファイル.csv') で読み込むと OSError: Initializing from file failed が発生してしまう。 読み込みエンジンのデフォルトであるCだと半角にしか対応していないとのことで、 エンジン指定をPythonに変更したら…

フォルダが存在しない場合に作成する処理を、存在確認なしで実行

csv出力の際に、作成先フォルダおよび中間フォルダが存在するかの チェックを入れてから出力するのがめんどくさい。 一気に出力する方法がないか調べたところ、 os.makedirs(フォルダパス, exist_ok=True) でいけることが分かった。 note.nkmk.me 便利

Prophetをimportするまでにつまづいたことと対応

Anaconda環境でProphet使おうと思い、 install後にimportしようとしてつまづいた。 なんとかimport成功まで行ったので手順を記録する。 参考にさせてもらった以下スライドのP.15に沿って、 まずはpystanをpip installした。 Prophet入門【Python編】Facebook…

pandasで縦持ちデータを横持ちデータにする

時系列データで種類を表す列に複数パターンが存在するとき、 グラフ表示のために横持ちにしたくなった。 以下のページが参考になったのでやってみる。 blog.amedama.jp pivot_tableを使えばいける。 便利。 Jupyter Notebookを貼り付ける方法が見つかったか…

test

test hoge fuga