きょうも亀だけど

機械学習やデータサイエンスの勉強記録など

Python 3 エンジニア認定データ分析試験に合格しました

先日、 Pythonエンジニア育成推進協会の「Python 3 エンジニア認定データ分析試験」のベータ試験を受験し、無事合格しました。 次回受ける方の参考に、そして己の振り返りとして書きます。 受験時のスペック データサイエンスや機械学習のセミナーには数回参…

LightGBMではOne-hot encodingは不要

blog.amedama.jp orizuru.io LightGBMではpandasのカテゴリ列の型をcategoryにしてあげれば、数値変換するだけでカテゴリとしての分岐をしてくれるとのこと。 One-hot encodingだるいと思ってたけど、とても便利。 is or is notで分岐するという仕組みも分か…

button要素のform属性

button要素内にform属性がある場合はどういうときかわからなかった。 以下のとおりで、buttonがformの外に配置するときに紐づけるために使う。formの中に配置される場合は不要。 www.tagindex.com

G検定に合格しました

先日、日本ディープラーニング協会のG検定(ジェネラリスト検定)を受験し、無事合格しました。 次回受ける方の参考に、そして己の振り返りとして書きます。 受験時のスペック データサイエンスや機械学習のセミナーには数回参加 業務でディープラーニングを…

文字列からクラス名を取得してインスタンス生成

これのgetattrを使うパターンでうまくいった。 前回の記事で書いたyamlファイルから情報を取得する方法を利用し、 必要に応じてインスタンスを作成する仕組みを作れた。 便利。 qiita.com

yamlの読み込み

設定ファイルを読み込む形を作りたくて調べた。 最初はxmlでやろうと思ったけど、yamlの方が可読性が高いとのことで 使ってみることにした。 python.swift-studying.com これでうまくいった。

時系列分析の交差検証の方法

どうやってやるのか全くわからなかったけど以下のやり方があるとのこと。 ask.fm medium.com 最後のp日を残して検証用にするのか。 なるほど。 前処理大全にも似たようなことが書いてあった。 覚えよう。

read_csvでファイル名が日本語のcsvを読み込む

pandas.read_csvで pandas.read_csv('../日本語ファイル.csv') で読み込むと OSError: Initializing from file failed が発生してしまう。 読み込みエンジンのデフォルトであるCだと半角にしか対応していないとのことで、 エンジン指定をPythonに変更したら…

フォルダが存在しない場合に作成する処理を、存在確認なしで実行

csv出力の際に、作成先フォルダおよび中間フォルダが存在するかの チェックを入れてから出力するのがめんどくさい。 一気に出力する方法がないか調べたところ、 os.makedirs(フォルダパス, exist_ok=True) でいけることが分かった。 note.nkmk.me 便利

Prophetをimportするまでにつまづいたことと対応

Anaconda環境でProphet使おうと思い、 install後にimportしようとしてつまづいた。 なんとかimport成功まで行ったので手順を記録する。 参考にさせてもらった以下スライドのP.15に沿って、 まずはpystanをpip installした。 Prophet入門【Python編】Facebook…

pandasで縦持ちデータを横持ちデータにする

時系列データで種類を表す列に複数パターンが存在するとき、 グラフ表示のために横持ちにしたくなった。 以下のページが参考になったのでやってみる。 blog.amedama.jp pivot_tableを使えばいける。 便利。 Jupyter Notebookを貼り付ける方法が見つかったか…

test

test hoge fuga