どこにでもいる30代SEの学習ブログ

主にプログラミング関連の学習内容。読んだ本の感想や株式投資についても書いてます。

2020-10-01から1ヶ月間の記事一覧

pygribで気象庁の数値予報GPVデータを読み込む

※ 2020/08/16にQrunchで書いた記事を移行しました。 気象庁の数値予報データをPythonで扱いました。 pygribというライブラリでデータを読み込み、数値予報データの中身を確認する方法を紹介します。 [1] 数値予報GPVデータ [1-1] 数値予報とは [1-2] 数値予…

pygribのインストール方法:Amazon Linux2

<pygribのインストール方法:Amazon Linux2>*1 ※ 2020/06/09にQrunchで書いた記事を移行しました。 Amazon Linux2で、pygribのインストールに、かなり手間取りました。 自分や他の方が、再び同じ所で躓かないように、備忘録として解決法をまとめました。 何が起きるのか 色々インストールすることにな</pygribのインストール方法:amazon>…

【機械学習】matplotlibの日本語文字化け対策(Amazon Linux2)

※ 2020/05/20にQrunchで書いた記事を移行しました。 matplotlibの文字化け対策は多くの情報がありますが、Amazon Linux2向けの情報はありませんでした。他のOSと基本的な対策方針は同様です。日本語フォントをインストールし、キャッシュを削除します。 対策…

【機械学習】xgboostでグリッドサーチ(GridSearchCV)

<xgboostでグリッドサーチ(GridSearchCV)>*1 ※ 2020/04/09にQrunchで書いた記事を移行しました。 scikit-learnのGridSearchCVを利用して、グリッドサーチを行いました。 xgboostにはscikit-learnのWrapperが用意されているため、scikit-learnを使ったことがある人であれば、違和感なく使うことが出来</xgboostでグリッドサーチ(gridsearchcv)>…

pandasで複数行の列を持つDataFrameを作成する方法

<pandasで複数行の列を持つDataFrameを作成する方法>*1 ※ 2020/04/04にQrunchで書いた記事を移行しました。 列が複数行となっているDataFrameを作成する方法の覚書です。 結論は「pd.MultiIndexを使う」です。 例えば、次のようなDataFrameを作成したいとします。 # One Two Three # Four Five Six # 0 1.11 2.</pandasで複数行の列を持つdataframeを作成する方法>…

【機械学習】xgboostでクロスバリデーション(Cross Validation)

<xgboostでクロスバリデーション(Cross Validation)>*1 ※ 2020/04/06にQrunchで書いた記事を移行しました。 xgboost.cv()を使用したクロスバリデーション(交差検証)の方法を簡単にまとめました。 クロスバリデーションとは、学習データの一部を検証用データとして使用する手法です。 Wikipedaによれば次の通り</xgboostでクロスバリデーション(cross>…

Pythonでセルが結合されたテーブルをスクレイピングする方法

<pandasのDataFrameをconcatすると型が変わってしまう場合の対処法>*1 ※ 2020/03/26にQrunchで書いた記事を移行しました。 BeautifulSoupを使うと、Pythonでスクレイピングを簡単に行うことができます。しかし、セルが結合されたテーブルのスクレイピングは少々面倒です。 以下の画像は、過去の気象データなのですが、テーブ</pandasのdataframeをconcatすると型が変わってしまう場合の対処法>…

pandasのDataFrameをconcatすると型が変わってしまう場合の対処法

<pandasのDataFrameをconcatすると型が変わってしまう場合の対処法>*1 ※ 2020/03/14にQrunchで書いた記事を移行しました。 pandasのDataFrameを連結する際はconcatを使用します。 このとき、DataFrameにNaNが含まれていると型が変わってしまう場合があります。 起きた事象 dtypeがintの列を結合するとき、結合元のいずれかにN</pandasのdataframeをconcatすると型が変わってしまう場合の対処法>…

【機械学習】Kaggle Titanic competitionのチュートリアルが終わったあとにやったこと

Kaggle Titanic competitionのチュートリアルが終わったあとにやったこと*1 ※ 2020/03/11にQrunchで書いた記事を移行しました。 チュートリアルを終え、予測結果の提出方法までは分かりました。 以降は、予測精度の向上を目指しました。 結果として、スコア(…

【機械学習】Kaggle Titanic competitionをチュートリアル通りに進めてみた

※ 2020/03/02にQrunchで書いた記事を移行しました。 前回:Kaggleの始め方(Titanicコンペに参加する)の続きです。 前回は提供されたサンプルファイルを提出しただけでした。 今回から予測精度の向上を図っていきます。 引き続き、チュートリアルを参考に進め…

【機械学習】Kaggleの始め方(Titanicコンペに参加する)

Kaggleの入門用コンペ「Titanic」の参加方法を紹介します。 ※ 2020/02/29にQrunchで書いた記事を移行しました。 Titanicコンペは入門用コンペ [1] コンペに参加する [1-1] Titanicコンペのページを開く [1-2] ルール [1-3] 参加完了 [2] チュートリアルを参…

【機械学習】Kaggleの始め方(アカウント作成)

データ分析コンペ「Kaggle」の始め方を紹介します。 ※ 2020/02/27にQrunchで書いた記事を移行しました。 Kaggleとは アカウント作成 [1] Kaggleのサイトにアクセス [2] ユーザー情報を入力 [2-1] 入力する項目は4つ [2-2] Usernameに注意 [2-3] 個人情報の取…

Pythonで気象庁の過去気象データをスクレイピング

※ 2020/02/23にQrunchで書いた記事を移行しました。 気象庁が公開している過去の気象データを取得するためにスクレイピングを使用しました。 今回、取得したのは高層の気象データです。過去の気象データ検索からアクセスできます。 下図の2つの表(table1, ta…

【機械学習】pandasでCSV読み込み

※ 2020/02/16にQrunchで書いた記事を移行しました。 Pyhtonで機械学習を行うとき、入力データをCSVファイルから取得することがあります。 Pythonで機械学習と言えばnumpyが欠かせませんが、CSVファイルの読み込みはpandasで行うと大変便利です。数行のコード…