Google データポータルでヒストグラムなどの標準的でないグラフを描く(Vega/Vega-Lite)

データポータルの限界

Googleデータポータル*1はSpreadsheetやGoogle アナリティクス等の様々なデータソースと接続して気軽に表・グラフを含むレポートを作成できる強力なツールだ。しかし、データポータルに標準で用意されていない可視化手法を実現しようとするととたんに困難にぶち当たる。

例えばデータポータルではヒストグラムを作成できない。いやそんなまさかという感じだができないものはできない。

箱ひげ図もダメだし、棒グラフにエラーバーもつけられないし、ヒートマップも描けないし、色と形の両方に変数を割り当てた散布図も描けないし…

とまあできないことを並べていくとキリがない。

しかしデータポータルはできる範囲のことをやるだけなら手軽だ。特にデータの探索機能は優れている。いろいろな条件でデータを絞り込みながら、簡単な棒グラフや折れ線グラフ、データテーブルを眺める。それで満足すべきではないのか…?

だがやはりヒストグラムくらいは作りたい。そうでなければ日常生活に支障がある。できればもっと複雑な可視化もしたい…

*1:どういう経緯か不明だが日本語以外では相変わらずData Studioという名称が使われているようで、Google Data Studioだとか#datastudioなどのキーワードを使わないと日本語以外のリソースが見つけづらい。

続きを読む

Rでマネーフォワードをスクレイピングする

マネーフォワードのポートフォリオ(資産ページ)は資産の内訳が一覧できて便利なのだが、銘柄コードがあるものは全部株、という感じでざっくりしている。商品の区分も業種の区分もわからないので、もうちょい細かく見たいときに困る。というか自分のポートフォリオが実際どうなっているのかよく分かってない。これでは良くないということできちんと集計しようと考えた。

しかし証券会社のwebサイトの出力はしょぼいし、マネーフォワードのポートフォリオはそもそも出力できないしユーザーが使えるAPIも公開されてない、ということでマネーフォワードをスクレイピングすることにした。

続きを読む

似非エラトステネスの篩は「アイデアとして正しい」のか?

少し前に某所でエラトステネスの篩の実装が正しくないとかなんとかで話題になったことがあった*1*2。そこでの結論が「アイデアとしては正しいが高速化のための実装としては間違い」みたいなところに落ち着いてしまってイマイチ腑に落ちなかったので少し調べた。

続きを読む

食洗機を買った

食洗機は前から買おうと思っていたのだが、在宅勤務も長くなり、家で食事を作る機会が増えてきたので買った。導入までやったことを記しておく。まだ今日設置したところなので、食洗機買って良かったかどうかという判断はできていない。大変だったので設置できたことについての満足感はある。

続きを読む

メンデルの法則をめぐる論争について (4) - 連鎖および近年のメンデルに対する評価

関連記事一覧


前回まで3回にわたってメンデルの法則をめぐる論争について取り上げた。この話に関連してよく取り上げられる話題はもう一つある。

それは「メンデルは連鎖を見つけられたのではないか?」というものだ。

続きを読む

メンデルの法則をめぐる論争について (3) - 「データができすぎている」は解決できない

関連記事一覧


前々回前回とメンデルの法則をめぐる法則を紹介し、前回はフィッシャーの2つの指摘のうち1つについて否定が可能という説明をした。今回はフィッシャーの指摘のもうひとつの要点である「データが理論値に一致しすぎている」について説明する。今回が本題である。

そもそも、Weldonに始まるメンデルのデータに対する疑問はこの「データが理論値に一致しすぎている」が発端である。前回取り上げた「1:1.7」問題はフィッシャーの疑念をより強めたポイントではあったが、それ単体で見れば「運が良かった」でも済ませられる程度のものであった。

続きを読む