カテゴリカルデータ解析読書メモ(第6章)

R

ロジット変換 比率pを変換した値と説明変数xの間に線形関係を仮定する一般化線形モデルにおいて、比率pに対する変換として有名なものにロジット変換とプロビット変換がある。いずれもp→0でf(p)→-∞、p→1でf(p)→∞となるような変換であるが、ロジット変換の方が…

カテゴリカルデータ解析読書メモ(第5章)

シンプソンのパラドックス 層別をしないで解析すると関連が見られるが、層別をして解析すると関連が見られなくなるような現象。層別に用いるカテゴリカル変数が、他のカテゴリカル変数全てに影響を与えているような場合に発生する、見かけ上の相関。連続変数…

カテゴリカルデータ解析読書メモ(第4章)

R

オッズとオッズ比 2つの割合とに対して、オッズの比を考えると、このオッズ比が1より大なら、1より小ならである。 オッズ比は、ロジスティック回帰において回帰係数がオッズ比の対数に一致することや、患者対照研究のようにオッズ比のみが推定できる研究方法…

カテゴリカルデータ解析読書メモ(第3章)

R

第3章の内容は大体知ってる事なのでささっと。 二項検定 > binom.test(405, 765) Exact binomial test data: 405 and 765 number of successes = 405, number of trials = 765, p-value = 0.1116 alternative hypothesis: true probability of success is no…

カテゴリカルデータ解析読書メモ(第2章)

R

気付いたら買って本棚に飾ってあったので読んでいる。カテゴリカルデータ解析 (Rで学ぶデータサイエンス 1)作者: 藤井良宜,金明哲出版社/メーカー: 共立出版発売日: 2010/04/22メディア: 単行本 クリック: 13回この商品を含むブログ (3件) を見る 準備 insta…

Rで複数条件抽出&集計

R

このようなデータフレームがあって、条件c1とc2に基づいて何らかの集計をしたいとする。 また、データフレームはdfというオブジェクトに代入されているとする。 tapply > with(df, tapply(v, list(c1, c2), mean)) 1 2 a 1.689910 2.563432 b 1.780409 2.568…

Excelで複数条件抽出&集計

このようなデータがあって、条件1と条件2に基づいて何らかの集計をしたいとする。 AVERAGEIFS 平均値を計算したいのであれば、AVERAGEIFS関数があるので、例えばこのように入力する。 =AVERAGEIFS(平均対象範囲,条件範囲1,条件1,条件範囲2,条件2)最初の例で…

グループ変数に応じて複数の折れ線グラフを書く

R

緑色の本のp.119に載っている図と似たものを書こうとして、 d <- data.frame(q = rep(c("q0.1", "q0.3", "q0.8"), c(9, 9, 9)), p = c(dbinom(0:8, 8, 0.1), dbinom(0:8, 8, 0.3), dbinom(0:8, 8, 0.8)), y = rep(0:8, 3)) というようなデータを準備したもの…

RStudioのキーバインド変更

Windowsでのお話。 Tools -> Modify Keyboard Shortcuts...で出来るようになっているという話だけど、Ctrl+hをBackSpaceにしたいとかCtrl+zをPgUpにしたいとか思ってもどうもうまく出来ないので結局AutoHotkeyを使うことにした。ほんの少しゴニョゴニョした…

ggplot2で凡例のラベルと項目名を操作する

ラベルと項目名を操作する 以下の説明ではggplot2を含めて3つのパッケージを使う。 library(dplyr) library(tidyr) library(ggplot2) データは次のように準備した。 # テストデータの準備 testdata <- data.frame(x = seq(1, 10, 0.1)) %>% mutate(sin = sin…

facetのstripのtextを変更する

R

ggplot2でfacet_gridやfacet_wrapを使ってグラフを分割描画した際に、各グラフについているラベル(strip)のテキストは、何もしなければ分割に用いたグループ名が自動的に入る。 例: ggplot(iris, aes(x = Petal.Length, y = Petal.Width)) + geom_point()…

飽和水蒸気圧の求め方

何年か前に飽和水蒸気圧の求め方に関して、Goff-Gratchの式やTetensの式やMurrayの式について少し触れたことがあった*1のだが、最近Wikipediaを見ていたらTetensの式だと思っていたものが Tetens(1930)のパラメータ値によるAugust他の式 飽和水蒸気量 - Wiki…

ThinkPad X61 SSD化+その他いろいろ

2万ほど投資したらまだまだ使えそうな感じになった。 用意したもの SSD(A-DATA ASP900S3-256GM-C-7MM ADATA 2.5"SSD 256GB SATA6G A-DATA ASP900S3-256GM-C-7MM) 2.5インチHDケース(【日本正規代理店】 ORICO 2.5インチ HDD/SSD 外付け ドライブ ケース S…

ggplot2で任意の線分

R

baseライブラリ中のlines()に対応するggplot2のレイヤー関数はgeom_line()であると説明される場合が多く、大抵の場合はそれで事足りるのだが、任意の位置に線分を描き込みたいという場合はあまり使い勝手が良くない。 例えば、「統計学:Rを用いた入門書(Mi…

分布の集中度を調べる

R

ランダムか、集中か 水田の調査圃場において、正方形に区切った調査区画毎にニカメイガの卵塊が次のように見つかったとする。 egg <- c(2,4,1,1, 4,0,3,3, 4,3,0,1, 3,2,1,1, 2,1,4,3, 2,2,1,0, 1,0,5,1, 2,1,3,2, 2,2,2,2, 4,1,1,2, 3,2,0,1, 1,2,1,0) もし…

Rで逆推定

R

JMPには逆推定というコマンドがある 次のようなデータを用意して、線形回帰を行うとする。 temp <- rep(c(15, 20, 25), c(5, 5, 5)) day <- c(34, 33, 36, 37, 35, 30, 28, 29, 25, 28, 23, 25, 22, 24, 26) こんなかんじで適当に。 > result <- lm(day~temp…

不審なファイルの存在確認等

事の発端 【注意喚起】潜伏しているかもしれないウイルスの感染検査を今すぐ!:IPA 独立行政法人 情報処理推進機構www.ipa.go.jp 「バッチでの配布でも可能です」とか書くならバッチファイル用意しといてほしい…。 バッチファイル 上からやれといわれたけど…

ggplot2で縦に並べたグラフの横幅を揃える

R

(※2015/06/03 20:27追記あり) 下記の記事に基づく発言に関連してどうも某所で勘違いが発生しているようなので。R Recipe: Aligning Axes in ggplot2 | Exegetic Analyticswww.exegetic.biz 使用データ 下記のように生成したものを用いる。 x <- 0:100 x <-…

RStudioの折りたたみ機能

R

今更ながらコードの折りたたみ機能が付いている事に気付いた。 詳細はCode Folding and Sections – RStudio Supportを参照。 折りたたみ設定されるもの ブレース(波括弧{})で括られた領域。 R SweaveやR Markdownドキュメントにおけるコードチャンク。 R M…

S3

R

RStudioではじめるRプログラミング入門を読んだ。RStudioについて詳しい情報があるかと思っていたのだが、これについてはそこそこの記述だった。 ただ、全体的に見て、Rとプログラミングをゼロから学ぼうと思うのであれば良い情報量だと感じた。リゲス本なん…

S-Insertでペーストできない

.vimperatorrc中でペースト操作をしたいところに今までS-Insertと書いていたのだけど、気付いたら動作しなくなっていた。 今まではVimperator側でペースト操作に上書きしていたが(vimperatorでのコマンドラインへの貼り付け方法が分からなかった, S-Fマガジ…

キュウリに対して、おそらく同時期に放飼したであろうスワルスキーカブリダニが容易に見つかるほ場と30分探しても見つからないほ場があった。 スワルスキーカブリダニはナスやキュウリの害虫を食べるダニで、生き物だが農薬として登録されている。生き物だろ…

3週連続、洗車の翌日に雨が降っている。雨乞いに使えるのではないかというレベル。

紙の日記、全く長続きしないのでやはりここに書こうと思う。 朝、今日薬剤散布をするのであれば今か夕方かという相談があった。この時期の薬剤散布は難しい。だいたい、農薬というのは散布後に乾かなかったり、散布時に温度が高すぎたりすると薬害の危険性が…

gap.plot()で省略される部分のラインを途中まで描く

R

plotrixパッケージに含まれるgap.plot()関数は、データの途中を省略したプロットを行う関数で、以前に少し紹介した。 ギャップのあるデータを途中を省略してプロットする - もうカツ丼はいいよな このとき、typeに"o"、"l"、"b"などを指定した場合、省略範囲…

Majestouch MINILA買った&また改造した

職場で使う用にMINILAの黒軸を購入したので、前回(Majestouch MINILA買った&Mac用にとりあえず改造した - もうカツ丼はいいよな)と同じような感じで少々いじった。 基本的には前回と同様で、Fnキーへの変換・無変換割り当てとCapsLockへのFnキー割り当てを…

Rでinstall.packages()しようとしたらエラー

R

すごく久しぶりにRでinstall.packages()してみたら、 > install.packages("ggplot2") --- Please select a CRAN mirror for use in this session --- Error: .onLoad failed in loadNamespace() for 'tcltk', details: call: dyn.load(file, DLLpath = DLLpa…

TypeError:['@@iterator'] is not a function

Firefox34.0.5にした(された)ら見出しのようなエラーが出てVimperatorがうんともすんとも言わなくなってしまって大分焦ったけど、_libly.jsを新しいものにしたら直った。 fix "TypeError: ['@@iterator'] is not a function" on Firefox 34 · 0d4ec6d · vi…

ギャップのあるデータを途中を省略してプロットする

R

ギャップのあるデータ 例えばこのようなデータが有るとする。 testdata <- data.frame(x = 1:10, y = c(1,3,2,4,3,21,23,22,24,23)) 前半と後半の間にデータの大きな飛躍があるため、そのままプロットすると前半部、後半部の変化が相対的に小さくなって見難…

Majestouch MINILA買った&Mac用にとりあえず改造した

なんかMacでも使えるらしいという曖昧な情報を元にMINILAを買ってしまった。スペースキーの両隣にFnキーが付いてるのが若干気になったけど、まあKarabinerとかでなんとかなるだろうと思っていた。 … どうにもならなかった…。なんか単独ではイベントが発生し…