統計数理研究所で開催されたRユーザー会に参加してきました.
プログラムはhttp://jasp.ism.ac.jp/~nakanoj/R09/で公開されています.
twitterのハッシュタグは#rjpusers2009でした.
- Twitter. It's what's happening.
- hashtagcloud.net - このウェブサイトは販売用です! - ハッシュタグ ハッシュタグクラウド ハッシュ 入力 クラウド フォロー リソースおよび情報
KMLとR
- 牧山文彦さん(http://www.okada.jp.org/RWiki/index.php?okinawa)の発表
- RでKML(Keyhole Markup Langage, Keyholeとは買収される前のGoogle Earth)を出力し,それをGoogle Earthに取り込んで利用
- Google Earth上にポリゴンの地球をくっつけるデモなど
- 各国の人口を人間の形のポリゴンで表示するとか,そういうことに使える
RExcelの紹介
- 石田基宏さん(FrontPage - RとLinuxと...)によるRExcelに関する発表
- ESSは便利なんだけど,初めての人に見せると引かれる…
- 統計の授業でExcelしか使えない…
- R Through Excel(http://www.amazon.co.jp/Through-Excel-Spreadsheet-Interface-Statistics/dp/1441900519/)
- RExcelの本
- "現実をしっかり見据えましょう.統計でもっとも広く使われているソフトウェアはExcelなのです"
- statconnからRExcelがダウンロードできる
- 本体だけじゃなくて,RとRExcel,必要なパッケージがセットになったパッケージ(RAndFriends)もある
- 何かいろいろ出るけどだいたいokクリックしてけばインストールできるっぽい
- オプションでrggobiというパッケージも
- インタラクティブなグラフ作成ができる
- このパッケージを解説した本(http://www.amazon.co.jp/Interactive-Dynamic-Graphics-Data-Analysis/dp/0387717617/)もある
- RExcelのデモ
- OpenOfficeで使えるROOoというものも公開されている
- うまく動かない?
RExcelに関しては私も過去にちょっとした解説記事を書いているのでよろしければどうぞ.
Rによる環境疫学
- 谷村晋さんによる発表
- 疫学の現場においてどうRを活用しているのかを紹介
- 疫学とは?
- 疾患のリスク要因を見つけたい
- どの汚染物質がどの濃度だったらどの程度疾患が出るのか
- 生態的時系列研究
- 事例:PM10と日別死亡数の関係
- PM10:大気中の微粒子."PM10とは、空気動力学径10マイクロメートルにおいて捕集効率が50%(50%カットオフ粒径が10マイクロメートル)となる粒子であり、世界中で一般に用いられる定義である。"(大気エアロゾル粒子 - Wikipedia)
- まずやること:単純な回帰分析 -> PM10と死亡数の間には関係がありそうだが当てはまりが悪い
- 時系列への分解:トレンド+季節成分+短期成分,その他
- 成分ごとに相関を見る:年*年 -> 正の相関,季節*季節 -> 負の相関,週*週 -> ちょっとだけ正の相関
- 季節が負の相関になったのは死亡数,PM10双方に影響する交絡因子があるのではないか -> 気温?
- 気温の影響を取り除くと季節成分同士も正の相関,理論通り
- 余談:RでLaTeXの表吐けるよ! -> xtable
- 時系列データのモデルはポアソン対数線型モデルが一般的
- Lag()を使ったラグの検討や,未知の交絡因子の検討
- 未知の交絡因子は時間に対してなめらかに変動していると仮定して平滑化関数をモデルに組み込む
==== お昼休み ====
HTMLアプリケーションを用いた簡易Rツールの作成方法
- 舟尾暢男さん(http://cwoweb2.bai.ne.jp/~jgb11101/index2.html)の発表
- htaを使ってRのツールを作成する方法について
- 発表資料:http://www.occn.zaq.ne.jp/cuhxr802/HTAApp_R.pdf
- 臨床試験のデータ解析
- htaならHTML/Javascriptを使って100行くらいで作れるのでカンタン
- 最大の欠点:ウイルスだと認識される><
オープンなビジネスデータ分析環境
- 鈴木了太さんの発表
- R Analytic Flow(ef-prime, inc.)のバージョンアップについて
- R Analytic Folw:フローチャート形式のJava製R GUIフロントエンド.
- http://www.okada.jp.org/RWiki/?R%20AnalyticFlow
- 分析過程をフローチャート形式で図示できる
- 思考の整理,作業グループでの共有,再実行が容易などの利点
- バージョンアップで追加された機能について
- BOX: 部分フローを格納できる.フローが長くなったときに見た目をシンプルに.BOX中にBOXを設置することもできるが,使いすぎには注意.
- キャッシュ: 計算結果を保存しておく.長く時間のかかる計算を繰り返さない.単に結果をキャッシュするだけでなく,上流コードや実行ファイルに変更があったときなど適切なタイミングで自動的に再計算してくれる.
- コードエディタ: ハイライトなどに対応.複数行のコードを記述できる自由記述ノードにおいて使用可能.
- バージョンアップは年内には公開予定!
- ここから本題
- なぜ「オープンがいいのか?」
- すでにあるものを組み合わせれば,やりたいことが素早くできる.
- 既存のものをちょっと変えたいだけならさらにカンタン
- 「クローズド」ではだめか
- うまく併用すべき.費用対効果を考慮すれば購入したほうがいいことも当然ある.
- ただし自由度は限られる.
- つまるところ適材適所ということ.
- オープンならではの安心
- 「使えなくなる」ことが少ない(Officeとかはバージョン変わると…)
- 中身を見て同じ仕組みで動くものを自分で作ることができる
- オープンソースでソフト作っても資産扱いされて課税されるとか
RとFOSS4G
- 岡田昌史さん(http://www.okada.jp.org/RWiki/)の発表
- FOSS4G: Free and Open Source Software for Geospatial
- 地理情報のためのオープンソースソフトウェア
- GRASS(GRASS GIS - Home)というソフトウェアとRの連携について
- Quantum GIS(QGIS):ArcGISっぽいインターフェースで使えるフリーのGISソフト
R running on mobile gadgets
Tsukuba.Rの活動
- id:syou6162の発表
- 発表資料:Rユーザー会で発表してきました - yasuhisa's blog
- Tsukuba.Rとはなんなのか
- 始めた経緯
- もともとRの勉強会をしていたがスピーカーがなかなか集まらず消滅してしまった
- RubyKaigiの存在
- Rもコミュニティほしい…! -> Tsukuba.R
- FAQ
- つくばとおい…
- UstreamやSkype使えば距離関係ないよ!(cf. http://wakuteka.info/R/)
- R仲間いない
- BlogやTwitterの告知効果
- でも発表するようなネタが…
- 自分が常識と思ってるようなことを発表する
- 自分と他人の常識は違う
- つくばとおい…
パッケージccgarchによる多変量GARCHモデルの推定
- 中谷朋昭さんの発表
- ccgarchパッケージの作者
- garch: がーち
- 日付を扱うパッケージ:zoo
- 質疑では計算時間に関わるパラメータについて
初めて聞く単語が多くてなかなか理解が追いつきませんでした.勉強しないと…
インタラクティブPDF作成ライブラリPDF2の紹介
- 門脇正史さんの発表
- PDF2パッケージ(http://www.okada.jp.org/RWiki/?pdf%20device%20patch)の作者
- PDFにはハイパーリンクが付いたものがある.でもRのPDFには付いてない.
- 中身を見てみるとテキスト -> いける -> PDF2
- パッケージの作成について
- Writing R Extentions(http://cran.r-project.org/doc/manuals/R-exts.pdf)をひたすら読む
- PDF2はgrDevicesに対するパッチの形なので,Rのバージョンが変わる度に作り直す必要がある
Rcmdrによる教育用パッケージの開発
- 荒木孝治さん(index.html -)の発表
- 品質管理の場合
- 品質管理ではヒストグラムこう作れとか,ここに点線とか,こまかい「こだわり」が沢山…
- Excelでやるのは大変→Rで→コマンド入力&英語ベースは学生には敷居高い→Rコマンダー&日本語で
- Rコマンダーのプラグイン作成(荒木先生のHPからダウンロードできます)
- RExcel上でのデモ
==== 発表プログラムここまで ====
感想というか日記というか行動記録というかそんな類のもの
id:syou6162に誘われてid:ikakura4と東京まで行ってきました.
4日の20:00ごろ出発.東京は初では無いけれど,初めての夜行バス.お金に余裕ができたら新幹線を使おうと固く決意.
バス→電車→夜行バスと乗り継いで6時ちょい前に新宿着.マクドナルドで時間をつぶす.5時台から行列&店内いっぱいとかヤバイ.やっぱ次回新幹線使いたい.
朝マックなどというモダンな行為をした結果おなかいたい.やはり東京に行くなら新幹線ではないか.
id:syou6162,id:wakutekaと合流.Web上でしか交流のない方と会うのは初めてなので新鮮な気分.
そして統計数理研究所へ.どの発表もとても面白くて刺激的で,「どの発表が面白かったですか?」とか聞かれても即答できない程度に頭がぐるぐるしてたけど,メモの量とか見ると大体自分が何に興味を持っていたのか分かる気がする.もちろん本当は全部頭に突っ込んで持ち帰りたかった.「あの本を書いてるあの人」とか「あのサイト作ってるあの人」とか「twitterで知ってるあの人」にお会いできたのも嬉しい思い出です.
その後懇親会にも参加させて頂きました.学生ということで色々お世話になってしまいました.中谷さん,中間さん,そして他の参加者の方々も本当にありがとうございました.
懇親会後はバスまで時間があったのでid:syou6162と新宿ですいーつ頂いたりMeadowいじったり(3分でバッテリー切れたけど)して時間つぶし.突然呼んだ酔っぱらったid:reposeも来てくれた.間に座った僕の頭越しにsyou先生と便所さんの漫才が展開されて大変愉快な時間を過ごすことができた.
そんなこんなで23:00ごろ新宿を出た.7時くらいに帰宅.なんていうか,東京行くなら新幹線だと思いますよ.
今回は時間や資金の制約で日帰りだったけど,便所さんに会えただけでも僕は満足です(cf.←↓↑→ on Twitter: "便所さんの笑い声を聞いているだけで勇気が沸いてくるし明日も頑張ろうという気持ちになれる.").