class: center, middle, inverse, title-slide # 再現可能な日本語論文執筆入門 ## –再現可能な論文執筆と環境構築– ### 国里愛彦 (専修大学) ### 小杉 考司(専修大学) ### 2020年9月6日 --- # TWS開始前のアナウンス - 本TWSでは,RとRStudioを使用します。 - TWS用のサイトを用意していますので,以下を参考に,RとRStudioのセットアップをお願いします。 https://ykunisato.github.io/jpa2021-tws-jpaRmd/index.html - 「6 TWS: 再現可能な論文執筆と環境構築」は,概要説明になります。RやRStudio(可能ならDockerが良いです)の準備がまだの場合は,そちらを優先なさってください。 --- class: center, middle # 1.再現可能な論文執筆とは? --- # 心理学の再現性の危機 <img style="float:right" src="fig/01.png" width="250"> - 1576名の研究者への調査.med[(Baker, 2016, Nature)]で,90%が再現性の危機があると回答.med[(52%が重大な危機,38%が軽い危機)] - 100本の心理学研究を追試したところ,元の研究は97%が有意な効果なのに,追試は有意な効果が36%だけ.med[(Open Science Collaboration, 2015)] → 心理学の再現可能性を高めないと! --- # 3つの再現性(Goodman et al., 2016) <img style="float:right" src="fig/02.png" width="300"> - **.large[方法]の再現可能性**: 同じデータ+同じ方法 → 同じ結果 - **.large[結果]の再現可能性**: 新規データ+同じ方法 → 同じ結果 - **.large[推論]の再現可能性**: 同じ結果 → 同じ結論 → 本TWSの目的は,**方法**の再現可能性を高めること! --- # 方法の再現可能性の問題 - Cognition誌(2009-2016年)でデータ共有している35本の内,同じ解析で同じ結果を再現できたのは,**62%**(著者の助けなく再現できたのは**31%**, Hardwicke et al., 2018)。 - 同じ仮説.small[「移民が市民の社会政策への支持を低下させるか」]&同じデータを,73の研究チーム(162名の研究者)が解析すると,推定値もその結論(**60.7%が仮説棄却,28.5%が仮説支持**)も大きく異なった(Breznau et al.,2021) → 同じデータであっても結果を再現するのは難しい! --- # 方法の再現可能性を高める方法 <img style="float:right" src="fig/03.png" width="200"> 1. 共有を前提にデータとコードを用意する 1. ファイルを組織化する(Research Compendium) 1. データから論文出版までを一気につなぐ 1. 解析環境をまるごと共有する --- # 共有を前提にデータとコードを用意する - 第3者が利用できるように,機械が読みやすく人も理解しやすい形式でデータを配布する(整然データ) - ヒトから収集したデータを共有・公開する場合は,データ共有に対する同意も必要になる(倫理審査から準備が必要)。 - データから個人が特定できないように工夫する(個人識別情報を含んでなくても特定できることがある) - 第3者が利用できるように,解析コードは,その分野で馴染みのある書き方にする(Rの場合は,The tidyverse style guide https://style.tidyverse.org/) --- # ファイルを組織化する - 実行するコードの順番や説明を入れたり,データの場所が分かりやすいようにフォルダを作成(ソフトのパッケージ化を意識した**Research Compendium**.med[(Marwick et al., 2018)]の利用) <img src="fig/04.png" width="800"> --- # データから論文出版までを一気につなぐ - データと論文執筆をつなぐには,R Markdownが便利! <img src="fig/05.png" width="800"> --- # 解析環境をまるごと共有する - パッケージのバージョンが違ったりすると,結果が再現できないことがある。 - 解析環境(OSやソフト)が違うとそもそも実行ができないor結果が再現できないことがある。 → コードだけでなく,解析環境やバージョン情報も公開する。 → **Docker**を使ってOSやソフトを含んだコンテナを共有する。 --- # 方法の再現可能性を高めるツール 1. 共有を前提にデータとコードを用意する → **The tidyverse style guide** 2. ファイルを組織化する(Research Compendium) → **jpaRmd** 3. データから論文出版までを一気につなぐ → **R Markdown, rticles, jpaRmd, ** 4. 解析環境をまるごと共有する → **Docker** → 今回は主に**RStudio, RMarkdown, jpaRmd**を中心に解説を行う。 --- class: center, middle # 2.環境構築(RStudioとRmarkdown環境を整える) --- # 解析環境を整える - 統計解析環境の構築では,RとRStudioがおすすめ(フリー,高機能,便利なパッケージがある)。 - Rは[The R Project for Statistical Computing](https://www.r-project.org/),Rstudioは[RStudio社のHP](https://rstudio.com/products/rstudio/)からデスクトップ版をダウンロード&インストールできる。 デメリット:(1)Rstanなどインストールでトラブりがちなパッケージの用意が面倒,(2)複数のパソコンで完全に同じ環境を整えるのは大変,(3)純粋にめんどくさい --- # Dockerを使って簡単に環境構築する - Dockerは,Linuxベースのアプリケーションをコンテナ化する技術。Dockerではコンテナのイメージをつくるが,これを共有すれば,再現可能な環境を共有できる。 <img src="fig/06.png" width="550"> --- # Rockerを使う.small[(https://hub.docker.com/u/rocker)] - RockerはRやRStudio用のDockerイメージ。パソコン内にコンテナを用意して,RStudioサーバーを動かす。ユーザーは,ブラウザからRSutidoサーバーにアクセスする。 <img src="fig/07.png" width="700"> --- # paper-r:心理学の論文執筆用Docker - ykunisato/paper-rは,RstudioでR Markdownを用いて論文執筆を行う際に便利なパッケージやアドインを含めたDockerファイルのリポジトリ (https://hub.docker.com/r/ykunisato/paper-r ) - ykunisato/paper-rは,rocker/verseをベースにしており,心理学で使いそうなRパッケージは大体入っている(stanも最初から入っている)。 - 注意点:Paper-rは10GBくらい容量を使う。Win,Mac,Linuxに関係なく導入ができるが,長く使用していて様々な設定を施したパソコンは導入が難しいことがある(また,タブレットは導入が難しい印象)。 --- # paper-rの使い方(事前準備動画参照) - ターミナル(Mac)・コマンドプロンプト(Win)で以下を実行 ### Windows docker run -e PASSWORD=paper -p 8787:8787 -v "%cd%":/home/rstudio -d --name paper ykunisato/paper-r ### Mac docker run -e PASSWORD=paper -e DISABLE_AUTH=true -p 8787:8787 -v $(pwd):/home/rstudio -d --name paper ykunisato/paper-r --- # jpaRmdパッケージ <img style="float:right" src="fig/08.png" width="250"> - rstudioのrticlesは便利だが,日本の心理学系の雑誌には対応していない。 → [jpaRmd](https://github.com/ykunisato/jpaRmd)を開発! - jpaRmdは,「心理学研究」の投稿時に求められる書式をPDFで出力するRMarkdownのテンプレートを提供するRパッケージ --- # jpaRmdのインストール - jpaRmdは,githubからremotesのinstall_github()関数を用いてインストールする(CRANには登録されていない)。 - remotesがインストールされてない方は,CRANからインストールください。 ```r # install.packages("remotes") remotes::install_github("ykunisato/jpaRmd") ``` --- class: center, middle # Q&A --- # 引用文献 .small[ - Baker, M. (2016). 1,500 scientists lift the lid on reproducibility. Nature, 533(7604), 452–454. - Breznau et al.(2021). Observing many researchers using the same data and hypothesis reveals a hidden universe of uncertainty. In BITSS. https://doi.org/10.31222/osf.io/cd5j9 - Goodman, S. N., Fanelli, D., & Ioannidis, J. P. A. (2016). What does research reproducibility mean? Science Translational Medicine, 8(341), 341ps12. - Hardwicke, T. E., Mathur, M. B., MacDonald, K., Nilsonne, G., Banks, G. C., Kidwell, M. C., Hofelich Mohr, A., Clayton, E., Yoon, E. J., Henry Tessler, M., Lenne, R. L., Altman, S., Long, B., & Frank, M. C. (2018). Data availability, reusability, and analytic reproducibility: evaluating the impact of a mandatory open data policy at the journal Cognition. Royal Society Open Science, 5(8), 180448. - Marwick, B., Boettiger, C., & Mullen, L. (2018). Packaging Data Analytical Work Reproducibly Using R (and Friends). The American Statistician, 72(1), 80–88. - Open Science Collaboration. (2015). Estimating the reproducibility of psychological science. Science, 349(6251), aac4716. ]