食洗機を買った

食洗機は前から買おうと思っていたのだが、在宅勤務も長くなり、家で食事を作る機会が増えてきたので買った。導入までやったことを記しておく。まだ今日設置したところなので、食洗機買って良かったかどうかという判断はできていない。大変だったので設置できたことについての満足感はある。

食洗機の選定

我が家の台所はあまり広くない。シンクの奥がカウンターになっている構造なので、カウンターに乗せることもできなくはないが、あまりデカイものがカウンターに乗っていると圧迫感があるので避けたかった。したがって、実質的に利用可能なスペースは幅50cm、奥行き55cmのみであった。調理することを考えると、奥行きをあまり使うわけにはいかない。

部屋が賃貸ということもあり、当初は配管不要なタンクタイプのものを検討していた。最近このタイプのものは新しいものが続々と出てきており、いくつか選択肢があった。しかし、どれも奥行きをそれなりに要求されるため、このタイプは断念した。タンクがある以上やむを得ないのかもしれない。

腹をくくって分岐水栓を取り付けるということにしてしまえば選択肢は広がる。結局食洗機はパナソニックのものに決めた。

panasonic.jp

パナソニックのプチ食洗は奥行き30cmで設置でき、我が家のスペースでもある程度の余裕をもって設置ができる。手前にまな板も置ける。また、公式Webサイトの情報が手厚い。何としてでも設置させるという強い意志を感じる。

事前調査

分岐水栓を取り付けるためには水を止める必要がある。これが室内から簡単にできなければ面倒なので、まずここを確認した。シンク下に止水栓があり、比較的容易に水を止められることが分かった。

水が止められることが分かったので、次に必要なモノを確認した。まず分岐水栓が必要となるが、これはパナソニックのWebサイトから検索ができ、設置マニュアルもダウンロードできる。我が家の水栓の型番はKM346であり、対応する水栓はCB-SKE6であることが分かった。

また、取り付けにあたってはモーターレンチと水栓を押さえるための工具G26が必要ということも分かった(後にこれだけでは足りないことが分かる)。

発注

食洗機の選定と必要なものの洗い出しが終わったので、一通り注文。

食洗機と工具はamazonで買えた。後で洗剤も専用のものが必要ということに気付き、追加で注文した。今思うと、食洗機の発注は最後にしたほうが良かった。後述するが、分岐水栓が無事に取り付けられるとは限らないからだ。

分岐水栓はamazonに商品ページはあったものの、品切れ状態だったのでモノタロウで発注した。こういうときはモノタロウを探すとだいたいあるので助かる。ただ、発送まではある程度の時間を要した(amazonで入荷を待つよりはずっとマシだったが)。結局、5日ほど食洗機を眺める生活をした。

設置(1日目)

一通りモノが揃ったので、早速設置にとりかかる。分岐水栓の設置マニュアルに従って、止水栓を締め、レバーハンドルを取り外し、水栓自体が回らないようにG26で押さえながら、モーターレンチでカバーナットを回す…回らない。

どうやっても回らないので外し方が間違ってるのではと思ってネットで調べてみると、何年も経った水栓のカバーナットが固着して容易には外れなくなるというのはよくあることらしい。手元の工具だけではどうも無理な雰囲気がしていたので、固着したカバーナットを外したという報告を参考に次のものを追加発注した。

先に結論を言うとショックレスハンマーだけで良かった。

設置(2日目)

注文して翌日には全部揃うのはすごい。

まずゴムシートを水栓に巻いて、ウォーターポンププライヤーで回すというのをやってみた。だが回らなかった。全く回らない。モーターレンチ単体よりは力が入れやすいが、全体重をかけても回らない。勢いをつけてみても回らない。ショックレスハンマーで柄を叩いてみても回らなかった。1時間くらい格闘したが断念。食洗機は設置できないのではないかという不安が頭をよぎる。

次に再度モーターレンチをカバーナットにセットし、ショックレスハンマーで叩いてみた。結果、2回叩いただけで回った。拍子抜けもいいとこである。

やはり撃力がかからなければダメなようだ。ウォーターポンププライヤーを使うやり方は力はかけやすいが、ゴムシートを巻いていることもあり衝撃が分散してしまう。かといってゴムシートなしでは滑って力がかからない。おそらく固着が強くなければこの方法でもいけるのだろうが、撃力を素直に伝えられる方法を検討したほうが良さそうである。

カバーナットが外れてしまえば後はマニュアルに従って分岐水栓と食洗機を設置するだけで、何も難しいところはなく、水漏れ等もすることなく設置は完了した。

注意点と反省点

分岐水栓を利用するタイプの食洗機を設置する前にまず次の2点は確認しておく必要がある。

  • 設置スペースはあるか...設置後に調理スペースが確保できるか、配管は可能か、電源をどこからとるかなどを確認しておく。
  • 水を止められるか...特に集合住宅の場合は容易に止められるかどうか、事前に確認しておいたほうが良い。

次に、分岐水栓と食洗機を発注する前に、分岐水栓の設置に必要な操作(既存の水栓の取り外し)が可能かどうかを確認しておいたほうが良い。水栓の設置から年数が経過している場合、カバーナット等はおそらく固着してしまっているだろう。容易に取り外しができれば良いが、できない場合のほうが多いだろう。おそらく食洗機の設置にあたってはここが最も困難な作業となる。

食洗機はもとより、分岐水栓も安い商品ではない(1万円前後する)。一方でモーターレンチ、水栓固定用工具、ショックレスハンマーを全部買ったとしても5千円以内で済むし、水栓固定用工具以外は多少汎用性がある。水栓の固着があまりに強いと食洗機の設置を断念したい気持ちになってくる(なった)。したがって、設置を断念するかもしれないという可能性を念頭に置いて行動したほうが良い。

買ったもの a.k.a. アフィ置き場

  • 食洗機(パナソニック 食器洗い乾燥機 プチ食洗 NP-TCR4-W ホワイト
    • 49,716円
    • 設置スペースだけで決めた。まだほとんど使ってないので使い勝手や洗浄能力はなんとも言えない。
  • 食洗機用洗剤(キュキュット 食器用洗剤 食洗機用 クエン酸オレンジオイル 本体 680g
    • 541円
    • 普段使っているのと同じブランドのものにしたが、食洗機についてきたサンプルがあり(3回分)、まだ使ってないのでなんとも言えない。
  • 分岐水栓
    • 8,679円
    • パナソニックのサイトとかで検索して必要なものを買う。結構高くておそらくどのメーカーでも1万円前後する。
  • モーターレンチ(スーパー モーターレンチ MF230
    • 1,436円
    • 専用工具があったが、専用工具のほうが高かったのでモーターレンチにした。
  • ショックレスハンマー(SK11 ショックレスハンマー 衝撃吸収 無反動 E-050
    • 2,105円
    • ショックレスハンマー、値段がピンキリだったので日和って中程度の価格のものを買ってしまったが、もっと安いやつで良かった気もする。
  • 水栓を固定する工具
    • 663円
    • カバーナットを取り外そうとすると水栓自体が回ってしまう場合、何らかの方法で水栓を固定する必要がある。メーカーや水栓によっては専用工具が用意されている場合があり、利用できるならそれを利用したほうが良い。我が家の水栓はKVK製で、分岐水栓の取り付けマニュアルにはG26という工具が利用可能と記載があったので購入(実際に購入したのはPG26という同等品)。うちのキッチンはいい感じの場所に突起があり、G26の柄を引っ掛けて水栓を完全に固定することができたが、場合によっては他にもクランプなどの工具が必要になるかもしれない。
  • ウォーターポンププライヤ
    • 1,769円
    • これは不要だった。
  • ゴムシート
    • 486円
    • これも不要だった。
  • パッキンセット
    • 498円
    • もしかすると要るかもと思って買ったが、不要だった。

コスト

前述の通り、利用に必要なもの(本体, 分岐水栓, 洗剤)で 58,936 円、取り付けに必要な工具(モーターレンチ、固定工具、ショックレスハンマー)で4,204円、その他不要だった工具類が2,753円かかった。合計で65,893円の出費となった。工具類は今から再度選ぶならショックレスハンマーを安いものにして3,000円以内にすると思う。

取り付けにかかった時間としては事前の調査が2日程度、分岐水栓取り付けのための格闘が4時間程度、分岐水栓取り付け後の設置は30分程度であった。もし今の経験をもって再度食洗機設置を行うとしたら1時間程度で終わらせられると思われる。

メンデルの法則をめぐる論争について (4) - 連鎖および近年のメンデルに対する評価

関連記事一覧


前回まで3回にわたってメンデルの法則をめぐる論争について取り上げた。この話に関連してよく取り上げられる話題はもう一つある。

それは「メンデルは連鎖を見つけられたのではないか?」というものだ。

メンデルは連鎖を見つけられなかったのか?

メンデルは各形質がそれぞれ独立に分離の法則に従うこと(独立の法則)について比較的強い調子で述べている。

多数の、根本的に異なる形質を併せもっている雑種の子孫は、各対立形質1組に関する展開級数を結合して得られる組合せの級数の項として表される。これは同時に、1組の対立形質の雑種におけるふるまいは、両親のそれ以外の形質の違いと無関係であることを証明する。

(メンデル著, 岩槻邦男・須原準平訳『雑種植物の研究』)

メンデルの時代には当然分かっていなかったことであるが、同一染色体上に乗っている遺伝子はある程度同調して遺伝する。これが連鎖である。連鎖は独立の法則に反する結果をもたらす。つまりメンデルの記述は連鎖している遺伝子間に対しては正しくないのである。

ただし、同一染色体上に乗っていなければ連鎖は発生しない。さらに、同一染色体上に乗っていても位置が離れていれば組み換えという現象によって連鎖の程度が弱くなる。つまり、メンデルが扱った形質の遺伝子が別々の染色体に乗っていたり、同一染色体上でも距離が離れていたりという事情があれば、連鎖に遭遇しなかったということは十分想定できる。

メンデルは連鎖に偶然遭遇しなかったのか、あるいは遭遇したのに無視をしたのか…。

これを判断するポイントは3つある。

  1. メンデルが調べた表現型に対応する遺伝子のうち、同一染色体上に乗っているものはあるか。
  2. 同一染色体上に乗っている遺伝子があるとして、距離は近いか。
  3. 距離の近い遺伝子の組み合せがあるとして、その組み合せでメンデルは実験をしたか。

このような文脈でいう「遺伝子間の距離」としては、物理的な距離よりも「この遺伝子間でどのくらい連鎖が起こりやすいのか」を指標とした距離が望ましい。そのような距離概念として連鎖を打ち消す現象である組み換えの起こりやすさを利用したものがある。ある2つの遺伝子の間で平均すると1回組み換えが発生するとき、その間の距離を1M(モルガン)と定義する。通常、その1/100の単位であるcM(センチモルガン)が使われる。組み換えは偶然に支配される現象なので、100cM離れていたら必ず組み換えが起こるという意味ではない。さしあたっては値が大きければ連鎖を発見することはほとんどできないと考えておけば良い。

連鎖の件について「よく取り上げられる」と述べたとおり、既存の説明がある。これにはそれほどバリエーションは無い。たとえば、日本語のメンデルについてのテキストとして比較的新しい中村(2016)では次のような説明をしている。

  • 第1染色体上でI(種子の色)とA(種皮の色)が連鎖。
  • 第4染色体上でV(さやの形)、Fa(花序)、Le(草丈)が連鎖。
  • IAの距離は204cM
  • FaLeの距離は121cM
  • VLeの距離は12cM

これを見るとVLeの距離が近く、連鎖に遭遇しそうに見える。しかし、遺伝子とメンデルが用いた表現型の対応は必ずしも明確ではない。別の遺伝子が似たような表現型をもたらすという例はある。実際、さやの形は第6染色体上のPという遺伝子に支配されている可能性もあり、メンデルが用いた材料の遺伝子がこちらであったとも考えられる。ゆえに、中村(2016)では「断言はできないが、おそらくこの p であったと考えることは十分可能である」と考察している。

ところで、cMで表現した遺伝子間の距離に基づいて遺伝子をマッピングしたものを連鎖地図と呼ぶ。上記の議論は、Blixtが1972年に発表した連鎖地図を根拠としている。これはBlixt(1975)、Novitski and Blixt(1979)、Rytting(2001)、Franklin et al.(2008)といった多くの文献で根拠として挙げられている。

しかし、前回紹介したWeedenは再度この連鎖の話題を取り上げている。なぜかというと、肝心のBlixt(1972)の連鎖地図が誤っているのである。1984年には分子マーカーを用いた実験ですでに異なる結果が得られており、1998年にはWeedenほか複数の研究者の共同研究により現在コンセンサスの得られている遺伝地図が完成している。したがって、1998年以降の説明においてもなおBlixt(1972)が根拠とされているのは問題である。

新しい連鎖地図によれば、メンデルの取り上げた形質のうち連鎖する可能性のあるのは次の2つの組み合わせである。

  • 第5連鎖群でR(種子の形状)とGp(さやの色)が連鎖。距離は40cMをしばしば超える。
  • 第3連鎖群でV(さやの形)とLe(草丈)が連鎖。距離は5cM程度。

連鎖群というのは連鎖する可能性が認められた遺伝子の集まりを表す表現で、調べた遺伝子やマーカー配列が十分に多ければ染色体と1:1にする。逆に調査した遺伝子数が少ない段階では染色体と1:1に対応しない場合もあるが、さしあたってこれはこのさきの議論に影響しない。RGpについては具体的な調査が行われた事例が長田(2017)に紹介されている。それによれば、イギリスのジョン・イネス研究所の保有株JI15とJI399の交配において組み換え価は36%(=36cM)とされ、F₂における分離比は9.6:2.42:2.4:1であった。メンデルがこの組み合せで試験を行ったかは不明であるが、偶然の産物として見逃していたとしても不思議ではない。

一方、VLeであるが、これについてはもし実験が行われていたのであればほぼ確実に連鎖に遭遇していたと考えられる。なお、メンデルの扱った系統でくびれを司る遺伝子がPで合った可能性をWeedenは否定している。くびれはさやの厚膜組織の強度低下により引き起こされるが、VPではそのパターンが異なる。Pでは厚膜がわずかに多く、はっきりとしたくびれが生じずに判別が不明瞭となる場合がある。しかしメンデルは「種子の間が深くくびれ」という表現をしており、判別が困難になるという記述はしていないことから、Pの可能性は低いとしている。

残る問題はVLeの組み合わせにおいてメンデルが実験を行っていたかである。メンデルはCarl Nägeliにあてた2通目の手紙の中で、「くびれたさやをもつ背の高い系統」と「アーチ型のさやをもつ矮性の系統」の雑種について言及している。実験は行われていたのである。この組み合わせで実験をした場合、連鎖の影響は二重劣性(くびれたさやをもつ矮性の個体)の出現の欠如という形で現れるはずである。メンデルが実験をしたF₂の集団サイズを仮に40〜120(2〜3個の種子を播種したと仮定)とすれば、連鎖が無ければ二重劣性が3〜8個体期待できるところ、連鎖があるので実際には0〜1個体しか出現しない。メンデルは少なくともF₅まで試験をしているはずなので、二重劣性が連続して欠如していることに少し注意を払うべきであった。これに注意を払わなかったのは、メンデルが事前に理論(独立の法則)を構築しており、それを強く信じていたのだということが考えられる。

メンデルには「動機」があったか

前回説明した事項や連鎖の話から分かるように、メンデルは多かれ少なかれ理論から外れるデータを除外・省略した可能性が高い(それが捏造とまで言えるレベルのものであるかどうかはさておき)。メンデルがそのような操作をしたくなるような何らかの動機があったかどうかについて、Weedenは次のように考察している。

これはFisherも指摘していることであるが、メンデルの発表はもともと口頭発表されたものであり、デモンストレーションとしての意味合いが強かった。したがって、理論をあいまいにするような結果はなるべく除外したかったであろうと考えられる。

そのうえ、当時の生物学会はメンデルの説を受け入れるための十分な準備ができていない状態にあった。たとえば、ウィーン大学の教員認定試験でEduard Fenzlによる口頭試問の際に議論となり、冷静を失ってしまったという話が伝わっている。Fenzlは「植物の遺伝形質は花粉に依存する」と信じていたと孫のErich Tschermak(「再発見」のTschermakと同一人物)が語っており、これが影響していた可能性が考えられている(長田、2017)。メンデルと手紙を交わしていたCarl Nägeliもメンデルの実験の価値をよく理解しなかった一人とされることが多い。メンデルは自分の理論がよく理解されない場面に何度も遭遇していたのである。

だとすれば、理論の説明はよりシンプルであるべきと考え、あいまいな表現型を無理やり分類したり、分離比の偏りを省略したり、連鎖に注意を払わなかったりといったことをする動機があったとしても不思議ではない。また、メンデルの論文を見ると分かることだが、実験の結果はかなり要約されたデータとして提示されている。例えば「22品種を選んだ」とは書いてあるが、具体的にどのような形質をもつどの品種をどのように交配したかは記述されていない。メンデルの記述スタイルにはそもそも省略が多いのである。

とはいえ、エンドウ形質の遺伝についてのモデルを組み立て、他に類を見ない粘り強さでこれを検証したのはメンデルの才能にほかならない。しかし、メンデルを遺伝学の祖とみなせるかどうかは、まだ議論の余地がある。我々はみなそれぞれは「公平な観察者」にはなりえず、科学が自己修正をできるのはコミュニティとしてのみである。「まだ論争を終わらせるときではない」。

としてWeedenは締めくくっている。

そもそもメンデルの論文は遺伝の法則を調べたものであったか?

私はこの話を調べ始めるまでこの説は全く知らなかったのだが、1979年ごろからの流れとして、メンデルについての「通説」、すなわち「メンデルは『雑種植物の研究』により遺伝の法則を明らかにしたが、長い間無視された」という説を否定する発表が相次いでいるらしい。これについて日本語での解説はあまり多くないが、比較的近年の総説として松永(2016)がある。

www.jstage.jst.go.jp

この話題については正直あまり調べられていないので、記事の概要を紹介するにとどめたい。

  • メンデルはそもそも自身の研究を18世紀以来続いてきた植物雑種の研究の系譜と位置づけていた。
    • ここでの主題は「雑種による新種形成の有無」にある。
  • メンデルは親の形質が変わることなく子に伝わることを特に強調したが、これはダーウィンの「種の起源」で交雑が変異を誘発すると記述していることへの反論である。
  • メンデルは論文の後半で環境要因が変異を引き起こすことを強く否定しているが、これもダーウィンが「種の起源」で環境要因も変異の原因になりうると主張していることへの反論とみなせる。
  • すなわち、メンデルは雑種による新種形成を主張し、ダーウィン的な進化論を否定したかった。
  • メンデルは粒子的な遺伝的要素を仮定などしていない。ホモ接合体をAAやaaではなくA、aと一文字で表しているのは省略ではなく、メンデルがあくまで形質に注目していたことを反映している。
  • メンデルの論文は遺伝の論文ではないのだから、1900年まで無視されたいわゆる「ロング・ネグレクト」問題はそもそも問題として成立していない。1900年以前には、伝統的な雑種研究の論文としてそれなりの扱いを受けていた。
  • 1900年に注目されたのは、ド・フリースに先を越されたコレンスが先主権を打ち消すためことさらにメンデルを讃えた影響である。同じころ、ベイトソンも自説の根拠としてエンドウ論文を利用した。

おわりに

この話を調べようと思ったのは、次にまとめられている「メンデルが捏造は否定されているらしい」という話が発端であった。

自分も「メンデルのデータは何かできすぎているらしい」という浅い認識でいたので、これは良くなかったと反省したことを覚えている。しかし、上記まとめを読んでも、まとめで紹介されている文献を流し読みしても、具体的に何が問題で何が否定されているのかイマイチ釈然としない。誰も具体的な説明をしていなくてモヤモヤする…。

ということでずっとモヤモヤしていたのだが、数ヶ月前に思い立ってモヤモヤを晴らすべく腰を据えて調べることにした。結果としてはご覧の通りモヤモヤは悪化の一途である。「メンデルが捏造は否定されている」なんてとても言い切れないし、フィッシャーの指摘は割と的を射ていたし、「論争の終わり」なんて名前のついた本はちっとも論争を終わらせられていない。それに加えてそもそもメンデルは遺伝の研究のつもりで論文書いてないみたいな話も出てきた。

この記事は一旦ここで区切りとするが、幸いにも論争はまだ終わっていない様子である。もう少しこの話題を追いかけていきたい。

参考文献

メンデルの法則をめぐる論争について (3) - 「データができすぎている」は解決できない

関連記事一覧


前々回前回とメンデルの法則をめぐる法則を紹介し、前回はフィッシャーの2つの指摘のうち1つについて否定が可能という説明をした。今回はフィッシャーの指摘のもうひとつの要点である「データが理論値に一致しすぎている」について説明する。今回が本題である。

そもそも、Weldonに始まるメンデルのデータに対する疑問はこの「データが理論値に一致しすぎている」が発端である。前回取り上げた「1:1.7」問題はフィッシャーの疑念をより強めたポイントではあったが、それ単体で見れば「運が良かった」でも済ませられる程度のものであった。

フィッシャーの指摘

この問題における指摘の要点はこうだ。

「メンデルと同様の実験を行ったとき、メンデルと同等またはメンデルよりよい理論値への一致が得られるのは10万回に7回程度しかない」

具体的な計算はχ²値を用いて行われた。「雑種植物の研究」にメンデルは多くのデータを記載しているが、フィッシャーはそれらすべてについて(メンデルがデータ変動のために部分的に示した個体毎のデータも含めて)、χ²値を計算し上側確率を求めた。Fisher(1936)に記載されている表の内容を次に示す。

f:id:Rion778:20200308213134p:plain

結論としては、84の自由度に対してχ² = 41.6056、対応する上側確率は0.99993というものであった*1。すなわち、分離比が理論どおりになるとすれば、実験を繰り返したときにメンデルの結果より理論値から外れた結果が得られる確率は0.99993ということである。これを逆に見れば、メンデルと同等以上の理論値に一致したデータは0.00007の確率でしか得られないということである。

そもそもχ²値をこのような使い方をしてよいのかという議論もあるのだが、ともあれ、この結果からフィッシャーは「メンデルのデータは期待値に一致しすぎている」という指摘をしている。

フィッシャーの指摘に対する説明たち

「データが一致しすぎている」に対しては、前回のように歯切れのよい説明は難しい。しかし、これまでにいくつかの説明が考えられている。主要なものは次の4つである。

  1. エンドウは分離比に影響する何らかの特性を持っている。これにより、分離比が自然に期待値に近接しやすい
  2. 期待比率から大きく外れるデータが除外されている
  3. あいまいな表現型を示す可能性がある形質の分類において、あいまいな表現型が都合よく分類されてしまった
  4. 助手によるデータ操作があった

これらの仮説は過去に何度も言及、検証されてはいるのだが、近年まで欠けていた視点としてエンドウの実際の遺伝的特性を踏まえた議論というものがある。これについて、エンドウの遺伝学者という立場からの視点を含めた検証を行った結果をまとめたのがWeedenの2016年の論文、"Are Mendel's Data Reliable? The Perspective of a Pea Geneticist"である。

academic.oup.com

今回はWeedenの論文を中心として、4つの説明それぞれについて解説していく。

1. エンドウは分離比を期待比率に近付ける何らかの特性をもつか?

エンドウの分離比は自然現象の結果であり、単純な統計モデルでは表現できない振る舞いを示す可能性を考慮しておく必要はあるだろう。もしかすると、二項分布が予想するより分散を減らす何らかのしくみがあるのかもしれない…。

この仮説は論争の比較的初期から存在していた。この仮説を説明するモデルとして代表的なものがテトラ花粉モデル(Tetrad-Pollen Model)と呼ばれているものである。このモデルは次のようなものだ。

  1. 花粉母細胞から花粉四分子が生ずるが、親植物がヘテロ接合型であれば、花粉四分子に含まれる半数体細胞は優性形質を含むものと劣性形質を含むものがそれぞれ2つずつとなっている。
  2. 花粉粒が成熟しても、花粉四分子の立体的配置が維持される。つまり、優性遺伝子を含む花粉と劣性遺伝子を含む花粉とが、3次元的に均等配置される。
  3. 均等配置が維持されたまま、花粉粒のサンプリングが起こる。その結果として、ランダムサンプリングが期待するのよりも分散が減少し、優性遺伝子と劣性遺伝子は1:1に近い比率でサンプリングされて柱頭に付着する。
  4. このサンプリング結果がさやの中の子世代の遺伝形質の分離にまで影響する。その結果として形質の分離比も期待値に近接する。

テトラ花粉モデルは40年以上にわたり、メンデルのデータの説明に用いられてきた。にもかかわらず、近年までテトラ花粉モデルはあくまで説にすぎず、具体的検証が行われていなかった。実験的検証の結果が報告されたのは2007年のことである。FairbanksとSchaaljeによるその論文は "The Tetrad-Pollen Model Fails to Explain the Bias in Mendel's Pea (Pisum sativum) Experiments" というタイトルである。

doi.org

すでに出落ち感があるが、タイトルが示すようにテトラ花粉モデルはメンデルのデータのバイアス(ここでいうバイアスは理論値への近接を示していることに注意してほしい)を説明できなかった。実験では誤分類の可能性が低い形質として花の色を選び、973の自由度のもとで1003.58というχ²を得ており、対応するP値は0.2415であった。すべてのデータを合算して自由度1でP値を計算した場合はややP値が高くなるのだが、χ² = 0.0164に対しP = 0.8981であり、メンデルのデータに比べれば偶然の範疇と判断できる水準である*2

すでに否定されている内容ではあるものの、Weedenはあらためてこの問題を遺伝学の知見を加えて検証した。Weedeが採用したアプローチは「過去の研究結果と比較する」というものである。このアプローチ自体は過去にも存在したが、Weedenは「分離比自体を調査対象とした研究を対象としない」という選択をした。これはどういうことかというと、分離比自体が調査対象である場合、実験者は(メンデルと同じように)期待比率を知っているため、メンデルと同様のバイアスが混入する危険性を避けられないためである。

「分離比自体が調査対象ではないが、分離比データが入っている」という都合のよい研究は何かというと、連鎖である。連鎖の研究では関心の対象は組み換え価にある。したがって、分離比が3:1であるかどうかはさほど重要ではなく、メンデルと同様のバイアスが入っている可能性は低いと考えられる。

Weedenは連鎖の研究データを数多く収集したが、一部は今回の調査対象から除外した。なぜなら、現代ではエンドウは一部の系統掛け合わせにおいて分離比が極端に偏るということが知られているためである。メンデルも実験手順の解説の記述から稔性による系統のスクリーニングをしていたことが伺えるため、このデータ選別自体大きな問題があるとは考えられない。また、メンデルにとっては有利に働くはずである。なお、データセットは元論文に補足資料として添付されているため、内容の確認は可能である。

データ分析の手法は先人のものと同様である。すなわち、各データセットについてχ²値と対応する上側確率を計算し、その分布を比較したのである。結果を次に示す。

f:id:Rion778:20200227075255p:plain

なお、論文中では過去の同様の調査結果であるJohannsen(1926)が収集したデータセットもプロットされているが、数が少ないため除外してある。

結果からは次のことが読み取れる。

  1. 連鎖研究に由来するデータセットのP値は比較的一様に分布している。ただし、P < 0.05のデータセットはやや多い。
  2. メンデルのデータにはP > 0.35のものしかない。

すなわち、エンドウの分離比は自然と期待比率に一致する性質を持っていないし、むしろ、極端なデータを除外してもなおやや歪んだ比率を示す傾向を有する可能性があるということである。また、メンデルのデータはその性質を反映しておらず、極端なデータを除外した可能性が疑われる。

2. 期待比率から大きく外れるデータが除外されたか?

さきほどの調査結果からもすでにメンデルがデータの選別を行った可能性が示唆されるが、Weedenは加えて花序という形質に注目した。

花序は花が脇芽につく(腋生)か、頂芽につく(頂生)かという形質で、腋生が優性である。現代においては、エンドウの系統の組み合わせによっては花序の劣性形質の浸透度が100%とならないことがあること、またケースの多いことが知られている。浸透度というのは、表現型に対応する遺伝子を有している際に、実際にその表現型が現れる割合のことである。つまり、「劣性形質の浸透度が100%ではない」ということは、劣性ホモ接合型の個体が優性形質を示すケースがあるということだ。

もしこの現象がメンデルのデータに反映されていれば、優性形質の過剰という形で影響が現れるはずである。実際にはメンデルは花序について651:207 = 3.15:1という分離比を報告しており、大きな偏りが確認できない。すなわち、メンデルがデータ操作をしていなかったにしても、少なくとも浸透度が高い組み合わせを意図的に選別していた可能性が考えられる。

3. あいまいな表現型が都合よく分類されたか?

1対の対立形質は必ずしも常に明確に区別できる表現型として現れるわけではなく、ときにあいまいな表現型が生じてしまうケースがある。これはメンデルも認識しており、論文中でも言及している。しかし、メンデルは形質の区別について問題がなかったということを比較的はっきりと強調している。

まず、メンデルは実験に採用した形質はあいまいさの無いものだけであると記述している。

ここに挙げた形質の一部は確実、明確な識別ができず、識別はしばしば定義し難い「多少とも」という表現によるものであった。そのような形質は個々の実験には採用できないので、植物に明確、決定的に発現する形質のみに限った。

(メンデル著, 岩槻邦男・須原準平訳『雑種植物の研究』)

それでもなお場合によってはあいまいな例が生じることを認識しており、それにも言及している。しかし、そのような例は「選別の訓練をすれば」間違えることはないと述べている。

発育の途中で昆虫によって傷つけられた種子は、よく色と形が変わるが、ちょっと選別の訓練をすれば、誤りを避けることができる。

(メンデル著, 岩槻邦男・須原準平訳『雑種植物の研究』)

そして、メンデルの実験データには「判別不能」というカテゴリは存在せず、すべてのデータは必ず対立形質のいずれかに分類されている。

しかし、Weedenは表現型の分類がそれほど容易ではなく、メンデルが「明確に区別できる」として選定した形質の中にも判別が難しいものはあるとの指摘をしている。そうであれば、そこにはあいまいな形質を都合よく解釈してしまう(意図的かそうでないかにかかわらず)バイアスの入り込む余地がある。

Weedenはまずメンデルが扱った形質を「明確に判別できるもの」と「判別があいまいとなりうるもの」に分類した。

明確に判別できる形質は次の3つである。

  1. 草丈
  2. 種皮の色
  3. さやの色

これらの形質は違いが明瞭であり、またそれ単体で変化するわけではない。草丈は違いが明瞭であるのに加えて、背の高い形質では巻きひげが目立つ。種皮の色はアントシアニン合成経路の障害に関連しているため、透明な種皮は花色やアントシアニンの斑点と連動する。さやの色が黄色い個体は、さや以外の部分も黄色くなる。そしてこれらの特性についてはメンデルも言及している。

一方、判別があいまいとなりうる形質は次の4つである。

  1. 花序
  2. 種子の形状
  3. 子葉の色
  4. さやの形状

花序は先に説明したとおり浸透度の問題であり、中間型の形質があるわけではない。残り3つは中間型の形質を生ずる可能性がある。種子の形状(丸/しわ)は、丸い形質であっても発育不良でしわやへこみを生ずる場合がある。これについては種子内部のデンプン粒の形状観察がより正確な分類手法であるが、メンデルの時代には不明であった。子葉の色は発育不良で消えることがある。これはメンデルも認めている。また、当時は不明であった要因として、種皮の緑色要素に作用して色をあいまいにする遺伝子が存在する。さやの形状については後にReasmusson(1927)により草丈の遺伝子との間で組み換え価が調べられているが、その見積もりは5〜15cMと幅のあるものであった。これは表現型の分類の難しさに起因するとWeedenは推測している。なお、さやの形状と草丈の連鎖について気になると思うが、これは別の機会に再び取り上げる。

では、仮にあいまいな表現型が都合よく分類されたと仮定してみよう。そうであるなら、あいまいな表現型を生ずる形質は、明確に判別できる形質よりもより良く理論値に一致してしまっていると想定される。そこで、Weedenは次のようなアプローチをとった。

  1. メンデルのデータセットと連鎖研究由来のデータセットそれぞれについて、P値が0.5以上のものと0.5以下のものをカウントした。P値が0.5に等しいデータセットはそれぞれの階級に0.5個としてカウントした。
  2. もしデータにバイアスがなければP値は均一に分布すると期待できるので、P値0.5以上のデータセット数と0.5以下のデータセット数の期待比率を1:1としてχ²検定を行った。

結果を次に示す。

f:id:Rion778:20200227221437p:plain

メンデルのデータセットのうちあいまいな表現型を生ずる形質のみが有意な偏差を示した。したがって、あいまいな形質に対して理論が予測する結果を(意図的にせよそうでないにせよ)反映した分類をしてしまった可能性が否定できない。

4. 助手がデータ操作をしたか?

この説も何度か取り上げられている。Novitski(1995)は、メンデルのデータは初期と後期でそれほど差がなく、実験開始前には期待結果を知らなかったはずであるからという理由でこの説に反対している。一方、フィッシャーはメンデルが先に理論を構築してから実験に取り組んだと考え、実験開始時点で助手に期待結果は伝えられていたと想定した。

メンデルは、茎の高さ、さやの色、さやの形状、花序という植物体を栽培しなければ調査できない形質を自分で調査し、種子で判別可能な形質については助手に任せたということが考えられている。もしそうであり、そのうえで助手が都合のよいデータ操作をしたのであれば、種子で判別可能な形質にバイアスが集中していると想定される。そこで、Weedenはさきほど「あいまいな表現型」仮説の際に用いた手法を、形質が種子で判別できるかどうかというグルーピングに対して適用した。結果を示す。

f:id:Rion778:20200227222936p:plain

メンデルのデータセットのうち種子で判別されたものだけが有意な偏差を示している。したがって、この説も否定できないという結果となった。

「あいまいな表現型が都合よく分類された」「助手がデータを操作した」のいずれも否定できなかったが、これら2つの仮説についてどちらがよりありそうなのか比較は可能だろうか?

これについては種皮の色が鍵となる可能性があった。種皮の色は中間的な形質を生ずる可能性が低く、なおかつ種子の状態でも判別可能な形質である。もしこの形質に由来するデータがバイアスをもつなら「データ加工」仮説が有利であり、バイアスをもたないなら「あいまいな表現型」仮説が有利ということになる。しかし、種皮は花色でも判別できるため、メンデルが種皮形質を種子の状態で調査したデータは限られている。したがって、データセット数が十分ではなく、Weedenの検証内ではそこまでの判断はできなかった。

まとめ

「データが理論値に一致しすぎている」問題には主要な4つの説明があった。それぞれに対する結論を再度まとめよう。

  1. エンドウは分離比を期待比率に近付ける何らかの特性をもつか?
    • この可能性は否定された。むしろ、エンドウの分離比は理論値よりも偏る傾向を示すことが多い。
  2. 期待比率から大きく外れるデータが除外されたか?
    • これは可能性が高い。エンドウは形質の種類や系統の掛け合わせパターンによっては分離比が歪みやすい性質を示すが、メンデルのデータにはそのような例が欠如している。
  3. あいまいな表現型が都合よく分類されたか?
    • あいまいな表現型は理論値に強く近接しており、可能性は否定できなかった。
  4. 助手がデータ操作をしたか?
    • 助手が調査した可能性の高い種子形質のデータは理論値に近接しており、この可能性も否定できなかった。

結果としては、データ操作なしにメンデルの実験結果を再現する可能性のある仮説のみが否定され、それ以外の仮説は生き残った。これは「メンデルが捏造をした」にそのままつながるものではないが、少なくとも「論争は終わった」とは言えない状況だろう。

長くなったため、次の2点を次回に回す。

  • メンデルはなぜ連鎖を発見できなかったのか。
  • メンデルには極端なデータを省略して提示せざるを得ない動機、状況があったか。

参考文献

*1:この表はしばしば引用されており、たとえばC.R.ラオの「統計学とは何か」にも記載がある。これをもって同書籍内でメンデルが「悪者」にされているとの指摘を見たことがあるが、該当箇所を確認した限りではラオはフィッシャーの指摘を紹介しているのみであり、特に「悪者」扱いしているわけではない。むしろ、書籍内においてラオは「彼は今から120年前に,科学の歴史において初めて, "非決定論的規範" を導入したのである.」と高い評価をしており、扱いは肯定的である。ラオがメンデルを「悪者」扱いしているという指摘はラオに対して不当であろう。一方、ウィリアム・ブロードらによる「背信の科学者たち」のようにメンデルについて悪い印象を与えるような記述がされている書籍が存在するのもまた事実である。

*2:メンデルの法則の日本語版Wikipediaでは本稿執筆時点でこの論文を参照して「実験再現は、メンデルのデータに本当のバイアスがないことを実証している」との記述をしている。これは英語版のメンデルのページ(メンデルの法則のページではない)のテキストを直訳したものと思われるが、いささか誤解をまねく表現である。Fairbanks and Schaalje (2007)の結果にもとづくなら「再現実験の結果、メンデルのデータ中には本来のデータにあるべきバイアスが確認できなかった」とでもすべきだろう。ただ、そもそもこの論文はテトラ花粉モデルの検証が目的であり「メンデルの実験データにはバイアスが生じるべきであったかどうか」についてはそもそも言及しておらず、いずれにせよWikipediaの参照は適切とは言えない。

メンデルの法則をめぐる論争について (2) - 「1:1.7問題」は解決できる

関連記事一覧


前回、メンデルの法則をめぐる論争の背景について説明し、フィッシャーの2つの指摘を紹介した。

今回はフィッシャーの指摘のうちの1つ、「F₂世代で優性型を示した個体の雑種型と不変型の分離比は2:1ではなく1.7:1として観測されるべきだがデータは2:1に近接している」という点について説明する。

メンデルの主張

フィッシャーの指摘内容を正確に理解するために、まずはメンデルの記述内容を再度確認する。

この問題の舞台となるのは、メンデルの論文中で「雑種の第二代目」と名付けられた節が扱う部分である。メンデルはこの節の頭に結論を書いているので、次に引用する。

第一代目に劣性の形質を有する型は、第二代目でも、その形質がもはや変わらず、その子孫まで不変である。

第一代目に優性の形質を有する型は、これと異なったふるまいをする。このうち、3分の2の部分は3:1の比で優性形質と劣性形質を示す子孫をつくり、雑種型とまったく同じふるまいを示す。3分の1の部分のみが優性形質で不変である。

(メンデル著, 岩槻邦男・須原準平訳『雑種植物の研究』)

ここで「第一代目」と言っているのは、雑種の子孫の第一代目という意味であり、現代風にいえばF₂世代のことを示す。F₂世代は優性形質と劣性形質が3:1の比率で分離する(分離の法則)。そのF₂世代についてそれぞれ自殖させてF₃世代を育成したとき、F₃世代の形質の現れ方のパターンでF₂世代が分類でき、その比率が一定の割合になるというのがメンデルの主張である。

  1. F₂世代で劣性形質を示したもの...子孫のすべてが劣性形質を示す
  2. F₂世代で優性形質を示したもの
    • 2/3の個体は優性形質と劣性形質が3:1の比率で混ざった子孫を生ずる
      • メンデルはこれを雑種、雑種型などと呼んでいるが、現代的にいえばヘテロ接合型である。
    • 1/3の個体はすべての子孫が優性形質を示す
      • メンデルはこれを不変の優性、不変型などと呼んだ。現代でいうホモ接合型である。

f:id:Rion778:20200308174326p:plain

フィッシャーの指摘にも出てくる「2:1」という比率は、F₂世代で優性形質を示した個体の分類比率である。

フィッシャーの指摘

問題はメンデルの確認方法にある。ヘテロ接合型の子孫は優性形質と劣性形質を3:1の比率で示すのだから、子孫をn個体調査したとき、優性形質を示す個体の数は試行数n、確率θ = 0.75の二項分布に従うと考えられる。偶然にすべての個体が優性形質を示す確率は、[tex:0.75n]である。これはヘテロ接合型が偶然にホモ接合型と誤分類されてしまう確率である。すなわち、この確率のぶんだけ、ホモ接合型と判断される個体が理論値より過剰になるはずである。

メンデルが第一実験、第二実験と呼んでいる種子の形質(丸/しわ、黄/緑)を調べた実験では、(明示的には書かれていないものの)各個体から生じたすべての種子が調査されたと考えられる。1個体あたりの種子数は30程度と期待できるため、0.75^{30} \sim 0.0002であり、誤分類率は2:1を狂わせるほどには大きくない。

問題は第三実験から第七実験である。この実験では種皮の色(=花の色)などの形質を扱っている。これらは植物個体を育成して調査する必要があるため、おそらく敷地面積や労力の都合から調査数が限定されている。調査方法についてのメンデルの記述を次に示す。

以下の実験のすべての場合に、第一代目に優性形質を示した100株の植物を選び、その優性の意味を調べるためにそれぞれの植物からの10粒の種子を播いて育てた。

(メンデル著, 岩槻邦男・須原準平訳『雑種植物の研究』)

メンデルは方法を示してはいるが、データについて細かくは提示していない。メンデルの記述を字義どおりに受け取れば、10粒を播種したのであるから、発芽不良などを考慮すると調査できた個体数は10個体より少ない可能性もある。しかし、いったんすべての種子が正常に発芽し、形質確認が可能になるまで生育したと仮定しよう。このとき、ヘテロ接合型の子孫が偶然にすべて優性形質を示してしまう確率は0.75^{10} \sim 0.0563、すなわち約5.63%である。

つまり、優性形質を示したF₂世代の個体のうち、

  • ホモ接合型と判断されるもの = 1 + 2 \times 0.0563 \sim 1.1126
  • ヘテロ接合型と判断されるもの =  2 \times (1 - 0.0563) \sim 1.8874

である。 1.1126:1.8874 \sim 1:1.7であり、フィッシャーの指摘にある1:1.7というのはここにでてくる。すなわち、第三実験から第七実験の結果は、1:1.7に近くなければならない。実際のデータはどうなっているか確認してみよう。

実験 ホモ接合型 ヘテロ接合型 合計 ヘテロ接合型/ホモ接合型
第三実験 36 64 100 1.777778
第四実験 29 71 100 2.448276
第五実験 40 60 100 1.500000
第六実験 33 67 100 2.030303
七実 28 72 100 2.571429
第五実験2回目 35 65 100 1.857143
合計 201 399 600 1.985075

第五実験に2回目があるのは、第五実験の結果が理論値からやや大きくずれたために実験が繰り返されたという事情による。

見て分かるように、合計結果は1:2にかなり近接している。しかも、6回の実験のうち5回でヘテロ接合型の比率が1.7より大きくなっており、1:2に対するバイアスがあるように見える。これはどうなのか、というのが指摘の要点となる。

なお、この部分だけでいえば期待比率1:2に対するχ²値は4.575、P=0.60程度であり、「データが良すぎる」というほどではない。期待比率1:1.7としてもχ²値は7.658、P = 0.264であり、逸脱が大きいわけでもない。この点に関してだけ注目すればフィッシャーの指摘はそもそもあまり筋が良くはないのである。ただし、実際にはフィッシャーの指摘はこれだけではないという点には注意しておくべきである。フィッシャーの指摘の要点は「データが全体として理論値に一致しすぎている」という点にあったが、ゆえにこの1:1.7からのバイアスを重要な証拠とみなしたのである。

指摘に対する反論1

フィッシャーの指摘を否定する仮説はいくつか提案されている。中でもSeidenfeld(1998)の説は「仮にメンデルが記述どおりの調査を行っていたとしても矛盾なく結果を説明できる」という点で優れているのでこれを紹介する。

Seidenfeldの説の要点は「メンデルはF₃の観察のみに基づいてF₂を分類したわけではない」というものである。

メンデルは「雑種の第二代目」に引き続いて「その後の雑種世代」と題した節を設けている。そこでは、第三世代(すなわちF₄)以降についての実験結果が示されている。形質によるが、4代〜6代まで実験を継続して行ったとの記述がある。ここでは、自殖を繰り返すにつれて相対的に雑種型の比率が少なくなる、というようなことが述べられているのみで、具体的なデータはほとんど示されていない。

しかし、ここで重要なのはメンデルがF₃世代以降も実験を続けたということである。この場合の自然な考え方は、「雑種の第二代目」の実験でF₂世代の分類に用いたF₃世代がそのまま育成して種子が採取され、F₄の親として使われたということである。

「その後の雑種世代」にはわずかに「三代目からはより少数の植物で実験を行った」との記述があるだけで、具体的な実験方法についての記述がなく詳しくは想像になるが、仮にF₃の各個体から1粒ずつの種子が採取されて育成されたとしよう。このとき、F₃の親はヘテロ接合型であったが、たまたまF₃の10株すべてが優性形質を示した例を考える。F₄まで考慮した場合の実際の誤分類率は次のように計算される。

  1. ヘテロ接合型に由来するF₃10個体が偶然にすべて優性形質を示す = 5.63%
  2. 10株のうち、平均的に2/3はヘテロ接合型であるから、F₃の種子1粒づつを栽培し、F₄がすべて偶然に優性形質を示す確率は、0.75^{10 \times 2/3} \sim 0.147
  3. 1と2が同時に起こる確率は1%未満となる。

この場合でも誤分類は発生するのだが、上記のように比率1:2に対する影響は軽微となる。いまはF₃あたり1株と仮定したが、仮に2株であったら誤分類は1000株に1株程度の割合となる。そして、メンデルが実験に用いた庭の広さから考えても、このような実験は可能であったと判断されている。

指摘に対する反論2

他の反論として、「メンデルは10株以上を調査したのではないか」というものがある。仮にメンデルが10株ではなく15株を調査してのであれば、それだけで誤分類の確率は1%程度となる。この説も何度か言及されている。

この問題を考える上で重要なのは「それぞれの植物からの10粒の種子を播いて育てた」というメンデルの記述を字義どおりにとらえられるか、という点である。

フィッシャーは科学論文というものは記述について正確に解釈しなければならないという観点からこの説を否定した。しかし、実際にはメンデルの記述は正確とはいえず、正確さよりもわかりやすさを重視したと思われる部分がかなり多い。したがって、「10粒の種子を播いて育てた」とはいうものの、実際には発芽不良などを見越して10株よりもやや多い個体を調査していた可能性は十分に考えられる。

まとめ

  • フィッシャーはデータの誤分類率から「1:1.7になるべき」という指摘をした。
  • 実際にはメンデルの実験デザインまたは単なる記述の不正確から、「1:1.7」という比率が期待比率ではない可能性は十分に考えられる。
  • したがって、この部分についてフィッシャーの指摘はさほど筋が良くなく、「メンデルのデータが曲げられている」と主張するには弱い。

今回はフィッシャーの指摘が部分的に正しくない可能性について説明した。しかし、繰り返しになるがフィッシャーの指摘はこれだけではない。そして、フィッシャーのもうひとつの指摘は、この「1:1.7問題」がなかったとしても(というよりないと仮定したうえで)成立するものである。したがって、この問題だけを否定しても「メンデルが捏造」の否定にはならないのである。次回はもうひとつの問題である「データが理論値に一致しすぎている」について説明する。

参考文献

メンデルの法則をめぐる論争について (1) - フィッシャーによる2つの指摘

関連記事一覧


「メンデルのデータには捏造があるのではないか」という説は統計学の読み物や教科書にしばしば登場する。多くの場合、これはR. A. フィッシャーによる指摘として紹介される。例として『背信の科学者たち』の一節を次に引用する。

しかしながら、メンデルのデータが極めて正確であったため、一九三六年、高名な統計学者であるロナルド・A・フィッシャーは、メンデルの方法を綿密に検討することにした。その結果はあまりにもうまくできすぎていた。フィッシャーは、精力的な実験の陰に何かがあったにちがいないと結論し、「すべてではないにしても、ほとんどの実験データがメンデルの期待に非常によく一致するように曲げられている」と書いている。

(ウイリアム・ブロード, ニコラス・ウェイド著, 牧野賢治訳 『背信の科学者たち 論文捏造はなぜ繰り返されるのか?』)

日本語のテキストにおける取り上げられ方は似たようなもので、メンデルにとって不利な記述であるものが目立つ。そのような状況のなか、「『メンデルが捏造』はすでに否定されているようだ」ということが数年前に少し話題となった。

ただ、結局のところ論争は終わっているのか、結論はどうなっているのかという点が当時はよく納得できなかった。結局そのときはきちんと調べなかった。この件について日本語で解説された資料があまりに少なく、かといってゆっくり英語文献を調べる気にもならなかったというのもあった。

最近また少しこの話が気になってきたので、いくつかの文献をある程度真面目に読んだ。そこで、ここまで理解したことをまとめた。長くなったので、何回かに分割して説明する。

メンデルの実験とフィッシャーの指摘

今回はまず論争の背景を理解するため、メンデルの実験と論争の火種となったフィッシャーの指摘を中心に解説する。

メンデルの実験

メンデルがエンドウの交配実験を始めたのは1856年のことである。ただし、実験材料の選定は1854年から行っていた。実験は8年間続けられ、その結果は1865年のブルノ自然科学研究会の例会にて、2月8日と3月8日の2回にわたり口頭発表された。翌年1866年には研究会の紀要に掲載され、出版された。そのため、1865年/1866年がメンデルの法則発見の年とされることが多い。

まず、メンデルの実験内容と「法則」に関連付けて簡単に説明する。

実験の準備(1854〜)

メンデルは実験に際してまず34のエンドウの品種を種子屋から買い集め、その中から22の品種を選抜して実験に用いた。これはおそらく稔性や形質による選抜と思われるが、理由についてメンデルは明確に記述していない。

これら品種は、さまざまな点で異なった形質を有していたが、そのうちで7つの対立形質が実験のために選定された。

  1. 種子の形の違い: 丸/しわ
  2. 種子(子葉)の色の違い: 黄色/緑色
  3. 種皮の色の違い: 有色/白色(花の色も異なる)
  4. さやの形: くびれなし/くびれあり
  5. 未熟なさやの色: 緑色/黄色
  6. 花の位置(花序): 腋生/頂生
  7. 草丈: 高い/低い

これらの7つの形質のうち、1〜3までは種子の状態で判別できる。ただし、3の種皮の色の違いについては花の色と連動しており、メンデルは実験の種類によって花の色で判別する場合と種皮の色で判別する場合を使い分けている。

1857年の実験(優性の法則)

まずメンデルは対立した形質をもつ系統どうしを交配した雑種を育成した。

この雑種第一代(F₁世代)においては、すべての場合において親の片方の形質のみが現れた。現れた形質を優性形質、現れなかった形質を劣性形質と呼ぶ。

f:id:Rion778:20200226220855p:plain

1858年、1859年の実験(分離の法則)

1858年には前年度に得られたF₁世代の自殖後代(F₂世代)の形質が調査された。その結果、劣性形質を示す個体が1/4の割合で分離してくることが明らかとなった。

f:id:Rion778:20200226221130p:plain

続く1859年には、さらにF₂世代の自殖後代(F₃世代)の形質が調べられた。このとき、F₂世代で劣性形質を示した個体からは必ず劣性形質を示す子孫が生じた(これについてメンデルは結果を述べるのみでデータを示していない)。

F₂世代で優性形質を示した個体については、F₃世代で子孫の形質が3:1に分離するもの(メンデルは「雑種型」と呼んだが、現代で言うヘテロ接合体)と、すべて優性形質を示すもの(メンデルは不変型と呼んだ。ホモ接合体)に分かれた。F₂世代のその比率は2:1であった。

メンデルは、種子の形状(丸/しわ)および子葉の色(緑/黄)についてはF₂世代の各個体すべてから種子を得て、種子の形質から雑種型と不変型の判別をした。残りの形質については、優性形質を示した個体100株を選び、その種子10粒を栽培して雑種型と不変型の判別をした。メンデルは次のように記述している。

以下の実験のすべての場合に、第一代目に優性形質を示した100株の植物を選び、その優性の意味を調べるためにそれぞれの植物からの10粒の種子を播いて育てた。

(メンデル著, 岩槻邦男・須原準平訳『雑種植物の研究』)

ここで、「第一代目」というのは雑種型の自殖後代一代目の意味であり、F₂を指すことに注意してもらいたい。

多数の対立形質の組み合わせ

メンデルは、複数の対立形質について同時に雑種とした場合についても実験を行っている。具体的にデータが示されているのは「種子の形と子葉の色」の2要素を組み合わせた場合と、「種子の形、子葉の色、種皮の色」の3要素を組み合わせた場合の試験である。これらの形質はいずれも種子で判別可能なものであり、「もっとも簡単、確実に目標を達成」できたとメンデルは述べている。

結果として、メンデルはそれぞれの形質が独立に3:1の分離比に従うという結論を出した。すなわち、種子の形と子葉の色であれば、それぞれが3:1で分離するため、形質の4つの組み合わせが9:3:3:1の比率で生ずる、ということを意味する。ここでのメンデルの表現は次のようなものである。

多数の、根本的に異なる形質を併せもっている雑種の子孫は、各対立形質1組に関する展開級数を結合して得られる組合わせ級数の項として表される。これは同時に、1組の対立形質の雑種におけるふるまいは、両親のそれ以外の形質の違いと無関係であることを証明する。

(メンデル著, 岩槻邦男・須原準平訳『雑種植物の研究』)

いわゆる「独立の法則」であるが、これに対する反例として「連鎖」が思い浮かぶ人もいるだろう。実際、メンデルが採用した7つの形質のうちいくつかは連鎖している。しかし、メンデルは連鎖についてその可能性に言及していない。これについてはまた後日取り上げる。

フィッシャーの指摘

フィッシャーによる指摘は"Has Mendel's Work Been Rediscovered?"と題された1936年の論文にある。ただし、メンデルのデータに対する指摘はこれが最初ではなく、またフィッシャー自身による指摘もこれが最初ではない。しかし、詳細な検討を行って疑問を明確に提示したのは1936年の論文であり、後に発生する論争の火種となったのも主にはこの論文が原因である。したがって、この論文におけるフィッシャーの指摘を紹介する。

フィッシャーによる指摘の要点は2つある。

  1. 分離比が2:1ではなく1.7:1になるべき実験があるが、メンデルのデータは2:1に近接している。
  2. データが全体として理論値に一致しすぎている。

この2点はときどき混同して語られる。内容的に類似する部分もあるのだが、性質は異なる。それぞれ別の問題として把握しておくことは重要である。

特に前者については、現実的に無理のないいくつかの仮定をおくことで、ある程度容易に否定する仮説を構築できる。ゆえに、この問題の否定をもって「メンデルに対する疑念は解消された」としてしまう、あるいはそのように読めるような解説となってしまっている例は少なくない。

しかし、前者の問題が解決できても、後者の問題が同時に解決するわけではない。むしろ、後者の問題の方がやっかいである。それぞれ説明する。

「2:1ではなく1.7:1になるべき」

これは、いわゆる「分離の法則」が示された実験のうち、1859年の実験についての指摘である。ここでは、F₂世代で優性形質を示した個体のうち100個体について雑種型であるか不変型であるかが調べられ、それが2:1に分離するという結論が得られたのであった。

このときメンデルは種子で調査しなかった、できなかった形質について、個体ごとに10個の種子を播種して調査したと述べている。これがフィッシャーの指摘につながる。

雑種型の子孫は、1858年の試験から分かるように、3/4の確率で優性形質を示すのである。10個体を調べた場合、そのすべてが偶然に優性形質を示してしまう確率は、3/4^{10} \sim 5.6\%も存在するのである。

すなわち、メンデルの調べ方では雑種型のうち約5.6%が不変型と誤認される。つまり、

  • 雑種型と判断される... 2 × (1 - 0.0563) = 1.8874
  • 不変型と判断される... 1 + 2 × 0.0563 = 1.1126

であり、1.8874:1.1126\sim1.7:1になるべき、ということである。しかしながら、メンデルのデータは1.7:1よりも、理論が予測する期待値である2:1に非常に近い、これはおかしい、というのがフィッシャーの指摘である。

「データが理論値に一致しすぎている」

いったん、「1.7:1問題」はなかったとしよう。それでもなおデータには疑わしい点がある、というのがこちらの指摘である。そもそも、初期の指摘はこちらであった。Weldon(1902)は1858年の実験、すなわちF₂世代の分離比のデータをまとめ、χ²値を用いた分析により「このようなデータが得られる確率は1/16である」という旨のコメントを残している(これはχ²分析の最初期の応用とも考えられている)。Weldonがメンデルのデータを不正と考えていたかどうかは不明である。その後、フィッシャーも1911年の優生学会でWeldonと同様のコメントをしている。

1936年の分析ではフィッシャーは可能な限りデータを整理し、分割できるデータは分割し、論文全体としてより大きな自由度のもとでデータを再度検討している。その結果として、「メンデルのデータよりもよい結果が得られる確率は7/100,000である」という結果を導いている。

以上2つがフィッシャーの指摘の概略である。これらの分析結果にもとづいてフィッシャーは「すべてではないにしても、ほとんどの実験データがメンデルの期待に非常によく一致するよう曲げられている」とコメントを残したのである。フィッシャーは自らの指摘した内容についてメンデルの責任に帰することを好まなかった。結果として、フィッシャーはメンデルの助手がデータ操作を行った可能性を示唆した。

その後の論争

メンデルの法則が発見後しばらくあまり注目されず、1900年になって「再発見」されたことはよく知られている。同様に、フィッシャーの指摘も発表後しばらくはそれほど強い注目を受けることはなかった。しかし、1965年、メンデルの発表から100周年ということで一連の関連する記事が続々と発表されると、その中でフィッシャーの指摘が注目をあつめ、現代まで続く「論争」の火種となったのである。

さて、今回はメンデルによる実験の概要と、フィッシャーによる指摘についてある程度の説明をした。次回はフィッシャーの2つの指摘のうち、まずは「1:1.7問題」について、フィッシャーが指摘したような問題は実は無かった可能性が高い、という点について説明したいと思う。

参考文献

  • イリアム・ブロード, ニコラス・ウェイド著, 牧野賢治訳, (2014). 背信の科学者たち 論文捏造はなぜ繰り返されるのか? (講談社)
  • メンデル著, 岩槻邦男・須原準平訳, (1999). 雑種植物の研究 (岩波文庫)
    • メンデルによる研究成果の発表内容の日本語訳である。この問題を考える上で欠かせない文献であるというのに加え、メンデルの記述は明確で一貫しており、実験に対する姿勢も含め、現代からみても参考になる部分が多い書籍である。フィッシャーがメンデルを尊敬していたであろうこと、自身の分析結果に衝撃を受けたであろうことが容易に想像できる。
  • 長田敏行, (2017). メンデルの軌跡を訪ねる旅 (シリーズ・生命の神秘と不思議) (裳華房)
    • 近年書かれたメンデルについての日本語の伝記として非常に詳しい。メンデルの生涯についてのみならず、実験内容や扱った形質についても詳しい解説があり、遺伝形質についての解説が正確である(後の回で取り上げるが、最近の文献でも不正確なものが存在している)。

統計検定準1級に合格したので合格するまでにやったことを書く

2019年6月16日に実施された統計検定の準1級に合格したので、合格までにやったことを書いておく。

試験の結果

統計検定はただの合格の他に評価S(極めて優秀な成績)と評価A(特に優秀な成績)がある。

今回は合格したものの、評価Aには及んでおらず、自己採点の結果では多肢選択が7割、記述・論述が3割くらいの感覚だったので、良い成績での合格ではない。今のまま再度受験して合格できるかは怪しい。

前提知識

2018年11月25日の統計検定で、2級を受験して評価Aを得ており、2級の範囲についてある程度の自信をもって解ける程度の知識はあった。2級のレベル感は簡単すぎず難しすぎずで手頃なので、統計検定を受けたことがなければまずは2級を目標にすると良いと思う。

2級は試験会場と日程にある程度融通のきくCBT方式(コンピュータを使って受験するもの)に対応しているので、好きなタイミングで受験することもできる。 

2級については過去問を数度周回し、わからない部分を軽く調べる、という程度の勉強だった。多肢選択なので問題に慣れておけばそれだけでもある程度の点数は取れる。

やったこと

期間

2級に合格した時点(2018年末)で受けてみようかと思い過去問を買ってきたりしたがあまり捗らず、紙とペンで真面目に勉強をし始めたのは5月の連休あたりからだった。

勉強方法

例の赤い本を流し読みしたりはしていたが、ある程度腰を据えて勉強を始めたのは5月の連休頃からだった。

まずは「心理統計学ワークブック」を8割くらいやった。わからないところは「心理統計学の基礎」に書いてあるので、分からなかった部分に遭遇したらノートに転記していた。8割でやめたのは特に範囲がどうこうということではなくて、単に飽きたためである。2週間くらいやった。

その後は公式問題集の過去問を解き、

  • 自信をもって解けた → 次の問題へ
  • 解けなかった
    • 解説を読んで理解できた → 次の問題へ
    • 解説を理解できなかった → 理解できるまで調べてノートにまとめ、再度挑戦

ということを試験当日まで繰り返した。

公式問題集の解説は紙面の都合もあるのか非常にあっさりしているので、ある程度内容をわかっていなければ理解することもままならない。逆に言えば、解説を読んで理解できるのであれば、過去問の練習だけで類似の問題は解けるようになると思う。

やらなかった/やれなかったこと

用語の確認

はじめ、出題範囲に記載されている用語を洗い出して分からない部分を潰していこうと考えていた。しかしこれは2日で挫折した。統計検定準1級は範囲がクソ広いので、出題範囲に含まれる用語もクソ多い。したがって用語を書き出すだけでも一苦労で、それを一つ一つ洗っていくなどということはとてもやれなかった。評価A以上を狙うのであれば、ある程度勉強した段階でやる必要があっただろうとは思う。

手法の実践

ありがちな問題として「このデータセットに○○という手法を適用したときの結果はどれか(グラフを選ぶ)」というものがある。これはほぼボーナス問題みたいなもので、その手法をRやPythonでやったことがあればかなりの割合で正解できる。たいてい、そのような問題が出る手法というだけあって、グラフには手法の特徴が明瞭に現れるから判断がしやすいのだ。

しかし、やったことがなければ解けない。理屈を知って結果を想像するのは、結果そのものを見て覚えてしまうのよりもずっと労力がかかる。

今回は主に紙とペンで勉強していたので、手法を実際にやってみるというのは不足していたと思う。今回は問8にFused Lassoの結果のグラフを選べという問題が出たが、正答できなかった。

参考書

アフィ置き場コーナー。

後のものほどあまり真面目に読んでいない。あまり馴染みのない概念を調べる場合、私は複数の情報源の説明を比べないと理解の効率が悪いので、内容的に重複しているようなものでもなるべく手元に置いて勉強するようにしていた。

試験前後の動き

※この先は何の参考にもなりません。

全体スケジュール

会場は北海道だったので、前日に移動して翌日帰るという2泊3日のスケジュールであった。ただの北海道旅行である。

前日

行きの移動はフェリーにした。昼に新潟港を出発して翌朝小樽港に付く航路であった。最初飛行機で行くつもりだったので、差額で良い部屋をとってみたが非常に快適であった。でかい風呂があったりビンゴ大会が開催されていたりエンターテイメント性が高い。

船内では主に真面目に勉強していた。

ちなみに何もしないと下船は4:30だが、そんな時間に降りてもやることがない。これは事前にカウンターで申し出ておくことで6:00まで延長できる。

当日

当日は雨だった。寒かった。薄着で行ってしまったので、完全に軽装で山に登ってしまった人の気持であった。6:00に小樽に居てもやることがないので、さっさと札幌に移動して駅のドトールで朝食をとりながら時間を潰した。

その後は事前に調べておいた札幌市中央図書館へ向かった。ここは自習室があるので自習がしやすい。また、経路上に時計台がある。

図書館で2時間程度勉強してから札幌駅に戻り、適当に昼食を済ませてから会場の北海道大学へ向かった。

北大は構内の手入れがかなり行き届いていて、どう見てもただの観光客みたいな人や犬の散歩してる人が多いのが印象的だった。

試験結果はさんざんでまさか合格はしていまい…、という感覚だったので、試験後は完全に北海道旅行モードであった。

試験後に付近を散策していたらホクレンのビルがあった。異様にでかかったのと入り口で水稲品種の展示をしていたのがホクレン感があってよかった。

ホクレンのビルの前に水稲展示してた

そしてホクレンのビルはウルトラクソデカ㌱であった…

翌日

ニッカウイスキーの工場である余市蒸溜所へ行った。

マッサンは全く見ていないが色々と見るものがあって面白かった。

稼働しているので工場内のいたるところでウイスキーの香りが立ち込めており、歩いているだけで酔いそうになる。

そしてウイスキーの試飲ができる。シングルモルト余市は最&高であった。若干高かった気がしたけど気づいたら買っていた。

これは帰宅してからもう1本買った。

見学と試飲とお買い物済ませたあたりで丁度工場内のレストランが開店したので、うまいものやうまいものを食べたり飲んだりした。

プレミアムハイボール

なんか玉ねぎ揚げたやつ(うまい)

ザンギ(うまい)

アイスにウイスキーついてるやつ!

また行きたい。何なら住みたい。

n日後

(試験駄目だったし来年も北海道だなー仕方ないなー)と思ってたら合格してたのでびっくりした。

🙌

とはいえギリ合格で準1級相当の知識・能力が本当にあるかというと微妙なので、来年も受験しようと思う。やむを得ない。

あと某所で話をした(このときは結果発表前なので完全に落ちてるテンションだった)。

ABC 125反省会

問題自体はそれほど難しくなかったが、問題が正しく読めて無くてCとDでWAを何度か出してしまった。読解力を鍛えたい。

A. Biscuit Generator

「0.5秒」のところで若干不安になったけどとりあえずこれで正解だった。

#include <bits/stdc++.h>
using namespace std;

int main(){
  int a, b, t;
  cin >> a >> b >> t;
  cout << t / a * b << endl; 
}

B. Resale

これは危なげなくクリア。

#include <bits/stdc++.h>
using namespace std;

int main(){
  int n;
  cin >> n;
  vector<int> v(n);
  vector<int> c(n);
  
  for (int i = 0; i < n; i++) {
    cin >> v.at(i);
  }
  for (int i = 0; i < n; i++) {
    cin >> c.at(i);
  }
  int ans = 0;
  for (int i = 0; i < n; i++) {
    if (v.at(i) > c.at(i)) ans += v.at(i) - c.at(i);
  }
  cout << ans << endl;
}

C. GCD on Blackboard

gcd(a, b, c) = gcd(gcd(a, b), c)なので、順番に見ていってOK。

任意の数に変更できるというのは数を除外するのと同じなので「次の数を使わないパターン」がこれまでの最大ケースより大きいかどうかを順次比較しつつ結果を更新していけばよい。

最初手間取ったので、もうちょっとコードを綺麗にできそうな気もする。

#include <bits/stdc++.h>
using namespace std;
using ll = long long;

ll gcd(ll a, ll b) {
  ll tmp = 0;
  while (b != 0) {
    if (b < a) {
      swap(a, b);
    }
    b = b % a;
  }
  return a;
}

int main(){
  ll N;
  cin >> N;
  vector<ll> A(N);
  for (int i = 0; i < N; i++) {
    cin >> A.at(i);
  }

  if (A.size() == 2) {
    cout << max(A.at(0), A.at(1)) << endl;
  } else {
    ll a = A.at(0);
    ll b = A.at(1);
    ll c = A.at(2);
    ll gcd_max = 0;
    ll gcd_all = gcd(a, b);
    if (gcd(a, c) > gcd(b, c)) {
      gcd_max = gcd(a, c);
    } else {
      gcd_max = gcd(b, c);
    }
    for (int i = 2; i < N; i++) {
      ll c = A.at(i);
      gcd_max = gcd(gcd_max, c) > gcd_all ? gcd(gcd_max, c) : gcd_all;
      gcd_all = gcd(gcd_all, c);
    }
    cout << gcd_max << endl;
  }
}

D. Flipping Signs

Cより簡単だった気がする。実際正解者数もCよりかなり多かった様子。

最初、最後の1個だけ見るのかと思ってWAを2回ほど出してしまった。

操作はいくらでもできるので、負数が偶数個なら全部正整数にできるし、奇数個ならどれか1つが負数になる。

したがって、負数をカウントして偶数なら絶対値の和が答えになり、奇数個なら絶対値の和から絶対値が最小の値の2倍を引けば答えになる。

#include <bits/stdc++.h>
using namespace std;
using ll = long long;

int main(){
  ll N;
  cin >> N;
  vector<ll> A(N);
  for (ll i = 0; i < N; i++) {
    cin >> A.at(i);
  }

  ll ans = 0; // 絶対値の合計
  for (ll i = 0; i < N; i++){
    ans += abs(A.at(i));
  }

  int minus_cnt = 0; // 負数の数を数える
  for (ll i = 0; i < N; i++) {
    if (A.at(i) < 0) minus_cnt++;
  }
  
  if (minus_cnt % 2 != 0) { // 負数が奇数個ならどれか一つ-が残るので、絶対値が一番小さいものを負にする
    ll min = abs(A.at(0));
    for (ll i = 1; i < N; i++) {
      if (abs(A.at(i)) < min) min = abs(A.at(i));
    }
    ans -= abs(min) * 2;
  }
  
  cout << ans << endl;
}