正常な結腸直腸上皮における広範な体細胞性L1レトロ転位

ニュース

ホームページホームページ / ニュース / 正常な結腸直腸上皮における広範な体細胞性L1レトロ転位

Mar 08, 2023

正常な結腸直腸上皮における広範な体細胞性L1レトロ転位

Natura Volume 617, pagine

Nature volume 617、pages 540–547 (2023)この記事を引用

14,000 アクセス

161 オルトメトリック

メトリクスの詳細

個人の生涯を通じて、ゲノム変化は体細胞に蓄積されます1、2、3、4、5、6、7、8、9、10、11。 しかし、ヒトゲノムに広く分布する可動性要素である長く散在する核要素-1 (L1) の逆転位によって誘発される突然変異の状況は 12、13、14 、正常細胞ではほとんど理解されていません。 今回我々は、28 人から収集した 3 つの異なる細胞型から確立された 899 個の単細胞クローンの全ゲノム配列を調査しました。 私たちは、結腸直腸上皮に多く存在し、年齢と正の関係を示した 1,708 件の体細胞 L1 逆転位イベントを特定しました。 ソース要素のフィンガープリンティングにより、34 個の逆転位コンピテントな L1 が示されました。 多次元解析により、(1) 体細胞の L1 逆転移は初期胚形成からかなりの割合で起こる、(2) ソース要素のエピジェネティックなオン/オフは初期の器官形成段階で優先的に決定される、(3) 逆転移能のある L1 の集団は少ないことが実証されました。対立遺伝子頻度はより高いレトロトランスポジション活性を持ち、(4) 細胞質内の L1 転写産物のごく一部のみが最終的に体細胞でレトロトランスポーズされます。 一致する癌の分析により、結腸直腸腫瘍形成中に体細胞 L1 逆転位率が実質的に増加することがさらに示唆されました。 要約すると、この研究は、正常細胞におけるL1レトロ転位誘発性の体細胞モザイク現象を示し、ヒトの生涯にわたる転移因子のゲノムおよびエピゲノム制御についての洞察を提供する。

体細胞突然変異は、最初の細胞分裂から個人の生涯を通して正常細胞に自然に蓄積します2、3、4、5。 体細胞モザイク現象に関するこれまでの研究は、主にヌクレオチド変異体に焦点を当ててきました6、7、8、9、10、11。 より複雑な構造イベントは、相対的に不足していることと、特に単一細胞分解能における検出における技術的課題のせいで、あまり研究されていません。

長く散在する核エレメント 1 (L1) レトロトランスポゾンは、ヒトゲノムの約 17% を占める広範な転移因子です 12、13、14。 進化的には、L1 レトロトランスポゾンは、新しいゲノム部位に自分自身を「コピー&ペースト」することにより、生殖細胞系で非常に成功した寄生ユニットです 15。 しかし、ヒト参照ゲノムにある約 500,000 個の L1 のほとんどは、切断されて機能的潜在力を失っているため、それ以上転位することができません。 現在までに、264 個のレトロトランスポジションコンピテント L1 (rc-L1) ソースが癌ゲノム 16、17 または他の実験研究 12、13、18、19、20、21 で発見されています。 時折、L1 レトロ転位がいくつかの疾患の組織の遺伝子分析で発見されており 22,23、これはヒトの疾患の発症における L1 レトロ転位の役割を示唆しており、より体系的な特徴付けが必要です。

体細胞性 L1 逆転位イベント (soL1R) は、がん組織において系統的に研究されています 16、17、24。 食道腺がんや結腸直腸腺がんなどの特定のがんの種類では、soL1R の負荷が高く、がん遺伝子の変化につながることがよくあります 17。 ポリクローナル正常組織では、細胞のごく一部に限定された例を検出することが困難であるため、soL1R はまだ明確に研究されていません。 正常なニューロンにおける soL1R を示すためにこれまでにいくつかの手法が使用されてきましたが、研究全体で一貫性のない soL1R 率が報告されており、ニューロンあたり 0.04 ~ 13.7 soL1R の範囲でした 25、26、27、28、29、30。

正常細胞における soL1R 誘発モザイク現象を体系的に調査するために、我々は単一細胞から拡大したコロニー (以下、クローンと呼びます) の全ゲノム配列を調査しました 2,4。 さらに、我々のアプローチにより、同一クローンからの同時マルチオミクスプロファイリング 31 と、複数のクローンが共有する初期胚発生事象の正確な検出が可能になりました 2,4,5。

我々は、結腸直腸上皮から確立されたクローン(19 人のドナーから 406 クローン)、さまざまな場所から収集された線維芽細胞(7 人のドナーから 341 クローン)4、造血幹細胞および前駆細胞(140 1 人のドナーからのクローン)9 および結腸内の MUTYH 関連腺腫性ポリープ(1 人のドナーの 4 つのポリープから 12 個のクローン)。 さらに、正常な結腸直腸クローンのドナーからの19の一致する結腸直腸癌組織を調査しました(補足表1)。 これらの配列から、一塩基変異体 (SNV)、インデル、構造変異、soL1R などの体細胞的に獲得した変異を評価しました (補足表 1)。 これらの変異により、クローンの大部分が単一の非腫瘍性創始細胞から確立され、培養に関連したアーチファクトが頻繁に発生しないことが確認されました(拡張データ図1a、b)。

a, 研究の実験計画。 HSC、造血幹細胞および前駆細胞。 b、異なる細胞型にわたるさまざまな数のsoL1Rを有するクローンの割合(括弧内にクローン数を示す)。 c、19人の個人にわたる、さまざまな数のsoL1Rを有する正常な結腸直腸クローンの割合(括弧内にクローン数を示す)。 d、正常な結腸直腸クローンを有する19人の個体における、年齢に応じたクローン当たりのsoL1Rの平均数の線形回帰。 各点を横切る垂直線は、各個体のクローンあたりのsoL1R負荷の範囲を示します。 青い線は回帰直線を表し、影付きの領域はその 95% 信頼区間を示します。 2 つの外れ値の個人 (HC15 および HC06) が赤色で強調表示されます。 e、f、体細胞点突然変異によって再構築されたHC14(e)およびHC19(f)の初期クローン系統発生。 枝の長さは体細胞変異の数に比例し、枝の横の数字で示されます。 初期胚の分岐は、血液中の初期胚突然変異 (EEM) の変異対立遺伝子画分 (VAF) によって色分けされます。 検出されたsoL1Rの数を枝の先端の黒丸で示す。 円グラフは、EEM または soL1R を保有する血球の割合を示します。 RT セグメント、レトロトランスポーズド セグメント。 g、さまざまな段階および細胞タイプにおける正規化されたsoL1R速度。

4つの異なるバイオインフォマティクスツールを使用した組み合わせ分析により、887個の正常クローンと12個のMUTYH関連腺腫性クローンの中から、それぞれ1,250個と458個のsoL1Rを同定した(拡張データ図1cおよび補足表1および2)。 注目すべきことに、soL1Rイベントは、レトロ転位の2つの標準的な特徴であるポリAテールと標的部位の重複(TSD;拡張データ図1d、e)により、他のゲノム再構成とは明確に区別されました。 複数の証拠は、クローンのほとんどのsoL1Rが培養誘発性イベントではなく真の体細胞イベントであることを示しました(補足議論1および補足図1)。 さらに、19 個の一致する癌から 572 個の soL1R が見つかり、その 97.2% (n = 556) が組織内のすべての癌細胞に共有されるクローン性イベントでした。 他のレトロトランスポゾンタイプについては、正常クローンで 9 つの体細胞 Alu 挿入がさらに検出されました (補足表 2)。

887 個の健康なクローン中の 1,250 個の soL1R のうち、98.9% (n = 1,236) が結腸直腸上皮から検出され、極めて高い細胞型特異性を示しました (P = 9.0 × 10−173、両側フィッシャーの直接確率検定)。 ほとんどの正常な結腸直腸クローン (n = 359、88%) は少なくとも 1 つの soL1R を保持しており、クローンあたり平均 3 つのイベントがありました (図 1b)。 注目すべきことに、soL1Rは、クローンにおける他の古典的なタイプの体細胞構造変異よりも豊富でした(拡張データ図1f)。

結腸直腸上皮では、クローンと個体間で soL1R 負荷に大きなばらつきがあることがわかりました。 結腸直腸クローンにおけるsoL1R負荷は、クローンあたり0〜18でした(図1c)。 平均すると、soL1R負荷は、内在性体細胞SNVおよびインデルの時計のような特性と同様に、個人の年齢と広範かつ正の関係を示しました(クローンあたり年間0.028 soL1R、図1d)(拡張データ図2a)32。 。 これは、soL1R が結腸直腸上皮において一生を通じてほぼ一定のバックグラウンド速度で獲得されることを意味します。 2 人の外れ値の個人はさらに、L1 活性を刺激する遺伝的素因および/または環境曝露を示唆しています (図 1d)。

soL1R負荷は、結腸内のクローンの性別や解剖学的位置などの他の特徴と強く関連していませんでした(拡張データ図2b、c)。 個々のクローンレベルでは、soL1R 負荷は、点突然変異負荷、テロメア長、細胞内因性 SNV プロセスの活性 33 (SBS1 および SBS5/40; COSMIC データベースの標準シグネチャ)、曝露などの他のゲノム特徴との顕著な関連性を示さなかった。活性酸素種 (SBS18) または pks+ Escherichia coli34 (SBS88) 由来のコリバクチン (拡張データ図 2d–i)。

正常細胞のSoL1Rは結腸直腸上皮に限定されません。これは、13の臓器からレーザーキャプチャ顕微解剖(LCM)パッチ259個のうちさらに37個を検出したためです5、11(拡張データ図2jおよび補足表3)。 ただし、LCM ベースの全ゲノム配列決定では soL1R 検出感度が損なわれるため、これらの負荷を結腸直腸クローンからの負荷と直接比較すべきではありません (WGS; 補足説明 2 および補足図 2 および 3)。

正常なクローンの 1,250 個の soL1R のうち、30 個は個体内の 2 つ以上のクローンによって共有されていました (折りたたむと 10 個のイベント)。これは、これらのイベントがクローンの最も最近の共通祖先細胞に存在することを意味します。 以前に報告されたように接合後突然変異を使用して再構築されたクローンの発生系統発生4,5(図1e、fおよび拡張データ図3および4)は、これらのsoL1Rが胚性イベントであることを明確に示しました。 たとえば、6つの結腸直腸クローン(19クローン中6クローン、クローン頻度32%)によって共有されるHC14のsoL1Rイベントは、系統発生の第2世代ノードにある祖先細胞で取得されました(図1e)。 ノードの位置に加えて、祖先ノードの接合後点突然変異の数 (n = 5) は、ヒトの発生における最初の 2 つの細胞世代を考慮すると、この出来事が 4 細胞期の胚で起こったという考えを裏付けました。細胞分裂ごとに細胞あたり 2.4 ~ 3.8 個の突然変異 (pcpcd) が生成され、それ以降の細胞世代では 0.7 ~ 1.2 個の突然変異が生成されます (pcpcd4,5)。 原腸形成前イベントについて予想されたように、soL1Rは、結腸直腸上皮を超えて約34%の細胞頻度で末梢血(中胚葉起源)の約200倍の全ゲノム配列(内胚葉起源;図1e)で観察されました。 同様に、HC04 に見られる 1 つの体細胞 Alu 挿入も、おそらく原腸形成前段階で得られたと考えられます (拡張データ図 4)。

他の 9 つの共有 soL1R は、系統発生における祖先節の下流位置と分子時間を考慮すると、おそらく原腸形成後の胚事象であったと考えられます (分子時間の 16 ~ 56 の点突然変異、前述の固定点突然変異率を仮定すると 11 ~ 78 番目の細胞世代に相当)胚形成における)4,5、および血液の約200倍の全ゲノム配列にはsoL1Rが存在しない(図1fおよび拡張データ図3および4)。

さまざまな段階と細胞型を比較す​​るために、内因性点突然変異 32,33 (EPM; SBS1 および SBS5/40 SNV および ID1 および ID2 インデルとして定義) の数あたりの soL1R イベントの数をカウントすることにより、soL1R 率を計算しました。 結腸直腸末端枝(発生後の結腸直腸上皮)におけるsoL1R率は、1,000 EPMあたり1.2でした(図1g)。 この率は、結腸直腸上皮に分化する原腸形成後の胚枝では約 4 倍高く (1,000 EPM あたり 4.52、P = 8.4 × 10−4、両側ポアソン正確検定)、1.1 × 10−3 と 9.0 × 10− の間に相当します。 3 soL1R pcpcd (初期の内因性点突然変異率が固定されていると仮定)。 原腸形成前枝におけるsoL1R率の点推定値は1,000 EPMあたり1.06でしたが、28人でそのような例が1つ見つかりました(図1e)。 対照的に、血液および線維芽細胞系統では、胚期および発生後の段階に関係なく、1,000 EPM あたりの割合はゼロに近かった(図 1g)。

正常な結腸直腸クローンの soL1R のレトロ転位セグメントは、ほとんどが反復 L1 配列の 3' 部分でした (n = 1,063、89%、solo-L1 として知られています、図 2a)16。 場合によっては、L1 ソースの固有の下流配列が、L1 配列の有無にかかわらずレトロトランスポーズされることがありました(それぞれパートナー形質導入(n = 11、1%)およびオーファン形質導入(n = 124、10%)として知られています。図 2a)16。 形質導入イベントでは、L1 ソースのバーコードとして固有の配列を使用して、ソース要素のフィンガープリンティングが可能です16。

a、L1レトロ転位の3つのクラスの概略図:ソロL1、パートナー形質導入、およびオーファン形質導入。 b. 34 個の rc-L1 の特徴を備えた伝達イベントの風景。 TD、伝達。 AFR、アフリカ人。 ユーロ、ヨーロッパ人。 EAS、東アジア人。 SAS、南アジア人。 AMR、アメリカ人。 c、rc-L1の集団対立遺伝子頻度とそれらの正規化されたレトロトランスポジション活性との関係。 緑色の点は、1 人の個人にのみ見つかったプライベート情報源を示します。 赤い点は、蔓延している活動的なソースを示します。 黒と灰色の点は、それぞれ、我々の研究における伝達事象に寄与する共通の発生源と寄与しない共通の発生源を示します。 青い線はアクティブではあるが蔓延していない情報源の回帰直線を表し、影付きの領域はその 95% 信頼区間を示します。 TPAM、分子時間の 100 万個の内因性点突然変異あたりの L1 対立遺伝子あたりの形質導入数。 d、L1サブファミリーの割合と、PAF全体にわたるrc-L1ソースの切断型変異の有病率。 PAF < 25、25 < PAF < 75、および PAF > 75 のグループには、それぞれ 10、34、および 90 個の L1 ソースがあります。

結腸直腸クローンと癌組織を組み合わせると、これらを含む34のL1ソースを持つ217の形質導入イベントが見つかり、それらのレトロトランスポジション能力が確認されました(図2bおよび補足表4)。 これらのうち、12 個 (35%) は、以前に知られていた 264 個の活動的な発生源と重複していなかったため、新しい rc-L1 でした 12、13、16、17、18、19、20、21。 新しい rc-L1 ソースには 3 つのタイプが含まれます: (1) 1 つの参照生殖系列ソース (ヒト参照ゲノムと個人の生殖系列の両方に存在)、(2) 7 つの非参照生殖系列ソース (参照ゲノムには存在しない) (3) 参照ゲノムと生殖系列の両方に存在しない、接合後獲得された 4 つのソース (拡張データ図 5)。 注目すべきことに、4つの新しい非参照生殖系列ソース(17q25.3、1q23.3-1、1p22.1および2q21.1-2、図2bおよび補足表4)は個人にプライベートなものであり、世界では観察されていませんでした。私たちの生殖細胞パネルには、5 つの祖先からの 2,860 人の個人が含まれています。 これは、集団ベースのゲノム研究によって示唆されているように、新しい rc-L1 ソースの取得がヒト ゲノム プールで進行中であることを示しています 12、21、35。

34 個の rc-L1 ソースのそれぞれは、結腸直腸クローンにおける異なる数の形質導入に寄与しました (図 2b)。 たとえば、4 つの L1 ソース (22q12.1-2、1p12、Xp22.2-1、および 12p13.32) は大部分 (少なくとも 50%) の個人に影響を及ぼし、我々の研究における体細胞伝達事象の約 50% を引き起こしました。 。 これら 4 つの rc-L1 は集団内で蔓延しており、ヒトゲノム プールでは約 100% の集団対立遺伝子頻度 (PAF) を示しました (図 2b)。

これら 4 つの「広く活性な」rc-L1 を除いて、高 PAF rc-L1 は結腸直腸上皮において低い soL1R 活性を示しました。 75%を超えるPAFを有する90個のrc-L1のほとんどは、406個の結腸直腸クローンにおいて、まったく寄与しないか(81、90%)、または1つのsoL1Rイベント(4、4%)のいずれかであった。 対照的に、まれなソース要素は、生殖系列にソースを持つ個体の複数のクローンで逆転位されることがよくありました。 たとえば、民間ソース 17q25.3 は、HC13 の 22 個の結腸直腸クローンにわたって 6 つのイベントに寄与しました (図 2b)。

異なるソースエレメントにわたるレトロトランスポジション活性を比較するために、各rc-L1からの形質導入を、そのソースを保有する個体の正常な結腸直腸系統において、分子時間100万EPM当たり(TPAMと呼ばれる)L1対立遺伝子ごとにカウントした。 興味深いことに、TPAM率は一般にrc-L1のPAFと負の相関を示しました(図2c)。 4 つの一般的に活性な rc-L1 を除き、希少なソースは一般的なソースよりも高いレトロトランスポジション活性を示しました。 これらの特徴は、ヒトゲノム変異の有病率と浸透率との逆関係と一致しています36。 rc-L1 は潜在的に有害な挿入変異誘発を引き起こす可能性があるため、その活性は遺伝的および/またはエピジェネティックな機構を通じて抑制される必要があります。 超希少資源は、比較的最近になって人間集団に出現したため、おそらく十分なネガティブセレクションに先立って存在します12。

rc-L1 間の異なる活性の遺伝的基盤を理解するために、我々は 2 つの結腸直腸クローンのロングリード WGS を使用して、ソース要素の配列多型を調査しました。 以前に示唆されているように、集団に蔓延するソース要素は主に古いL1サブファミリー(pre-TaやPA2など)にあり12、まれなソース要素よりも頻繁にオープンリーディングフレーム破壊変異を抱えていました(図2dおよび補足表4)。

正常細胞における異なるrc-L1活性のエピジェネティックな基盤を探索するために、樹立されたクローンのサブセットにおける全ゲノムDNAメチル化(139クローン)とRNA発現プロファイル(116クローン)を組み合わせました(図1aおよび3a)。 バルク組織について報告されているように 16,37 、これらのクローンは遺伝子座特異的 L1 プロモーターのメチル化と転写との間に強い負の相関を示し (拡張データ図 6)、L1 プロモーターの脱メチル化が L1 転写の主要なスイッチであることを示唆しています。

a、多次元解析の概略図。 b、9人の個体からの132個の正常な結腸直腸クローンおよび7個の線維芽細胞クローンの発生系統図を含む30個のrc-L1のDNAメチル化状態のパノラマ。 これには、これらのクローンにおける形質導入イベントに寄与する 14 個の rc-L1 と、少なくとも 5 つのクローンで脱メチル化プロモーターを示す追加の 16 個の rc-L1 が含まれます。 分岐特異的な点突然変異の数が系統発生に示されます。 c、d、22q12.1-2(c)および12p13.32(d)におけるrc-L1のDNAメチル化状態およびリードスルー転写レベル。 e、90の集団に蔓延するrc-L1の非切断およびプロモーター脱メチル化の割合。 赤い点、蔓延する活性源。 黒と灰色の点は、それぞれ我々の研究における伝達事象の有無を示す一般的な情報源です。 f、胚分岐時期に応じたクローンペアにおけるrc-L1プロモーターのメチル化の違い。 プロモーターのメチル化に実質的な変動を示す上位 30 個の rc-L1 を考慮しました。 固定の突然変異率 4 を使用して、突然変異時間を胚細胞の発生に換算しました。 %P、パーセントポイント。 *P < 2.2 × 10−16 (2 サンプルのコルモゴロフ – スミルノフ検定)。 g、h、22q12.1-2 (g) および 1p12 (h) における rc-L1 の 100 kb 上流および下流領域のメチル化プロファイル。 rc-L1 遺伝子座は黄色の四角形で強調表示されます。 上、ゲノム座標と CpG 部位の順序。 中央、結腸直腸 (金) および線維芽細胞 (銀) クローン (g)、および開いた (オレンジ) および閉じた (青) プロモーターを持つ結腸直腸クローン (h) におけるメチル化 CpG の画分。 下、中央のパネルに示されているメチル化 CpG の割合の違い。 mCpG、メチル化CpG。

プロモーターの脱メチル化(および結果として生じる転写)の頻度は、細胞タイプおよびソースエレメントによって異なりました(図3b、拡張データ図7、補足説明3、補足図4および5)。 線維芽細胞クローンでは主にメチル化されていますが、結腸直腸クローンでは rc-L1 プロモーターが顕著に脱メチル化されていることがよくありました。 たとえば、一般的な活性ソース22q12.1-2および12p13.32のプロモーターは、結腸直腸クローンにおいて頻繁な二対立遺伝子脱メチル化(およびその結果生じるRNA転写)を示しました(図3b-d)。 ソース 5q14.1-1 および 14q12-3 で観察されたように、rc-L1 プロモーターの脱メチル化のクローン頻度が特定の個人でより一般的になることがありました (図 3b)。 さまざまなバルク組織からの全ゲノム DNA メチル化プロファイル 38 は、結腸組織が他のどの細胞型よりも rc-L1 プロモーターの脱メチル化の頻度が高いことを示唆しています (拡張データ図 8a)。

注目すべきことに、集団に蔓延するrc-L1が、プロモーターのメチル化および/または遺伝子の切断によって頻繁に抑制されることが観察されました。 集団に蔓延している90個のrc-L1(PAF > 75%)のうち、68個(75.6%)が結腸直腸クローンの75%以上で主要なプロモーターメチル化を示しました(図3e)。 優先的にプロモーターがメチル化されていない他の 22 個の rc-L1 (12q13.13 など) のうち、10 個には、ロングリード シーケンスから得られたすべての有益な対立遺伝子にオープン リーディング フレーム切断変異が含まれていました。 残りの 12 個の rc-L1、特に 4 つの一般的な活性源 (22q12.1-2、Xp22.2-1、1p12、および 12p13.32) は、遺伝的およびエピジェネティックな抑制の両方から逃れており、これは、rc-L1 の機能的役割を示している可能性があります。情報源39。

多次元分析により、ソース要素のエピジェネティックな制御とその後の soL1R 活性に関する 4 つの洞察がさらに得られました。 まず、rc-L1 プロモーターの脱メチル化は soL1R の必須条件です。 クローン内で形質導入イベントを引き起こすソースエレメントは、対応するクローン内で常にプロモーター脱メチル化されていました(図3b;47個中47個、赤い四角で強調表示;37個のホモ接合性および10個のヘテロ接合性脱メチル化)。 これはさらに、脱メチル化された rc-L1 プロモーターが体細胞系列において経時的に安定であることを示しています。なぜなら、その逆メチル化によりそのような排他的な会合が破壊されるからです。

第二に、L1 プロモーターのエピジェノタイプは主に胚発生時に決定されます。 常染色体rc-L1プロモーターの脱メチル化は主にホモ接合性であり(図3b-d)、これはゲノム内のDNAメチル化を全体的に除去する原腸形成前のエピジェネティックな再プログラミングから直接受け継がれていることを示唆しています40、41、42。 別のシナリオである老化プロセスにおけるメチル化の確率的損失は、1 つの対立遺伝子で優先的に脱メチル化が形成されるため、その可能性は低くなります。 むしろ、我々の発見は、初期の胚段階で形成された完全に脱メチル化されたrc-L1プロモーターが、結腸直腸上皮系統ではその後十分に再メチル化されないことを示唆しています(図3b)。 線維芽細胞クローンはほぼ完全なrc-L1プロモーターのメチル化を示したので、線維芽細胞系統では再メチル化をより徹底する必要があります(図3b)。 クローン系統発生における分子時間は、rc-L1 プロモーターの再メチル化プロセスが主に原腸形成後の段階で機能していることも示しています。 分子時間の 17 ~ 65 の胚突然変異 (12 ~ 90 番目の細胞世代、上記の固定初期突然変異率 4,5、原腸形成から器官形成に近いと仮定した場合) に最も最近の共通祖先細胞を持つ結腸直腸クローンは、プロモーターのエピゲノタイプのより高い一致を示しました。 rc-L1ソースの場合(77%の一致率、1,885クローン-L1ペアのうち1,446)、以前に分岐したクローンよりも一致しました(図3b〜d、f)。

第三に、不十分な再メチル化の範囲は rc-L1 のプロモーターに局在しており、他のゲノム領域とは独立しています。 たとえば、線維芽細胞クローンと結腸直腸クローンの間では、一般的に活性な22q12.1-2ソースのプロモーターメチル化レベルが極端に異なるにもかかわらず、その100 kbの上流領域と下流領域は非常に類似したDNAメチル化プロファイルを示しました(図3g)。 同様に、隣接するゲノム全体の領域のDNAメチル化レベルは、L1プロモーターのエピゲノタイプに関係なく、結腸直腸クローン間でほぼ一致していました(図3hおよび拡張データ図8b、c)。

最後に、正常細胞の soL1R に関しては、ほとんどの L1 転写物は非生産的です。 結腸直腸クローンには、プロモーター脱メチル化を持つ17〜42個のrc-L1対立遺伝子があり(図3b)、それらのトランスクリプトーム配列は、結腸直腸上皮系統が生涯にわたっていくつかのrc-L1転写物に継続的に曝露されていることを示唆しています(転写物1キロベースあたり平均0.6フラグメント)すべての rc-L1 を集計した場合の 100 万あたりのマッピングされたリード (FPKM)、拡張データ図 7)43。 しかし、クローンは生涯に約 3 つの soL1R を獲得します。これは、正常細胞における L1 転写物のレトロトランスポジションを保護する能動的な防御機構が存在することを示唆しています。

soL1Rの標的部位は、正常細胞と癌細胞の両方においてゲノム全体に広く分布していた(拡張データ図9a)。 正常クローンの SoL1R は、L1 エンドヌクレアーゼ標的部位モチーフの領域 (190 倍、95% 信頼区間 (CI) 78.8 ~ 459) および後期複製領域 (5.89 倍、95% CI 4.48 ~ 7.74) により頻繁に挿入されました。これは癌で以前に観察されましたが17、クロマチン状態と転写レベルは比較的小さな影響を示しました(拡張データ図9b)。

我々は、生殖細胞系 L1s44 で観察されたように、ゲノムの機能領域でかなりのレベルの soL1R 枯渇を観察しました。 正常クローンの 1,250 個の soL1R の中で、タンパク質をコードする遺伝子のエクソンに関係するイベントは 1 つだけ見つかりました。このイベントは、ランダムな予想よりも 29 倍低い頻度を示しました (P = 1.9 × 10−11、両側ポアソン正確検定)。 同様に、soL1Rは遺伝子が疎な領域でより頻繁に観察されました(拡張データ図9c)。 SoL1R が結合したゲノム再構成は、がん組織における soL1R の 1% に相当します 17 が、正常クローンでは観察されませんでした。 私たちのデータはさらに、soL1Rイベントがレトロ転位部位の近くの領域で追加の突然変異、遺伝子発現/スプライシングの変化、またはDNAメチル化の変化を誘発しないことを実証しました(拡張データ図9d–f)。 機能的に損傷したsoL1Rを持つクローンが正常細胞ではネガティブに選択されたのではないかと我々は推測している。

我々は、L1挿入の機構的プロセスを推測するために、soL1R標的部位のブレークポイント配列をさらに調査した。 ターゲットプライミング逆転写(プロセスA;図4a、b)によって取得される2つの標準的な特徴(TSDおよびポリAテール)に加えて、soL1Rのかなりの部分が5'頭部の配列変異を示しました。 (1) イントラレトロ転位 (intraRT) ボディでの短い反転 (n = 354; 29.5%)、(2) 標的部位の 5 ' 上流での短いフォールドバック反転 (逆重複) (n = 3; 0.3%) または (3) 両方 (n = 1; 0.1%)。 これらの配列変異は、ツインプライミング機構 (プロセス B; 図 4b)45 と、L1 媒介挿入突然変異誘発の最終分解における DNA ポリメラーゼによる可能性のある追加の DNA 合成 (約 52 ~ 220 塩基対 (bp)) によって説明できます (プロセスC、図4b)。 さらに、腺腫から樹立されたクローンでは、挿入部位付近で転写された前駆体 mRNA の一部が逆転写されてゲノムに同時挿入される現象が時折観察され、これは逆転写酵素 (拡張) の鎖スイッチングを示唆しています。データ図9g)。 これらの特徴は、soL1R が完全に順序付けられた線形プロセスによって取得されるわけではないが、いくつかのオプションのイベントが確率的に関与する可能性があることをまとめて示しています 46。

a、b、標準および複雑な L1 挿入のゲノム構造 (a) および基礎となるメカニズム (b) の概略図。 RT ボディ、レトロトランスポーズドボディ。 DSB、二本鎖切断。 c、ドライバー変異によって分類された系統のグループにおける正規化されたL1率を有するMUTYH関連腺腫性クローンの系統発生。 体細胞点突然変異の数によって測定されるように、枝の長さは分子時間に比例します。 ブランチ固有の soL1R とブランチ固有のドライバー変異の数が表示されます。

興味深いことに、我々は2つのクローンを発見しました。それぞれが異なるゲノム標的部位に形質導入を持ちましたが、まったく同じ長さの固有の配列を持っていました(拡張データ図9h)。 ポリ A テーリングがリードスルー転写におけるランダムなイベントであることを考えると、我々の発見は、単一の L1 転写産物から複数の soL1R イベントが発生する可能性があることを示唆しています。

19 個の一致する結腸直腸癌における soL1R 負荷は、4 ~ 105 の間でかなりのばらつきを示しました (図 1b)。 平均して、soL1R 負荷は癌あたり 30 であり、これは正常な結腸直腸クローンで観察される頻度よりも約 10 倍多かった。 結腸直腸癌におけるsoL1R率は1,000 EPMあたり3.47であり、これは正常な結腸直腸上皮よりも約3倍高かった(拡張データ図10a)。 定性的には、腫瘍内のsoL1Rは、より長い挿入長(solo-L1の場合は1,031対453 bp、P = 8.6 × 10−20、両側t検定、パートナー形質導入の場合は755対615 bp、P = 0.59)を含む、より重大な変化を形成しました。 、両側ウィルコクソン順位和検定、オーファン形質導入の場合は 530 対 242 bp、P = 0.004、両側 t 検定、拡張データ図 10b)、および頭部配列変異の頻度が高くなりました (41.8 対 29.9%、 P = 9.6 × 10−7、両側フィッシャーの直接確率検定、拡張データ図 10c)。 我々の発見は、腫瘍発生におけるL1レトロ転位の許容条件が、癌における古典的なゲノム不安定性と必ずしも同等ではないことを示唆している。 例えば、TP53不活性化変異、マイクロサテライトおよび染色体の不安定性は、結腸直腸癌におけるsoL1R負荷と強い相関関係を示さなかった(拡張データ図10d、e)。 染色体不安定性は、2,600 例を超える癌症例を含む汎癌で顕著でしたが 17 (拡張データ図 10f、g)、関連性は各腫瘍組織型で弱く、一貫性がありませんでした (拡張データ図 11)。

MUTYH 関連腺腫性クローンでは、腫瘍発生中の soL1R 速度の加速が観察されました。 腺腫性ポリープの発生系統樹では、系統がより多くのドライバー変異の蓄積により癌に近づくにつれて、soL1R 率が増加しました。 たとえば、3つのドライバー変異(APCおよびARID1Aの機能喪失変異とKRASの機能獲得変異)を持つ系統のsoL1R率は、顕著なドライバーのない系統よりも3〜5倍高かった(図1)。 4c)。

我々の発見は、細胞内因性L1要素が正常な体細胞系統においてレトロトランスポジションを引き起こし、結腸上皮細胞が年間0.028のsoL1Rイベントを獲得することを実証している。 以前に観察されたように、動員はヒトの初期胚発生から、原腸形成前であっても始まります 13,47。 rc-L1のレパートリーは親から受け継がれ、そのエピジェネティックな活性化は主に原腸形成後の胚段階で決定され、その後老化中に体細胞系譜にしっかりと伝達されます(図5)。 結腸内の陰窩の数(1,000 万)48 を考慮すると、60 代の人は結腸直腸上皮で合計 2,000 万回の逆転位イベントを有することになります。 これらの L1 挿入のごく一部は、変異細胞に表現型の変化を与え、癌などのヒトの病気に寄与する可能性があります 17。

soL1R の状況に影響を与える要因を示す概略図。 rc-L1s の遺伝子構成は両親から受け継がれます。 rc-L1 プロモーターのメチル化状況は、主に全体的な DNA 脱メチル化と、それに続く発生段階での再メチル化プロセスによって決定されます。 次に、特定の細胞系統で rc-L1 プロモーターが脱メチル化されると、そのソースが L1 転写物を発現し、soL1R の誘導が可能になります。

ディープシークエンシング 6、全ゲノム増幅 8、二本鎖 DNA シークエンシング 49、LCM5、10、11、および in vitro 単一細胞拡張 2、4、7、9 などのいくつかの相補的な方法を使用して、正常細胞で体細胞的に獲得されたゲノム変化を調査できます。 クローン増殖は労働集約的であり、分裂細胞にのみ適用可能ですが、(1) 絶対的な単一細胞レベルでの高感度で正確な突然変異検出の実装、(2) 同じ単一細胞内での追加のマルチオミクスプロファイリングの容易化などの基本的な利点があります31。 (3) クローンの初期発生関係の調査が可能になります。

私たちの分析はいくつかのメカニズムを示唆していますが、正常細胞における L1 レトロ転位の動態についてはまだ解明されていないことが多くあります。 ソースエレメントと soL1R の配列は、反復的な性質のため、ショートリードではほとんどアクセスできません。 異なるプロモーター脱メチル化における遺伝子座および細胞型の特異性の機構的基礎は不可解である。 これらの疑問に答えるためには、老化や病気の進行のさまざまな時点からの、より革新的な配列決定技術50による、多様な細胞型のより多くの単細胞に関するより包括的なパノラマが保証されています。

結腸直腸組織からのクローンオルガノイドの in vitro 樹立のために、待機的腫瘍除去手術を受けた 19 人の患者の外科標本から健康な粘膜組織が得られました (補足表 1)。 正常組織(サイズ約 1 × 1 × 1 cm3)を原発腫瘍から 5 cm 以上離れた領域から切り出しました。 同じ患者からの一致する血液および結腸直腸腫瘍組織も、バルク組織 WGS のために収集されました。

MUTYH 関連の家族性腺腫性ポリポーシスを患う 1 人の患者からの新鮮な生検材料が結腸内視鏡検査によって得られました。 組織 (サイズ約 0.5 × 0.5 × 0.5 cm3) を 4 つのポリープから切り出しました。 同じ患者からの一致する血液および頬粘膜組織も収集されました。

すべての組織は、収集手順から 8 時間以内にオルガノイド培養実験のために研究室に輸送されました。 この研究のすべての手順は、ソウル大学病院の治験審査委員会(承認番号 1911-106-1080)および KAIST(承認番号 KH2022-058)によって承認され、すべての研究参加者からインフォームドコンセントが得られました。 この研究はヘルシンキ宣言とその後の修正に従って実施されました。 サンプルサイズを事前に決定するために統計的手法は使用されませんでした。 実験は無作為化せずに実施され、研究者は実験手順とデータ分析中に盲検化されませんでした。

さまざまなヒト組織における L1 レトロトランスポジションのより完全な全体像に到達するために、単一細胞増殖クローンの公的に入手可能な全ゲノム配列を含めました。 我々は、以前の 2 つのデータセットから 474 個の全ゲノム配列を含めました。1 つは造血細胞のもの (1 人の個人から 140 クローン) 9、もう 1 つは以前の研究の間葉線維芽細胞のもの (7 人の個人から 334 クローン) 4 です。 さらに、以前の研究で調査された 13 臓器から解剖された LCM ベースのパッチから生成された 259 の全ゲノム配列も含めました 5,11。 さらに、結腸直腸組織の LCM ベースのパッチから生成された 578 の全ゲノム配列 51 を調査し、LCM 法とクローン拡大法の間の soL1R 検出感度の違いを調査しました。

rc-L1 の PAF を理解するために、既知の民族情報を持つ正常組織の公開されている 2,852 の全ゲノム配列を収集しました。 これらのデータはさまざまな研究から収集されたものです52、53、54、55、56、57。

腫瘍におけるsoL1Rの頻度に対するゲノム不安定性のレベルの影響を理解するために、ICGC/TCGA汎がん全ゲノム解析(PCAWG)コンソーシアムからの変異コールをさらに調査しました。これには2,677のがんが含まれ、正常な全ゲノムと一致しました。約 40 種類の腫瘍にわたるゲノム配列 17,53。 PCAWG サンプルの SoL1R は、以前の論文で見つけることができます17。 コンソーシアムによって生成された他の体細胞突然変異コール (TP53 不活化突然変異、構造的変異、および突然変異シグネチャを含む) は、https://dcc.icgc.org/releases/PCAWG からダウンロードできます。 分析に使用されたマトリックスは補足表 5 にあります。これには、CancerVision (Genome Insight) を使用して特定された 19 個の一致する結腸直腸癌のドライバー変異が含まれています。

すべてのオルガノイド確立手順と培地組成は、わずかに変更を加えて文献から採用されました 58。 粘膜組織を約5 mmの切片に切断し、PBSで洗浄した。 組織を50mlコニカルチューブ中の10mM EDTA(Invitrogen)に移し、続いて室温で30分間振盪インキュベートした。 インキュベーション後、チューブを穏やかに振盪して結合組織から陰窩を分離した。 上清を回収し、懸濁液20μlを実体顕微鏡で観察し、陰窩の存在を確認した。 陰窩懸濁液を相対遠心力300で3分間遠心分離し、虚血時間を短縮するためにペレットをPBSで1回洗浄した。 単離した陰窩を増殖因子低減マトリゲル (Corning) に包埋し、12 ウェル プレート (TPP) にプレーティングしました。 陰窩のプレーティングは、以前の研究からのプロトコールを修正することにより、限定された希釈で実施された59。 簡単に説明すると、約 2,000 個の陰窩を 900 μl のマトリゲルに移し、3 × 150 μl の液滴を 12 ウェル プレートの 3 つのウェルにプレーティングしました。 次に、450μlのマトリゲルを残りの希釈液に添加し、3つのウェルに3つの液滴をプレーティングすることを繰り返した。 段階希釈を少なくとも 4 回実行し、最後に残った希釈液を 6 つのウェルにプレーティングしました。 プレートを 37 °C のインキュベーターに移し、5 ~ 10 分間放置してマトリゲルを固化させました。 各ウェルを1 mlのオルガノイド培地で覆い、その組成を補足表6に記載します。

単一陰窩由来オルガノイドの初期質量を確保するために、バルクおよび希釈陰窩の一次培養を少なくとも10日間維持した。 オルガノイドの成長後、倒立顕微鏡下で 200 μl ピペットを使用して 1 つの例を手動で採取しました。 採取したオルガノイドをエッペンドルフチューブに入れ、TrypLE Express (Gibco) の下で 25 G 針を備えた 1 ml シリンジを使用して解離させました。 次に、ADF+++(10mM HEPES、1×GlutaMAXおよび1%ペニシリン-ストレプトマイシンを含むAdvanced DMEM/F12)によるTrypLEのブロッキングに続いて、遠心分離および洗浄を行った。 ペレットを 24 ウェル プレートの 1 つのウェルに配置しました。 プレートを加湿した 37 °C/5% CO2 インキュベーターに移し、培地を 2 ~ 3 日ごとに交換しました。 継代に成功した後、クローンオルガノイドを 12 ウェルプレートに移し、さらに増殖させました。 核酸抽出およびオルガノイドストックのために、コンフルエントなクローンを収集しました。

培養された単一陰窩由来オルガノイドを収集し、TrypLE Express を使用して解離しました。 TrypLE のブロッキングと洗浄後、ADF+++ を使用してオルガノイドを再懸濁しました。 オルガノイド懸濁液を40μmストレーナー(Falcon)を通して濾過し、次いで単一細胞をセルソーター(FACSMelody、BD Biosciences)によってFACSチューブに選別した。 メーカーのプロトコルに従って、前方散乱特性と側方散乱特性に基づいて単一細胞を選択しました。 選別した細胞を、12ウェルプレートに増殖因子を減少させたマトリゲル(ウェルあたり500個)とともにまばらに播種した。 成長した再クローン化された単一オルガノイドを手動で選択し、上記の方法によって拡張しました。

メチル化分析のために 7 つの線維芽細胞クローンを取得しました。 真皮線維芽細胞は前述の方法で培養しました4。 簡単に説明すると、皮膚サンプルを PBS (Gibco) で洗浄し、脂肪組織と血管を除去しました。 残りの組織を小片(1 ~ 2 mm2)に切断し、1 mg ml-1 コラゲナーゼ/ディスパーゼ溶液(Roche)で 37 °C で 1 時間処理しました。 処理後、表皮層を真皮層から分離し、真皮層を20%FBS(Gibco)を含むDMEM培地で洗浄してコラゲナーゼ/ディスパーゼ活性を阻害した。 次に、真皮組織を小片に切り刻み、コラーゲン I でコーティングした 24 ウェル プレート (Corning) で培地 200 μl を用いて、37 °C、CO2 濃度 5% の加湿インキュベーター内で培養しました。

イルミナのシーケンシングでは、メーカーのプロトコールに従って、DNeasy Blood and Tissue kit (Qiagen) または Allprep DNA/RNA kit (Qiagen) のいずれかを使用して、クローン増殖した細胞からゲノム DNA 材料を抽出し、末梢血および結腸直腸腫瘍組織を照合しました。 DNA ライブラリーは、Truseq DNA PCR-Free Library Prep Kits (Illumina) を使用して生成し、Illumina HiSeq X Ten プラットフォームまたは NovaSeq 6000 プラットフォームのいずれかで配列決定しました。 結腸直腸クローンは、平均 17 倍の深さで全ゲノム配列決定されました。 一致する末梢血および結腸直腸腫瘍組織は、それぞれ平均カバー率 181 倍および 35 倍で配列決定されました。 PacBio シーケンスでは、Circulomics Nanobind Tissue Big DNA キット (Circulomics) を製造元のプロトコールに従って使用して結腸オルガノイドからゲノム DNA を抽出しました。 MRTbell Express template prep kit 2.0 (PacBio) を使用して DNA ライブラリーを調製し、PacBio Sequel IIe プラットフォームで配列決定しました。

全RNAは、Allprep DNA/RNAキット(Qiagen)を使用して、クローン的に増殖させた細胞から抽出した。 製造業者のプロトコールに従って、Truseq Stranded Total RNA Gold キット (Illumina) を使用して、トータル RNA シーケンシング ライブラリを構築しました。

ゲノム DNA は、DNeasy Blood and Tissue キット (Qiagen) または Allprep DNA/RNA キット (Qiagen) のいずれかを使用して、クローン的に増殖させた細胞から抽出しました。 ライブラリは、NEBNext Enzymatic Mmethylation-seq キット (NEB) を製造業者のプロトコールに従って使用して、コントロール DNA (CpG メチル化 pUC19 および CpG 非メチル化ラムダ DNA) とともに 200 ng のインプット DNA から調製しました。 ペアエンド配列決定は、NovaSeq 6000 プラットフォーム (Illumina) を使用して実行されました。

配列決定されたリードは、Burrows-Wheeler aligner (BWA)-MEM アルゴリズム 60 を使用してヒト参照ゲノム (GRCh37) にマッピングされました。 重複したリードは、Picard (http://broadinstitute.github.io/picard で入手可能) または SAMBLASTER61 によって削除されました。 以前に報告されたように、SNV と短いインデルを特定しました 4。 簡単に言うと、塩基置換と短いインデルは、Haplotypecaller2 (参考文献 62) と VarScan2 (参考文献 63) を使用して呼び出されました。 信頼性の高いバリアント セットを確立するために、次の特徴を持つバリアントを削除しました: (1) 正常パネル内の VAF が 1% 以上、(2) インデルまたはクリッピングの割合が高い (70% 以上)、(3) 3 つ以上バリアントリードにおける塩基の不一致、および (4) 他のクローンにおけるエラーリードの頻繁な存在。

私たちは以前の報告と同様の方法で体細胞構造の変異を特定しました4。 我々は、初期胚突然変異と体細胞突然変異の両方を保持するために、一致する血液サンプルと系統発生的に遠いクローンを使用して DELLY64 を使用して構造変異を呼び出しました。 次に、以下の特徴を持つバリアントを破棄しました:(1)正常のパネル内に存在する、(2)サポートするリードペアの数が不十分(サポートする SA タグがないリードペアが 10 未満、またはサポートする SA タグが 1 つある不一致リードペアが 3 つ未満) SA タグ)および(3)一致する血液サンプル内の多くの不一致リード。 残りの偽陽性イベントを削除し、ブレークポイント付近にある偽陰性イベントをレスキューするために、Integrative Genomics Viewer65 を使用して、フィルター処理を通過したすべての再配置を視覚的に検査しました。

一致する血液サンプルと系統発生的に遠いクローンを使用して、MELT20、TraFiC-mem16、DELLY64、および xTea66 を使用して L1 レトロ転位を呼び出し、初期胚突然変異と体細胞突然変異の両方を保持しました。 一致しない血液サンプルで見つかったイベントと重複する潜在的な生殖細胞系列コールは削除されました。 コールの信頼性を確認し、残りの偽陽性イベントを除去するために、Integrative Genomics Viewer65 を使用して、2 つの裏付けとなる証拠 (1) ポリ A テールと (2) 標的部位の重複に焦点を当てて、すべての soL1R 候補を視覚的に検査しました。 さらに、潜在的なアーティファクトを排除するために、サポートリード数が少ない(総リードの 10% 未満)バリアントを除外しました。 soL1Rのサイズを計算し、L1反転またはL1媒介形質導入が組み合わされたかどうかを決定するために、挿入されたセグメントの5'および3'末端を取得しました。 インサートの両端が反対側の鎖にマッピングされている場合、変異体は反転していると考えられます。 挿入されたセグメントがユニークで非反復的なゲノム配列にマッピングされ、全長 L1 エレメントが 15 kb 上流領域内に位置する場合、L1 挿入は 3' 形質導入と結合し、L1 エレメントに由来すると判断されました。ユニークな配列の上流領域にあります。 soL1R の VAF を計算するために、L1 サポート リード ペアの数を挿入部位周囲の有益なリード ペアの総数で割りました。 読み取りペアの開始と終了をカバーする領域が挿入ブレークポイントにまたがる場合、その読み取りペアは有益であると見なされます。 さらに、挿入は挿入の両端のリードペアによってサポートされているため、有益なリードペアの総数を計算するときに参照サポートリードペアの数を2回数えました。 癌サンプルにおけるクローン L1 挿入を同定するために、共有 soL1R は真の変異体とみなされるため、正常な結腸直腸クローンにおける共有 soL1R の最小細胞分画値に基づいてカットオフを設定しました。 Alu や SVA などの他の可動要素の挿入にも同じアプローチを使用しました。

サンプル内の突然変異サインを抽出するために、3 つの異なるツール (社内スクリプト、SigProfiler67、および階層型ディリクレ プロセス 68) を使用して、正常上皮細胞、腺腫、癌腫を含む結腸サンプルの各タイプについて突然変異サインのコンセンサス セットを達成しました。 簡単に言うと、私たちの社内スクリプトは、さまざまな数学的制約の有無にかかわらず、非負の行列因数分解に基づいており、モデルの選択に安定性と再構成誤差の尺度を使用するなど、SigProfiler69 の前身からコアメソッドを借用しています。 ただし、これにより、SigProfiler によって見逃される可能性のある解決策を含む、より広範な一連の可能な解決策を検討する際の柔軟性が向上し、推定される変異プロセスの数を決定するための意図的なアプローチが可能になります。 その結果、特定の変異スペクトルを最もよく説明するシグネチャのサブセットを選択しました。正常な結腸直腸上皮細胞の場合は、SBS1、SBS5、SBS18、SBS40、SBS88、SBS89、ID1、ID2、ID5、ID9、ID18、および IDB。 MUTYH 関連腺腫の場合は SBS1、SBS5、SBS18、SBS36、SBS40、ID1、ID2、ID5、および ID9。 結腸直腸がんの場合は SBS1、SBS2、SBS5、SBS13、SBS15、SBS17a、SBS17b、SBS18、SBS21、SBS36、SBS40、SBS44、SBS88、ID1、ID2、ID5、ID9、ID12、ID14、および ID18。 すべてのシグネチャは、COSMIC 変異シグネチャ (https://cancer.sanger.ac.uk/cosmic/signatures で入手可能) の v.3.2 から入手可能な既知の変異シグネチャと、以前の研究で新たに発見されたシグネチャである IDB に起因すると考えられます。正常な結腸直腸上皮細胞 51 ですが、COSMIC 変異シグネチャにはまだカタログ化されていません。

以前に実施したように、m 個のサンプルの n 個の突然変異の遺伝子型を表す n × m 行列を生成することにより、個体からのコロニーの系統樹とがん組織の主要クローンを再構築しました 4。 簡単に言うと、カバレッジが低くて不正確なジェノタイピングを避けるために、個人のすべてのサンプルからの SNV と短いインデルがマージされ、すべてのサンプルで 5 つ以上のマッピングされたリードを持つバリアントのみが含まれました。 さらに、潜在的なシーケンスアーチファクトを排除するために、すべてのサンプルで VAF < 0.25 のバリアントが削除されました。 j 番目のサンプルの i 番目の変異の VAF が 0.1 より大きい場合、Mij には 1 が割り当てられます。 それ以外の場合は 0。すべてのサンプルに共通する変異は生殖細胞系列変異とみなされ、破棄されました。 すべての突然変異を、それらが見つかったサンプルの種類に従ってグループ化し、突然変異グループ間の階層関係を確立しました。 つまり、変異グループ A のサンプルに他のサンプルに加えて変異グループ B のサンプルがすべて含まれている場合、変異グループ B は変異グループ A に従属することになります。次に、変異グループの階層を最もよく説明する系統樹を再構築しました。 最終的な系統樹は、各サンプル (コロニー) がツリーの 1 つの終端ノードに接続され、対応する突然変異グループ内の突然変異の数が枝の長さになるルート付きツリーです。 がんサンプルの場合、枝の長さはがん細胞の割合が 0.7 を超えるクローン点突然変異を表します。 分子時間(初期突然変異の数)を物理的な細胞世代に変換するために、最初の 2 つの細胞分裂では 2.4 ~ 3.8 pcpcd の突然変異率を使用し、その後は以前の研究から推定された 0.7 ~ 1.2 pcpcd の突然変異率を使用しました 4,5。

soL1R 率を計算する際、系統樹上の点突然変異を 4 つの異なる段階、すなわち原腸形成前、原腸形成後、老化 (発生後)、および腫瘍形成に分類しました。 複数のクローンに共有され、バルク血液全ゲノム配列 (中胚葉起源) で検出された変異は、原腸形成前のものと考えられました。 初期の分枝における変異4、51、70 はあるが、バルク血液の全ゲノム配列には見出されなかった変異は、原腸形成後であると考えられました。 正常なクローンにおける他のすべての突然変異は、老化の過程で蓄積されたものと考えられました。 老化および腫瘍形成における突然変異については、外部発がん物質への曝露による余分な突然変異を除外するために、内因性突然変異プロセス (SNV の場合は SBS1 および SBS5/40、インデルの場合は ID1 および ID2) に起因するものをカウントしました。 腫瘍内の変異については、サブクローン変異を除外するためにクローン点変異 (0.7 より大きい癌細胞画分) をカウントしました。 最後に、soL1R の数を内因性点突然変異の総数で割ることにより、各段階の soL1R 率を計算しました。 腫瘍形成に関する soL1R 率の計算には、非高度変異腫瘍のみが含まれていました。

rc-L1 ソースの PAF を計算するために、既知の民族情報 (アフリカ人 714 名、ヨーロッパ人 588 名、南アジア人 538 名、東アジア人 646 名、およびアメリカ人)52、53、54、55、56、57。 最初に、私たちは個人のゲノムに rc-L1 が存在するかどうかを調べました。 簡単に言うと、非参照 L1 については L1 をサポートするリードの割合、および参照 L1 については L1 欠失に反対する小さな挿入サイズを持つリードの割合をそれぞれ計算しました。 15%以上の割合を有するr​​c-L1のみがゲノム中に存在すると考えられた。 次に、特定の rc-L1 の PAF を、集団内の L1 を持つ個体の割合として計算しました。

minimap2 (参考文献 71) のラッパーである pbmm2 (https://github.com/PacificBiosciences/pbmm2) を使用して、配列されたリードをヒト参照ゲノム (GRCh37) にマッピングしました。 ソース要素に近い L1 サポートリードの配列が抽出され、BWA60 を使用して L1HS コンセンサス配列 18 にマッピングされました。 次に、切断変異を含むソース要素の配列変異を特定し、各ソース要素を対応する L1 サブファミリーに割り当てました 21。

配列決定されたリードは、Cutadapt72 を使用して処理され、アダプター配列が除去されました。 トリミングされたリードは、Bismark73 を使用して、非参照 L1 ソース部位での L1 コンセンサス配列の組み込みによって修飾されたヒト参照ゲノム (GRCh37)、pUC19 およびラムダ DNA 配列を組み合わせたゲノムにマッピングされました。 単一の CpG 部位について、メチル化をサポートするリード数 (C または G)、脱メチル化をサポートするリード数 (A または T)、および全リードに占める前者のリードの割合 (メチル化率) を Bismark を使用して計算しました。 変換効率は、CpG メチル化 pUC19 および CpG 非メチル化ラムダ DNA にマッピングされたリードを使用して推定されました。 全体的なメチル化状態を観察するために、各 L1 ソースエレメントの L1 転写開始部位から 600 bp 上流から 600 bp 下流の範囲の領域のメチル化画分を調べました。 次に、L1 転写開始部位と 250 bp 下流領域 (+1 ~ +250) の間に位置する CpG 部位に焦点を当て、各 CpG 部位をメチル化割合に応じて 3 つのカテゴリのいずれかに分類しました: ホモ接合型脱メチル化 (メチル化割合 25% 未満) 、ヘテロ接合性(メチル化率が少なくとも 25%、メチル化率が 75% 未満)およびホモ接合性メチル化(メチル化率が少なくとも 75%)。 次に、メチル化スコアを CpG 部位 (ホモ接合性脱メチル化の場合は 0、ヘテロ接合性の場合は 5、ホモ接合性のメチル化の場合は 10) に割り当て、L1 要素の +1 ~ +250 領域上のすべての CpG 部位のスコアを平均することによって要約しました。 最後に、すべてのサンプルとすべての既知のソース要素のメチル化スコアを比較して、メチル化状態とソース活性化の関係を決定しました。

バルク組織における L1 プロモーターのメチル化レベルを分析するために、ロードマップ エピゲノミクス 74 から 16 の異なる組織の全ゲノム重亜硫酸塩配列データをダウンロードしました。 ロードマップ コードは、E050 BLD.MOB.CD34.PC.F (Mobilized_CD34_Primary_Cells_ Female)、E058 SKIN.PEN.FRSK.KER.03 (Penis_Foreskin_Keratinocyte_Primary_Cells_skin03)、E066 LIV.ADLT (Adult_Liver)、E071 BRN.HIPP.MID (Brain_Hi) です。 ppocampus_Middle)、 E079 GI.ESO (食道)、E094 GI.STMC.GAST (胃)、E095 HRT.VENT.L (左心室)、E096 LNG (肺)、E097 OVRY (卵巣)、E098 PANC (膵臓)、E100 MUS.PSOAS (腰筋)、E104 HRT.ATR.R (右心房)、E105 HRT.VNT.R (右心室)、E106 GI.CLN.SIG (S状結腸)、E109 GI.S.INT (小腸)、および E112 THYM (胸腺)。 参照された L1 ソースの CpG 部位のメチル化画分を収集し、L1 要素の +1 ~ +250 領域上のすべての CpG 部位の画分を平均することによって要約し、その後、異なる組織にわたる平均 L1 プロモーター メチル化レベルを比較しました。

配列決定されたリードは、Cutadapt72 を使用して処理され、アダプター配列が除去されました。 トリミングされたリードは、BWA-MEM アルゴリズム 60 を使用してヒト参照ゲノム (GRCh37) にマッピングされました。 重複した読み取りは SAMBLASTER61 によって削除されました。 各 L1 ソースエレメントの発現レベルを特定するために、ソースエレメントの 3' 末端から最大 1 kb 下流の領域にマッピングされたリードを収集し、FPKM 値を計算しました。 ソース要素と同じ方向の読み取りのみが考慮されました。 ソースエレメントが遺伝子上にあり、両方が同じ鎖上にある場合、下流領域のリードの起源が曖昧であるため、FPKM 値は計算されません。

L1 挿入率は、10 Mb のスライディング ウィンドウあたりの soL1R の総数として、5 Mb ずつ増加して計算されました。 L1 挿入率と他のゲノム特徴の関係を一塩基分解能で調べるために、以前に説明した統計的アプローチを使用しました 17,75。 簡単に言うと、複製時間、DNA過敏性、ヒストンマーク(H3K9me3およびH3K36me3)、RNA発現、L1標準エンドヌクレアーゼモチーフ(ここで定義したもの)への近さなどのゲノム特徴ごとに、ゲノムを4つのビン(0~3)に分割しました。 TTTT|R (R は A または G) または Y|AAAA (Y は C または T)) のいずれかです。 L1 エンドヌクレアーゼ モチーフとブレークポイント配列を比較することにより、L1 エンドヌクレアーゼ モチーフに対する 4 つ以上 (最も類似しない)、3 つ、2 つ、1 つ未満 (最も類似する) のミスマッチを持つゲノム領域をビン 0、1、2、および 3 に割り当てました。 、 それぞれ。 Roadmap Epigenomics Consortium からの DNA 過敏症とヒストン マークのデータは、8 種類の細胞にわたる濃縮倍率シグナルを平均することによって要約されました。 濃縮倍率シグナルが 1 未満のゲノム領域はビン 0 に属し、残りは 3 つの同じサイズのビン、ビン 1 (最も濃縮されていない)、ビン 2 (中程度に濃縮)、ビン 3 (最も濃縮) に分割されました。 RNA 配列データもロードマップと FPKM から取得し、8 種類の細胞で平均化しました。 発現のない領域 (FPKM = 0) はビン 0 に属し、残りは 3 つの同じサイズのビン、ビン 1 (最も発現が少ない)、ビン 2 (中程度に発現)、およびビン 3 (最も発現) に分割されました。 複製時間は 8 つの ENCODE 細胞タイプを平均することによって処理され、ゲノム領域は 4 つの等しいサイズの領域に階層化されました。ビン 0 には最も遅い複製時間を持つ領域が含まれ、ビン 3 には最も早い複製時間を持つ領域が含まれます。 すべての特徴について、エンリッチメント スコアはビン 1 ~ 3 とビン 0 の比較によって計算されました。したがって、ビン 0 のエンリッチメント スコアの対数値は 0 に等しい必要があり、プロットには記述されません。

研究デザインの詳細については、この記事にリンクされている Nature Portfolio Reporting Summary を参照してください。

全ゲノム、DNA メチル化、およびトランスクリプトーム配列決定データは、アクセッション番号 2 で European Genome-phenome Archive に寄託されています。 EGAS00001006213 は一般的な研究用途に利用できます。 ヒト参照ゲノム GRCh37 は、https://www.ncbi.nlm.nih.gov/data-hub/genome/GCF_000001405.13 で入手できます。

分析用の社内スクリプトは GitHub (https://github.com/ju-lab/colon_LINE1) で入手できます。

MR ストラットン、PJ キャンベル、ペンシルベニア州フットリアル がんゲノム。 ネイチャー 458、719–724 (2009)。

論文 CAS PubMed PubMed Central ADS Google Scholar

Behjati, S. et al. 正常細胞のゲノム配列決定により、発生系統と変異プロセスが明らかになります。 ネイチャー 513、422–425 (2014)。

論文 CAS PubMed PubMed Central ADS Google Scholar

ジュ、YSら。 体細胞突然変異は、ヒトの初期胚における非対称な細胞動態を明らかにします。 ネイチャー 543、714–718 (2017)。

論文 CAS PubMed PubMed Central ADS Google Scholar

Park, S. et al. 体細胞突然変異から推測される初期ヒト胚形成におけるクローン動態。 ネイチャー 597、393–397 (2021)。

論文 CAS PubMed ADS Google Scholar

クーレンス、THH et al. 体細胞突然変異から推測されるヒト発生の広範な系統発生。 ネイチャー 597、387–392 (2021)。

論文 CAS PubMed ADS Google Scholar

Martincorena、I. et al. 腫瘍の進化。 正常なヒトの皮膚における体細胞突然変異の高い負荷と広範なポジティブセレクション。 サイエンス 348、880–886 (2015)。

論文 CAS PubMed PubMed Central ADS Google Scholar

Blokzijl、F. et al. 生涯にわたるヒト成体幹細胞における組織特異的変異の蓄積。 ネイチャー 538、260–264 (2016)。

論文 CAS PubMed PubMed Central ADS Google Scholar

マサチューセッツ州ロダトら。 老化と神経変性は、単一のヒトニューロンにおける突然変異の増加と関連しています。 サイエンス 359、555–559 (2018)。

論文 CAS PubMed ADS Google Scholar

Lee-Six、H. 他体細胞突然変異から推測される正常なヒトの血液の集団動態。 ネイチャー 561、473–478 (2018)。

論文 CAS PubMed PubMed Central ADS Google Scholar

ムーア、L.ら。 正常なヒト子宮内膜上皮の突然変異の状況。 ネイチャー 580、640–646 (2020)。

論文 CAS PubMed ADS Google Scholar

ムーア、L.ら。 ヒトの体細胞および生殖系列細胞の突然変異の状況。 Nature 597、381–386 (2021)。

論文 CAS PubMed ADS Google Scholar

エバート、P.ら。 多様なヒトゲノムをハプロタイプ解析し、構造変異を統合的に解析します。 サイエンス 372、eabf7117 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Sanchez-Luque、FJ et al. LINE-1 はヒトにおけるエピジェネティックな抑制を回避します。 モル。 セル 75、590 ~ 604。

論文 CAS PubMed Google Scholar

ランダー、ES et al. ヒトゲノムの初期配列決定と分析。 Nature 409、860–921 (2001)。

論文 CAS PubMed ADS Google Scholar

カザジアン、HH ジュニア モバイル要素: ゲノム進化の原動力。 サイエンス 303、1626–1632 (2004)。

論文 CAS PubMed ADS Google Scholar

トゥビオ、JMC 他がんにおける可動性 DNA。 がんゲノムにおける L1 レトロトランスポジションを介した非反復 DNA の広範な形質導入。 サイエンス 345、1251343 (2014)。

記事 PubMed PubMed Central Google Scholar

ロドリゲス・マーティン、B.ら。 全ゲノムの汎がん解析により、LINE-1 レトロトランスポジションによって促進されるドライバーの再構成が特定されます。 ナット。 ジュネット。 52、306–319 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

Brouha、B. et al. ホット L1 は、ヒト集団における逆転位の大部分を占めます。 手順国立アカデミー。 科学。 USA 100、5280–5285 (2003)。

論文 CAS PubMed PubMed Central ADS Google Scholar

ベック、CRら。 ヒトゲノムにおける LINE-1 レトロトランスポジション活性。 セル 141、1159–1170 (2010)。

論文 CAS PubMed PubMed Central Google Scholar

ガードナー、EJ et al. Mobile Element Locator Tool (MELT): 人口規模の移動要素の発見と生物学。 ゲノム研究所 27、1916 ~ 1929 年 (2017)。

論文 CAS PubMed PubMed Central Google Scholar

Chuang、NT et al. 集団規模での内因性可動因子によるヒトゲノムの突然変異誘発。 ゲノム研究所 31、2225–2235 (2021)。

記事 PubMed PubMed Central Google Scholar

カザジアン、HH Jr 他 L1 配列の新規挿入によって生じる血友病 A は、ヒトにおける突然変異の新しいメカニズムを表します。 Nature 332、164–166 (1988)。

論文 CAS PubMed ADS Google Scholar

オスタータグ、EM、カザジアン、HH ジュニア 哺乳類の L1 レトロトランスポゾンの生物学。 アンヌ。 神父牧師ジュネット。 35、501–538 (2001)。

論文 CAS PubMed Google Scholar

リー、Eら。 ヒトの癌における体細胞逆転位の状況。 サイエンス 337、967–971 (2012)。

論文 CAS PubMed PubMed Central ADS Google Scholar

クーファル、NG et al. ヒト神経前駆細胞における L1 レトロトランスポジション。 Nature 460、1127–1131 (2009)。

論文 CAS PubMed PubMed Central ADS Google Scholar

ベイリー、JK 他体細胞のレトロトランスポジションは、人間の脳の遺伝的状況を変化させます。 ネイチャー 479、534–537 (2011)。

論文 CAS PubMed PubMed Central ADS Google Scholar

エブロニー、GD 他。 人間の脳における L1 レトロ転位と体細胞突然変異の単一ニューロン配列解析。 セル 151、483–496 (2012)。

論文 CAS PubMed PubMed Central Google Scholar

エブロニー、GD 他。 内因性レトロエレメントを使用したヒト脳の細胞系統解析。 ニューロン 85、49–59 (2015)。

論文 CAS PubMed PubMed Central Google Scholar

アプトン、KR 他海馬ニューロンにおける遍在的な L1 モザイク現象。 セル 161、228–239 (2015)。

論文 CAS PubMed PubMed Central Google Scholar

アーウィン、J.A. et al. 健康な人間の脳の体細胞では、L1 関連ゲノム領域が欠失しています。 ナット。 神経科学。 19、1583–1591 (2016)。

論文 CAS PubMed PubMed Central Google Scholar

Youk、J.、Kwon、HW、Kim、R.、Ju、YS クローンオルガノイド技術による単細胞ゲノムの解剖。 経験値モル。 医学。 53、1503–1511 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

アレクサンドロフ、LB 他ヒト体細胞における時計のような突然変異プロセス。 ナット。 ジュネット。 47、1402–1407 (2015)。

論文 CAS PubMed PubMed Central Google Scholar

アレクサンドロフ、LB 他ヒトの癌における突然変異サインのレパートリー。 ネイチャー 578、94–101 (2020)。

論文 CAS PubMed PubMed Central ADS Google Scholar

Pleguezuelos-Manzano, C. et al. 遺伝毒性のある pks E. coli によって引き起こされる結腸直腸癌における突然変異サイン。 ネイチャー 580、269–273 (2020)。

論文 CAS PubMed PubMed Central ADS Google Scholar

スチュワート、C.ら。 ヒトにおける可動要素挿入多型の包括的なマップ。 PLoS ジュネット。 7、e1002236 (2011)。

論文 CAS PubMed PubMed Central Google Scholar

ミシガン州マッカーシーら。 複雑な形質に関するゲノム全体の関連性研究: コンセンサス、不確実性、および課題。 ナット。 ジュネ牧師。 9、356–369 (2008)。

論文 CAS PubMed Google Scholar

Iskow、RC et al. 内在性レトロトランスポゾンによるヒトゲノムの自然な突然変異誘発。 セル 141、1253–1261 (2010)。

論文 CAS PubMed PubMed Central Google Scholar

ENCODEプロジェクトコンソーシアム。 ヒトゲノムの DNA 要素の統合百科事典。 Nature 489、57–74 (2012)。

記事 ADS Google Scholar

Jachowicz、JW et al. 受精後の LINE-1 の活性化は、マウス初期胚における全体的なクロマチンのアクセス可能性を調節します。 ナット。 ジュネット。 49、1502–1510 (2017)。

論文 CAS PubMed Google Scholar

Messerschmidt, DM、Knowles, BB & Solter, D. 生殖系列および着床前胚におけるエピジェネティックな再プログラミング中の DNA メチル化ダイナミクス。 遺伝子開発 28、812–828 (2014)。

論文 CAS PubMed PubMed Central Google Scholar

Guo、H.ら。 ヒト初期胚の DNA メチル化の状況。 ネイチャー 511、606–610 (2014)。

論文 CAS PubMed ADS Google Scholar

スミス、ZDら。 ヒト着床前胚の DNA メチル化ダイナミクス。 ネイチャー 511、611–615 (2014)。

論文 CAS PubMed PubMed Central ADS Google Scholar

Mortazavi, A.、Williams, BA、McCue, K.、Schaeffer, L. & Wold, B. RNA-Seq による哺乳動物のトランスクリプトームのマッピングと定量。 ナット。 方法 5、621–628 (2008)。

論文 CAS PubMed Google Scholar

Medstorm, P.、van de Lagemaat, LN & Mager, DL ヒトゲノムにおけるレトロエレメント分布: 年齢と遺伝子への近さに関連する変異。 ゲノム研究所 12、1483–1495 (2002)。

論文 CAS PubMed PubMed Central Google Scholar

Ostertag, EM & Kazazian, HH Jr ツインプライミング: L1 レトロトランスポジションにおける反転を作成するための提案されたメカニズム。 ゲノム研究所 11、2059 ~ 2065 年 (2001 年)。

論文 CAS PubMed PubMed Central Google Scholar

Gilbert, N.、Lutz, S.、Morrish, TA & Moran, JV 培養ヒト細胞における L1 逆転位中間体の複数の運命。 モル。 細胞。 バイオル。 25、7780–7795 (2005)。

論文 CAS PubMed PubMed Central Google Scholar

ヴァン・デン・ハーク、JA 他 L1 レトロ転位は、ヒトの胎児発生の初期に発生する可能性があります。 ハム。 モル。 ジュネット。 16、1587–1592 (2007)。

論文 PubMed Google Scholar

グエン、H.ら。 結腸癌への進行中の視野欠損におけるPms2、ERCC1、Ku86、CcOIの欠損。 J.Vis. 経験値 1931 年 28 日 (2010)。

Google スカラー

アバスカル、F.ら。 体細胞突然変異を単一分子の解像度で観察します。 ネイチャー 593、405–410 (2021)。

論文 CAS PubMed ADS Google Scholar

ユーイング、AD 他。 ナノポアシーケンシングにより、包括的な転移因子エピゲノムプロファイリングが可能になります。 モル。 セル 80、915–928 (2020)。

論文 CAS PubMed Google Scholar

Lee-Six、H. 他正常な結腸直腸上皮細胞における体細胞突然変異の状況。 ネイチャー 574、532–537 (2019)。

論文 CAS PubMed ADS Google Scholar

リー、JJ-K. 他。 肺腺癌の変異履歴における癌遺伝子の再構成の追跡。 セル 177、1842 ~ 1857 年 (2019)。

論文 CAS PubMed Google Scholar

ICGC/TCGA 全ゲノムの汎がん解析コンソーシアム。 全ゲノムの汎がん解析。 Nature 578、82–93 (2020)。

記事 ADS Google Scholar

1000ゲノムプロジェクトコンソーシアムほか人間の遺伝的変異に関する世界的なリファレンス。 ネイチャー 526、68–74 (2015)。

記事 Google Scholar

マリック、S.ら。 Simons Genome Diversity Project: 142 の多様な集団からの 300 のゲノム。 Nature 538、201–206 (2016)。

論文 CAS PubMed PubMed Central ADS Google Scholar

バーグストローム、A. et al. 929 の多様なゲノムからヒトの遺伝的変異と集団の歴史についての洞察。 サイエンス 367、eaay5012 (2020)。

記事 PubMed PubMed Central Google Scholar

Lorente-Galdos, B. et al. 汎アフリカのサンプルセットの全ゲノム配列分析により、絶滅した現生人類の基礎集団からサハラ以南の集団への古風な遺伝子の流れが明らかになりました。 ゲノムバイオル。 20、77 (2019)。

記事 PubMed PubMed Central Google Scholar

藤井正人、俣野正人、南木和樹、佐藤哲也、エレクトロポレーションを用いたヒト腸オルガノイドの効率的な遺伝子工学。 ナット。 プロトック。 10、1474–1485 (2015)。

論文 CAS PubMed Google Scholar

ジェイガー、M.ら。 オルガノイド培養物の全ゲノム配列決定による単一ヒト成人幹細胞における変異蓄積の測定。 ナット。 プロトック。 13、59–78 (2018)。

論文 CAS PubMed Google Scholar

Li, H. & Durbin, R. Burrows-Wheeler 変換による高速かつ正確なショートリード アライメント。 バイオインフォマティクス 25、1754–1760 (2009)。

論文 CAS PubMed PubMed Central Google Scholar

Faust、GG & Hall、IM SAMBLASTER: 高速重複マーキングと構造バリアント読み取り抽出。 バイオインフォマティクス 30、2503–2505 (2014)。

論文 CAS PubMed PubMed Central Google Scholar

Van der Auwera、GA et al. FastQ データから信頼性の高いバリアント呼び出しまで: ゲノム解析ツールキットのベスト プラクティス パイプライン。 カー。 プロトック。 バイオインフォマティクス 43、11.10.11–11.10.33 (2013)。

Google スカラー

コボルト、DC et al. VarScan 2: エクソーム配列決定によるがんにおける体細胞変異とコピー数変化の発見。 ゲノム研究所 22、568–576 (2012)。

論文 CAS PubMed PubMed Central Google Scholar

ラウシュ、T.ら。 DELLY: 統合されたペアエンド分析とスプリットリード分析による構造的変異の発見。 バイオインフォマティクス 28、i333–i339 (2012)。

論文 CAS PubMed PubMed Central Google Scholar

ロビンソン、JT 他。 統合ゲノミクスビューア。 ナット。 バイオテクノロジー。 29、24–26 (2011)。

論文 CAS PubMed PubMed Central Google Scholar

Chu、C.ら。 複数のシーケンシング技術を使用した、転移因子挿入の包括的な同定。 ナット。 共通。 12、3836 (2021)。

論文 CAS PubMed PubMed Central ADS Google Scholar

イスラム、SMA 他 SigProfilerExtractor を使用した de novo 抽出により、新規の突然変異シグネチャを明らかにします。 セルゲノミクス 2、100179 (2022)。

論文 CAS PubMed PubMed Central Google Scholar

Teh、YW、Jordan、MI、Beal、MJ & Blei、DM 階層ディリクレ プロセス。 混雑する。 統計准教授 101、1566–1581 (2006)。

記事 MathSciNet CAS MATH Google Scholar

Alexandrov, LB、Nik-Zainal, S.、Wedge, DC、Campbell, PJ & Stratton, MR ヒトのがんに作用する突然変異プロセスのサインを解読する。 Cell Rep. 3、246–259 (2013)。

論文 CAS PubMed PubMed Central Google Scholar

ミッチェル、E.ら。 人間の生涯にわたる造血のクローン動態。 Nature 606、343–350 (2022)。

論文 CAS PubMed PubMed Central ADS Google Scholar

Li、H. Minimap2: ヌクレオチド配列のペアワイズ アライメント。 バイオインフォマティクス 34、3094–3100 (2018)。

論文 CAS PubMed PubMed Central Google Scholar

Martin, M. Cutadapt は、ハイスループット シーケンシング リードからアダプター シーケンスを削除します。 EMBnet J 17、10 (2011)。

記事 Google Scholar

Krueger, F. & Andrews, SR Bismark: Bisulfite-Seq アプリケーション用の柔軟なアライナーおよびメチル化コーラー。 バイオインフォマティクス 27、1571–1572 (2011)。

論文 CAS PubMed PubMed Central Google Scholar

Kundaje, A. et al. 111 の参照ヒトエピゲノムの統合分析。 ネイチャー 518、317–330 (2015)。

論文 CAS PubMed PubMed Central Google Scholar

Supek, F. & Lehner, B. クラスター化された突然変異シグネチャにより、エラーを起こしやすい DNA 修復が活性遺伝子に対する突然変異をターゲットにしていることが明らかになりました。 セル 170、534–547 (2017)。

論文 CAS PubMed Google Scholar

リファレンスをダウンロードする

S. Park、R. Kim、B.-K に感謝します。 Koo 氏と GJ Faulkner 氏にコメントと議論をしていただきました。 この研究は、韓国政府から資金提供を受けた韓国国立研究財団によって支援されました(YSJ への番号 NRF-2020R1A3B2078973 および HWK への NRF-2021R1G1A1009606)。 韓国保健産業開発研究院を通じたMD-PhD/医療科学者研修プログラムからの助成金(韓国保健福祉省の資金提供)。 ソ・ギョンベ財団(YSJ の番号 SUHF-18010082)によるもの。

これらの著者は同様に貢献しました: Chang Hyun Nam、Jeonhwan Youk

韓国科学技術院、大韓民国大田市医科学工学大学院

チャン・ヒョンナム、ジョンファン・ユク、ジュノ・リム、スア・オ、ヘインウォン、ユナ・リー、ジンジュ・ハン、ヨン・ソクチュ

Genome Insight, Inc.(韓国、大田)

ジョンファン・ユク、ジョンヨン・キム、ジュノ・リム、ヨン・ソクチュ

ソウル国立大学病院内科、ソウル、韓国

ジョンファン・ユク&ヒョンジョン・イ

韓国科学技術情報院、韓国大田市

ジョン・ウ・パク & ジューンホーク・リー

ソウル国立大学医学部外科、ソウル、韓国

パク・ジウォン、チョン・スンヨン、キム・ミンジョン

ソウル大学生命科学部、ソウル、韓国

イ・ドンソン

韓国、大邱、慶北大学校医学部解剖学教室

オ・ジウォン

延世大学医学部解剖学教室、ソウル、韓国

オ・ジウォン

高麗大学医科大学核医学教室、ソウル、韓国

クォン・ヒョヌ

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

JYとYSJがこの研究を発案した。 JY、HWK、JYK、HW、および YL は、結腸直腸上皮細胞のクローン増殖のプロトコル全体を開発し、実験を実施しました。 HJL、Ji.WP、S.-YJ、MJK は患者から結腸直腸サンプルと臨床病歴を収集しました。 SAOはゲノム解読を実施した。 CHN と JY はほとんどのゲノム解析と統計解析を実施し、J.Lim、HWK、YSJ の貢献により、Ju.WP と J.Lee が大規模なゲノムデータ管理に貢献しました。 D.-SL、JWO、JH がデータ解釈に参加しました。 CHN、HWK、YSJ は、すべての著者からの寄稿を受けて原稿を執筆しました。 YSJが研究全体を監修した。

ヒョヌ・クォン、ミンジョン・キム、ヨンソクチュへの通信。

YSJ は Genome Insight, Inc. の共同創設者兼最高経営責任者です。残りの著者は競合する利害関係を宣言していません。

Nature は、この研究の査読に貢献してくれた Trevor Graham、Jose Tubio、およびその他の匿名の査読者に感謝します。 査読者レポートが利用可能です。

発行者注記 Springer Nature は、発行された地図および所属機関の管轄権の主張に関して中立を保っています。

a、クローンの平均配列決定範囲および体細胞変異のピークVAFを示す散布図。 ほとんどのクローンは約 0.5 のピーク VAF を示し、これらが単一の創始細胞から確立されたことを示しています。 b、887個の正常クローンの染色体レベルのコピー数の変化。 重大なゲノム全体の異数性は検出されず、正常な単一細胞のクローン増殖中のゲノムの安定性が裏付けられました。 c、各バイオインフォマティクスツールによって検出されたsoL1Rの数を示すベン図。 d、レトロ転位の 2 つのゲノム フットプリント、ポリ A テールと標的部位の重複を説明する概略プロット。 RT ボディ、レトロトランスポーズドボディ。 TSD、ターゲットサイトの重複。 e, 挿入部位における標的部位の長さの分布。 正および負の標的部位の長さは、それぞれ標的部位の重複および欠失を示します。 soL1R、体細胞L1逆転位。 f、正常な結腸上皮細胞からの406個のクローンにおける構造的変異の数。 TT 反転、テールツーテール反転。 HH 反転、ヘッドツーヘッド反転。

a、結腸直腸クローンにおける内因性点突然変異の平均数と19人の個体におけるサンプリング年齢との間の線形回帰。 青い線は回帰直線 (年間 44.6 個の点突然変異) を表し、影付きの領域はその 95% 信頼区間を示します。 この割合は、結腸で以前に推定された割合と一致しています (Lee-Six et al.、Ref. 51 による年間 43.6 個の突然変異)。 b、c、両側ウィルコクソン順位和検定による、正常な結腸直腸クローンを持つ19人の個人における、性別を超えた個人当たりのsoL1Rの平均数(b)と結腸直腸陰窩の解剖学的位置(c)の比較。 箱ひげ図は、四分位範囲 (IQR) の中央値をひげ付きで示します (1.5 x IQR)。 ns、重要ではありません。 d – i、各結腸直腸クローンのsoL1Rの数と体細胞点突然変異の数との関係(d)、テロメア長(e)、体細胞SBS1 SNVの数(f、5-メチルシトシンの脱アミノ化による時計様突然変異) )、体細胞 SBS5+SBS40 SNV の数 (g、未知のプロセスによる時計様変異)、体細胞 SBS18 SNV の数 (h、活性酸素種による損傷の可能性)、および体細胞 SBS88 SNV の数 (i、損傷) pks+大腸菌由来のコリバクチンによる)。 明らかな関連性は見つかりませんでした。 j、さまざまな臓器にわたるさまざまな数の soL1R を持つ LCM ベースのパッチの数。 LCM、レーザーキャプチャマイクロダイセクション。

結腸直腸クローンおよび一致する癌組織の初期系統発生が、クローン間で soL1R を共有する 7 人の個体で示されています。 枝の長さは、体細胞点突然変異の数によって測定される分子時間に比例します。 枝特異的な点突然変異の数を数字で示します。 枝の端にある黒丸は、正常クローン (黒丸) と癌クローン (赤丸) を表します。 黒丸内の数字は、クローンから検出されたsoL1Rの数を示します。 影付きの領域は、soL1R を共有する体細胞系統を示します。 共有された soL1R 挿入のゲノム位置と soL1R を保有する血球の割合がゲノム座標と円グラフで示されます。 右側の色付きのバーは、体細胞点突然変異に起因する突然変異サインの割合を表します。 オレンジ色のひし形は、結腸直腸クローン全体で形質導入イベントを引き起こした L1 ソース (起源) を示します。

結腸直腸クローンおよび対応する癌組織の初期系統発生が、クローン間で共有された soL1R を持たない 12 人の個体で示されています。 枝の長さは、体細胞点突然変異の数によって測定される分子時間に比例します。 枝特異的な点突然変異の数を数字で示します。 枝の端にある黒丸は、正常クローン (黒丸) と癌クローン (赤丸) を表します。 黒丸内の数字は、クローンから検出されたsoL1Rの数を示します。 影付きの領域は、共有された Alu 挿入を持つ体細胞系統を示します。 共有された Alu 挿入のゲノム位置と Alu 挿入を持つ血球の割合がゲノム座標と円グラフで示されます。 右側の色付きのバーは、体細胞点突然変異に起因する突然変異サインの割合を表します。 オレンジ色のひし形は、結腸直腸クローン全体で形質導入イベントを引き起こした L1 ソース (起源) を示します。

HC05 腫瘍は 22q12.1 (中央) に rc-L1 を持ちますが、これは HC05 の生殖系列には見つかりません (血​​液、左)。 rc-L1 (22q12.1-1) は腫瘍内の 5q31.1 (右) で形質導入イベントを引き起こし、新たに体細胞的に獲得された rc-L1 からの二次形質導入を示唆しています。 提案されたイベントの順序は、左下のパネルにまとめられています。 SoL1R、体細胞 L1 レトロトランスポジション。

メチル化および発現量が異なるrc-L1のプロモーター領域のDNAメチル化状態とリードスルーRNA発現量との関係を個体ごとに記載する。 これには、個体内の特定の rc-L1 のメチル化および発現レベルに関する情報を持つクローンが 10 個を超える場合のみが含まれます。 ピアソン検定の相関係数と P 値について説明します。 青い線は回帰直線を表し、影付きの領域はその 95% 信頼区間を示します。 FPKM、100 万あたりの転写産物の 1 キロベースあたりのフラグメント。

132 個の正常結腸直腸クローンおよび 9 人の患者からの 7 個の線維芽細胞クローンにおける 48 個の rc-L1 の DNA メチル化状態、リードスルー RNA 発現レベル、発生系統が表示されます。 これには、我々の結腸直腸コホートで活性を示した 27 個の rc-L1 と、少なくとも 5 つの結腸直腸クローンで脱メチル化プロモーターを保持する 21 個の rc-L1 が含まれます。 系統発生は点突然変異の数 (分子時間) とともに左側に表示されます。 PAF、集団対立遺伝子頻度。 FPKM、100 万あたりの転写産物の 1 キロベースあたりのフラグメント。 rc-L1、レトロトランスポジション能力のある L1。

a、ENCODE からのさまざまな組織にわたる L1 プロモーター DNA メチル化の平均レベル。 図3bに記載されている30個のrc-L1のうち、すべての組織で十分な読み取り値を持つ12個のrc-L1のみが選択されました。 b、結腸直腸クローンにおける可変メチル化レベルを有する6つの参照rc-L1の100kbの上流および下流領域のメチル化プロファイル。 rc-L1 の領域は黄色のボックスで強調表示されます。 CpG部位のゲノム座標と順序を上のパネルに示します。 中央のパネルは、開いたプロモーター (オレンジ色) と閉じたプロモーター (青色) を持つ結腸直腸クローンにおけるメチル化 CpG の割合を示しています。 下のパネルは、中央のパネルに示されているメチル化 CpG の割合の違いを示しています。 mCpG、メチル化CpG。 c、各個体における正常な結腸直腸クローンのゲノム全体のメチル化レベルを示す散布図。

a、正常な結腸直腸クローンおよび19の一致する結腸直腸癌におけるsoL1R標的部位のゲノム全体にわたる分布。 バーは、5 Mb サイズのステップを持つ 10 Mb スライディング ウィンドウ内の L1 挿入の数を表します。 b、L1挿入率とさまざまなゲノム特徴との関連性。 ドットは、各特徴のビン 1 ~ 3 とビン 0 を比較することによって計算されたエンリッチメント スコアの対数値を表します。 L1 EN モチーフ、L1 エンドヌクレアーゼ ターゲット モチーフ; DHS、DNase I 過敏症部位。 c、L1挿入部位から最も近い遺伝子までの距離と、ランダムな部位からの距離の分布。 d – f、L1挿入の有無にかかわらず結腸直腸クローンにおける最も近い点突然変異(d)、遺伝子発現レベル(e)、および近くの領域のメチル化率(f)までの距離の分布。 TPM、100 万あたりのトランスクリプト。 g. 挿入部位付近に発現遺伝子を同時挿入したsoL1Rの例。 示唆的なメカニズムが下のパネルに示されています。 SoL1R、体細胞 L1 レトロトランスポジション。 TSD、ターゲットサイトの重複。 RT ボディ、レトロトランスポーズドボディ。 h. 異なるゲノム標的部位で 2 つの形質導入イベントを持つが、同じ長さの固有の配列を持つクローンの例。 示唆的なメカニズムが下のパネルに示されています。

a, soL1R 速度は、結腸直腸系統の腫瘍形成中に加速されます。 EPM、内因性点突然変異。 b、406個の正常な結腸直腸クローンおよび19個の一致する結腸直腸癌におけるL1挿入サイズの分布。 c、406個の正常結腸直腸クローンおよび19個の一致する結腸直腸癌における頭部変異を伴うsoL1Rイベントの割合。 d – g、TP53不活化変異(左)、マイクロサテライト不安定性(中央)、およびゲノム不安定性(染色体不安定性、右)の有無にかかわらず、結腸直腸がん間のsoL1Rの数。 括弧内にサンプル番号を示します。 両側 t 検定 (左、中央) と線形回帰 (右) からの P 値が示されました。 箱ひげ図は、四分位範囲 (IQR) の中央値をひげ付きで示します (1.5 x IQR)。 青い線は回帰直線を表し、影付きの領域はその 95% 信頼区間を示します。 両側多変量回帰からの P 値は右側の空間に表されました。 ns、重要ではありません。 d. 19 個の結腸直腸癌組織が一致しました。 e. 19 の一致する結腸直腸癌組織と 52 の PCAWG 結腸直腸癌組織。 f. PCAWG の 19 の一致する結腸直腸癌組織と 4 つの癌型 (結腸直腸腺癌、食道腺癌、肺扁平上皮癌、頭頸部扁平上皮癌) では、PCAWG の 40 の組織型の中でより高い soL1R 負荷が示されました。 g. 19 件の結腸直腸癌組織がすべてのホワイトリスト PCAWG サンプルと一致しました。

この研究では、soL1R 負荷と、TP53 不活化変異や染色体不安定性などの古典的ゲノム不安定性との関係が、PCAWG ホワイトリストサンプル (n = 2,677) および 19 件の一致する結腸直腸癌で分析されました。 症例数が 10 件未満のがんの種類は考慮されませんでした。 a、体細胞のTP53不活化変異とsoL1Rイベントの数。 箱ひげ図は、四分位範囲 (IQR) の中央値をひげ付きで示します (1.5 x IQR)。 各組織型の症例数を括弧内に示した。 両側 t 検定からの P 値が示されました。 NA、利用できません。 b. 各癌タイプにおける染色体の不安定性 (ゲノム再構成) と soL1R イベントの数の間の線形回帰。 青い線は回帰直線を表し、影付きの領域はその 95% 信頼区間を示します。 線形回帰からの R 二乗値と P 値を各パネルに表しました。

このファイルには、補足説明 1 (クローンにおける潜在的な培養関連 L1 逆転位イベント)、補足説明 2 (soL1R の高感度検出のためのゲノミクス技術)、補足説明 3 (プロモーターのメチル化と rc-L1 のリードスルー発現のパノラマ)、補足説明が含まれています。参考文献、補足図。 1 ~ 5 および補足表 1 ~ 6 の凡例。

サンプルの人口統計学的特徴と突然変異的特徴。 表には、患者の年齢と性別、サンプルが採取された解剖学的位置、各サンプルの変異負荷とサインなど、研究内の各サンプルに関する情報が表示されます。

この研究で特定された体細胞逆転位の注釈。 表には、ゲノム座標、鎖の方向、挿入のサイズとタイプ、各挿入のサポートリード数など、研究で特定された各体細胞逆転位事象に関する詳細情報が示されています。

LCM ベースのパッチで特定された体細胞逆転位の注釈。 この表には、ゲノム座標、鎖の方向、挿入のサイズとタイプ、各挿入のサポートリード数など、LCM ベースのパッチで特定された各体細胞逆転位イベントに関する詳細情報が表示されます。

特性を持つソース要素のリスト。 この表には、ゲノム座標、サイトバンド、鎖方向、集団対立遺伝子頻度、L1 サブファミリー情報、および切断型変異のリストなど、研究で分析された 276 個の rc-L1 に関する情報が含まれています。 さらに、この表は、研究で検査されたすべての結腸直腸サンプルにおける各 rc-L1 からの伝達イベントの数を示しています。

soL1R とがんにおけるゲノム不安定性の特徴の関連性。 この表は、組織学情報、体細胞L1レトロトランスポジションと構造変異の数、サンプルがTP53不活性化変異またはマイクロサテライト不安定性を保有しているかどうか、および標準的なドライバー変異のリストを含む、研究で分析された結腸直腸癌サンプルおよびPCAWGホワイトリストに登録された癌に関する情報を示しています。

結腸直腸上皮細胞用のオルガノイド培地組成物。 表は結腸直腸上皮細胞のオルガノイド培地の組成を示しています。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Nam、CH、Youk、J.、Kim、JY 他正常な結腸直腸上皮における広範な体細胞L1レトロ転位。 ネイチャー 617、540–547 (2023)。 https://doi.org/10.1038/s41586-023-06046-z

引用をダウンロード

受信日: 2022 年 5 月 18 日

受理日: 2023 年 4 月 4 日

公開日: 2023 年 5 月 10 日

発行日: 2023 年 5 月 18 日

DOI: https://doi.org/10.1038/s41586-023-06046-z

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。