观察这个蛋白序列,MMSRTPSAEPPSDPSSGPPSDPSSGPSSGPPAAQRPLRVLT...

作成日: 2025年12月10日

使用モデル GPT-5.1 Thinking by Chat01

質問

观察这个蛋白序列,MMSRTPSAEPPSDPSSGPPSDPSSGPSSGPPAAQRPLRVLTARHRHEAHRAATPLELFFDLCFVVAIAQAGVQLVHSVAESHAGEGVLDYAMVFFAIWWAWMNFTWFASAYDNDDVPYRLVTLVQIAGVLVLAAGVSRAFEEHDWTAVVIGYVIMRVALSAQWLRAARCAPPPERAMALKYAGGVLVCQVGWLGLLLLPEGSRGWLFLVMVVLELSVPVLAERRHRSSWHPHHIAERYGLLTIIVLGETIAAATVAVKSGIDENDALGELLPIAAGGLLIVFAAWWVYFVVPVHGHLRSSRQAFLWGYGHYLVFASAAAIGAGLEVAVEQAVGEAHISTLAASASVTLPTALFLLTVWALHARHFKVGVAEQLVLPTAALLVVCCTFVGDLAVLAAGLVLAAAVATGVMLTARRTAPGRARTTPAS,对此蛋白质序列进行详细的分析、结构预测,预测其功能,并与Hxt2的序列和三维结构进行比较。输出比对结果。

思考

undefined

思考

undefined

思考

undefined

思考

undefined

思考

undefined

思考

undefined

思考

undefined

思考

undefined

思考

undefined

思考

undefined

思考

undefined

思考

undefined

思考

undefined

思考

undefined

思考

Gathering citations and rounding figures

I’m rounding the alignment percentages to 21.4% and 47.4%, which would be written in Chinese as “约21%” and “约47%,” respectively. I'll also cite Hxt2 as a high-affinity glucose transporter from reputable sources, and confirm its length as 541 amino acids. Additionally, I'll reference the yeast hexose transporter family from a review.

Thought for 6m 51s

回答

先给个结论版总结,然后下面是细节和序列比对。


1. 你的序列的基本特征

序列:426 aa

text
MMSRTPSAEPPSDPSSGPPSDPSSGPSSGPPAAQRPLRVLTARHRHEAHRAATPLELFFDLCFVVAIAQAGVQLVHSVAESHAGEGVLDYAMVFFAIWWAWMNFTWFASAYDNDDVPYRLVTLVQIAGVLVLAAGVSRAFEEHDWTAVVIGYVIMRVALSAQWLRAARCAPPPERAMALKYAGGVLVCQVGWLGLLLLPEGSRGWLFLVMVVLELSVPVLAERRHRSSWHPHHIAERYGLLTIIVLGETIAAATVAVKSGIDENDALGELLPIAAGGLLIVFAAWWVYFVVPVHGHLRSSRQAFLWGYGHYLVFASAAAIGAGLEVAVEQAVGEAHISTLAASASVTLPTALFLLTVWALHARHFKVGVAEQLVLPTAALLVVCCTFVGDLAVLAAGLVLAAAVATGVMLTARRTAPGRARTTPAS

用简单计算可得:

  • 长度:426 aa
  • 估算分子量:约 45 kDa(未计修饰)
  • 疏水氨基酸比例:约 54%(A, V, L, I, M, F, W, Y 等)
  • 碱性残基 (K/R/H):约 10%

前 N 端大约 30–40 aa 为 Ser/Pro/Thr 富集、带正电的低复杂区,没有典型信号肽那种长疏水段;真正的第一个强疏水段出现在 ~50 aa 以后,这非常像典型 多跨膜内膜蛋白 的 N 端胞质尾 + 第一跨膜螺旋的布局。

在序列中可以找到一个保守的 N-X-S/T N-糖基化位点

  • N103-F-T:NFT —— 如果该蛋白在等价于“胞外面”的一侧暴露(例如质膜外侧或内膜腔侧),这里很可能被糖基化。

这些特性整体非常符合 主要转运蛋白超家族(MFS) 中糖转运蛋白的序列风格。(Wikipedia)


2. 跨膜结构与拓扑预测

我用 Kyte–Doolittle 滑动窗口做了一个粗略疏水性分析(窗口 19 aa),在序列中看到了多段长疏水峰值,集中在 50–80, 115–140, 180–225, 235–300, 335–415 等区域,这些区段基本被连续的疏水残基(I, V, L, F, M, A)占据,长度 20 aa 左右,非常像跨膜 α-螺旋。

虽然简化算法无法精确拆成 12 段,但从模式上看:

  • 在 426 aa 的范围内容纳 10–12 个跨膜螺旋 是完全合理的;
  • N 端和 C 端都富含 Lys/Arg(例如 N 端 30–40 aa 的多个 R/K,C 端的 TARRTAPGRARTTPAS),符合 “正电在内侧” 的拓扑法则,说明 N 端与 C 端都在胞质侧
  • 中间的大多数长疏水段之间由短的极性 loop 分隔,符合 MFS 折叠:两组 6 螺旋束(N 端半 + C 端半) 的典型布局。(EMBL-EBI)

拓扑预测(概念图):

  • N 端胞质尾(1–~45 aa):低复杂区 + 若干 Lys/Arg,可能参与调控或与其它蛋白相互作用;
  • 随后 10–12 个跨膜螺旋:大致分布在 ~50–400 aa 之间;
  • C 端短胞质尾(~410–426 aa):带有 Lys/Arg 簇,可能作为内侧调控或锚定信号。

3. 3D 结构层面:与典型 MFS / 糖转运蛋白的比较

虽然我没有直接对该序列跑 AlphaFold,但可以借助已知 MFS 糖转运蛋白的结构来推断:

  • 人 GLUT1 的晶体结构(PDB: 4PYP)展示了 12 跨膜 α-螺旋构成的 MFS 折叠,两组 6 螺旋呈伪对称排布,形成一个中央底物结合腔。(RCSB PDB)
  • 大肠杆菌 D-xylose/H⁺ 共转运蛋白 XylE(PDB: 4GBY)结构同样是 12 螺旋的 MFS 折叠,并且直接被证明为 GLUT 家族的同源物。(RCSB PDB)

你的序列在:

  • 跨膜螺旋数量和分布
  • 疏水核心高度富集的 Leu/Ile/Val/Phe
  • 中央几个 W/F/Y 富集段(例如 WWAWMNF TWFAS

方面都和上述 MFS 糖转运蛋白高度相似,因此非常合理的 3D 结构预测是:

该蛋白采用 MFS sugar porter 典型折叠:12 条跨膜 α-螺旋组成的摇摆式“rocker-switch”结构,中央形成一个对底物开放的空腔,通过构象改变在“外向开放”和“内向开放”之间切换,实现底物的“协助扩散”或质子共转运。

如果用 Hxt2 或 GLUT1/XylE 作为模板做同源建模,一个合理的预期是:这条序列在 12 条跨膜螺旋位置上会与模板有良好重叠,而 N/C 端尾部的结构可能较不保守、预测置信度较低。


4. Hxt2 的已知信息(用来做比较)

Hxt2(S. cerevisiae,基因 YMR011W)是酵母的一个典型 高亲和力葡萄糖转运蛋白:(Yeast Genome Database)

  • 长度:541 aa(多家数据库/试剂公司一致给出 541 aa 的全长蛋白,P23585)。(MyBioSource)
  • 家族:MFS(major facilitator superfamily),属 sugar porter 亚家族;
  • 功能:在低葡萄糖浓度环境下负责高亲和力葡萄糖/果糖/甘露糖转运,是酵母多种 HXT 转运蛋白中的一个成员;(Wikipedia)
  • 拓扑:预测和功能研究表明含 12 个跨膜螺旋,N/C 端都在胞质侧,中间由几个较大的胞外/胞内 loop。(OUP Academic)
  • 3D 模型:在 AlphaFold 数据库里有 HXT2 的预测结构(条目 P23585),其折叠为典型 MFS sugar porter,与 GLUT1/XylE 的 12 螺旋骨架高度同源。(AlphaFold)

5. 你的蛋白 vs Hxt2:序列比对与定量相似性

我把你的序列和 Hxt2(P23585, 541 aa)的氨基酸序列做了一次 全局 Needleman–Wunsch 比对(简单打分:match +1,mismatch −1,gap −2)。

得到的主要结论:

  1. 整体序列身份 (identity)

    • 全长比对长度:543 aa(含 gap)
    • 完全一致的氨基酸位点:116
    • 整体身份 ≈ 21%
  2. 疏水核心位点的身份
    把对齐后两条序列都为疏水氨基酸(A, I, L, M, F, W, V, Y)的位置拿出来统计:

    • 此类疏水对数:190 位
    • 其中完全相同的残基对:90
    • 疏水核心身份 ≈ 47%

    也就是说,虽然全长只有 ~21% 身份,但在跨膜螺旋的疏水核心位置上,接近一半的残基是完全保守的——这是典型“远缘同源蛋白”的特征,说明两者很可能属于 同一结构家族(MFS sugar porter)。(ScienceDirect)

  3. N-糖基化位点对比

    • Hxt2:在 82 位和 299 位附近有两个 N-X-S/T 模体(NQT, NAS),被认为位于胞外 loop 上,可能参与糖基化。(MyBioSource)
    • 你的蛋白:有一个清晰的 N103FT 模体,同样可能位于等价的胞外 loop,被 N-糖基化。

    这也支持 拓扑类似、loop 长度略有不同 的观点。

  4. N/C 端长度与调控尾的差异

    • Hxt2 全长 541 aa,比你的蛋白多出 ~115 aa;其额外长度主要体现在 N 端和 C 端的尾部,这些区域被认为与酵母中特异性的表达调控、内吞和降解信号有关。(Yeast Genome Database)
    • 你的蛋白 N 端尾约 40 aa、C 端尾约 15 aa,相对 更为紧凑,提示:
      • 更偏向“纯转运器”,而非复杂调控的传感器;
      • 可能来自 非酵母 生物(例如细菌或其它真菌),缺乏酵母特有的长调控尾。

6. 具体比对结果(节选)

下面是我算出的 全局序列对齐(上:你的蛋白;下:Hxt2;中间 | 表示完全匹配的残基)。为便于阅读按 80 列分段展示:

text
Pos 1 Q: M-MSRTPSAEPPS-DPS--SGP-PSDPSSGPSSGPPAAQRPLRVLTARHRHEAHRAATPLEL---FFDLCF-VVAIAQAG | | | | | | | | | | | | | | | | H: MSEFATSRVEGSSQQTSIHSTPIVQKLETDESPIQTKSEYTNAELPA-KPIAAYWTVICLCLMIAFGGFVFGWDTGTISG Q: -V-Q---LVHSVAESHAGEGVL-D---YAMV-FFAIWWAWMNFTWFASAYDNDDVPYRL--VTLVQIAG-VLVLA--AGV H: FVNQTDFKRRFGQMKSDGTYYLSDVRTGLIVGIFNIGCAFGGLT-LGRLGDMYGRRIGLMCVVLVYIVGIVIQIASSDKW Q: SRAF-EEHDWTAVVIG-YVIMRVALS--A-QWLR---AARCAPPPERAMALKY---AG-GVLVCQVGW---LGL--LLLP H: YQYFIGRIISGMGVGGIAVLSPTLISETAPKHIRGTCVSFYQLMITLGIFLGYCTNYGTKDYSNSVQWRVPLGLNFAFAI Q: EGSRGWL-------FLV-MVVLE-----L--SVPVLAERRHRSSWHPHHIA----ER-YGLLTIIVLGETIAAATVAVKS H: FMIAGMLMVPESPRFLVEKGRYEDAKRSLAKSNKVTIEDPSIVAEMDTIMANVETERLAGNASWGELFSNKGAILPRVIM Q: G--IDENDALGELLPIAAGGLLIVFA-AWWVYF-VVPVHG--HLRSSRQA----FLWGYGHYLVFASA-AAI--GAGLEV H: GIMIQSLQQLTGNNYFFYYGTTIFNAVGMKDSFQTSIVLGIVNFASTFVALYTVDKFGRRKCLLGGSASMAICFVIFSTV Q: AV--EQAVGEAHISTLAASASVTLPTALFLLTVWALHARHFKVGVAE--QL-V----LPTA--A-----LLVVCCT-F-- H: GVTSLYPNGKDQPSSKAAGNVMIVFTCLFIFFFAISWAPIAYVIVAESYPLRVKNRAMAIAVGANWIWGFLIGFFTPFIT Q: --VG--DLAVLAAGLV-----LAAAV-AT-G-----V--M--LTARRTAPG--RARTTPAS-- H: SAIGFSYGYVFMGCLVFSFFYVFFFVCETKGLTLEEVNEMYVEGVKPWKSGSWISKEKRVSEE

可以看到:

  • 跨膜区段(大块疏水残基)之间对齐良好,大量 L/I/V/F/M 在两条序列中对上;
  • loop 区域(尤其是 N/C 端)存在很多 gap、插入和缺失,是长度差异的主要来源;
  • 在 TM 核心处有很多完全保守的残基(|),这些通常与结构稳定性和底物识别有关。

7. 功能预测:它可能做什么?

综合上面的拓扑、结构与 Hxt2 同源性分析:

  1. 蛋白类型

    • 多跨膜、12 螺旋左右、N/C 端胞质、带 N-糖基化位点 → 强烈指向 MFS 家族内的糖转运蛋白(sugar porter)。(Wikipedia)
  2. 可能的底物

    • Hxt2 属于 hexose(葡萄糖/果糖/甘露糖等)转运蛋白,Km 在 1.5–10 mM 范围,是高/中亲和力转运器;(Wikipedia)
    • 你的序列与 Hxt2 只有远缘同源(~21% identity),不能凭序列直接断言就是葡萄糖转运器,但非常可能是:
      • 六碳糖(葡萄糖/果糖/甘露糖)转运蛋白,或者
      • 同一结构家族中其它 单糖/戊糖(如木糖)转运蛋白。(Europe PMC)
  3. 转运机制

    • MFS sugar porter 的经典机制是 交替通道模型 (alternating access):蛋白在外向开放、底物结合、闭合、内向开放、底物释放几个状态之间来回切换,其 3D 构架与 GLUT1/XylE 的结构高度类似。(RCSB PDB)
    • 你的序列在 TM 核心水平上的保守性支持它采用相同的构象变化模式。
  4. 是否是质子共转运?

    • 仅凭当前序列和 Hxt2 的远缘相似,我们无法区分它是:
      • 类似 GLUT/Hxt2 的 促进扩散型 uniporter,还是
      • 类似 XylE 的 H⁺ 共转运体(symporter)。(EMBL-EBI)
    • 这需要进一步的 功能实验(底物摄取实验、电位依赖性、pH 梯度实验) 来确认。

8. 与 Hxt2 结构和功能的总体比较结论

相同点:

  • 都是 多跨膜 α-螺旋膜蛋白,拓扑上非常接近 MFS sugar porter;
  • 疏水核心区有较高残基保守性(疏水位点 ~47% identity),支持折叠类型相同;
  • 都有 N-糖基化模体,说明存在相似的跨膜拓扑与胞外 loop 布局。

不同点:

  • 你的蛋白明显更短(426 vs 541 aa),N/C 端尾巴大幅缩短,提示其调控层面可能比 Hxt2 简单;
  • 序列整体身份只有 ~21%,说明它更可能是 同一家族的远缘成员,而不是 Hxt2 的近缘直系同源;
  • 具体决定高亲和力葡萄糖转运的关键残基(Hxt2 在 TM1, 5, 7, 8 的几个氨基酸位点)是否在你的蛋白中保留,不能简单一一对应,需要更严谨的同源建模和结构—功能分析。(ScienceDirect)

总体判断

你的蛋白序列很大概率是一个 MFS 家族的多跨膜糖转运蛋白,结构折叠与酵母 Hxt2 和哺乳动物 GLUT1 等 sugar porter 高度类似,但序列上属于远缘同源

  • 结构上:预计都有 12 条跨膜螺旋和一个中间底物结合腔,采用“摇摆式”交替通道机制;
  • 功能上:很可能跨膜转运单糖(六碳糖或戊糖),是 uniporter 还是 H⁺ 共转运需要功能实验确认;
  • 与 Hxt2 相比:保留了跨膜核心的关键结构特征,但缺乏酵母 Hxt2 那样长的调控尾,很可能是不同物种 / 不同调控环境下的同族成员。

如果你后续愿意做更深入的分析,可以考虑:

  • 把该序列提交到 AlphaFold 或 RoseTTAFold,得到 3D 模型后再与 Hxt2 / GLUT1 / XylE 做结构叠合;
  • 在同一系统(比如酵母 hexose-transporter-null 背景或 Xenopus oocyte)表达你的蛋白,测定不同糖底物的 Km 和 Vmax,验证它究竟更像 Hxt2 还是 XylE 一类的转运器。

このQ&Aを共有