观察这个蛋白序列,MMSRTPSAEPPSDPSSGPPSDPSSGPSSGPPAAQRPLRVLT...
作成日: 2025年12月10日
使用モデル GPT-5.1 Thinking by Chat01
作成日: 2025年12月10日
使用モデル GPT-5.1 Thinking by Chat01
观察这个蛋白序列,MMSRTPSAEPPSDPSSGPPSDPSSGPSSGPPAAQRPLRVLTARHRHEAHRAATPLELFFDLCFVVAIAQAGVQLVHSVAESHAGEGVLDYAMVFFAIWWAWMNFTWFASAYDNDDVPYRLVTLVQIAGVLVLAAGVSRAFEEHDWTAVVIGYVIMRVALSAQWLRAARCAPPPERAMALKYAGGVLVCQVGWLGLLLLPEGSRGWLFLVMVVLELSVPVLAERRHRSSWHPHHIAERYGLLTIIVLGETIAAATVAVKSGIDENDALGELLPIAAGGLLIVFAAWWVYFVVPVHGHLRSSRQAFLWGYGHYLVFASAAAIGAGLEVAVEQAVGEAHISTLAASASVTLPTALFLLTVWALHARHFKVGVAEQLVLPTAALLVVCCTFVGDLAVLAAGLVLAAAVATGVMLTARRTAPGRARTTPAS,对此蛋白质序列进行详细的分析、结构预测,预测其功能,并与Hxt2的序列和三维结构进行比较。输出比对结果。
先给个结论版总结,然后下面是细节和序列比对。
序列:426 aa
textMMSRTPSAEPPSDPSSGPPSDPSSGPSSGPPAAQRPLRVLTARHRHEAHRAATPLELFFDLCFVVAIAQAGVQLVHSVAESHAGEGVLDYAMVFFAIWWAWMNFTWFASAYDNDDVPYRLVTLVQIAGVLVLAAGVSRAFEEHDWTAVVIGYVIMRVALSAQWLRAARCAPPPERAMALKYAGGVLVCQVGWLGLLLLPEGSRGWLFLVMVVLELSVPVLAERRHRSSWHPHHIAERYGLLTIIVLGETIAAATVAVKSGIDENDALGELLPIAAGGLLIVFAAWWVYFVVPVHGHLRSSRQAFLWGYGHYLVFASAAAIGAGLEVAVEQAVGEAHISTLAASASVTLPTALFLLTVWALHARHFKVGVAEQLVLPTAALLVVCCTFVGDLAVLAAGLVLAAAVATGVMLTARRTAPGRARTTPAS
用简单计算可得:
前 N 端大约 30–40 aa 为 Ser/Pro/Thr 富集、带正电的低复杂区,没有典型信号肽那种长疏水段;真正的第一个强疏水段出现在 ~50 aa 以后,这非常像典型 多跨膜内膜蛋白 的 N 端胞质尾 + 第一跨膜螺旋的布局。
在序列中可以找到一个保守的 N-X-S/T N-糖基化位点:
NFT —— 如果该蛋白在等价于“胞外面”的一侧暴露(例如质膜外侧或内膜腔侧),这里很可能被糖基化。这些特性整体非常符合 主要转运蛋白超家族(MFS) 中糖转运蛋白的序列风格。(Wikipedia)
我用 Kyte–Doolittle 滑动窗口做了一个粗略疏水性分析(窗口 19 aa),在序列中看到了多段长疏水峰值,集中在 50–80, 115–140, 180–225, 235–300, 335–415 等区域,这些区段基本被连续的疏水残基(I, V, L, F, M, A)占据,长度 20 aa 左右,非常像跨膜 α-螺旋。
虽然简化算法无法精确拆成 12 段,但从模式上看:
TARRTAPGRARTTPAS),符合 “正电在内侧” 的拓扑法则,说明 N 端与 C 端都在胞质侧;拓扑预测(概念图):
虽然我没有直接对该序列跑 AlphaFold,但可以借助已知 MFS 糖转运蛋白的结构来推断:
你的序列在:
WWAWMNF TWFAS)方面都和上述 MFS 糖转运蛋白高度相似,因此非常合理的 3D 结构预测是:
该蛋白采用 MFS sugar porter 典型折叠:12 条跨膜 α-螺旋组成的摇摆式“rocker-switch”结构,中央形成一个对底物开放的空腔,通过构象改变在“外向开放”和“内向开放”之间切换,实现底物的“协助扩散”或质子共转运。
如果用 Hxt2 或 GLUT1/XylE 作为模板做同源建模,一个合理的预期是:这条序列在 12 条跨膜螺旋位置上会与模板有良好重叠,而 N/C 端尾部的结构可能较不保守、预测置信度较低。
Hxt2(S. cerevisiae,基因 YMR011W)是酵母的一个典型 高亲和力葡萄糖转运蛋白:(Yeast Genome Database)
我把你的序列和 Hxt2(P23585, 541 aa)的氨基酸序列做了一次 全局 Needleman–Wunsch 比对(简单打分:match +1,mismatch −1,gap −2)。
得到的主要结论:
整体序列身份 (identity)
疏水核心位点的身份
把对齐后两条序列都为疏水氨基酸(A, I, L, M, F, W, V, Y)的位置拿出来统计:
也就是说,虽然全长只有 ~21% 身份,但在跨膜螺旋的疏水核心位置上,接近一半的残基是完全保守的——这是典型“远缘同源蛋白”的特征,说明两者很可能属于 同一结构家族(MFS sugar porter)。(ScienceDirect)
N-糖基化位点对比
NQT, NAS),被认为位于胞外 loop 上,可能参与糖基化。(MyBioSource)N103FT 模体,同样可能位于等价的胞外 loop,被 N-糖基化。这也支持 拓扑类似、loop 长度略有不同 的观点。
N/C 端长度与调控尾的差异
下面是我算出的 全局序列对齐(上:你的蛋白;下:Hxt2;中间 | 表示完全匹配的残基)。为便于阅读按 80 列分段展示:
textPos 1 Q: M-MSRTPSAEPPS-DPS--SGP-PSDPSSGPSSGPPAAQRPLRVLTARHRHEAHRAATPLEL---FFDLCF-VVAIAQAG | | | | | | | | | | | | | | | | H: MSEFATSRVEGSSQQTSIHSTPIVQKLETDESPIQTKSEYTNAELPA-KPIAAYWTVICLCLMIAFGGFVFGWDTGTISG Q: -V-Q---LVHSVAESHAGEGVL-D---YAMV-FFAIWWAWMNFTWFASAYDNDDVPYRL--VTLVQIAG-VLVLA--AGV H: FVNQTDFKRRFGQMKSDGTYYLSDVRTGLIVGIFNIGCAFGGLT-LGRLGDMYGRRIGLMCVVLVYIVGIVIQIASSDKW Q: SRAF-EEHDWTAVVIG-YVIMRVALS--A-QWLR---AARCAPPPERAMALKY---AG-GVLVCQVGW---LGL--LLLP H: YQYFIGRIISGMGVGGIAVLSPTLISETAPKHIRGTCVSFYQLMITLGIFLGYCTNYGTKDYSNSVQWRVPLGLNFAFAI Q: EGSRGWL-------FLV-MVVLE-----L--SVPVLAERRHRSSWHPHHIA----ER-YGLLTIIVLGETIAAATVAVKS H: FMIAGMLMVPESPRFLVEKGRYEDAKRSLAKSNKVTIEDPSIVAEMDTIMANVETERLAGNASWGELFSNKGAILPRVIM Q: G--IDENDALGELLPIAAGGLLIVFA-AWWVYF-VVPVHG--HLRSSRQA----FLWGYGHYLVFASA-AAI--GAGLEV H: GIMIQSLQQLTGNNYFFYYGTTIFNAVGMKDSFQTSIVLGIVNFASTFVALYTVDKFGRRKCLLGGSASMAICFVIFSTV Q: AV--EQAVGEAHISTLAASASVTLPTALFLLTVWALHARHFKVGVAE--QL-V----LPTA--A-----LLVVCCT-F-- H: GVTSLYPNGKDQPSSKAAGNVMIVFTCLFIFFFAISWAPIAYVIVAESYPLRVKNRAMAIAVGANWIWGFLIGFFTPFIT Q: --VG--DLAVLAAGLV-----LAAAV-AT-G-----V--M--LTARRTAPG--RARTTPAS-- H: SAIGFSYGYVFMGCLVFSFFYVFFFVCETKGLTLEEVNEMYVEGVKPWKSGSWISKEKRVSEE
可以看到:
|),这些通常与结构稳定性和底物识别有关。综合上面的拓扑、结构与 Hxt2 同源性分析:
蛋白类型
可能的底物
转运机制
是否是质子共转运?
相同点:
不同点:
你的蛋白序列很大概率是一个 MFS 家族的多跨膜糖转运蛋白,结构折叠与酵母 Hxt2 和哺乳动物 GLUT1 等 sugar porter 高度类似,但序列上属于远缘同源:
- 结构上:预计都有 12 条跨膜螺旋和一个中间底物结合腔,采用“摇摆式”交替通道机制;
- 功能上:很可能跨膜转运单糖(六碳糖或戊糖),是 uniporter 还是 H⁺ 共转运需要功能实验确认;
- 与 Hxt2 相比:保留了跨膜核心的关键结构特征,但缺乏酵母 Hxt2 那样长的调控尾,很可能是不同物种 / 不同调控环境下的同族成员。
如果你后续愿意做更深入的分析,可以考虑: