摘要
分析疫苗或感染免疫反应的限速步骤之一是单克隆抗体的分离和鉴定。因此,我们提出了一种混合结构和生物信息的方法,直接分配重链和轻链,识别和补充决定区域,并从多克隆抗体的低温电子显微镜密度图中找到序列,该密度图与下一代免疫库测序相结合,我们可以特别识别和复制家庭成员,生成单克隆抗体,并确认它们以与相应的多克隆抗体相同的方式与抗原相互作用。这种基于结构的设计是从多克隆血清中识别单克隆抗体的开始。
简介
全面分析感染或疫苗接种的免疫反应既费力又昂贵。酶联免疫吸附试验等经典血清方法(ELISA)以及病毒中和试验,提供了丰富的信息,但需要一套相对较多的生物和病毒试剂。为了合理和基于结构的疫苗设计,还需要将疫苗/病原菌引起的特异性单克隆抗体分离出来。(mAbs),然而,抗原特异性B细胞的分离需要荧光标记探头和先进的细胞分离设备。然后进一步整合和评估单克隆抗体的结构和功能,以评估表格的特异性、亲和力和活性(即中和能力)。所选抗体的高分辨率结构通常在这个过程结束后进行,需要为每个独特的样本获得独立的数据。
最近,我们开发了一种使用低温电子显微镜的方法。(cryoEM)以免疫血清的程度表征疫苗接种或感染(cryoEMPEM)导致多克隆抗体(pAb)反应。我们可以很容易地从单个cryoEMPEM数据集中到近原子分辨率(~3-4-Å免疫复合物图谱在范围内重建,绕过单克隆抗体的分离步骤,简化结构分析。然而,由于抗体的多克隆特性和固有序列信息的缺乏,重建图的真实原子分辨率受到限制,特定表位决定了簇的融合。
在cryoEMPEM图中,我们开发了一种直接确定单抗序列的方法。这一混合方法包括电子显微镜(EM)和下一代一起测序(NGS),使多克隆Fabs(Fv)可变区域的序列分配,包括互补决定区域(CDRs)。
结果
最近,我们使用了恒河猴免疫实验的结构数据,这是一个可溶性HIVEnv三聚体。本研究常用的三个主要cryoEMPEM图谱/模型显示,BG505SOSIP结合不同结构的pAbs(图1)。优质的低温电子显微镜(33).3-3.7Å分辨率),与Fab相对应的部分电子显微镜图具有较高的局部分辨率(图1)。
具有BG505SOSIPCryoEMPEM图谱,抗原和恒河猴单抗体。高分辨率图谱(透明灰色表层)和相应的免疫复合物模型(从左到右:Rh.4O9pAbC-1,Rh.33104pAbC-1,和Rh.33172pAbC-2).底部显示完整的地图和模型,顶部显示表位-副表位界面的特写视图。丝带表示用于模型(BG505SOSIP,深灰;Rh.4O9多克隆Fab,绿色;Rh.33104多克隆Fab,粉红色;和Rh.33172多克隆Fab,绿)。我们只对多克隆Fabs的可变域进行了建模。n-链聚糖表现为杆状物和黄色。
第一,我们进行了阐述Rh.4O9pAbC-1cryoEMPEM图片(图1,左),显示一个pAb组合在一起。BG505SOSIP抗原的V一环上。最初发布的数据采用图中所示的集中分类方法进行再处理。S二是降低异质性,重建更高质量V1pAb图谱。识别该表位的单克隆抗体最近从同一只恒河猴子中分离出来。两种抗体来自同一个复制家族。Rh4O9.7和Rh4O9.8中和了野生型BG505假病毒,并通过诱变发现靶向V一环。我们使用阴性染色电镜。(nsEM)来表征Rh4O9.8抗体与BG505SOSIP融合,并得到验证V1的特异性。另外,Rh4O9.8单抗与来自Rh4O9pAbC-多克隆Fab叠加1。(图2B)。
运用Rh4O9.建立了8个序列Rh4O9pAbC-fab对应部分原子模型(图2)C)。该模型处于二级结构水平(图2D,左边)和侧链水平(图2D,右边)上与cryoEMPEM图具有良好的一致性。每一个残基Q评分图都得到了验证Rh4O9.8抗体具有良好的整体模型-图拟合,并在框架内。(FW)与CDR区域的一致性很高。总而言之,结构数据显示,通过B细胞筛分分离出来的Rh4O9.通过低温电子显微镜检测出单克隆抗体的血清程度。V1针对单克隆抗体的复制家庭。
在上面的例子中,了解所选单克隆抗体的序列可以在原子程度上解释低温电子显微镜的密度。但考虑到抗体的多克隆特性和~3-4Å结构信息过于模糊,无法直接从结构中确定最终cryoEMPEM图谱分辨率的抗体序列。假设,如果合适的序列数据库中有B细胞受体(BCR)图库在目的时间点与血清匹配(即pAb)集合是可用的,因此构造信息包括cryoEMPEM图谱可以用来选择从这些数据库中选择重链和轻链序列的候选人。因此,我们开发了一种混合方法,利用cryoEMPEM图谱和NGS数据中抗原特异性B细胞库的结构限制来识别单克隆抗体。
第一,为类似的解释3-4-Å在低温电子显微镜图中,我们开发了一个与相应结构类型(即每个氨基酸周围的密度体积相关的确定性水平)相结合的分配系统。A)。取值是手动实现的,每个氨基酸位置都有一个层次类别标志符,对应于最符合密度的预定氨基酸残基子集。在这个过程的最后,用于定义CDR和已发表抗体结构的结构同源性FW区域性,从而导致抗体序列的初始分配。
针对BG505SOSIPV1环抗体的mAb和pAb构造比较。(A)Rh4O9.8Fab与BG505SOSIPnsEM特性是三聚体复合物。BG505SOSIP三聚体(左:二维平均值,右:重建三维图)。抗体的位置显示在箭头上。(B)以Rh4O9.8mAbnsEM地图的叠加(透明的白色表层)和特征Rh.4O9pAbC-1EMPEM低温图(BG505SOSIP,灰色;pAb,绿色)。(C)BG505SOSIP带状图的原子模型。(肽,深灰色;糖,黄色)和Rh4O9.8mAb基于多克隆低温EMPEM图的原子模型(绿色)复合体,Rh.4O9pAbC-1(白色透明表层)。(D)特写显示Rh4O9.8mAb的重链(HC;顶部)和轻链(LC;底部)模型-地图拟合,包括HCDR3和LCDR3部分(重链)。橄榄绿;轻链,森林绿;EM图片,透明白色表面)。
下一步,我们设计了一种优化算法,以获得两个主要输入:(i)NGS序列数据库和预处理(ii)客户定义,基于结构的序列查询(图3C)。NGS数据由用户集的长度公差在序列分配步骤中确定的CDR长度进行预过滤。然后,该程序对齐搜索查询和数据库中的每个序列进行非投射。根据特点查询(FW1/2/3和CDR1/2/3)分割,每个特征都是单独对齐的。匹配是根据NGS序列中指定的氨基酸类别和相应氨基酸的一致性来决定的。对于给定位置的每一个匹配(在导出中描述为“),分数是根据相对抽象的类型计算的(1/Xi,Xi是位置I上可能有多少氨基酸?X)。不匹配(在导出中描述为“−”)得分为0。根据CDR长度,导出对齐分数和不对齐分数。