一种由荧光和机器学习结合的新技术,可以快速扫描数千张图像
781
任何生物样品(例如污垢,水或食物)都含有数十亿细菌。只有少数对人类有害或致病。但是,很少的病原体可能意味着可靠供应肉类或生菜与爆发食物中毒(或更严重的是大流行)之间的区别。
国防部高级研究计划局(DARPA)的目标之一是在致命的病原体袭来之前发现它们。该机构是美国国防部的一部分,致力于开发新技术来帮助保护美国。
几年前,DARPA向研究界发起了“朋友或敌人”挑战,以查看它们是否可以从非常复杂的样品中快速分离出病原体而又不影响样品的基本功能或表型。太平洋西北国家实验室(PNNL)是面临挑战的三个机构之一,组建了一支多学科团队,在土壤微生物学和蛋白质组学,生化合成和数据分析方面拥有科学专长。
现在,在2019年开始的项目中途,该团队正在完善他们为病原体发现开发的有前途的新方法。
这种称为OmniScreen的方法是一条端到端的管道,用于快速有效地区分微生物群落中的大量致病细胞。该系统可在几天之内提取,探测和筛选成千上万的细胞以挑选出病原体。
值得注意的是,OmniScreen还可以使样本保持活动状态。
通常,在生物学研究中,将样品冷冻,然后根据需要进行“固定”使用。固定溶液可以杀死细菌,或至少改变其原始表型。克服这一障碍对于PNNL为项目的下一阶段获得DARPA的批准至关重要。
PNNL的生物医学科学家,OmniScreen的项目负责人Becky Hess说:“我们真的不确定它是否会起作用。我们在一开始发现的部分风险是细胞可能无法在探测中幸存下来。”
“这是进入第二阶段的标准之一,我们使之奏效。”
启动细菌管道
第一个挑战是提取隐藏在土壤样品小袋中的细菌。在微生物学家和实验室研究员Janet Jansson的带领下,研究小组尝试了几种不同的离心技术,并确定了密度梯度。在中性溶液中旋转样品后,沉重的土壤颗粒沉降到底部,而较轻的细菌则漂浮到顶部。
该技术最初在三个小时内产生了100万个细胞,比该小组的最初目标要长两个小时。Jansson强调了加快DARPA提取和分析技术的速度。
接下来,詹森将死者的活细胞分类,并对它们进行染色,以帮助随后的表型鉴定。蛋白质组学分析是在环境分子科学实验室(EMSL)进行的,该实验室是美国能源部科学技术办公室的用户设施,位于PNNL-Richland校园内。EMSL上强大的质谱仪绘制了每个细胞中与蛋白质相关的特征。
蛋白质组学步骤前后的子样本比较证实了表型仍然匹配。为了保持细胞的存活并保持每个细胞的表型不变,Jansson提出了一种简单但新颖的维护培养基-土壤茶。
Jansson解释说:“当我们将土壤浸入水中进行离心分离时,最终会得到一种茶。”
“它完美地防止了细胞在新环境中受到冲击。”
对病原体进行诱饵和分箱
细菌是一种微生物,可以包含使它们致病的特定特征或化学性质。赖特使用有关微生物特征的信息来构建具有相似分子特征的化学探针。探针用作诱饵,以捕获具有相同性状亲和力的细菌。
PNNL生物科学部的生物医学科学家亚伦·赖特(Aaron Wright)表示:“就像鱼钩上的鱼一样,一旦微生物抓住了探针,它们就被卡住了。”
赖特补充说,探头上的不同颜色使它们散发出来。“我们知道我们钓到了哪条鱼。”
每个探针中还内置有用于跟踪目的的报告程序机制。在这种情况下,该机制是荧光。探针一旦粘在蛋白质上,就会根据病原体发出某种颜色。
然后赖特使用流式细胞仪以每小时超过一千万个细胞的速度一次将细菌分选出一个细胞。仪器可以判断该细胞是否具有彩色探针,从而判断是否具有病原体特征,并相应地将其分类。
赖特说:“我们可以制造各种诱饵来钩住不同类型的病原体。”
在实验室中,该技术称为多路复用。多种探针可以快速,同时靶向多种致病性状。
筛查病细胞
一旦被探测到,细菌就会与人的肺,肠道和免疫细胞一起在塑料培养皿中挂出。该团队使用肺和肠细胞,因为它们是人类最常见的感染途径。在标准显微镜下,可以看到健康生长的细胞牢固地粘附在培养皿上,但是病态的细胞会失去结构完整性,并开始从培养皿中移出。
赫斯说:“病原体可以逃避免疫细胞并造成肺或肠组织损伤。”
“当细胞连接开始破裂时,这表明病原体暴露。”
受损的细胞也会发光。
赫斯说:“这是我们的验证步骤。”
“如果人类细胞看起来健康,则不存在任何病原体。如果人类细胞丧失结构完整性或发光,则说明我们引入了病原体。”
但是,验证是一个耗时且笨拙的步骤。赫斯说,一种检测方法可以产生15,000张图像。即使使用自动成像显微镜,通过手动查看所有图像来确定致病性仍需要花费几天的时间。这是机器学习(流水线的第三部分)进入的障碍。
机器学习加快病原体发现
加州大学圣塔芭芭拉分校的助理教授Enoch Yeung开发了机器学习算法,以识别指示生病或健康细胞的细胞特征。
Yeung在PNNL国家安全局作为客座科学家从事其他研究时,构想了OmniScreen构想“朋友还是敌人”挑战。他意识到Hess在免疫学和合成生物学方面的专业知识,问她:“您能让人体细胞告诉您他们是否生病吗?”
她说:“是的,我可以。”
两位科学家仔细检查了她收集的健康与不健康细胞,以构建稀疏的,标记好的数据集来训练算法。从这些图像和病原体的颜色或表型中学习,该算法快速筛选了数千张图像,并生成了具有三个S形曲线的数据图:健康细胞崩溃(死亡),不健康细胞增加以及细菌的生长速率群落。曲线左侧的曲线越陡,病原体就越具有侵略性。
提高吞吐量
在第一阶段的测试中,OmniScreen算法在一周内解决了30种细菌,准确率达92%。DARPA提供的地面真相样本包含19种病原菌;OmniScreen发现17-比预期的要好得多。
进入这个耗资840万美元的项目的第二阶段,该团队的下一个挑战是要解决一个样品,该样品中细菌的数量几乎是土壤样品中细菌数量的两倍,但来源未知。
与第一阶段一样,合成生物学家罗伯特·埃格伯特(Robert Egbert)致力于解决整个系统中仪器和工艺步骤的关键集成问题。
赫斯说:“我们正在不断努力在技术领域之间进行交接,但是盲目抽样是对系统的真实测试。”