《自然》评选改变科学的10个计算机代码项目( 四 )


20世纪80年代初, 程序员韦恩·拉斯班德在马里兰州贝塞斯达的美国国立卫生研究院的脑成像实验室工作 。 该实验室拥有一台扫描仪, 可以对X光片进行数字化处理, 但无法在电脑上显示或分析 。 为此, 拉斯班德写了一个程序 。
这个程序是专门为一台价值15万美元的PDP-11小型计算机设计的, 这是一台安装在架子上的计算机, 显然不适合个人使用 。 然后, 在1987年, 苹果公司发布了Macintosh II, 这是一个更友好、更实惠的选择 。 拉斯班德说:“在我看来, 这显然是一种更好的实验室图像分析系统 。 ”他将软件转移到新的平台上, 并重新命名, 建立了一个图像分析生态系统 。
NIH Image及其后续版本使研究人员能在任何计算机上查看和量化几乎任何图像 。 该软件系列包括ImageJ, 一个拉斯班德为Windows和Linux用户编写的基于Java的版本;以及Fiji, 这是ImageJ的分发版, 由德国德累斯顿的马克斯普朗克分子细胞生物学和遗传学研究所的Pavel Tomancak团队开发, 其中包括关键的插件 。 “ImageJ无疑是我们所拥有的最基础的工具, ”布洛德研究所(由麻省理工学院和哈佛大学联合创立)成像平台的计算生物学家贝丝·契米妮说, “我从来没有和一个使用过显微镜, 但没有使用过ImageJ或Fiji的生物学家说过话 。 ”
拉斯班德表示, 部分原因可能是这些工具是免费的 。 但威斯康星大学麦迪逊分校的生物医学工程师Kevin Eliceiri指出, 另一个原因是用户可以很容易地根据自己的需求定制工具 。 自拉斯班德退休后, Kevin Eliceiri的团队一直领导着ImageJ的开发 。 ImageJ提供了一个看似简单、极简主义的用户界面, 自20世纪90年代以来基本上没有改变 。 然而, 由于其内置的宏记录器(允许用户通过记录鼠标点击和菜单选择的序列来保存工作流)、广泛的文件格式兼容性和灵活的插件架构, 该工具具有无限的可扩展性 。 该团队的编程主管柯蒂斯·鲁登表示, 有“数以百计的人”为ImageJ贡献了插件 。 这些新添加的功能极大扩展了研究人员的工具集, 例如在视频中跟踪对象或自动识别细胞的功能 。
Kevin Eliceiri说:“这个程序的目的不是做到一切或终结一切, 而是服务于用户的目标 。 不像Photoshop和其他程序, ImageJ可以成为你想要的任何东西 。 ”
序列搜索器:BLAST (1990年)
可能没有什么能比把软件名称变成动词更能说明文化的相关性了 。 提到搜索, 你会想到谷歌;而提到遗传学, 研究者会立刻想到BLAST 。
通过诸如替代、删除、缺失和重排等方式, 生物将进化中的改变蚀刻在分子序列中 。 寻找序列之间的相似性——特别是蛋白质之间的相似性——可以让研究人员发现进化关系, 并深入了解基因功能 。 在迅速膨胀的分子信息数据库中, 想要快速而准确地做到这一点并不容易 。
玛格丽特·戴霍夫在1978年提供了关键的进展 。 她设计了一种“点接受突变”矩阵, 使研究人员不仅可以根据两种蛋白质序列的相似程度, 还可以根据进化距离来为评估它们的亲缘关系 。
1985年, 弗吉尼亚大学的威廉·皮尔森和NCBI的大卫·利普曼引入了FASTP, 这是一种结合了戴霍夫矩阵和快速搜索能力的算法 。
数年后, 利普曼与NCBI的沃伦·吉什和斯蒂芬·阿特舒尔, 宾夕法尼亚州立大学的韦伯·米勒, 以及亚利桑那大学的吉恩·迈尔斯一起开发了一种更强大的改进技术:BLAST(Basic Local Alignment Search Tool) 。 BLAST发布于1990年, 将处理快速增长的数据库所需的搜索速度, 与提取进化上更为遥远的匹配结果的能力结合起来 。 与此同时, 该工具还可以计算出这些匹配发生的概率 。

推荐阅读