一个开放源代码的机器学习框架可以进行系统的审查
当科学家对给定主题进行研究时,他们通常会先回顾以前的研究发现。进行系统的文献综述或荟萃分析可能非常具有挑战性和耗时,因为通常会有大量针对不同主题的研究,而这些研究可能并不总是与研究人员的工作相关。
乌得勒支大学的研究人员最近开发了一种机器学习框架,可以通过自动浏览过去的大量研究并汇编高质量的文献评论来显着加快这一过程。这个名为ASReview的框架可能对在COVID-19大流行期间进行研究特别有用。
参与这项研究的首席工程师乔纳森·德布鲁因(Jonathan de Bruin)对TechXplore表示:“研究人员和专家面临着当今当今领域最新动态的重大挑战。” “阅读相关领域的所有新文献都是一项非常耗时的任务,尤其是当您要系统地进行阅读时。那些系统的文献阅读方式(称为系统评价)通常会产生有影响力的科学出版物,因为它们是当前文献的详尽总结。证据。”
开发ASReview的研究人员之一Rens van de Schoot教授在他的整个学术生涯中进行了几次文献综述,因此他很清楚审阅过程可能会很耗时。他与乌得勒支大学的机器学习,工程和信息管理专家合作,着手开发一种可以显着加快进行系统评价和荟萃分析的工具。
由de Bruin,van de Schoot及其同事创建的机器学习框架经过优化,可以在大海捞针中找到隐喻的“针”或多个“针”。随着科学家对各种不同主题进行大量研究,自动识别与给定主题最相关的研究将具有很高的价值。为此,de Bruin,van de Schoot和他的同事使用一种称为主动学习的交互式方法来训练他们的机器学习模型。
“在经典的审阅过程中,研究人员会手动获得一篇文章,并需要决定该文章是否相关,并且通常会继续探索,直到他/她查看了所有相关文章。” 德布鲁因说。“我们的机器学习框架面临的挑战是最大程度地减少显示给研究人员的无关文章的数量,这可以节省大量文献审查过程中的时间。”
大多数现有的机器学习系统都经过培训,可以准确地对单个图像,文本或其他数据进行分类(即,根据其特征将数据放置在不同的类别中)。相反,de Bruin和他的同事创建的系统受过训练,可以分析多个文档并确定哪些文档与给定的研究主题相关,哪些文档不相关。
德布鲁因说:“ COVID-19大流行需要医学指导,并寻求在创纪录的时间内开发出新的治疗方法。” “医生必须在医院不停地工作时阅读文献,而且阅读的时间有限。为此,我们与艾伦AI研究所合作,后者出版了最大的关于的学术文献数据库。 ”
De Bruin,van de Schoot和他的同事在COVID-19大流行的最初几周内公开了自动进行系统综述的自动系统,因为他们认为这可以大大加快对SARS-CoV2病毒的研究并有助于其理解。 。此后,ASReview是其系统的用户友好版本,许多科学家已使用它来审查有关新的以往研究,并为制定更有效的医学指南提供信息。将来,ASReview可以用于进行许多其他系统的评论和元分析,从而最终可以加快各个领域的研究速度。
德布鲁因说:“在未来几年中,像主动学习这样的交互式机器学习的使用将迅速增长。” “至关重要的是确保交互式机器学习方法是完全透明和可解释的。在即将到来的时期,我们将证明这有可能以负责任的方式将交互式机器学习应用于其他应用程序,例如法律文件和法院判决。”