生命科学中的人工智能3(2023)100067社论生命科学研究中的数据科学和数据分析于尔根·巴约拉特生命科学信息学和数据科学系,B-IT,LIMES程序单元化学生物学和药物化学,Rheinische Friedrich-Wilhelms-Universität,Friedrich-Hirzebruch-Allee 5/6,D-53115 Bonn,Germany。aRT i cL e i nf o保留字:数据科学数据分析人工智能大数据跨学科研究数据科学(DS)[1,2]和数据分析(DA)[3]是密切相关但独立的领域,这也反映在可用性方面。在DS和DA中的不同教育计划[4]。 DS和DA都专注于探索性数据分析。常见任务包括软件工具、算法和统计技术的实施和应用,用于数据处理、组织、集成和可视化,最终目标是从数据中提取知识。DS的一个主要区别特征是对数据模型的更强关注。DS优先通过机器学习和预测建模扩展数据模式和统计趋势的识别[1,2]。另一方面,DA通常专注于从给定的源或应用程序中管理数据等任务,然后提取见解和知识来解决特定问题。因此,DS 通常比DA更面向算法和预测。在过去的十年中,DS和DA的重要性稳步上升由于在许多领域中结构化和非结构化数据量的大量增加[5除了数据量之外,其他在包括药物发现在内的生命科学中,数据异质性是一个使跨学科研究复杂化的主要问题,需要DS和DA对数据集成做出巨大贡献[8]。此外,生命科学数据具有学科特定属性,DS/DA专业人员还必须具备科学领域知识以及在不同学科之间进行操作和交流的能力。显然,DS和DA专家的贡献对于开发生命科学和药物发现研究中的数据驱动概念至关重要[8]。电子邮件地址:bajorath@bit.uni-bonn.dehttps://doi.org/10.1016/j.ailsci.2023.100067接收日期:2023年2月25日;接受日期:2023年2月26日在线预订2023年随着机器学习和人工智能在许多领域越来越受到重视,DS继续呈上升趋势。 然而,这并没有减轻对DA的需求,特别是在特定的项目背景下。从数据中学习不依赖于机器学习和数据模型。然而,仔细的数据分析和策展是知识提取的先决条件,无论使用什么方法需要强调的是,DS和DA的贡献是AILSCI范围的组成部分。例如,方法&方案手稿类别为DS和DA的新方法学发展的交流以及特定应用的研究或数据处理方案的出版提供了一个极好的论坛。展望未来,强烈鼓励突出数据分析和知识提取的特定方面或特定挑战和可能的解决方案的贡献显然,机器学习依赖于可用的数据及其完整性。源数据的特征和理解越好,预测成功的可能性就越大因此,DS,DA和人工智能研究必须不可避免地在上下文中考虑,强调它们与AILSCI的相关性。竞争利益作者声明,他们没有已知的竞争性经济利益或个人关系,可能会影响本文报告的工作。数据可用性文章中描述的研究未使用任何数据引用[1] 高湖数据科学:全面概述。 ACM Comput Surv 2017;50:1-42.[2] 达尔五世数据科学与预测 Commun ACM 2013;56:64-73.2667-3185/© 2023作者。由Elsevier B. V.发布。这是一个CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)可在ScienceDirect上获得目录列表生命科学期刊首页:www.elsevier.com/locate/ailsciJ. Bajorath生命科学中的人工智能3(2023)100067[3] RunklerTA. 数据分析。第三版。 Fachmedien Wiesbaden:Springer; 2020.[4] 杨伟杰,王伟杰,王伟杰.数据分析与数据科学:基于课程设计的本科课程相似性和差异性研究。JInf Syst Educ 2015;26:103.[5] 马克思五世大数据的巨大挑战 Nature 2013;498:255-60.[6] 弗西特·T.数据科学及其与大数据和数据驱动决策的关系。大数据2013;1:51[7] Agarwal R,Dhar V.大数据,大科学和分析:IS研究的机遇和挑战。Inform Syst Res2015;25:443[8] BajorathJ.数据驱动的药物化学基础。Future Sci OA 2018;4:FSO 320.2