4PDiKRrfRpj scroll.huanqiu.comzh-Hansarticle破局“数据孤岛”困境 AI赋能化学科研创新近日,由浙江大学研究员王文冠主导,联合中国人民大学科研团队,在国际权威期刊《自然·通讯》(Nature Communications)上发表创新性研究成果,提出/e3pmh1rv3/e5anvcnkq随着国家推动人工智能与实体经济深度融合、加快实现高水平科技自立自强的战略部署,人工智能已成为驱动科研范式变革和产业创新升级的核心引擎。在药物研发、新材料等化学领域,出于商业保密与数据安全的考虑,各大科研机构对共享原始数据普遍持高度审慎态度,导致“数据孤岛”现象,即大量有价值的数据被封锁在各自机构内部,难以共享。该现状已构成制约该领域发展的关键瓶颈,使数据驱动的人工智能方法无法充分发挥潜力。近日,由浙江大学研究员王文冠主导,联合中国人民大学科研团队,在国际权威期刊《自然·通讯》(Nature Communications)上发表创新性研究成果,提出由化学知识引导,面向化学逆合成的隐私保护学习框架——“CKIF(Chemical Knowledge-Informed Framework)”,实现在保护数据隐私前提下的跨机构协同学习,为化学研究的数字化、智能化转型提供了安全高效的新路径。为保护数据机密,构建安全、高效的化学研究协作生态系统,CKIF引入基于化学知识的智能加权策略。在该技术框架下,各参与机构仅需使用本地数据独立训练模型、上传模型参数,无需共享任何原始数据。CKIF通过基于分子指纹的化学相似度评估,智能判断不同机构模型的参考价值,进而为每个参与方定制个性化的融合模型。研究团队负责人王文冠研究员介绍:“就像多位化学家在不泄露各自实验细节的情况下交流心得一样,CKIF让AI模型在保护原始数据的前提下实现知识共享。”值得关注的是,CKIF在多个标准数据集上表现出卓越的性能及较强的泛化能力,其准确率相较独立机构单独训练的模型提升约15%;在涵盖十类主要化学反应的系统性评估中,CKIF均保持稳定优势。特别是在复杂成环反应等挑战性任务中,CKIF给出的预测结果展现出更高的化学合理性,显著优于对比基线。此外,CKIF还表现出优秀的抗干扰能力,即使在数据存在噪声的情况下仍能保持稳定性能。该技术为医药研发、材料科学等领域的跨机构合作提供了可行的解决方案。业内专家认为,这一突破将有效促进科研机构、高校与企业间的深度协同,在充分保护知识产权的前提下加速科学发现进程。研究团队表示,该框架具备良好的扩展性,可推广至其他受困于“数据孤岛”的科研领域,为构建安全、高效的科研协作生态系统提供关键技术支撑。根据数字经济横向打通、纵向贯通的发展战略,此类兼顾数据安全与协同创新的技术方案,将持续为我国科技创新体系注入发展动能。1763639050251环球网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。责编:郑媛媛环球网176363905025111[]{"email":"zhengyuanyuan@huanqiu.com","name":"郑媛媛"}
随着国家推动人工智能与实体经济深度融合、加快实现高水平科技自立自强的战略部署,人工智能已成为驱动科研范式变革和产业创新升级的核心引擎。在药物研发、新材料等化学领域,出于商业保密与数据安全的考虑,各大科研机构对共享原始数据普遍持高度审慎态度,导致“数据孤岛”现象,即大量有价值的数据被封锁在各自机构内部,难以共享。该现状已构成制约该领域发展的关键瓶颈,使数据驱动的人工智能方法无法充分发挥潜力。近日,由浙江大学研究员王文冠主导,联合中国人民大学科研团队,在国际权威期刊《自然·通讯》(Nature Communications)上发表创新性研究成果,提出由化学知识引导,面向化学逆合成的隐私保护学习框架——“CKIF(Chemical Knowledge-Informed Framework)”,实现在保护数据隐私前提下的跨机构协同学习,为化学研究的数字化、智能化转型提供了安全高效的新路径。为保护数据机密,构建安全、高效的化学研究协作生态系统,CKIF引入基于化学知识的智能加权策略。在该技术框架下,各参与机构仅需使用本地数据独立训练模型、上传模型参数,无需共享任何原始数据。CKIF通过基于分子指纹的化学相似度评估,智能判断不同机构模型的参考价值,进而为每个参与方定制个性化的融合模型。研究团队负责人王文冠研究员介绍:“就像多位化学家在不泄露各自实验细节的情况下交流心得一样,CKIF让AI模型在保护原始数据的前提下实现知识共享。”值得关注的是,CKIF在多个标准数据集上表现出卓越的性能及较强的泛化能力,其准确率相较独立机构单独训练的模型提升约15%;在涵盖十类主要化学反应的系统性评估中,CKIF均保持稳定优势。特别是在复杂成环反应等挑战性任务中,CKIF给出的预测结果展现出更高的化学合理性,显著优于对比基线。此外,CKIF还表现出优秀的抗干扰能力,即使在数据存在噪声的情况下仍能保持稳定性能。该技术为医药研发、材料科学等领域的跨机构合作提供了可行的解决方案。业内专家认为,这一突破将有效促进科研机构、高校与企业间的深度协同,在充分保护知识产权的前提下加速科学发现进程。研究团队表示,该框架具备良好的扩展性,可推广至其他受困于“数据孤岛”的科研领域,为构建安全、高效的科研协作生态系统提供关键技术支撑。根据数字经济横向打通、纵向贯通的发展战略,此类兼顾数据安全与协同创新的技术方案,将持续为我国科技创新体系注入发展动能。