拓扑材料研究是凝聚态物理与材料科学的前沿领域,对新一代电子器件和量子计算技术发展具有重要意义。
近日,中心高性能计算部与中国科学院物理研究所合作,共同开发出基于大语言模型和多源知识增强的拓扑材料智能问答框架TopoChat。该系统构建了拓扑材料知识图谱(TopoKG),整合Materiae、Materials Project等权威数据库的2.8万余条拓扑材料数据,支持精确属性查询与智能推荐。同时引入文献聚类增强检索机制,基于语义相似性匹配、社区发现和中心性筛选技术,实现相关学术文献的智能检索与知识片段提取。通过设计结构化提示词策略,TopoChat实现了结构化知识与非结构化文献信息的高效融合,显著提升了专业领域问答的准确性与可靠性。基于Qwen2.5、DeepSeek-V3和DeepSeek-R1等主流大模型,系统在材料科学问答任务中准确率分别达到68.62%、70.62%和93.54%,显著优于基座模型性能,为材料科学研究提供了高效、可扩展的智能问答解决方案。该研究成果为知识增强型大语言模型在专业科学领域的应用提供了重要技术路径。
该研究成果发表于Journal of Computer Science and Technology(JCST,CCF推荐B类期刊)。中心博士研究生许黄超为论文第一作者,张宝花高级工程师为共同通讯作者。该研究得到国家重点研发计划项目支持。

TopoChat框架示意图
相关成果:
Xu HC, Zhang BH, Jin Z et al. TopoChat: Enhancing ftopological materials retrieval with large language model and multisource knowledge. JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2026. DOI: 10.1007/s11390-025-5113-9
责任编辑:郎杨琴