具体来说,团队将其最新研发的科学基座大模型 BBT-Neutron 应用于粒子对撞实验,模型采用了全新的二进制分词方法(Binary Tokenization),可实现对多模态数据(包括大规模数值实验数据、文本和图像数据)的混合预训练。
参考资料: [1]Naixin Qian, Xin Gao, Xiaoqi Lang, et al. Rapid single-particle chemical imaging of nanoplastics by SRS microscopy, Proceedings of The National Academy of Sciences, 2024, ...
大语言模型能否解决传统大语言模型在大规模数值数据分析中的局限性问题,助力科学界大科学社装置设计、高能物理领域科学计算?高能物理是探索宇宙基本组成与规律的前沿科学领域,研究粒子在极高能量下的相互作用,是揭示宇宙起源、暗物质与暗能量等未解之谜的重要手段。