日本发布大规模语言模型

2024年05月15日08:22  来源:科技日报
 
原标题:日本发布大规模语言模型

  科技日报讯 (记者李杨)东京工业大学、日本理化学研究所及富士通公司等近日宣布,利用超级计算机“富岳”,他们开发的大规模语言模型“Fugaku-LLM”正式发布。

  “Fugaku-LLM”是首个完全由日本国产技术构建的AI语言模型,其在处理日语及相关文化内容上表现卓越。模型特别擅长基于日语敬语进行自然对话,并展现出在人文社会科学领域的能力。

  面对全球范围内用于大语言模型计算的GPU短缺现状,此次研究团队选择使用富士通制造的CPU。通过提升“富岳”的计算能力,研究团队成功实现了完全基于CPU的AI学习。

  “Fugaku-LLM”目前已向全球研究者和技术人员开放,以鼓励更多的专业人士参与到模型的进一步改进和新的应用研究中,旨在推动更多创新性研究和商业应用的发展。随着该模型的推广,预计将加速推动AI技术在各行各业的应用,尤其是在需要深度理解并运用日语的领域。

  普通公众可在富士通的官网上免费下载并体验这一技术。这种开放的策略有助于提高公众对AI技术的理解和接受度,同时也可促进技术的广泛应用与可持续发展。

(责编:许文金、陈建军)