丝路新观察杜尚别7月5日电 据亚洲快讯通讯社7月5日报道,塔吉克斯坦(简称:塔)成功研发首个能理解和处理塔吉克语的人工智能系统SoroLLM,该系统由zehnlab.ai公司研究团队开发完成。
据zehnlab.ai团队介绍,SoroLLM是首个专为塔吉克语及其多种方言设计的神经网络模型。6月25日,在塔首个AI计算资源中心启用仪式上,该项目曾向拉赫蒙总统进行展示。
作为专门针对塔吉克语开发的神经网络模型,SoroLLM填补了国际主流语言模型(如GPT、LLaMA)在塔吉克语支持方面的空白,标志着塔数字化发展迈出重要一步。
SoroLLM专门针对塔吉克语特点开发,包括其特殊语法结构、罕见词汇及多样化发音特点。研发团队强调:“我们的目标不仅是实现基础语言识别,更要完整呈现从北方方言到帕米尔语系的语言多样性。”
据悉,该系统将持续升级,计划引入多模态功能,实现文本、音频和视频数据的综合处理。
编译:冯嘉睿