当前位置:首页 > 生活常识 > 正文

MCIT宣布四家数据提供商参与阿拉伯语GenAI项目

  

  

  卡塔尔多哈:通信和信息技术部(MCIT)人工智能委员会周三宣布,四家著名机构参与阿拉伯生成人工智能(GenAI)项目“Fanar”。

  这一消息是在政府和学术界代表参加的会议上宣布的。参与机构包括捐赠和伊斯兰事务部(Awqaf)、卡塔尔国家图书馆(QNL)、半岛电视台和阿拉伯研究与政策研究中心(ACRPS)。

  这项合作是MCIT及其合作伙伴持续努力的一部分,目的是为Fanar提供高质量的数据,并为阿拉伯语GenAI模型Fanar实现3000亿字的目标。

  Fanar项目是在第四届卡塔尔经济论坛开幕式上宣布的。数据提供者将为建立一个广泛的阿拉伯语内容数据库作出贡献,该数据库将作为机器翻译、语音识别和阿拉伯语自然语言处理等人工智能解决方案的宝贵资源。这些新的数据来源将有助于为法纳尔建立更准确和更有效的语言模型,从而提高其总体表现和对阿拉伯语的理解。

  这些著名机构的参与标志着Fanar项目发展的重要一步,与其目标一致,即增强阿拉伯基因的表现,加强阿拉伯在全球舞台上的地位,并扩大其应用范围。

  在评论这一合作时,通信和信息技术部长Mohammed bin Ali Al Mannai说:“我们很高兴数据提供商机构参与阿拉伯GenAI项目“Fanar”。此次参与是项目发展的重要一步,因为这些实体拥有丰富多样的阿拉伯语内容的历史、语言、文化和技术资源。”

  他补充说:“我们相信这次合作将对阿拉伯语大型语言模型(llm)产生积极影响,我们期待有更多的本地和国际各方加入Fanar项目作为数据来源。这将支持我们努力保护我们真正的阿拉伯语及其本质。随着数据源的多样性增加,项目的丰富性和与阿拉伯语内容互动的能力将变得更加准确和全面。”

  捐赠和伊斯兰事务部(Awqaf)将通过其伊斯兰网络网站“伊斯兰网”上的语言资源提供宗教和文化内容,为该项目作出贡献。这包括大量的伊斯兰科学、法律教令,以及医学、文化和家庭事务方面的咨询服务。

  卡塔尔国家图书馆IT运营和基础设施总监Nasser bin Salem Al Ansari博士表示,此次合作符合图书馆保护国家和地区遗产的使命,并强调了卡塔尔国家图书馆通过各种倡议和活动突出阿拉伯语丰富性的承诺。

  半岛电视台拥有大量的广播时数和视频内容档案,其网站上还有大量的文章。

  半岛电视台媒体网络技术与网络运营执行总监Ahmed Al Fahad评论说:“作为先进技术和人工智能应用的开拓者,这一举措在加强和保护阿拉伯语独特的语言和文化属性方面发挥着关键作用。”

  阿拉伯研究与政策研究中心(ACRPS)的研究库广泛收集了数千篇发表在同行评议期刊上的学术论文,以及数百本原创和翻译书籍。

  ACRPS数字和阿拉伯社会实地单位负责人Fadi Zaraqat博士强调了建立阿拉伯法学硕士的重要性。他表示,开发这样的模型是中心任务的核心,他们正在开发自己的模型,名为DALLA:多哈阿拉伯语大型语言模型,基于开源原型。

  哈马德·本·哈利法大学代理研究副校长兼卡塔尔计算研究所(QCRI)执行主任Ahmed K. Elmagarmid博士说:“我们为四个主要国家机构参与阿拉伯生成人工智能模型(Fanar)项目感到自豪,这代表了支持和加强项目的质的飞跃,因为高质量数据资源的可用性是创建和改进语言技术的基础。强调卡塔尔计算研究所在发展阿拉伯语处理方面发挥着重要作用,通过对其技术进行先进研究,生产工具和创造资源,确保其在数字世界中的繁荣。”

有话要说...