2025-06-10 08:16来源:本站
沙迦大学的科学家们相信他们已经创造了一种人工智能系统,可以自动识别某人说的是哪种阿拉伯语方言。这项研究发表在IEEE探索杂志上。
他们说,他们的系统揭示了丰富而复杂的阿拉伯方言,迄今为止,传统的语音系统无法准确地解释和识别这些方言。
阿拉伯语是一门丰富的语言,有许多地方方言,每一种方言都有自己独特的词汇、表达和发音。计算机科学与智能系统教授Ashraf Elnagar说:“这种多样性使得技术难以准确理解和区分它们。”
“为了解决这个问题,我们开发了一个系统,可以自动识别某人说的是哪种阿拉伯语方言。”
阿拉伯语是中东、北非和阿拉伯半岛22个国家的官方语言,是全球使用人数最多的语言之一,有超过3.7亿人将其作为母语。它也是世界上最沉浸在文化中的语言之一,那些以它为母语或作为第二语言或外语学习的人发现自己也在学习伊斯兰教及其文化。
与英语完全不同的字母表,这种语言有许多特定于其音系的声音。它的声音和文字的魅力使无数渴望流利地说汉语的外国学习者感到困惑。虽然大多数阿拉伯语的学习都是在标准的正式形式中进行的,但许多外国学习者选择口语或日常版本,特别是埃及和叙利亚的口语形式。
作者说,他们试图教计算机仅仅通过听口语来识别不同的阿拉伯方言,这并不是一件容易的事。他们写道:“主要的挑战是开发一种机器学习模型,能够从录音中准确识别各种阿拉伯方言。
“阿拉伯方言固有的多样性和复杂性,再加上音频处理和机器学习模型优化的技术挑战,使这项任务变得更加复杂。”
作者使用的数据集包括从YouTube收集的3000多个小时的音频片段。这些数据包括阿尔及利亚、埃及、伊拉克、约旦、沙特阿拉伯、科威特、黎巴嫩、利比亚、毛里塔尼亚、突尼斯、摩洛哥、阿曼、巴勒斯坦、卡塔尔、苏丹、叙利亚、阿拉伯联合酋长国、巴林和也门的19种不同方言。
埃尔纳加尔教授说,结果令人印象深刻,强调了该模型在地区和国家层面识别阿拉伯语方言方面的高准确性。“我们的模型在97.29%的时间里正确识别了地区方言,在94.92%的时间里正确识别了特定的国家方言。
“值得注意的是,我们只用了其他研究人员通常需要的29%的训练数据就实现了这一目标。我们已经公开了我们的模型,以便其他研究人员和开发人员可以使用它们为阿拉伯语使用者创造更好的语音相关技术。”
该项目有可能加强全世界数百万阿拉伯语使用者的交流和可及性。埃尔纳加尔教授说,该模型正确识别方言的能力可以“改善语音激活技术,如虚拟助手、翻译服务和自动客户支持系统”。
“这不仅弥合了不同阿拉伯语地区之间的沟通差距,而且有助于使技术对阿拉伯语使用者更具包容性和用户友好性。”
埃尔纳加尔教授指出,尽管取得了惊人的成果,但该项目仍有待改进。为此,作者们在一个名为HuggingFace的平台上公开了他们的系统,“这样其他人就可以访问并利用我们的工作来改进阿拉伯语技术。”
这项研究是埃尔纳加尔教授和他的三名本科生合作的成果,作为一个项目的一部分,该项目旨在建立一个从语音中识别阿拉伯方言的深度学习模型。最初的研究成果首次在2024年的第15届应用计算本科研究年会(URC)上发表。
“我们的系统背后的技术是由我们敬业的学生开发的,集成了尖端的方法和深度学习技术。将其功能从文本扩展到音频信号使其与众不同,为理解和处理阿拉伯语提供了多模态方法,”埃尔纳加尔教授说。
学生研究员Amr Barakat认为,该项目“弥补了语言技术的重大差距,为世界各地的阿拉伯语使用者提供了更包容、更准确的交流。”通过利用先进的机器学习,我们创造了一个不仅在性能上表现出色的模型,而且为未来的语音识别创新铺平了道路。”
另一位学生研究员Abdulla Aldhaheri报告说,该项目引起了业界的广泛兴趣,因为它“具有广泛采用的潜力,为各种人工智能驱动的语言应用和服务提供了许多好处和改进。”
除了精度高,作者开发的工具,不像目前可用的模型,需要更少的数据和计算资源,使其可以更广泛地使用。根据作者的说法,这一特点是行业对他们的工作感兴趣的原因。他们表示,微软(Microsoft)等科技公司和阿联酋沙迦的政府机构对他们的工作特别热情。
更多信息:Amr Barakat等人,从语音中识别阿拉伯语方言,2024年第15届应用计算本科生研究会议(URC)(2024)。DOI: 10.1109/URC62276.2024.10604557由沙迦大学提供引文:科学家开发机器学习工具,以准确识别22个阿拉伯语国家的阿拉伯语方言(2024年10月7日)检索自https://techxplore.com/news/2024-10-scientists-machine-tool-accurately-arabic.html。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。