什么是语言智能?胡开宝教授带来第三期外语学科新生学术引领计划通识教育系列讲座

为实现我校“会语言、通国家、精领域”的人才培养目标,帮助外语学科新生从一开始就了解本学科的知识体系和研究领域,提升外语能力,掌握基本的学术研究方法,学校特邀请资深学者举办“外语学科新生学术引领计划”通识教育系列讲座。2021年11月26日,第三期外语学科新生学术引领计划通识教育系列讲座在上外松江校区成功举办,上海外国语大学语料库研究院院长胡开宝教授为大家分享:什么是语言智能。东方语学院院长程彤教授担任本场讲座的主持人。

什么是语言智能?胡开宝教授带来第三期外语学科新生学术引领计划通识教育系列讲座

讲座主讲胡开宝教授

什么是语言智能?胡开宝教授带来第三期外语学科新生学术引领计划通识教育系列讲座

讲座主持程彤教授

为激发新生对语言智能的学习兴趣,东方语学院院长程彤教授指出:“语言语料库的发展,标志着外语学科在未来一段时期的一个发展方向。语言如何与机器的结合,是外语学科今后一个十分重要的发展方向。这个方向是非常激动人心的,令人遐想无限的。”随后,胡开宝教授围绕“语言智能”的主题,从语言智能的界定与范畴、语言智能的发展与历程、语言智能的主要研究领域和语言智能与外语人才培养结合等四个方面进行了深刻的阐述。

什么是语言智能?

“机器翻译能做文学翻译吗?”,胡老师通过这样一个问题,引发了同学们对机器翻译的思考。他指出,大部分人通常认为机器翻译的结果一般是直译,并且文学翻译的效果也不理想。然而,胡老师用莎士比亚的戏剧作为翻译样本,通过比较梁实秋的翻译和机器翻译的结果,向同学们证明了机器翻译系统不仅懂得直译,甚至还能够将文学的内涵翻译出来。也就是说,在一些情况下,机器翻译甚至优于人工翻译。通过这样一个案例,胡老师也为同学们揭开了语言智能的概念:“语言智能旨在运用计算机信息技术让机器像人一样理解、分析和处理人类语言,实现人机语言交互的一种技术。它是人工智能金字塔的顶尖。”胡老师表示,“我们每天都在与语言智能在打交道。为什么我们每个人的手机应用的主页界面各不相同?其实是因为这包含了语言智能技术,它通过我们的搜索行为就知道用户的个人喜好,从而向我们推送我们可能感兴趣的内容。” 实际上,语言智能的应用范畴十分的广泛。为了让同学们更好的理解,胡老师列举了许多生活中常见的情景。例如,我们在微信上使用的语音转文字功能,我们在高德地图上听到的导航,我们经常使用的“小爱”、“度秘”等语音助手,都是语言智能的体现。

那么语言智能要让机器像人一样能够应用语言,使用语言,能够用语言交互,它需要具备什么条件呢?胡老师进一步解释道,“机器要能够进行词法和句法分析,能够做语义分析理解,在这个基础上建构模型,能够做语音计算,能够做文本分类和聚类,能够做信息检索和信息抽取,能够自动文摘和自动作文,能够自动问答和人机对话和能够机器翻译等等。

什么是语言智能?胡开宝教授带来第三期外语学科新生学术引领计划通识教育系列讲座

语言智能的主要范畴(来源于胡开宝教授讲座内容)

 

语言智能的发展历程

了解了语言智能的概念和主要范畴后,胡老师进一步为同学们展示了语言智能的发展历史。胡老师总结道,语言智能主要经历了三个发展阶段:第一阶段为上世纪50年代至80年代,这一阶段侧重于机器翻译、自然语言理解以及相关算法等领域的研究。第二阶段为1980年至2000年,这一阶段过程中,随着机器学习理论、算法、语料库和知识库等在语言智能领域的应用,自然语言处理、机器翻译和人机对话研究发展迅速。机器翻译主体从理性主义主导转向经验主义主导,即从基于规则转换转向基于统计和实例的转换。这一阶段机器翻译质量有很大提高,语料库开始发挥真正作用。第三阶段,即当下阶段,也被人们称之为“机器学习”阶段,大数据和深度的“机器学习”被广泛用于语言智能之中,一系列基于语音智能的应用,例如百度度秘、苹果Siri、谷歌的基于深度学习的神经网络机器翻译系统层出不穷,标志着语音识别、语音合成、知识库检索等技术在此阶段取得了显著性发展。但胡老师也坦言,语言智能目前发展最大的瓶颈是它不能像人一样去理解语义,这也是我们目前亟需攻克的难题。

 

语言智能的主要研究领域

语言智能的研究领域主要包括语音识别与语音合成智能写作智能批改机器翻译智能问答第一,语音识别,即利用计算机自动识别语音的技术。该技术有广义和狭义两个概念。广义上,语音识别指利用声音进行说话人识别的技术;狭义上,语音识别则指利用计算机识别出语音信号所表达的内容,并将其转换为文字。例如公安侦查电话诈骗可以采用这个技术,通过识别声音判断性别、年纪、家庭范围等。第二,语音合成,即用人工的方法生成语音的技术。它将文字转换为语音,让原本“看到”却“听不到”的信息变成“即时可听”的信息。例如喜马拉雅的有声阅读。第三,智能写作,即用机器生成自然语言的技术。其过程主要分为阅读信息、提取信息和撰写稿件三个步骤。目前这项技术难度比较大,主要在于机器对于文章的分析是基于形式的判断,而非像人一样去理解语义。第四,智能批改,即利用计算机自动完成学生作文和作业的评分与反馈等一系列工作。该技术具备准确度高、误差低、数据采集和分析功能强大等优点,有助于实现精准教学和个性化学习。第五,机器翻译,即利用计算机把一种自然语言符号转换为另一种自然语言符号的过程。胡老师还提到了业界认为机器翻译进入了神经网络机器翻译阶段,不需要语言学人才,但胡老师认为“未来机器翻译必须是数据和知识、数据和规则双轮驱动转型”。第六,智能问答,是计算机运用信息检索和自然语言处理技术自动分析用户提问、辨识用户意图后,为用户提供精准答案的系统,例如手机智能导航,当用户说出他想要去的目的地,它会告诉用户路线。

什么是语言智能?胡开宝教授带来第三期外语学科新生学术引领计划通识教育系列讲座

语言智能的主要研究领域(整理自胡开宝教授讲座内容)

面对语言智能,我们该做什么?

胡老师表示,“语言是一种数字,语言是一种资源。未来是被语言智能书写的世界”。面对语言智能技术的快速发展与广泛应用,外语学科的学生应当如何面对?胡老师分别从学校层面和个人层面上分享了自己的观点。

什么是语言智能?胡开宝教授带来第三期外语学科新生学术引领计划通识教育系列讲座

讲座现场

学校层面上,当前外语学科现有培养方案均以传统外语专业人才的培养为主要内容,未能有效对接语言智能的发展。他建议,在语言智能背景下,外语专业人才培养应当注重语言智能相关领域知识与技能的传授,增设语言智能及其相关领域的课程,如语言智能基础、自然语言处理、语料库基础以及双语语料库的建设与应用等课程,让学生掌握语言智能的基本原理,把握语言智能的发展趋势,帮助学生掌握语料库建设与应用的基本方法和路径,并组织学生直接参与语料库的研制。同时,还应开设机器翻译基础、译前编辑和译后编辑等课程,帮助学生掌握机器翻译原理、译前编辑和译后编辑的原则和要求,帮助学生熟谙机器翻译的基本特征,主动介入机器翻译实践,提高机器翻译的质量。

个人层面上,胡老师建议外语学科的学生们应该拥抱语言智能,掌握语言智能的相关知识,同时努力成为高端的外语人才。胡老师告诉同学们,对于机器翻译行业而言,目前最欠缺的是机器翻译质量的品质,国家和企业对语言学家的需求特别的旺盛。究其原因,是因为语言智能的发展是以高精度语料库的研制为重要物质前提。这些语料库的研制涉及语料库设计、语料采集、语料预处理、分词与标注和双语平行等。此外,机器翻译系统的研制需要进行机器翻译质量的评估,而机器翻译系统的应用则需要进行译前编辑和译后编辑。要完成这些工作,需要掌握双语并具备语言学和翻译学等学科知识的语料质量评估人才、双语语料库和双语术语库研制人才,以及熟练从事译前编辑和译后编辑的翻译人才。

最后,胡老师指出,语言智能时代已经悄然而至,低端的基础性翻译需求逐渐下降,但对于能够驾驭机器翻译的高端语言人才的需求会越来越旺盛。为此,同学们应当主动适应语言智能时代的潮流,积极掌握语言智能基础知识及相关能力,精通外国语言文学知识,努力成为双语转换能力的高端外语专业人才

SISUers

通过本次讲座,我了解到了语言智能的概念和范畴,更重要的是引发了我对未来外语学习方向的思考。在外语学习的过程中,不乏存在着这么一种声音——机器翻译终将取代人工翻译。为此,我经常对我的未来的职业生涯感到迷茫,是否我今之所学,未来毫无用武之地?而胡老师的讲座拨云见日:作为外语学习者,不仅要在语言知识和语言技能上稳扎稳打,还应该具备跨学科的适应力,从而走上顶尖外语人才的道路。

我们现在进入的是一个信息文明的时代,胡老师建议我们应该去学习语料库建设应用,因为语料库是语言智能的基础,而语言智能将书写未来的世界。我深刻地意识到语言智能会是我们外语学子未来规划的方向之一,正如胡老师所说的,我们应当积极主动地去顺应语言智能时代的潮流,而不是畏惧语言智能的发展。流水线的低端岗位会被机械化取代,高精尖的岗位永远供不应求。我深受触动,只有努力成为双语转换能力的高端外语专业人才,才不会被语言智能时代所淘汰。

推荐学习资源

推荐书目

  1. 《人工智能》,李开复、王永刚著,2018,文化发展出版社;
  2. 《语音识别原理与应用》,洪清阳、李琳著,2020,电子工业出版社;
  3. 《人工智能导论》,李德毅主编,2017,中国科学技术出版社。

《人工智能》

什么是语言智能?胡开宝教授带来第三期外语学科新生学术引领计划通识教育系列讲座

《语言识别原理与应用》

什么是语言智能?胡开宝教授带来第三期外语学科新生学术引领计划通识教育系列讲座

《人工智能导论》

什么是语言智能?胡开宝教授带来第三期外语学科新生学术引领计划通识教育系列讲座

发布者:胡开宝,转转请注明出处:http://47.94.224.224/archives/21809

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022年7月21日 上午11:27
下一篇 2022年7月21日 下午2:21

关联资源