|
中腾信大数据负责人详解“自然语言处理”的“智能之魂”
人类面对机器时,原本有两份优越感:智力与情感。如今,“智力”全面失守,只剩下“情感”聊以了。不过在中腾信大数据业务负责人石正柏看来,未来“情感”方面的优越感也将消失。随着NLP(自然语言处理)的发展,机器的智能程度一定会实现质的飞越,机器也可通晓人类复杂而精妙的语言含义,自然地传情达意。
那么,到底什么是NLP?目前的发展情况怎么样?应用场景和商业价值又是怎样的?来听听石正柏为我们详解NLP这颗人工智能皇冠上的“明珠”。
NLP,机器实现智能的“灵魂”
石正柏,现任中腾信大数据业务负责人,专注于大数据与人工智能结合在互联网金融行业场景的落地。带领团队实现大数据计算平台,知识图谱计算平台,智能建模平台,智能质检以及智能语音机器人等平台和AI产品。
所谓NLP,就是开发能够理解人类语言的应用程序或服务,是人工智能和语言学交叉学科的一个领域,目标是计算机处理或“理解”自然语言,以执行语言翻译和问答的任务。
目前,NLP在机器翻译、文字识别、语音识别、语音合成、信息检索、信息抽取与过滤、文本分类与聚类、舆情分析和观点挖掘等场景中,都有广泛应用。
NLP的需求,无处不在,只要有语言出现的地方,就有NLP的用武之地。但通常无法简单概括NLP的需求,必须结合场景才能明确。像语音识别、人脸识别等应用,需求相对单一明确,与场景关联度低。例如语音识别是把语音转换成文字,无论转录、同声传译、对话场景,或是金融、教育等应用领域,需求是明确不变的。NLP需求的场景化,使NLP应用必须深入业务,只能针对具体场景具体定制,无法实现快速复制。这也是在NLP领域尚没有出现类似科大讯飞、商汤科技这样的独角兽公司的原因。
在中腾信大数据负责人石正柏看来,NLP技术的实际应用需要常识知识,而常识知识来源于具体的场景。常识知识包括两种,一种是通用知识,这些是普通人都掌握的知识。另一种是具体场景下的业务知识,例如催 收场景下具体的催 收流程、催 收术语和催 收话术等,这些是专业人员所拥有的专业知识,必须来源于场景。
具体场景下的业务知识,一般是由两类人掌握。一是具体业务人员,如一线催 收人员,但他们只懂业务,而对技术了解甚少;一是提供行业解决方案的应用开发人员,如中腾信智能语音机器人的开发工程师,既懂业务,又懂技术,做到了二者的结合。而对一般NLP开发人员来说,场景业务知识是短板。这是很多NLP技术人员,甚至是高校和大厂的顶级专家,落地到具体场景应用下倍感挫折的原因。NLP应用的落地,一定要将NLP技术与场景的常识知识结合起来。
|
|