语义魔方,I SEE YOU —让机器学会阅读

2017-10-28 14:35:00

《阿凡达》里杰克与纳美族人公主涅提妮的爱情让人动容,更让人记住了那句“I SEE YOU”,因为那是一种“眼相见、心相连”的感觉,大概就是“我懂你”的意思吧。

工作和生活中,我们也都需要这样一个“懂自己”的伴侣:

当你经常提起巴萨、梅西,她知道你是个足球迷;

当你念叨交通太堵、空气太差,她知道你不高兴了;

当你为了开个题,想要了解某个技术的发展现状和趋势,不得不淹没在长篇累牍中,还得睁大眼睛,怕一不留神错过的时候,她可以替你扫描定位,归纳分析……

是谁如此聪明,让人如此动心呢?这就是语义魔方。

简单来说,语义就是自然语言文本的含义。对于机器而言,文本只是一堆无意义的符号。而对于我们而言,这里面包含很多有价值的信息。语义技术就是要让机器理解文本所表达的含义,实现自然语言理解。

微软将自然语言处理比作人工智能皇冠上的明珠。没有语言,人类的思维也就无从谈起,所以自然语言处理体现了人工智能的最高任务与境界。只有当计算机具备了处理自然语言的能力时,机器才算实现了真正的智能。语言智能的突破,可以使知识和推理得到长足的发展,进而推动整个人工智能体系,也就有更多的场景可以落地。

2017年7月,北明智通科技有限公司推出国内首款行业化语义挖掘工具级产品——语义魔方。几十种算法、十大工具、三大专利技术,实现对海量数据和文本中业务知识的“识别理解”,准确率高达95%以上。语义魔方可以支撑用户的各种智能化应用,给用户一双“火眼金睛”,从各种资料中快速找到想要的信息,于庞杂信息中清晰理出关系、找到热点、发现规律。

在语义魔方产品发布会上,产品经理这样向我们来介绍语义魔方:

它“识文断句”。语义魔方,将机器看不懂的字符串成有意义的词、句、段、篇,当它读到“麻辣烫”这个词时,它知道这说的是一种小吃,不是“麻”、“辣”、“烫”这种感觉;当它读到“我爱北京天安门”这句话时,它知道这里面有我们熟悉的地名,还有一种情感的表达;当它读到《望庐山瀑布》这篇文章时,它知道这是属于诗歌的一种文体……语义魔方就是这样一步步让机器学会阅读、学会理解。

它“变幻莫测”,玩转“NLP+”。语义魔方是一个高开放性和适应性的产品,能嫁接到各个应用系统,搜索引擎、智能客服、商业智能……语义魔方具有很强的业务场景架构能力,造大飞机、勘探采油,“上天入地”的业务在语义魔方都能建模型、定规则,让知识围着业务跑起来。

它是有“背景”、有“底蕴”的产品。再“聪明”的产品也需要训练,然后通过不断的学习实现持续地自我优化。在视觉/图像识别方面,Facebook为了将有意义的婴儿照片、度假自拍照、宠物照挑出来,每秒要训练4万张图片。语料是进行语义分析训练的基础,语义魔方不仅有很强的训练管理工具,而且积累了上千万的领域语料,减少行业用户使用的“磨合期”。

目前,语义魔方已经在石化、政务、旅游、出版、法院等很多行业进行了应用:它帮助政府人员将老百姓网上的各种意见、建议、投诉分门别类,开展工作满意度分析,协助政府部门掌握舆情热点,提升服务质量;它帮法院庭前调解员从成千上万的案件中,快速找到与正在处理的调解案件相似的案件,并列出胜诉与败诉的要点,让调解员更好地与原被告双方沟通,明晰利害,提高效率,减少诉讼成本……

搞技术的人往往很闷,但谈到自己的研究,却又滔滔不绝。产品发布会那天,智通自然语言处理专家谭培波很激动,像是送自己的女儿出嫁一样。他这样说道:“语义这件事,很难,做到行业化的语义理解,更难。有一段时间,我真的夜不能寐。不过当我把分析的准确性一个百分点一个百分点提高的时候,当项目经理告诉我,客户很满意的时候,就觉得都值了。”对算法、工具的千万次组合优化、对已有技术的不断融合创新、忘我地沉浸于客户业务,只为那句“I SEE YOU”……