百度击败微软与Google AI自然语言理解摘冠

2020年03月29日 09:11:55   [来源:互联网]   [阅读:-]
字体:【

作者:DIGITIMES陈宜君

凭借中、英文之间的语言差异,国内搜寻引擎巨擘百度在一项人工智能(AI)自然语言处理竞赛中,击败微软(Microsoft)和全球搜寻引擎龙头Google,夺得冠军。

在自然语言理解的通用语言理解评估(General Language Understanding Evaluation;GLUE)基准与分析平台上,百度的ERNIE模型获得最高的90.1分,超越微软的89.9分和Google的89.7分。

ERNIE模型最初是为理解中文语言而开发,不过百度研究人员很快就发现此模型也能更正确理解英语。

ERNIE是受Google用来训练AI理解人类语言的BERT模型启发而来。BERT是一种屏蔽式语言模型,会在给定的每份文本中遮隐15%的单词,然后尝试根据上下文进行预测。

不过许多汉字唯有与其他汉字组合在一起时,才会有明确的内在含意,这是中、英文的一项重要语言差异。百度团队必须训练其AI模型理解如何先隐藏一串有意义的汉字,再预测这些被遮隐的内容。

百度团队在其原始码代管平台Github页面上说明ERNIE所采用的技术时,以哈利波特(Harry Potter)是英国小说家罗琳(J. K. Rowling)所写的系列奇幻小说,作为说明范例。

该说明指出,BERT模型能透过文本中同时出现的J、K和Rowling等单词,确定K在这份文本中所代表的意思,却无法学习和J. K. Rowling有关的任何知识;ERNIE则能透过分析单词和实体所隐藏的知识,推论Harry Potter和J. K. Rowling之间的关系,进而推论Harry Potter是J. K. Rowling所写的小说。

随着百度算法开始能理解有意义的单词,不再只是识别单一汉字后,ERNIE模型在中、英文理解上都有更好的表现。此后百度就将ERNIE应用于实际生活中,利用此AI模型提供更好的搜寻结果。人工智能促进协会(Association for the Advancement of Artificial Intelligence)曾在2019年2月的年会中,接受一篇以ERNIE模型为主题的报告在会上发表。

自Google在2010年退出国内后,国内搜寻引擎市场一直由百度独霸,囊括70%的市占率。不过网际网络使用模式的改变,让百度的优势开始松动。包括腾讯微信在内的自成一体超级应用程序(App)生态体系在中国崛起,意味民众观赏影片、阅读新闻、在在线购物或下单美食外送时,都不必再仰赖传统搜寻引擎。

此外,因短片App抖音风靡全球而崛起的字节跳动公司在2019年推出头条搜索,在国内搜寻引擎市场掀起新一波竞争。字节跳动声称,正在打造一个通用搜寻引擎,以提供更理想的用户体验。

推荐阅读:苹果7苹果8对比


相关新闻
新闻焦点
提到高血压,似乎人人都知道。你知道血压会升高,但你知道高到多少就算高血压了吗?你知道高血压很常见,但你知道哪些人属于易患高血压的高危人群吗?你知[更多]
引言:从当年《E.T》引爆的雅达利危机,到《星战前线2》被钉在耻辱柱上的视频被踩记录,授权游戏有时就像挥之不去的幽灵,附身在那些或贪得无厌或技不[更多]
近日,王子为台北时装周拍摄了一组写真,演绎了牛仔时尚。写真中,邱胜翊身穿靛蓝色丹宁套装搭配简单大方的白色T恤,脚踩小白鞋,洒脱随性、帅气时髦。[更多]
天气变凉的速度超乎想象,但越来越浓的秋味儿,也让生活多了几分烟火气,各种杂货、美食市集和跳蚤市场,就在这个周末扎堆儿举办,那种人来人往、热火朝天[更多]
关于我们 | 联系我们 | 老版地图 | 网站地图 | 版权声明
版权所有:珠江网讯未经授权禁止复制或建立镜像
相关作品的原创性、文中陈述文字以及内容数据庞杂本站无法一一核实,如果您发现本网站上有侵犯您的合法权益的内容,请联系我们,本网站将立即予以删除!
中国互联网违法和不良信息举报中心 网络警察报警岗亭