欢迎进入鸭脖官网人力资源服务股份有限公司官方网站!
新闻动态
聚集人力资源实时动态,发布鸭脖官网最新新闻,欢迎您的关注!
公司动态
深度学习在美团点评的应用【鸭脖手机版】
发布时间:2021-10-03 00:45
  |  
阅读量:
字号:
A+ A- A
本文摘要:按:本文刊登在微信号公众信号美团评论技术团队中,取得许可刊登。作者分别是文竹、美团评论美团平台和酒旅事业群智能技术中心负责人李彪、美团评论美团平台和酒旅事业群NLP技术负责人晓明、美团评论平台和酒旅事业群图像技术负责人。(公共编号:)|前言近年来,深度自学在语音、图像、自然语言处理等领域取得了非常引人注目的成果,成为最引人注目的技术热点之一。

鸭脖官网

按:本文刊登在微信号公众信号美团评论技术团队中,取得许可刊登。作者分别是文竹、美团评论美团平台和酒旅事业群智能技术中心负责人李彪、美团评论美团平台和酒旅事业群NLP技术负责人晓明、美团评论平台和酒旅事业群图像技术负责人。(公共编号:)|前言近年来,深度自学在语音、图像、自然语言处理等领域取得了非常引人注目的成果,成为最引人注目的技术热点之一。

美团评论这两年在深度自学方面也展开了一些探索,其中在自然语言处理领域,我们将深度自学技术应用于文本分析、语义给定、搜索引擎排名模型等;在计算机视觉领域,我们将其应用于文字识别、目标检测、图像分类、图像质量排名等。以语义给定、图像质量排序和文字识别三个应用于场景为例,详细说明美团评论在深度自学技术和应用方面的经验和方法论。

|根据深度自学的语义给定语义给定技术,在信息搜索、搜索引擎中具有最重要的地位,在结果解职、正确排名等环节发挥着最重要的作用。传统意义上的语义给予技术,重视文字水平的语义一致性,我们不得不称之为语言水平的语义给予的美团评论这样典型的O2O应用于场景下,我们的结果不仅与用户传达的语言水平的语义有很强的关系,还与用户的意图、用户的状态有很强的关系。

用户的意图是用户在做什么?例如,用户在百度上搜索关内外,他的意图可能是想告诉关内外代表的地理区域范围,关内和关外作为两个词进行搜索,在美团上搜索关内外,用户想找的是关内外这家酒店,关内外作为一个词进行处理。另外,在用户状态下,在北京和武汉的用户在百度和淘宝上搜索任何词条,可能得到的结果都很差,但是在美团这样与地理位置有很强关系的场景下几乎不同。例如,我在武汉搜索黄鹤楼,用户去的可能是观光地的票,在北京搜索黄鹤楼,用户去的可能是酒店。如何融合语言层的信息和用户的意图、状态来决定语义?我们的想法是在短文本之外引O2O业务场景的一部分特征,带入设计的深度自学,在语义给定的框架中,通过页/订购数据提示语义给定模型的优化方向,最后将训练的页相关模型应用于搜索业务。

右图是美团评论场景设计的页面近度框架ClickNet,是比较轻量级的模型,考虑到效果和性能,可以在线应用。表示层对Query和业者名分别以语义和业务特征作出反应,其中语义特征是核心,通过DNN/CNN/RNN/LSTM/GRU方法获得短文本的总体向量反应,并且不引进业务相关特征,例如用户和业者的相关信息自学层通过多层连接和非线性变化后,预测给定分数,根据分数和Label调整网络,自学制作有Query和业者名称的页面给定关系。

在这个算法框架上训练效果好的语义模型,必须根据场景优化模型。首先,我们必须从训练材料中进行很多优化。例如,考虑样品不平衡、样品最重要、方位Bias等问题。

其次,模型参数优秀时,考虑到优化算法、网络大小水平、强参数调整等问题。经过模式培训的优化,我们的语义给定模式已经在美团评论平台上搜索、广告、酒店、旅游等解职和排序系统上线,有效提高了访问率/收益/点击率等指标。总结深度自学应用于语义给定,必须在业务场景中设计合适的算法框架。另外,深度自学算法增加了特征工程的工作,但由于模型的可玩性不减,可以从框架设计、业务语料处理、模型参数优化三个方面综合考虑,构建效果和性能优异的模型。

|基于深度自学的图像质量排名国内外各大互联网公司(腾讯、蚂蚁、Yelp等)的在线广告业务,关注哪些图像可以有更多的页面。在美团的评论中,业者的第一张图是由业者和运营者人工注册的,如何自由选择第一张图是更好的用户呢?图像质量排序算法的目标是自动自由选择更高质量的第一张图片,以获得更多用户页面。传统图片质量排序方法主要从美学角度展开质量评价,通过色彩统计资料、主体产于、线条等分析图片的美感。但是,在实际的业务场景中,用户对图像质量好坏的辨别主观性很强,不能构成统一的评价标准。

例如,有些用户对清晰度和分辨率更脆弱,有些用户对颜色和线条更脆弱,有些用户喜欢视觉冲击力的内容,而不是平坦的环境图。因此,我们用于深入的自学方法,挖掘图像的哪些属性不影响用户的识别,如何有效地融合这些属性来评价图像。

我们用于AlexNet提取图像的上层语义叙述,补充了自学美感、记忆度、更有度、品种等Higholevel特征,人工设计的Lowholevel特征(颜色、锐度、对比度、角点等)。取得这些特点后,训练浅层神经网络对整个图像的评价。该框架(图2右图)的一个特征是引领深度自学特征和传统特征,引进高层语义,保持低层标准化记述,包括全局特征和局部特征。

对于每个维度图像属性的自学,必须支持大量的标签数据,但由于人工标签的代价很大,我们结合了美团评论的图像来源和POI标签系统。关于更具属性的自学,我们选择了美团DealBloger中点击率低的照片(多数是摄影师用单反相机拍摄)作为正例,选择UGCBloger中点击率低的照片(多数是低端手机拍摄)作为负例。关于类别属性的自学,我们将美团的一级类别和罕见的二级类别作为照片标签。基于上述质量排序模型,我们为广告POI选择合适的优质第一张图展开,发挥更多用户页面,提高业务指标的目的。

图3得出了基于质量排名的第一张图的替代结果。|基于深度自学的OCR为了提高用户体验,O2O产品对OCR技术的市场需求渗透到订单、缴纳、仓库和用户评价等环节。

OCR在美团评论业务中主要发挥两个方面。另一方面,在移动支付阶段识别银行卡号码的照片,构筑自动绑定卡,例如辅助BD输入菜单的菜肴信息。另一方面,审查检查。

鸭脖手机版

例如,在业者资格审查阶段,对业者上载的身份证、营业执照和饮食执照等证明书的照片展开信息的提取和检查,保证业者的合法性。例如,机械过滤器业者的订单和用户评价阶段产生的包括违禁语在内的照片。与传统的OCR场景(印刷体、瞄准文件)相比,美团的OCR场景主要对手机拍摄的照片展开文字信息的提取和识别,考虑到在线用户的多样性,主要面临以下挑战:光学简单:噪音、模糊、光线变化、应力文字简单:字体、字体、字体、颜色、磨损、笔画宽度不同、方向的背景简单:布局缺陷、背景障碍。

对于上述挑战,传统的OCR解决方案不存在以下严重不足:通过布局分析(二值化、连接域分析)分解文本行,拒绝布局结构有很强的规则性,前背景分离性强(例如文档图像、牌照),前背景简单的随意文字(例如场景文字、菜单、广告文字等)通过人工设计边缘的方向特征(例如HOG)训练文字识别模型,这样的单一特征在文字变化、模糊或背景障碍时一般化能力迅速上升。过度依赖文字重复的结果,文字变形、粘附、噪音受阻时,重复的错误传播尤其引人注目。对于传统OCR解决方案的严重不足,我们可以尝试基于深度自学的OCR。

1.基于FasterR-CNN和FCN的文字定位,首先根据是否有先验信息,将布局区分为可控场景(身份证、营业执照、银行卡)和非可控场景(菜单、门图)。对于可控场景,我们将文字定位切换为检测特定关键字目标的问题。

主要利用FasterR-CNN进行检查,如下图的右图所示。为了确保返板定位精度同时提高运算速度,我们对原先的框架和训练方式开展了微调:考虑到关键词目标类内的变化受到限制,我们裁剪了ZF模型的网络结构,将5层卷增加到3层。

训练过程中提高了样品的重合亲率阈值,根据业务市场的需要与RPN层Anchor的宽高比兼容。对于非可控场景,由于文字方向和笔画宽度的变化,目标检查中回归板的定位粒度过高,我们利用语义分割中常用的全卷积网络(FCN)展开像素级别的文字/背景显示,如下图所示。为了同时确保定位的准确性和语义的明确性,我们不仅在最后一层开展反卷积累,而且融合了深层Layer和浅层Layer的反卷积累结果2.根据序列自学框架的文字识别,有效控制文字重复和识别后处理的错误传播效果,构建从末端到末端的文字识别的训练性,我们使用下图右图的序列自学框架。框架整体分为三层:卷积层、反复层和翻译层。

其中,卷积层的特征、反复层是自学特征序列中文字特征的前后关系和自学文字的前后关系,翻译成层构筑时间序列分类结果的解码。由于序列自学框架对训练样本的数量和拒绝很高,我们使用了现实样本制作样本的方法。现实样本多为美团评论业务来源(如菜单、身份证、营业执照),制作样本考虑字体、应力、模糊、噪音、背景等因素。

根据上述序列的自学框架和训练数据,在各种场景的文字识别中大幅度提高了性能。|总结本文主要以深度自学在自然语言处理、图片处理两个领域的应用为例进行讲解,而深度自学在美团评论中可能发挥得淋漓尽致的价值相比之下并不局限于此。

未来,我们将在智能互动、仓库调度、智能运营等各种场景中发掘出来,为美团评论产品的智能道路做出贡献。版权文章允许禁止发布。下一篇文章发表了注意事项。


本文关键词:深度,学习,在,美团,点评,的,应用,【,鸭脖,按,鸭脖网页版

本文来源:鸭脖官网-www.faxlesspaydayloanscanada.com