首页>>人工智能->人工智能怎么选择标题(2023年最新分享)

人工智能怎么选择标题(2023年最新分享)

时间:2023-12-09 本站 点击:0

导读:今天首席CTO笔记来给各位分享关于人工智能怎么选择标题的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

人工智能怎么做?

工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人智能的理论、方法、技术及应用系统的一门新技术科学。人工智能领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新技术科学。

人工智能是计算机科学的一个分支,它企图了解智能的实质,可以产出一种新的可以和人类智能相似的方式做出反应的智能机器,该领域的研究主要有机器人、语言识别、图像识别、自然语言处理和专家系统等。

自从人工智能诞生以来,理论和技术越来越成熟,应用领域在不断的扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以把人的意识、思维的信息过程的模拟。虽然人工智能不是人的智能,但可以像人那样思考、最终可能超过人的智能。

优点:

1、在生产方面,效率更高且成本低廉的机器及人工智能实体代替了人的各种能力,人类的劳动力将大大被解放。

2、人类环境问题将会得到一定的改善,较少的资源可以满足更大的需求。

3、人工智能可以提高人类认识世界、适应世界的能力。

缺点:

1、人工智能代替了人类做各种各样的事情,人类失业率会明显的增高,人类就会处于无依靠可生存的状态。

电动玩具机器人,上拼多多要怎么写标题跟关键词?

1什么是机器人:机器人(Robot)是自动执行工作的机器装置。机器人可接受人类指挥,也可以执行预先编排的程序,也可以根据以人工智能技术制定的原则纲领行动。机器人执行的是取代或是协助人类工作的工作,例如制造业、建筑业,或是危险的工作。

2第一台机器人诞生于哪年?应用于哪个领域?恩格尔伯格是世界上最著名的机器人专家之一,1958年他建立了Unimation公司,并于1959年研制出了世界上第一台工业机器人,他对创建机器人工业作出了杰出的贡献。1983年,就在工业机器人销售日渐火爆的时候,恩格尔伯格和他的同事们毅然将Unimation公司买给了西屋公司,并创建了TRC公司,开始研制服务机器人。

3、机器人发展经历了哪几个阶段?

机器人发展的三个发展阶段

随着人们对机器的研究,机器人也在进步,按其发展过程机器人可分为三代:

第一代是示教再现型机器人:"尤尼梅特"和"沃尔萨特兰"这两种最早的工业机器人是示教再现型机器人的典型代表。它由人操纵机械手做一遍应当完成的动作或通过控制器发出指令让机械手臂动作,在动作过程中机器人会自动将这一过程存入记忆装置。当机器人工作时,能再现人教给它的动作,并能自动重复的执行。这类机器人不具有外界信息的反馈能力,很难适应变化的环境。

第二代是有感觉的机器人:它们对外界环境有一定感知能力,并具有听觉、视觉、触觉等功能。机器人工作时,根据感觉器官(传感器)获得的信息,灵活调整自己的工作状态,保证在适应环境的情况下完成工作。如:有触觉的机械手可轻松自如地抓取鸡蛋,具有嗅觉的机器人能分辨出不同饮料和酒类。

第三代是具有智能的机器人:智能机器人是靠人工智能技术决策行动的机器人,它们根据感觉到的信息,进行独立思维、识别、推理,并作出判断和决策,不用人的参与就可以完成一些复杂的工作。日本研制的能演奏数首曲目?quot;瓦伯特"2号机器人,已达到5岁儿童的智能水平。目前,智能机器人已在许多方面具有人类的特点,随着机器人技术不断发展与完善,机器人的智能水平将越来越接近人类。

4、机器人在哪些方面有广泛的应用?你可以浏览一下网页:、说说机器人与一些电动玩具的区别?

职能化程度与应用性质不一样

6、请你想象一下未来机器人的外形与功能会是什么样的?明天的高级智能机器人将比今天的智能机器人具有更丰富的感觉功能和更熟练的活动能力。到那时,家庭里将有服务周到、态度和蔼可亲的家庭机器人。早晨,主人吃过早点上班以后,它立即用吸尘器清的房间,用洗衣机洗涤(dí)主人换下的衣服。电话铃响了,它马上拿起耳机,在一张便条上记下对话内容。“哇——”摇篮里的婴儿醒了,它又像慈祥的母亲一样抱起婴儿,喂水、喂奶,轻声哼(hēng)起一支优美动听的催眠曲,把婴儿再一次送入梦乡。门铃响了,它并不急于开门,而首先问来访者是谁,然后根据来访者的声音仔细辨别他是不是主人的客人,以此决定是否开门。即使是盗贼的恐吓,它也不会害怕,而是声色俱厉地高喊:“快走,你这个无赖(lài)!再不走,我要报警了!”盗贼听到这喊声,只好胆战心惊地走开。做午餐的铃声响了,它走进厨房,熟练地烤面包、炸牛排,为主人准备可口的饭菜。门铃又响了,一听那熟悉的声音,它就知道是主人下班回来了,马上开门迎接……

ai中如何把标题1和标题二同时保存

ai中把标题1和标题二同时保存的方法是:

1、首先我们打开电脑中的AI软件,Ctrl+n新建文件。

2、使用椭圆工具,绘制两个有交集的圆形。

3、在上面的菜单栏中,点击窗口—路径查找器的选项。

4、选中两个圆形,在路径查找器的面板中,点击交集的选项。

5、最后,点击后即可获得两个形状重叠的部分后保存即可。ai一般指人工智能,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

人工智能推荐下信息的选择:别一看标题就把文章跳过

2019-11-22

现在人信息的来源太过于多种多样,但主要还是通过手机,网络为主,传统纸媒杂志早就退居到次要位置。

时代发展太快,信息的推送与传播也太快,快得很多时候,只能靠一篇文章的“标题”来判断这篇文章的内容质量。感兴趣吸引眼球吊足胃口的标题,就会吸引人点开进去,否则,一篇文章就会被石沉大海。

大数据的智能算法,只能根据用户的反馈数据来确定一篇文章信息质量的高低。对于文章信息质量的把握,很多时候只能通过人工复审来完成,很多优秀的文章,很难被发现挖掘出来。

相反,大部分的文字垃圾充斥着网络,大行其道招摇过市。

自媒体应用通过智能运算,给每个用户事先选择过滤了无效的信息,大大降低了用户筛选信息的无用时间,只推送和用户兴趣爱好相匹配的信息,

按照用户文章信息的点击浏览记录判定一个用户的兴趣爱好,接着再通过信息的阅读增加匹配度。

另一个方面,开发出来了“右下角的×”功能。可以精准屏蔽用户不敢兴趣的信息,这样,通过用户二次反馈,进一步掌握了读者准确的兴趣爱好点。

这是一把双利剑,你越是频繁使用“不感兴趣”的筛选功能,文章和你兴趣的匹配度越高,越容易增加你看到信息的质量。 可是在不知不觉中,你放弃了更多兴趣爱好的可能性,主动屏蔽了生活应该有的无限的可能性。

新世纪是一个信息传播的时间分界点,之前基本都是从上往下传播,获取信息的方式与手段都比较单一与封闭。

之后信息爆炸,获取的途径、方式方法都转变得太快。面对信息如山般的时代,如何去甄别取舍、去伪存真、得到高效与有价值的信息成为每一个人面对的难题。

八九十年代,通过报纸电视、广播、书本获取知识信息,不管好坏有用没用,只能主动去获取,先“拿来主义”再说。毕竟能够传播与交流的信息很有限,知识也匮乏。 话语权基本都掌握在主流媒体与报纸杂志的手中,普通群众能够接触获取的信息有限。

进入新世纪,网络的崛起,完全颠覆了这样的格局。首先信息传播途径之快,覆盖范围之广,获取渠道的之便利,已经完全超出了一般人的想象。

很多人被迫接受信息的轮番轰炸,信息已经超出了人能够承受的范围,每个人都被迫在信息浪潮中,有所取舍,有所爱憎,必须做出信息摄入的控制。最好能够避免过多无效信息、过期信息、无聊垃圾信息的摄入。

面对浩瀚如海的信息,你没有时间与精力去全盘接受,这需要我们对轮番轰炸的信息做出必要的判断、分拣、取舍、利用和摄入。

如何分辨真假、判断正误、汇总分析、学习与交流,应该是新时代每一个人都应该要掌握的生存技能。

由于时代的飞速发展,互联网的高效传播,有人综合计算,全世界的知识总量,七到十年翻一番。传统学科知识边缘不断扩展,各种学科知识不断融合,信息叠加在一起,一个人穷其一生,也不可能了解和掌握这么多的信息源。

所以,什么样的知识才是我们真正需要的?

每个人的经历、出身、处境、身份、职业、性格、爱好、立场、文化水平、知识面、家庭、个人综合条件、背景、品德修养等方面的差异不同,对同一问题的认知也就不一样,对同一信息的反馈对知识的理解掌握也不尽相同。

你很难去说到底什么样的信息是人们真正需要的,是有价值的。但是被动学习碎片化知识,不如主动学习系统化知识。

不能止步于表面肤浅的信息知识和整理汇编,不能只满足于信息的广泛摄入和累积,不自己加以综合分析梳理,太多的信息也仅仅是放在大脑的密室里而已。

我们需要掌握一种信息取舍的能力,能够取的太多,但是需要舍弃的总是那么几种。恶俗、色情、毁三观的不需要,违反公序良俗法律法规不需要,千篇一律的新八股文不需要,故意混淆视听的不需要。

每个人都应该要有这样的意识:对于什么样的信息内容,是我绝不需要的,剩下的,那些是可以接受的。

价值是选择的内核所在,首先必须明确占据我们大量时间的这些大量信息,真的那么有价值吗?

人都趋向于只愿意接受无压力、无信息增量的信息。 比如搞笑的视频,娱乐的图片,低俗的文字,明星娱乐八卦以及一些流水账类似的信息。经过大脑刻意的选择,只留下了令“大脑”愉快的信息,这样躺在大脑舒适区里面,主动隔离和屏蔽了自我进步,自我提升的可能性,同时也隔绝了人生一切的可能。

尝试选择能让人思考,有点难度的信息,这样可以扩宽思维的边界。

长期把不感兴趣的文章屏蔽了,久而久之视野与格局就只能限制在很小很窄的范围领域里面。如果选择正确,会往专家与教授专业化方面发展,兴趣会越来越浓,知识会越来越专业,可是如果一旦一开始选择的兴趣爱好就错误的,长期反复不断叉掉智能推荐的文章,只会往错误的方向越有越远。

很多人都有这样的经历,刚才看了某一篇文章,介绍某一个产品或者“东西”,重新打开一个购物软件,刚才看的东西豁然出现在醒目的位置,立马就会有“引诱”你买的意图。

才看了某一方面的文章,过了一小段时间,机器会反复不断地给你推送与之相关的信息,你只要点击读取评论转发,变现出感兴趣的可能,接下来就是这一个方面源源不断的兴趣点轰炸。

大多数人都是被动接受这样的信息供给,基本上没有过多自主选择的意图,更谈不上主动去取舍与筛选。其实要有刻意去选择,每天绝大多数的时间都会用在不停叉掉推荐文章这个行为动作上本身上,停留在深入阅读上面的时间就少得可怜。

现在自媒体的文章,一般读者停留的时间都很短,大部分写作者只能靠夸张博眼球的标题吸引读者增加点击率,一篇文章如果连标题都不够吸引读者,那么不管内容如何优质,读者能够读到的概率太低。

别把那些不感兴趣标题的文章叉掉,点开,或许你会有惊喜。 能获得有不一样的认知感悟,能看到不一样的另类信息解读,能够增加新的兴趣点知识面,还能拓宽思维的边界和格局。

顺眼感兴趣的内容标题,大多和你平时喜欢的信息有关,要培养博览众长广泛摄取信息的能力,这就要求对不同的内容,不同质量的信息都要有所关注。有时候在一堆凡俗无聊的文章包围环境中,错误的兴趣推荐中,突然点到了另类的文章,有思想观点的文字,会让你眼前一亮,说不一定你就会在垃圾信息轰炸中脱离出来。

与其在一大推垃圾里不停翻找可回收利用的二手信息,不如直接脱离垃圾,去寻找真正优质的一手资源。

AI智能写作,妙笔生花

由于人工智能是存储内容的一种存储和应用,所以所谓的人工智能写作可以分为两种形式。一种是改进 或改造存储的物品。在优化中,我们将讨论伪原创,它可以根据文章的类型和文章的中心思想匹配相应 的文章。或者直接在网上收集一些文章,根据指定的逻辑数据进行写作。我认为,这种写作不应该被 称为人工智能文章。因为他的形态不属于人工智能的特征。另一个是一般意义上的关联类型。机器需要 理解每个文本或句子,并根据指定的标题创建文章。我们通常根据我们所知道的、所想的、所听的和所 理解的写一篇文章。如果机器也能做到这一点,它真的可以在床上数钱。自媒体如此发达,可以直接取代 代手工创作文章,这是一件美妙的事情。人工智能创造文章。他会理解和分析每个单词的情绪,从而得 到单词,就像打字一样。对于某些单词,我们只需要键入前几个单词或与其他相关单词关联的单词。通 过这种方式,我们可以根据其他环境选择单词。以这种方式撰写的文章具有一定的创意色彩,这种人工 智能将成为未来人工智能写作的主流。然而,似乎还需要非常复杂的实现。

通过人工智能写文章需要大量内存来存储文章和单词。在这种情况下,似乎没有问题,可行性大大增加 。然而,在实际应用中,目前用人工智能编写的文章的可读性和价值是无法恭维的。伪原创文章的可读 性不是大问题。质量可能会变得很差,控制也很小。如果是通过词语的联想、额外的 情感 因素和对外部 环境的判断,那么这个值就会相对较高。但可读性或每个句子之间的联系可能是一个障碍。

目前,它只能在要求不高的地方实现,或者在对文章要求不高的地方实现,或者可以使用人工智能创作的文章。毕竟,这可以节省很多时间和精力。现在时间如此宝贵,真的不愿意浪费一分钱。哪一个行业对商品的需求量很大,而其他需求却不多?

在网站优化的过程中有一个关键的过程,那就是发送文章。本文的目的是调整内部链和关键字分布。二 是增加网站的收藏量,提高搜索引擎对网站的友好度。它还反映了网站在搜索引擎中的相关性和专业性 网站优化对文章的质量没有这么高的要求。非技术性文章可以通过人工智能编写或转换。由于人工智能 写作的高效性,它完全可以作为网站上非技术性文章的写作。如果你能使用高级创意文章,可能会有更多 好的效果。毕竟,这些文章是原创的相关文章。

生活中的人工智能之搜索和推荐算法

姓名:陈心语  学号:21009102266 书院:海棠1号书院

转自: 人工智能在搜索中的应用_u014033218的专栏-CSDN博客

人工智能在搜索的应用和实践_qq_40954115的博客-CSDN博客

【嵌牛导读】日常生活中的搜索和推荐算法也与人工智能有所关联,让我们一起来看看吧!

【嵌牛鼻子】人工智能运用于搜索和推荐算法。

【嵌牛提问】人工智能在搜索和推荐算法中有什么运用呢?

【嵌牛正文】

智能交互

智能交互有三个方面的这部分组成,第一个就是Query推荐,这是比较古老的课题;第二个做智能导购,这是现在正在做的一个原形,后面我会讲为什么做智能导购;第三个内容的展示和个性化的创意。就是说你把商品怎么展示给用户,也是我们认为是交互的一部分。

第一个是Query推荐,这个问题怎么来抽象呢?Query推荐是一个用户当前Query下面我们怎么推荐其它Query,这是我们相关搜索一样的。我们推荐这样的一个Query以后,如果用户一旦点了其中的一个Query,用户的状态就会发生变化,从当前的Query跳到另外一个Query,这是用户状态的变化。第二个就是说我们怎么评价我们推荐的Query的好坏,它由几部分组成,一个Query有没有被点,第二个就是说推荐Query里面,它的SRP页会不会点,因为Query推荐本质上不是Query推荐做的最好就是最好的,它是说最终要在搜索SRP用户有没有买,有没有点击,这才是做的好的,这是第二个收益。还有一个更加间接的,通过Query推,这个状态转到下一个状态以后,这个里面还会推其它Query,还会有其它点击,这个时候也是个间接推荐。如果我不推Query就不能到这个状态,不到状态不会有这个Query,不会有这个收益。我们了解,这就是典型的一个马尔科夫决策过程,我们是用强化学习来做的,Actions就是我们的Query list,根据用户和当前Query推荐其他Query,状态就是User + Query,收益就是包括推荐Query击,还有一个间接收益,间接收益通过bellman 公式可以算出来,这就是一个DQN的强化学习项目。

智能导购

现在的搜索呈现的问题就是说,如果去看搜索的Query都是一些品类词、品牌词、型号词或者属性词。假定用户他知道买什么再来搜索搜,但是有各很大的东西用户不知道买什么吗?智能导购就是做做一个类似智能导购机器人的产品,引导用户怎么搜,用户也可以主动问,获取知识或购物经验。这是后台的算法的一个原形,不久后会上线。

智能内容

因为淘宝的商品,卖家为了适应我们的引擎,做了大量的SEO,里面都是罗列热门的关健词,导致问题淘宝的标题没什么差异,都写的差不多,看标题也不知道什么东西,或者知道但里面没有很多特色的内容。我们做智能内容很重要的出发点是怎么从商品的评价、详情页、属性里面挖出一些比较有卖点,或者商品比较有特色的东西展示给用户,让用户更好的了解商品,这是第一个。第二个淘宝上面还有类似商品聚合的,比如清单,生成一个清单,怎么给清单生成一个比较好的导入的描述,让用户描述这个清单干什么。这里面主要做了这两个事情。具体怎么做的?一个会生成一些Topic,比如行业运营加上我们挖的一些点,比如像手机一般大家关注点会是手机的性价比,拍照是不是清晰,还有速度是不是快,是不是发热什么的,这是用户关注的兴趣点。然后它会根据这个商品会选择一个兴趣点,通过Seq2seq生成短文本。

语义搜索

我们的商品属性基本上是比较标准化的,因为这里淘宝有一个这样的商品库,非标准化的内容是没法上传的。导致的问题是我们的商品内容相对来说是比较规范化的,但是用户的输入的Query不是这样的,比如我这里举一些例子,比如一个新品有各种表达,2017新品,2017冬季新品,是吧?新品,有很多的表达。所以就是从从用户的需求跟商品的内容,就存在了一个语义的Gap。还有我们经常举例,比如三口之家用的电饭锅,很多这种语义的问题,这个语义从语义角度解决语义Match的事情。

大概会有这么几个方面。比如一个就是意图的理解,还有意图的Mapping,比如大容量冰箱,首先知道大的是跟冰箱的容量相关的,冰箱是个类目,最后要Mapping到人的冰箱,把‘大’改写成一个容量大于多少升,类目是冰箱这样才能够比较好的解决我们这个搜索的这个召回的问题。 第二个语义理解,这里面包括Query和商品都要做语义理解,比如通过image tagging计算从图片里面抽取很多文本的语义标签补充到商品文本索引中。 第三个就是现在有这个端到端的深度学习技术来直接学Query和商品的Similarity,通过端到端的深度学习技术来做语义的召回和语义的相关性。

智能匹配

主要就是讲个性化,做个性化的首要就是个性化数据。个性化本质上就是说以用户为中心构建用户的标签,用户的行为,还有用户的偏好,再通过这些数据找到,去Match到商品,比如说你看过相似商品,典型的协同过滤,还有你偏好的品牌的其它商品。那就是基于这些经历了一个以用户为中心的电商图谱,这里面还加了一些辅助的数据,比如商品的相似度,店铺之间的相似度,这样构建了我们这样的叫电商图谱。

个性化召回与向量化召回

召回是这样的,首先从咱们的电商图谱里取出用户的信息,包括比如说年龄性别,还有当地温度是多少,还有行为足迹等等之类的,社交现在没用了,因为这是几年前社交特别火,什么都要掺和一下,其实社交,信息的社交到电商其实风马牛不相及的领域,没有任何价值。所以现在好友这东西几乎没有用。因为不同Query中,用户信息重要性是不一样的,我们根据上下文会做用户信息的筛选或者排序,会找出比较重要的信息做个性化召回。以上是淘宝商品索引结构,传统的搜索关键字是通过搜索关键字召回,而个性化商品索引,除了Query还会有商品簇,簇与簇之间的关系,品牌店铺等等之类的,会加很多个性化的特征做召回,通过这种带的好处是召回的结果跟用户是直接相关的,就召回这一步带来个性化。

但是这种基于行为召回还是存在一个问题的。最重要的问题它的泛化能力会比较差。最典型的比如说你通过协同过滤来做,如果两个商品,没有用户同时看过的话,这两个商品你认为他们相似度是零,这个结论是错的,但是如果通过协同过滤就有这个问题。我们今年实现了向量化召回,包括两步:一个是Similarity learning,通过这个深度学习做端到端的Similarity learning,就会把这个我们的User 和Item会变成一个向量;第二步就是做向量化召回,比如层次聚类,随机游走,learning to hash等,这样的话就是说会极大的提升召回的深度。

个性化工作

在个性化领域其实最重要的一个核心的问题就是怎么去理解用户,怎么感知用户和预测用户行为及偏好。

首先是数据,用户在淘宝有两个中类型重要的基本信息:一个是用户标签,比如年龄、性别、职业等;第二是用户足迹,比如 点过,买过的商品,店铺等;

其次是用户感知要和搜索上下文相关,即这个用户的表征和要用户搜索意图相关;

第三是搜索有很多差异化的任务,比如用户消费能力的预估, User到Item的CTR预估和用户购物状态预估等,是为每个任务做个端到端的深度学习模型还是用统一的用户表征来完成不同的Task?如果每一个任务都做端到端深度学习会有很多问题,比如离线和在线的性能开销会大很多,或部分任务样本太少。

如图是用户感知深度模型,输入X是用户的点击行为序列,下一步是embedding,embedding完以后,通过LSTM把用户行为序列做embedding,因为在搜索用户感知和Query相关,所以加入query 的 attention层,选择和当前query有关系的行为,表征完是Multi-task learning 网络。整个这个网络的参数大概有一百亿个参数,我在双11我们还实现了在线学习。

算法包括智能交互、语义搜索、智能匹配和搜索策略四个方向。

智能交互

商品搜索就是带交互的商品推荐,用户通过关键字输入搜索意图,引擎返回和搜索意图匹配的个性化推荐结果,好的交互技术能够帮助到用户更好的使用搜索引擎,目前搜索的交互主要是主动关键字输入和关键字推荐,比如搜索框中的默认查询词和搜索结果中的文字链等,推荐引擎根据用户搜索历史、上下文、行为和状态推荐关键字。和商品推荐的区别是,关键字推荐是搜索链路的中间环节,关键字推荐的收益除了关键字的点击行为外,还需要考虑对整个购物链路的影响,包括在推荐关键字的后续行为中是否有商品点击、加购和成交或跳转到另外一个关键字的后继行为,这是一个典型的强化学习问题,action 是推荐的关键字候选集合,状态是用户当前搜索关键词、上下文等,收益是搜索引导的成交。除了被动的关键字推荐,我们也在思考搜索中更加主动的交互方式,能够做到像导购员一样的双向互动,主动询问用户需求,挑选个性化的商品和给出个性化的推荐理由,目前我们已经在做智能导购和智能内容方向的技术原型及论证,智能导购在技术上主要是借鉴对话系统,通过引导用户和引擎对话与关键字推荐方式互为补充,包括自然语言理解,对话策略,对话生成,知识推理、知识问答和商品搜索等模块,功能主要包括:a. 根据用户搜索上下文生成引导用户主动交互的文本,比如搜索“奶粉”时,会生成“您宝宝多大?0~6个月,6个月到1岁….”引导文案,提示用户细化搜索意图,如果用户输入“3个月”后,会召回相应段位的奶粉,并在后续的搜索中会记住对话状态“3个月”宝宝和提示用户“以下是适合3个月宝宝的奶粉”,b. 知识导购,包含提高售前知识问答或知识提示,比如“3个月宝宝吃什么奶粉” 回答“1段”,目前对话技术还不太成熟,尤其是在多轮对话状态跟踪、知识问答和自动评价几个方面,但随着深度学习、强化学习和生成对抗学习等技术在NLP、对话策略、阅读理解等领域的应用,越来越多的训练数据和应用场景,domain specific 的对话技术未来几年应该会突飞猛进;智能内容生成,包括生成或辅助人工生成商品和清单的“卖点”,短标题和文本摘要等,让淘宝商品表达更加个性化和多元化。

语义搜索

语义搜索主要是解决关键字和商品内容之间的语义鸿沟,比如搜索“2~3周岁宝宝外套”,如果按照关键字匹配召回结果会远小于实际语义匹配的商品。语义搜索的范围主要包括:a. query tagging和改写,比如新品,年龄,尺码,店铺名,属性,类目等搜索意图识别和归一化,query tagging模型是用的经典的序列标注模型 bi-lstm + CRF,而标签分类(归一化) 作为模型另外一个任务,将序列标注和分类融合在一起学习;b. query 改写,主要是计算query之间相似度,把一个query改写成多个语义相似的query,通常做法是先用不同改写策略生成改写候选query集合,比如词替换、向量化后top k、点击商品相似度等,然后在用ltr对后续集合排序找出合适的改写集合,模型设计和训练相对简单,比较难的是如何构建高质量的训练样本集合,线上我们用bandit 的方法探测部分query 改写结果的优劣,离线则用规则和生成对抗网络生成一批质量较高的样本; c. 商品内容理解和语义标签,通过商品图片,详情页,评价和同义词,上下位词等给商品打标签或扩充商品索引内容,比如用 image tagging技术生成图片的文本标签丰富商品内容,或者更进一步用直接用图片向量和文本向量融合,实现富媒体的检索和查询;d. 语义匹配,经典的DSSM 模型技术把query 和商品变成向量,用向量内积表达语义相似度,在问答或阅读理解中大量用到多层LSTM + attention 做语义匹配,同样高质量样本,特别是高质量负样本很大程度上决定了模型的质量,我们没有采样效率很低的随机负采样,而是基于电商知识图谱,通过生成字面相似但不相关的query及相关文档的方法生成负样本。从上面可以看到query tagging、query相似度、语义匹配和语义相关性是多个目标不同但关联程度非常高的任务,下一步我们计划用统一的语义计算框架支持不同的语义计算任务,具体包括1. 开发基于商品内容的商品表征学习框架,为商品内容理解,内容生成,商品召回和相关性提供统一的商品表征学习框架,重点包括商品标题,属性,详情页和评价等文本信息抽取,图像特征抽取和多模信号融合;2. query 表征学习框架,为query 类目预测,query改写,query 推荐等提供统一的表征学习框架,重点通过多个query 相似任务训练统一的query表征学习模型;3. 语义召回,语义相关性等业务应用模型框架。语义搜索除了增加搜索结果相关性,提升用户体验外,也可以一定程度上遏制淘宝商品标题堆砌热门关键词的问题。

智能匹配

这里主要是指个性化和排序。内容包括:a. ibrain (深度用户感知网络),搜索或推荐中个性化的重点是用户的理解与表达,基于淘宝的用户画像静态特征和用户行为动态特征,我们基于multi-modals learning、multi-task representation learning以及LSTM的相关技术,从海量用户行为日志中直接学习用户的通用表达,该学习方法善于“总结经验”、“触类旁通”,使得到的用户表达更基础且更全面,能够直接用于用户行为识别、偏好预估、个性化召回、个性化排序等任务,在搜索、推荐和广告等个性化业务中有广泛的应用场景,感知网络超过10B个参数,已经学习了几千亿次的用户行为,并且会保持不间断的增量学习越来越聪明; b. 多模学习,淘宝商品有文本、图像、标签、id 、品牌、类目、店铺及统计特征,这些特征彼此有一定程度的冗余和互补,我们利用多模学习通过多模联合学习方法把多维度特征融合在一起形成统一的商品标准,并多模联合学习中引入self-attention实现特征维度在不同场景下的差异,比如女装下图片特征比较重要,3C下文本比较重要等;c. deepfm,相对wide deep 模型,deepfm 增加了特征组合能力,基于先验知识的组合特征能够应用到深度学习模型中,提升模型预测精度;d. 在线深度排序模型,由于行为类型和商品重要性差异,每个样本学习权重不同,通过样本池对大权重样本重复copy分批学习,有效的提升了模型学习稳定性,同时通过融合用户状态深度ltr模型实现了千人千面的排序模型学习;e. 全局排序,ltr 只对单个文档打分然后按照ltr分数和打散规则排序,容易导致搜索结果同质化,影响总页效率,全局排序通过已知排序结果做为上下文预测下一个位置的商品点击概率,有效提升了总页排序效率;f. 另外工程还实现了基于用户和商品向量的向量召回引擎,相对倒排索引,向量化召回泛化能力更强,对语义搜索和提高个性化匹配深度是非常有价值的。以上实现了搜索从召回、排序特征、排序模型、个性化和重排的深度学习升级,在双11无线商品搜索中带来超过10% (AB-Test)的搜索指标提升。

智能决策

搜索中个性化产品都是成交最大化,导致的问题是搜索结果趋同,浪费曝光,今年做的一个重要工作是利用多智能体协同学习技术,实现了搜索多个异构场景间的环境感知、场景通信、单独决策和联合学习,实现联合收益最大化,而不是此消彼长,在今年双11中联合优化版本带来的店铺内和无线搜索综合指标提升12% (AB-Test),比非联合优化版本高3% (AB-Test)。

性能优化

在深度学习刚起步的时候,我们意识到深度模型inference 性能会是一个瓶颈,所以在这方面做了大量的调研和实验,包括模型压缩(剪枝),低秩分解,量化和二值网络,由于缺少相应的指令集和硬件支持,最终只在个别场景下上线,期待支持低精度矩阵计算和稀疏矩阵计算的硬件早日出现。

未来计划

通用用户表征学习。前面介绍的DUPN 是一个非常不错的用户表征学习模型,但基于query 的attention 只适合搜索,同时缺少基于日志来源的attention,难以推广到其他业务,在思考做一个能够适合多个业务场景的用户表征模型,非搜索业务做些简单fine tuning 就能取得比较好的效果;同时用户购物偏好受季节和周期等影响,时间跨度非常大,最近K个行为序列假设太简单,我们在思考能够做life-long learning 的模型,能够学习用户过去几年的行为序列;搜索链路联合优化。从用户进入搜索到离开搜索链路中的整体优化,比如 搜索前的query 引导(底纹),搜索中的商品和内容排序,搜索后的 query推荐(锦囊)等场景;跨场景联合优化。今年搜索内部主搜索和店铺内搜索联合优化取得了很好的结果,未来希望能够拓展在更多大流量场景,提高手淘的整体购物体验;多目标联合优化。搜索除了成交外,还需要承担卖家多样性,流量公平性,流量商业化等居多平台和卖家的诉求,搜索产品中除了商品搜索外还有“穹顶”,“主题搜索”,“锦囊”,“内容搜索”等非商品搜索内容,不同搜索目标和不同内容(物种)之间的联合优化未来很值得深挖。

结语:以上就是首席CTO笔记为大家介绍的关于人工智能怎么选择标题的全部内容了,希望对大家有所帮助,如果你还想了解更多这方面的信息,记得收藏关注本站。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:/AI/22030.html