淘宝搜索关键词拆分原理和标题打造
我们知道,淘宝的数据库⾥有很多很多的宝贝,可以说是亿万的,那么在这亿万的宝贝当中,⾃然就有亿万的宝贝标题。
然淘宝不可能⼈⼯去审核⼀个个标题的好坏,相关与不相关,违规与不违规等,那么系统是如何做到的呢?
⼜是如何识别标题关键词的相关性从⽽去匹配宝贝的呢?那么我们的宝贝⼜该如何去书写呢?今天我们就⼀起⾛进搜索,⼀起探讨学习这个问题。
相信⼤家对这块的问题肯定很迷惑,也很感兴趣,那么⾸先我们就讲解下这块的内容的理论,然后结合理论教⼤家去打造⼀个完美的标题;希望对⼤家有点帮助。
⼀、淘宝搜索引擎的拆分词原理
这块内容⽐较复杂希望⼤家认真去听会有很多发现
那么这⾥我们⾸先需要了解的就是淘宝搜索的⽬的是什么?我们可以花1分钟时间考虑下
淘宝搜索的⽬的:反映客户的需求
相信很多朋友都是有点了解的
所以⼀切搜索的改变都是根据⽤户的购物需求在改变⽽改变的这个相信⼤家能够理解的那么我们举个例⼦来说明下
相信⼤家最近看过语嫣谈的搜索变⾰这个视频
课上说到⼀个数据不知道⼤家还记得么【今年的2013年5⽉长词(字数⽐较多的关键字)占所有搜索词引导的PV对⽐去年同期显著上升9.4%】
那么这个数据就是反应了客户的需求
需求是什么呢
他这⾥反映的⽤户需求--更精准
描写大自然的精彩片段那么针对这个淘宝也会去跟着改变
碟刹了解了淘宝搜索的⽬的以后我们来讲下淘宝搜索的分词原理。淘宝搜索的分词是从2011年的6⽉1⽇开始的,有了分词的技术以后呢,从原来的单词索引到今天的以相关性为前提的索引⽅式
什么是单词索引呢?
草原歌曲精选大全简单来说就是你搜索“红⾊”这个词,那么只要包含红⾊的东西都会被展⽰,包括“红⾊⾐服”“红⾊⼿机”等。
显然不能满⾜客户的需求,给客户体验很差,那么今天淘宝的完善和变⾰其实正是跟着客户的需求的改变⽽改变的。
淘宝的分词原理⼤概包括以下五个部分:
我给⼤家看张图⽚
这张图上⼤概概括了这五个⽅⾯
接下来我们就⼀起来认识这五个⽅⾯的内容
1)最⼩滑动窗⼝模型
北京茶叶批发这个⽐较容易理解
什么是最⼩滑动窗⼝模型呢?简单来说就是紧密结合原则。
这个⼤家不会太陌⽣吧
举个例⼦来说下吧
⽐如说我们的产品是⼀款连⾐裙,我们以“雪纺连⾐裙”这个词来说,淘宝会把这个词进⾏拆分,变成“雪纺”&“连⾐裙”两个词
那么系统⼜是如何组合的呢
我们知道淘宝有⼀个庞⼤的词库动车组和高铁的区别
【词库的词的来源简单说下:就是⽤户搜索的⼀些短词和类⽬词等等】好,我们模拟下系统的匹配⽅式,
那么在“雪纺”这个词下对应了⼀个词库,是包含雪纺的所有的词,我们先把他命名为【雪纺.txt】, .txt是说这个包含这些词的⼀个⽂档
当然在“连⾐裙”这个词底下也是对应⼀个词库,我们把它命名为【连⾐裙.txt】也是包含连⾐裙的所有的关键词
然后每⼀个词底下都是对应⼀个最优类⽬的【这个是我⾃⼰简单理解的】
【最优类⽬的查询⽅法:相信⼤家很清楚了我喜欢⽤淘宝指数
shu.taobao的细分市场⾥⾯可以看到每个词的最优类⽬的分布情况
给⼤家展⽰⼀张图
然后在这些词中去他们的交集,这样⼀来交集出来的词都是⽐较相关的了,这就是简单的拆词和匹配
但是最⼩滑动窗⼝是什么呢?
也就是说“雪纺”这个词和“连⾐裙”这个词之间的距离,如果标题写成“雪纺连⾐裙”⽐“2013雪纺韩版连⾐裙”这个词相关性好,这是系统拆词的⼀个原则。为了⽅便⼤家理解我做了张图给⼤家参考
这个图很形象的说明了这个
但是那么我们如何去验证这个原则和我所说的正确性呢
⽅法是很简单的希望⼤家现场跟我⼀起操作下
去实战下这个对写标题很有好处
打开淘宝⾸页:
www.taobao
我们搜下“雪纺连⾐裙”这个词选择按照⼈⽓排名,因为⼈⽓排名是不考虑下架时间因素的,所以是⽐较好的⼀个验证⽅法,我们去看下排名中的这些宝贝当中是否是在销量差不多的前提下,越紧密结合的越是排名考前呢?当然这⾥会有⼀些其他因素的影响,所以会有些偏差。
希望⼤家现场去操作下我再反馈下结果给⼤家!
我们可以看到A宝贝的销量是4454 但是排在B宝贝销量7462的前⾯
在不考虑其他因素的前提下⾜以说明这⼀点
这个原则知道以后,我们就可以进⾏操作的是,把我们的每个宝贝都选择⼀个最佳的属性词或者修饰词那它与我们的产品中⼼词进⾏紧密结合,这样的⼀个长尾关键词的相关性就⾮常好了
亲们先花2分钟时间去检测下
如果这个没问题了就说第⼆原则
2)不要有异议
函授毕业生自我鉴定什么意思呢?我们剖析下
这个问题是相当严重的,因为在淘宝系统去识别我们的标题的时候,如果识别错误的话,那就不好了,所以我们不能让淘宝系统进⾏误识别,因为系统是根据算法来的,不可避免的会错⼀些,但是针对这个问题,我们必须需要谨慎和注意。
⽅便⼤家理解我举个简单的例⼦
“beizi”这类的词,相信⼤家有所理解吧
“beizi”这个词,这个叫特殊词,有时候搜索量很⾼,竞争很⼩,所以我们很多⼈就把这个词写进标题了,竞争⼩,流量多这样的词显然我们是需要的,我们看下这个词
但是我们知道“被⼦”&“杯⼦”这两个产品的拼⾳都是叫“beizi”这个时候,如果系统误识别把我们的被⼦识别成杯⼦,那么就⾮常不好了,因为产品的相关性太差了,从⽽影响我们的排名和宝贝的权重。这
个是我们平时需要的注意的。
我们再看⼀张图
我们再看⼀张图
这只是⼀个简单的例⼦,在后⾯我们再举个例⼦所以我们要注意这些问题相信⼤家有了简单的理解吧这些理论是⾮常重要的
3)属性进索引
我们知道,淘宝的搜索叫做路径搜索和百度不⼀样,百度是⽬标搜索。也就是说淘宝会先去匹配⽤户搜索的关键词的类⽬分布,然后去匹配我们的标题宝贝。
这是我们之前理解的相关性,其实淘宝远远不是这么简单的审核我们的相关性
所以我们知道,产品不能放错类⽬。但是呢?仅仅是这样远远满⾜不了⽤户的需求度和客户体验,所以进出来了这个属性进索引。
这个很重要的待会举个例⼦说明下
什么意思呢?
其⼀:当我们的宝贝的标题如果没有写上属性词的时候,但是我们的属性当中存在这个属性或者勾选了这个属性,那么⽤户在搜索这个词的时候,淘宝也会展⽰我们的商品,这是因为属性进了索引。
我们操作下
我们搜索的是“标准镜头摄像机”这个词
我们先操作等下公布
其⼆:我们需要去做的是不是说属性词就可以不写在标题当中了呢?显然这样去做会损失很多流量,不是因为淘宝不去展⽰我们的宝贝,⽽是因为影响排名因素的权重或者因⼦,不单单是属性这⼀项,所以我们的⼈⽓分很低的时候⽽是很难把握的,因为前⾯说到了紧密组合是吧,所以我们需要的是把⼀些重要属性或者热搜属性进⾏书写并紧密结合。所以我们需要填好属性,⽽且要全⾯的把属性填的完整。
【有⼀点需要注意的是,属性和标题是不能冲突的,如果属性勾选的是“短袖”但是标题中却出现了“长袖”显然这样是不会展⽰的,⽽且还是违规。所以在写标题的时候千万不可以⽤这样的字眼和犯这样的错误。
我举个例⼦说下
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论