• 运营托管
  • 装修设计
  • 摄影拍照
  • 客服外包
  • 全 部 栏 目

    装修设计 运营托管 摄影拍照 营销推广 客服外包 商城入驻 短视频推广 设计素材 电商百科

    如何利用淘宝的分词来帮助我们合理的书写标题

    如何利用淘宝的分词来帮助我们合理的书写标题

    今天跟大家分享一下淘宝的分词算法,分词我想大家都不陌生,当然我们讲的是淘宝的分词技术,我们知道淘宝中的每一个宝贝都有一个标题,而标题是由很多的词或者说字组成的,那么对于这些词和字我们如何得知淘宝是如何拆分和识别的呢?再淘宝的分词识别中我之前写过一篇文章:淘宝的分词系统,其中介绍了淘宝的分词技术的发展和其影响因素和识别的内容,今天我们继续这个话题跟大家简单谈谈淘宝的系统是如何拆分关键词的,好了,废话少说,直接进入主题。

    -------------------------------华丽的分割----------------------------------------------------

    分词;

    我们先拿出一个标题这里我准备了一个:

    2013秋冬pu短裙女包臀裙子水洗pu皮裙A字裙显瘦修身前开叉半身裙

    我们先不说这个标题的好坏,我们来看下淘宝是如何去拆分这个标题的,上图:

     

     

    OK,这张图是淘宝的系统给标题进行了拆分的结果:

    原标题:2013秋冬pu短裙女包臀裙子水洗pu皮裙A字裙显瘦修身前开叉半身裙

    拆分后:2013/秋冬/pu/短裙/女包/臀/裙子/水洗/pu/皮裙/A/字/裙/显瘦/修身/前/开叉/半身/裙

    细心的淘友们发现了淘宝在拆分的时候出现了一个词“女包”,很是纳闷,我们一眼就知道这款宝贝我们卖的裙子怎么变成女包了额,所以我们从淘宝的拆词系统中我们可以知道标题的关键词的组合是很重要的,而且淘宝的拆词算法是机器去做的,而并非是人工去拆分的,

    所以在写标题的时候就一定要注意下这些细小的组成部分。不然的话就出现了误识别导致宝贝失去了原有的流量基础。

    那么针对这类问题如何进行修改呢?

    修改后:2013秋冬pu短裙包臀裙子水洗pu皮裙A字裙显瘦修身前开叉半身裙

    我们来看下淘宝是如何拆分的?

     

    很显然已经非常正确的识别出来了,这里有的人就会很好奇的问::淘宝的拆词是如何进行的,因为我们能够看到的个体也就是我展示的图片是淘宝拆分后的一个结果图,那么如果我们知道了淘宝拆词的步骤和方法是不是说我们就很有效的让淘宝更好的识别我们的关键词呢,也就可以知道我们标题的权重指标是不是这样的呢?

    好,不说废话,上标题:

    迎/51/特价/镜面/全棉/平顶/帽子/男女/帽子/遮阳/军帽/男女/帽子/男/帽子

    这是一款帽子的标题,标题的拆分结果我们已经用“/”表示出来,好,我们来看下淘宝的一个识别情况:

    通过数据采集采样,我做了一个识别的结果(这个是我个人收集整理的,大家仅供参考):

     

    我们看A类:是标题拆分后的一个结果,B类是词性,C类是最优类目,D类是该宝贝的最优类目的包含情况,以上数据采集来自数据魔方。

    好了,我们简单看到的一个结果是“镜面这个词”是不包含所在的类目的,从利润上来说单词的索引是可以识别的,但是我们标出了红色,表示不可用。好了我们先分析结果数据再来看这个推理,

     

    OK,这是我们看到这款产品可以被识别的一些关键词从上到下是单词和组合词,我们简单来看下这两个小的概念,

    单词:就是指拆分的最小单位

    组合词:由最小单位两个及以上的组合形式

    这里有人会问为什么很多的组合词没有出现,没有出现不代表没有,由于权重和人气不同识别的也是不同的,我们自己采集的时候就这么多了,所以大家将就看下,最重要的是了解其中的含义。

    OK,我们标红的词我们看下上上面的那张表格,发现了木有,都是神马词?没错都是名词,对于这两个名词我们再来看下,“帽子”是类目词,“军帽”是名词但不是类目词。更多的技巧各位小卖家可以加群 193913654 交流,加入标明:B007便可通过。群共享里有N多使用技巧,大家一起讨论,更能创造灵感 ,或者加微信公共账户:“LMQDDS”每日更新淘宝最新技巧 ,现在大家继续往下看…… OK,这里我们就知道了淘宝第一识别的是什么,没错就是名词且是类目词优先识别,是不是有点像我们买家买东西一样,进入类目先点击一些关键词再输入一些关键词,模式是相通的哦!

    好了,我们把刚刚标题去重一下:

    特价/全棉/平顶/男女/遮阳/军帽/男/帽子

    为什么很多关键词都木有了呢?包括镜面这个词,OK

    其实呢去重也是淘宝的一个关键的步骤,所以做标题的时候注意了哦,亲

     

    OK,我们来观察下这组词:

    军帽 男

    帽子 男

    特价 男

    平顶帽子

    平顶帽子 男

    帽子特价

    帽子 军帽

    男 帽子 遮阳

    遮阳 帽子

    遮阳军帽

    男女 帽子

    全棉 特价

    帽子 全棉

    帽子 男特价

    帽子 男 军帽

     

    是不是又发现了一个秘密,什么秘密呢?第一系统很小去打破标题的顺序,虽然说标题中的顺序不是非常大的影响标题的识别,但是通过第一个例子和这里的样本,我们很显然知道是有影响的,OK,继续我们还可以知道这些组合词的组成基本上都是由靠近的邻词组成的,是不是大家可以自己去看下哦!

    -------------------------------------------------华丽的分割-----------------------------------------------

    好了,我们来看下“镜面”这个词的组成,

     

    OK,知道为什么不被单词识别了吧?

     

     

     

    这个图又告诉我们什么呢,一些特殊的词,单词是不被索引,但是组合词是可以被索引的。

    在我们平常书写标题的时候我们是不是也是值得注意的,此类词,本人建议最后不要去书写在标题中,如果一定要书写就记得合理的利用空格。

    OK,我们来总结一下:

    关键词的拆分

    拆成多个单词

    关键词的识别顺序

    类目词优先,名词,组合词

    标题组合词的规律

    单词到多词组合

    最小滑动组合

    特殊词如何组合,以免误识别

    合理利用空格技术

     

     

    OU,我的分享结束了,有时间再跟大家分享哦!记得关注我喔~~~~~~~~~~~~

    充分说明

    关于代码的查找:

    1丶先下载谷歌或者火狐浏览器  个人建议其他的也行,但是本人用惯了。

    2丶复制权标题进行搜索

    3丶搜索结果页面点击标题右键查看元素

    也希望大家关注我的淘宝店 暇淡绽放    微信公众平台  特谱

    上一篇:怎样才能把宝贝详情页做的既漂亮又美观呢?
    下一篇:新手开店求给我大神指点!!!!!

    © 2016-2020 巨人电商

    时间:9:00-21:00 (节假日不休)

    地址:江苏信息产业基地11号楼四层

    《增值电信业务经营许可证》 苏B2-20120278

    X

    截屏,微信识别二维码

    微信号:veteran88

    (点击微信号复制,添加好友)

     打开微信