淘宝搜索规则一直变化,也是卖家们一直关心的问题,作为一个搜索引擎研究的爱好者,近期有一些心得体会与大家分享。 Part1 机审 两大系统: 为了节省人力,淘宝的稽查系统大部分工作由电脑完成,就是机审,分为主要主判系统和旁判系统。 主判系统每月不定期大规模排查2-3次,所以每次偶尔会听到又有一批刷单的商家被抓了,比如5月20日,很多商家都收到了虚假交易炒作的站内信,其实这个就是当时主判系统排查的过程中对考核标准做了调整,导致大规模误判。此次事件也同样正式了主判系统的威力,当多维度不达标,根本不通过人工审核,系统直接判定。 旁判系统是常规型排查,可以把主判看做不定期大规模突击检查,旁判看做小规模定期检查,一般来讲,旁判系统有两个主要职责,一个是找出多维度排查中数据异常的单品,另一个是对单维度数据异常的宝贝进行重点监控。何为单维度数据异常和多维度数据异常,下面会重点讲解。 判定顺序 理论上而言,淘宝的每一笔完结订单都会被动接受一次完成的机审流程,注意是完成订单,如果未付款,或者付款未发货,或者发货未确定,都不算一次完整交易,所以,当评价没产生的时候,是不会被判定刷单的,而且即使评价产生,你的订单没超过索引数据库的维度范围,也不会被机审判定。 机审的判定顺序为:判断点击过滤(pmcots) >判断交易(ctu)>检索订单数据(数据检索>结果判定。简单的说,就是先根据电脑本身的物理信息判断是否刷流量或者刷单,再根据各个维度,判断订单是否在正常范围下去判定是否有刷单嫌疑。 判定标准 重点介绍下机审的各个判定标准:CTU(支付宝智能实时风险监控系统)、pmcots系统(防恶意点击系统)、特征索引数据库、数据检索系统。 CTU:该系统是支付宝风险管理的一个核心系统,能通过数据分析丶数据挖掘进行规则自学习,自动更新完善风险监控策略。CTU系统基于用户行为来判断风险等级,集风险分析丶预警丶控制为一体。并配备风险稽核专家小组进行风险稽查及处置。这个系统可以实现7*24小时全天候风险监控,监控内容包括:账户风险监控丶交易风险监控丶反洗钱监控丶反盗卡监控丶反**监控丶商户违规监控。 pmcots系统:防恶意点击系统,目前也主要用于直通车的防作弊稽查体系,主要考核的是流量环节,其中包网络技术识别有: 1、IP防止作弊。 2、Netclean防止作弊,当你访问过一个页面时,Netclean会记录,当你下一次访问该页面时,会提交一个相同COOKIES参数,可以判断重复的参数。 3、点击率,重要是点击数据被收入了特征索引库。比如说点击率过高,流量来源集中在某个关键词,这个特种索引数据库会根据这些问题找到数据异常。 4、来源统计,在生意参谋的交易分析,商品分析,单品分析中就可以找到,系统会根据流量来源和流量构成做对比分析。 5、唯一参数,这个需要调用很多参数,例如大家知道的MAC,硬盘序列号,浏览器版本,系统UI等。有一些唯一参数在WEB上很难做到获取,不是技术实现不了,因为这样太危险了,HTTP的协议权限要求太高,会造成整个PC数据暴露在外,就是有些朋友说的浏览个淘宝网页就能把系统安装时间、浏览器版本号什么读取出来?其实不是,是调用了系统的数据,如前面的CTU。 6丶点击时间时间顺差,打开一个页面,二次点击是否为瞬间?因为每个页面都由印象转变为关注,再转变成点击行动,当你打开一个前端页面,一定时间参数内立即关闭,也可以判断为无效点击。淘宝就是根据这个特征识别是否为机器人或者故意点击的。至于菜鸟卖家,怎么检验?这个可以从量子记录浏览深度和直通车过滤里面检验数据。 7丶鼠标值,显示屏幕上的每个点都具有一个坐标值,当你在某个点按下鼠标时,都会有一个坐标值,当采用机器人点击时,为同一个鼠标值,可以只记一次点击。每次点击都会产生鼠标的KEYUP 和KEYDOWN的行为,如果未能捕获到这个值,可能是模拟数据提交。又有菜鸟卖家会问?啥?机器人点淘宝,不会吧??为避免误解,科普一下,我们把系统或者软件也可以比喻成机器人。例如大家知道的刷信誉软件。 特征索引数据库:收集到的信息进行整理、分类、索引以产生索引库。按照一定方式有序编排起来,以供检索的数据库。此系统是不断收集和更新数据的学习型病毒积累系统,里面包含了大量数据,经过大量订单交易订单步骤轨迹数据的收集,分析比对,集合信息,就像日常配货一样先把货集合好,建立多个特征信息库。就是经常听到的数据纬度,里面有多少纬度就是商业机密,然后交给下面说的检索系统调用此数据库的数据纬度。每生成一个订单,就会生成各种数据进入这个系统供检索和分析。 数据检索系:引数据库或存储中查找和选取所需数据的过程。淘宝有千千万万个订单,每一个订单号都需要经过这个系统分析比对,其中调用了哪些数据估计在运营或者炒作过程中也得出了一些经验,在这里举几个例子开发模型: 1、淘宝静默转化数据纬度比对 旺旺在线聊天:如系统设定无聊天为w ,手机旺旺为WW,旺信为WWW,网页旺旺为WWWW 检索系统则调用特征索引数据库数据分析交易数据的其中一个纬度比对: 例女装类目交易订单中此纬度正常百分比【特征索引数据库数据】: WW>15%,www>0.15%,wwww>2% 淘宝商品I 官方推荐平台“排名无忧”助力商家快速提升手淘直播推荐、增粉、打榜、有效提升粉丝活跃度,增加商品曝光权重指数,快速占据首页位置,累计服务商家23万多家,注册入口限时开放注册:http://zhuce.pmwy.com 点击免费试用。 官方推荐平台“排名无忧”助力商家快速提升手淘直播推荐、增粉、打榜、有效提升粉丝活跃度,增加商品曝光权重指数,快速占据首页位置,累计服务商家23万多家,注册入口限时开放注册:http://zhuce.pmwy.com 点击免费试用。