• 全国400电话网上服务平台
    强大号码库资源任选,方便,快捷,快速开通。
    咨询热线:400-1100-266  

    老板说“我们要做个性化保举”时,你该怎么办
    POST TIME:2018-12-03 21:19
     

    今日头条的走红带动了“个性化保举”的概念,自此之后,内容型的产品,个性化算法就逐渐从卖点变为标配。

    陪同着“机器学习”,“大数据”之类的热词和概念,产品的档次瞬间提高了很多。而各种保举算法绝不但仅是研发本身的任务,作为产品经理,必需深入到算法内部,参与算法的设计,以及结合内容对算法不停“调教”,才能让产品的保举算法不停完善,最终与本身的内容双剑合璧。

    本文以新闻产品为例,结合了我之前产品从零积累用户的经验,整理了作为PM需要了解的基本算法知识和实操。

    算法的发展阶段

    个性化保举不是产品首次发布时就能带的,无论是基于用户行为的个性化,还是基于内容相似度的个性化,都建立在大量的用户数和内容的基础上。产品发布之初,一般两边的数据都有残缺,因此个性化保举也无法开展。

    所以在产品发展的初期,保举内容一般采用更加聚合的“热度算法”,顾名思义就是把热点的内容优先保举给用户。虽然无法做到基于兴趣和习惯为每一个用户做到精准化的保举,但能覆盖到大部分的内容需求,并且启动成本比个性化保举算法低太多。

    因此内容型产品,保举在发布初期用热度算法实现冷启动,积累了必然量级以后,才能逐渐开展个性化保举算法。

    热度算法

    1、热度算法基来源根基理

    需要了解的是,热度算法也是需要不停优化去完善的,基来源根基理:

    新闻热度分 = 初始热度分 + 用户交互产生的热度分 – 随时间衰减的热度分

    Score = S0 + S(Users) – S(Time)

    新闻入库后,系统为之赋予一个初始热度值,该新闻就进入了保举列表进行排序;随着新闻不停被用户点击阅读,保藏,分享等,这些用户行为被视作帮手新闻提升热度,系统需要为每一种新闻赋予热度值;同时,新闻是有较强时效性的内容,因此新闻发布之后,,热度必需随着新闻变得陈旧而衰减。

    新闻的热度就在这些算法的综合作用下不停变革,保举列表的排序也就不停变革。

    2、初始热度不该该一致

    上面的算法为每一条入库的新闻赋予了同样的热度值,但在现实使用后发现行欠亨,例如娱乐类别比文化类别受欢迎程度自己就高很多;或者突发了严重的灾害或变乱;或是奥运会期间,体育类另外关注度突然高了起来;而此时如果还是每条新闻给同样的热度就不能贴合实际了。

    解决措施就是把初始热度设置为变量:

    (1)根据新闻类别给予新闻差别的初始热度,让用户关注度高的类别获得更高的初始热度分,从而获得更多的曝光。

    例如:

    (2)对于重大事件的报道,如何让它入库时就有更高的热度,我们采用的是热词匹配的方式。

    即对大型新闻站点的头条,Twitter热点,竞品的头条做监控和扒取,并将这批新闻的关键词维护到热词库并连结更新;每条新闻入库的时候,让新闻的关键词去匹配热词库,匹配度越高,就有越高的初始热度分。

    这样处理后,重大事件发生时,Twitter和门户网站的争相报道会导致热词集中化,所有匹配到这些热词的新闻,即报道同样事件的新闻,会获得很高的初始热度分。

    3、用户行为分规则不是固定不乱的

    解决了新闻入库的初始分之后,接下来是新闻热度分的变革。先要明确用户的的哪些行为会提高新闻的热度值,然后对这些行为赋予必然的得分规则。

    例如对于单条新闻,用户可以点击阅读(click),保藏(favor),分享(share),评论(comment)这四种行为,我们为差别的行为赋予分数,就能得到新闻的实时用户行为分为:

    S(Users) = 1*click + 5*favor + 10*comment + 20*share

    这里对差别行为赋予的分数为1,5,10,20,但这个值不能是一成不乱的;当用户规模小的时候,各项事件都小,此时需要提高每个事件的行为分来提升用户行为的影响力;当用户规模变大时,行为分也应该慢慢降低,因此做内容运营时,应该对行为分不停调整。

    当然也有偷懒的措施,那就是把用户规模考虑进去,算固定用户数的行为分,即:

    S(Users) = (1*click + 5*favor + 10*comment + 20*share)/ DAU * N(固定数)

    这样就保证了在差别用户规模下,用户行为产生的行为分基本不变。

    4、热度随时间的衰减不是线性的

    
    Copyright © 2003-2016
    时间:9:00-21:00 (节假日不休)
    版权所有:巨人网络(扬州)科技有限公司
    总部地址:江苏省信息产业基地11号楼四层
    《增值电信业务经营许可证》 苏B2-20120278
    X

    截屏,微信识别二维码

    微信号:veteran88

    (点击微信号复制,添加好友)

     打开微信

    微信号已复制,请打开微信添加咨询详情!