早餐吃什么好| 新生儿dha什么时候开始吃| opc是什么意思| 什么茶降血糖| 什么食物维生素A含量高| 陆代表什么数字| 植物油是什么油| 飞蚊症是什么原因引起的| 滑膜炎吃什么好得快| 甘油三酯高吃什么药好| 梦见买棺材是什么征兆| 推辞是什么意思| 小孩坐火车需要什么证件| 护士要什么学历| 风热是什么意思| 狗什么东西不能吃| 坐班是什么意思| 血压低什么原因| 咳嗽咳到吐是什么原因| 斩金念什么| 寡妇年是什么意思| 后脑勺疼什么原因| 女性白带有血丝是什么原因| 言字旁的字和什么有关| 双子座和什么座最配| 五月一日是什么星座| 贼是什么意思| 失足是什么意思| 黎民是什么意思| 糖尿病什么水果不能吃| 炀是什么意思| 男人阴囊潮湿吃什么药| 大姨妈来了不能吃什么水果| 氩弧焊对身体有什么危害| 雨落心尘是什么意思| 裸钻是什么| 肚子上方中间疼是什么部位| 做梦坐飞机是什么意思| 口臭什么原因引起的| 蔬菜有什么| g代表什么意思| 羊肉不能和什么食物一起吃| 写字楼是干什么的| 螚什么意思| 抓包是什么意思| 检查血常规挂什么科| 4月24号是什么星座| 诅咒是什么意思| 褥疮是什么| 睡觉时身体抽搐是什么原因| 1985年是什么年| 醉酒第二天吃什么才能缓解难受| 说什么好| 卷饼卷什么菜好吃| 男人更年期吃什么药| 湿气重吃什么能去湿气| 径行是什么意思| 阴道流黄色分泌物是什么原因| 5月8号是什么日子| 黄金糕是什么做的| 血管炎吃什么药| 冰恋是什么| 为什么女人阴唇会变黑| 楚楚动人什么意思| 今天属相是什么生肖| 仙鹤代表什么生肖| ct检查是什么意思| 做什么生意| 五十肩是什么意思| 菠菜补什么| 磁共振是什么| 鸡蛋价格为什么这么低| 苦瓜泡水喝有什么功效| 什么是青光眼| 女人脑供血不足吃什么| 给花施肥用什么肥料| 清静是什么意思| 忌出行是什么意思| 排浊是什么意思| 白皮书是什么意思| 太阳穴长痘痘什么原因| 传教士是什么意思| ufc是什么意思| 喉咙痛买什么药| 车加失读什么| erke是什么牌子| 伤口出水是什么原因| 黄体不足吃什么药| 奶油霜是什么| 尿道炎症吃什么药好| 恶寒发热是什么意思| 心窦过缓是什么原因| 风林火山是什么意思| 老鹰的天敌是什么| 陪伴是最长情的告白下一句是什么| 标间是什么意思| aoa是什么意思| 子宫内膜增生有什么症状| 落枕挂什么科| 肚脐眼连接体内的什么器官| 生理期没来是什么原因| 炖鸭汤放什么食材最好| 吃什么可以增强硬度| 叶酸片是治什么的| 杨枝甘露是什么意思| 葛根粉是什么| 肠胃炎看什么科| 胃热吃什么药效果好| 总想小便是什么原因| 氨基酸什么牌子好| 菩提根是什么材质| 靳东妹妹叫什么名字| 囊腺瘤是什么| 气滞血瘀吃什么中成药| 12月出生的是什么星座| 湿气重去医院挂什么科| 小白兔是什么意思| 肠胃炎吃什么消炎药| 耐受性是什么意思| 苏小小属什么生肖| 裂变是什么意思| 梦见别人怀孕是什么意思| 光绪帝叫什么名字| 肝阴虚吃什么中成药| 达摩是什么意思| 为什么老是流鼻血| 11月1日是什么星座| 直肠炎吃什么药最好| 过劳肥是什么意思| 猫吃什么下奶最快最多| 什么水果去火效果最好| 玻璃心什么意思| lhrh是什么激素| 胸部疼痛挂什么科| 化疗和放疗有什么区别| 突然呕吐是什么原因| 蚊子吸血是为了什么| 月经提前十几天是什么原因| 不想要孩子用什么办法最好| 肌酐高是什么问题| 叫爸爸是什么意思| 无创是什么| 椰子水有什么好处| 肠胃功能紊乱什么症状| 尖斌卡引是什么意思| 俏皮话是什么意思| 蜂蜜水有什么好处| 暮光是什么意思| 一月十五号是什么星座| 什么山什么水| 一五行属性是什么| 身体缺钾吃什么药| 徒孙是什么意思| 喝牛奶为什么拉肚子| 帝旺是什么意思| 安宫牛黄丸治什么病| 大姨妈每个月提前来是什么原因| 高危行为是什么意思| 腋毛变白是什么原因| 儿童风热感冒吃什么药| 卤门什么时候闭合| 血脂高是什么原因| 巽代表什么| 什么眼霜去眼袋效果好| 20是什么意思| 感冒流黄鼻涕吃什么药| 泡热水脚有什么好处| 兔子不吃窝边草是什么生肖| 孩子生化了是什么意思| 皮神经炎是什么症状| 什么是权力| 养神经的药是什么药最好| 预防中暑喝什么水| 银屑病吃什么药| 杀青什么意思| 孕期头晕是什么原因| 牛大力和什么泡酒壮阳| 眼睛长黄斑是什么原因| 吃什么润肠通便| 什么时候闰五月| 什么粮食| 肛门瘙痒用什么药| 嘴巴下面长痘痘是什么原因| 肛周瘙痒是什么原因| o型血和什么血型最配| 范思哲是什么品牌| 11.6号是什么星座| 枸杞什么季节成熟| 什么辣椒又香又辣| cems是什么意思| 断交社保有什么影响| 海胆是什么动物| 间是什么结构| 心脏传导阻滞是什么意思| 什么情况下要打狂犬疫苗| 交感神经型颈椎病吃什么药| 植鞣皮是什么皮| 肠道胀气是什么原因造成的| 软助什么意思| 什么植物和动物很像鸡| 艾迪生病是什么病| 小便无力是什么原因| 为什么睡觉流口水很臭| 万象更新是什么生肖| 一般什么人戴江诗丹顿| 什么是逆商| 做梦梦见钓鱼是什么意思| 蜱虫咬人后有什么症状图片| 糖尿病的诊断标准是什么| 优势卵泡是什么意思| 每次上大便都出血是什么原因| 千叶豆腐是什么做的| 什么植物和动物最像鸡| 为什么会来月经| 味精是什么提炼出来的| 今天的日子适合做什么| 尿路感染什么症状| 极核是什么| 懿是什么意思| 法院院长是什么级别| 公公是什么意思| 黄芪煲汤和什么搭配| 耳鸣吃什么药效果最好| 空心菜不能和什么一起吃| 赞字五行属什么| 释迦牟尼是什么意思| 水猴子是什么| 血管瘤有什么危害吗| 下面有味道用什么药| 2000年属什么的| 胃底腺息肉是什么意思| 什么心什么意| 做梦梦见棺材和死人是什么意思| 老鼠属于什么类动物| 嫩模是什么意思| 发物是什么| 大臂疼痛怎么什么原因| 房水由什么产生| 为什么月经迟迟不来| 机油用什么能洗掉| 血清谷丙转氨酶偏高是什么意思| 党参不能和什么一起吃| jj是什么意思| 梦见死去的亲人又活了是什么意思| 水漫金山是什么意思| 什么原因会引起胎停| 什么时间喝酸奶最好| 三叉神经挂什么科| 嗓子疼流鼻涕吃什么药| 什么手机信号最好最强| 空腹吃荔枝有什么危害| 百合什么时候种植| 十月十号是什么星座| spo2过低是什么意思| 脚踝疼痛是什么原因| 广西古代叫什么| 经期可以喝什么茶| 抽烟为什么会上瘾| cr是什么意思| 抓龙筋什么意思| 什么是头七| 牛肉炖什么好吃| 宝宝拉肚子挂什么科| 葡萄糖高是什么意思| 百度

18年3月22日《铁岭新闻》

大数据 数据分析 算法
在知乎搜了一下推荐系统,果真结果比较少,显得小众一些,我们今天就来讲一讲推荐系统常用的推荐算法。
百度 短期内贸易战影响将有所缓解。

[[172692]]
一、推荐系统概述和常用评价指标

1.1 推荐系统的特点

在知乎搜了一下推荐系统,果真结果比较少,显得小众一些,然后大家对推荐系统普遍的观点是:

(1)重要性UI>数据>算法,就是推荐系统中一味追求先进的算法算是个误区,通常论文研究类的推荐方法有的带有很多的假设限制,有的考虑工程实现问题较少,推荐系统需要大量的数据整理和转化,同时更需要考虑公司业务特性以及与现有系统的集成,方能形成推荐系统和业务之间的良性循环;

(2)推荐系统离线测试很好,上线后要么没有严格的测试结果而只能凭感觉,要么实际效果差强人意,我想主要缘于离线测试比较理想,而在线AB冠军测试无论对于前端还是后台要求都很高,没有雄厚的研发实力难以实现;

(3)推荐系统受到的外部干扰因素特别多(季节、流行因素等),整个系统需要不断的迭代更新,没有一劳永逸的事情。

1.2 推荐系统的评价指标

由于推荐系统比较复杂,所以涉及到的评价指标也很多。当然,用户满意度最为的有效,因为这本来就是推荐系统的最终目标,但是奈何资源有限成本太高,推荐系统还依赖于其它客观评价指标。

(1)推荐准确度:这个参数可以离线计算所得,而且较为的客观,所以是各大研究论文算法最重要的参考指标。

总体来说,推荐系统有两大任务:“预测”和“推荐”,所以推荐系统准确度的评分包括:

评分预测:学习用户的评价模型,用于预测用户对于未接触事物的评分,其实可以看作是一个回归模型,一般用均方根误差或者绝对误差来衡量;

TopN推荐:给用户一个个性化的推荐列表,其一般通过准确度、召回率等指标评估。其中N也是一个可变参数,可以根据不同的N描绘出对应算法的ROC曲线来进一步评价推荐效果;

(2)覆盖率:体现了挖掘算法对发掘长尾商品的能力。最简单的定义是,对所有用户推荐出的产品做并集,然后看这个出现的并集产品与总产品数中所占的比例,这种方式比较的粗线条,因为推荐系统中马太效应频繁,所以好的推荐算法应当是所有商品被推荐的几率差不多,都可以找到各自合适的用户,所以实际中会考虑信息熵、基尼系数等指标。

(3)多样性:其原理可以表述为不在一棵树上吊死。因整个推荐系统涉及到的因素太多,如果只推荐用户一个类别的相似物品,失败风险比较的大,而且也难以实现整个推荐效益的***化。

(4)新颖性:原理就是那些用户没有接触过、没有操作过的商品,或者是流行度比较低的商品,对用户来说是比较新鲜的物品,往往会有意外的效果。个人觉得这个指标有点扯~~

(5)信任度:这个指标比较的主观,就是让用户信任推荐系统做出的推荐是有根据有理由的,以及推荐系统内部是如何运作的。例如亚马逊的商品推荐会给出推荐理由,作为用户的我会觉得很贴心,否则用户会觉得商家的利益驱动而带有抵触心理。

(6)健壮性:比如针对关联推荐算法,商户恶意下单提高产品的推荐频率,水军恶意评论等。

二、静态数据推荐

基本上绝大多数算法都会利用用户-产品的交互数据动态生成个性化的推荐。而静态数据指还没生成用户交互数据的时候,这种情况在系统冷启动的时候尤为的常见,常常使用的静态数据包括:

(1)用户注册时候的性别、年龄、地域、学历、兴趣等人口统计学信息;

(2)授权的社交网络账号的好友信息;

这类基于推荐方法简单,可以根据每类用户预先设置好推送内容,也可以根据同类用户相互之间进行推送,但是这种方法面临着推荐颗粒度较大,对于涉及个人品味爱好的个性化强的商品,参考价值有限,同时在大家隐私意识加强的情况下,这类数据不见得能够轻易得到;第二类社交网络好友信息效果会比较好,但也需要相应的平台授权接入才可以。

然后这里引申出对于新加入的用户和新加入的商品的冷启动问题:

新加入用户:推送热门商品;选择用上面人口统计信息进行粗粒度的推送;如果可以得到合作商数据,获取其好友信息,选择接近的好友进行UserCF推荐;向用户展示一些商品(热们常见、具有代表性和区分性、物品要多样性),得到用户的反馈,然后进行学习(Nadav Golbandi算法);

新加入商品:UserCF对新加入的物品冷启动不是很敏感,因为只要有用户发现这个新商品,这个新商品就会慢慢扩散开来。对于ItemCF就比较严重,比如可以考虑开始使用基于内容的推荐,等积累数据一定程度后切换成协同过滤推荐。

三、基于内容的推荐

其主要根据用户之前的喜好,推荐相似的物品。该系统包括用户属性和产品属性两方面构成,前者包括用户的固有属性(比如人口统计信息)以及用户的历史商品交互信息(比如对看过电影的评分,然后得到该用户对于喜欢电影的属性描述),后者是对商品的本身属性描述,这样通过简单的余弦相似度就可以实现推荐了。同时也能感觉到,对于同类型的物品描述维度相似,这种算法会工作的比较好,对于电商千奇百怪的商品,可能工作效果一般。

这个方法核心要解决的问题是推荐是否具有扩张性,如果根据用户之前的爱好只不断推荐同类的产品,显然整个推荐系统的价值就十分有限,但是如果能准确推荐其他不同类别的商品就会很好了。

Pandora的音乐推荐就是个典型的基于内容的推荐系统,他们把音乐使用各种维度的属性进行描述,然后根据用户之前的兴趣爱好推荐相似属性风格的音乐。

四、协同过滤算法

协同过滤算法算是推荐系统中最经典的算法了,也称为基于领域的算法。协同过滤牵涉到用户和商品的交互信息,也就是用户行为,而一般用户对于商品的行为反馈有:

显性反馈行为——用户明确表现出对某项产品和的喜好,比如用户对商品的打分、评论等信息。

隐性反馈行为——不能明确代表用户对产品喜好的行为,比如页面浏览行为等,这类数据量的比较多,常常伴有大量的噪音,需要经过处理和转化才可能有实际的用途。

4.1 基于用户的协同过滤算法(UserCF)

其基于的假设是——喜欢类似物品的用户可能有相同或者相似的口味和偏好。UserCF实现的步骤包括:

(1)找到与目标用户兴趣相似的用户群;

假设用户u和v的正反馈的商品集合为N(u),N(v),那么两者兴趣相似度可以记为

(2)找到这个集合中用户喜欢的,而目标用户没有听说过得商品推荐之;

UserCF提供的一个参数K表示要考虑目标用户兴趣最相似的人的个数,在保证精度的同时,K不宜过大,否则推荐结果会趋向于热门商品,流行度指标和覆盖度指标都会降低。

4.2 基于内容的协同过滤算法(ItemCF)

目前用的最广泛的推荐算法,不是通过商品本身,而是通过用户对商品的行为来计算商品之间的相似度,其假设能够引起用户兴趣的商品,必定与其之前评分高的商品相似。ItemCF的操作步骤包括:

(1)计算商品之间的相似度。

物品相似度可以表示为(其实跟前面的支持度比较像)

第二个式子比***个式子好在可以惩罚过热产品j。

(2)根据商品的相似度和用户的历史行为,给用户生成推荐列表。

4.3 基于模型的协同过滤算法

User-CF和Item-CF合称为memory-based CF,而model-based CF使用一般机器学习的方式,其基于样本的用户喜好信息,训练出一个推荐模型,然后根据实时的用户喜好的信息进行预测和计算推荐。

常用的模型包括LSI、贝叶斯网络等。

4.4 UserCF和ItemCF之间的比较

在现实的情况中,往往物品的个数是远远小于用户的数量的,而且物品的个数和相似度相对比较稳定,可以离线完成工作量***的相似性计算步骤,从而大大降低了在线计算量,基于用户的实时性更好一些。但是具体使用的场景,还需要根据具体的业务类型来区分,User-CF偏重于反应用户小群体热点,更具社会化,而Item-CF在于维持用户的历史兴趣,比如:

对于新闻、阅读类的推荐,新闻阅读类的信息是实时更新的,所以ItemCF在这种情况下需要不断更新,而用户对新闻的个性化推荐不是特别的强烈情况,用户有新行为不会导致相似用户的剧烈运动。

对于电子商务类别的,由于用户消费代价比较高,所以对个性化的精确程度要求也比较高,而一段用户有新的行为,也会导致推荐内容的实时变化

协同过滤的算法缺点也很明显,除了上面的冷启动之外,往往商家的用户数量和产品数量都很多,所以矩阵的计算量会非常的大,但某个具体的用户往往买的东西又有限,所以数据同时也是高度稀疏的。

五、基于标签的推荐方法

基于标签的推荐算法也是十分常见的,比如豆瓣网、京东的商品评论等。标签信息一般分为专家、学者类打的标签;一类为普通用户给商品打的标签(UGC, User Generated Content)。而标签的内容一般要么描述商品本身的,比如名字、类别、产地等,也或者用户对商品的观点评价,比如便宜、好用、性能强等,三元组(用户、物品、标签)通过标签将用户和物品进行联系。

基于标签推荐最简单的例子比如:统计一个用户最常用的标签,统计每个物品最常被打的标签,然后两者通过一定的关系推荐起来;当然也可以展现标签云,让用户点击自己感兴趣的标签,然后依此个性化推荐。

国内的京东、淘宝、豆瓣都大量使用标签信息。

由于标签的评价用户主观性比较强,所以一方面同样意思用户的用语差异性比较大,规范化可以考虑:用户评价的时候提供常用标签,让用户点击可以减少输入差异,而推荐的标签包括该物品描述性较好的标签,以及用户自己常用的标签(用户一致性);人为或者通过自然语言处理技术对标签进行整理,对于用户积极和消极的评价进行区分;标签也有长尾分布效应,所以除了热门标签外怎么提取那些差异化的有用标签进行更精确的推荐也是应当研究的课题(卡方分布/SVD)。

责任编辑:赵宁宁 来源: 36大数据
相关推荐

2025-08-05 17:00:59

2025-08-05 20:17:22

推荐算法系统

2025-08-05 09:46:29

2025-08-05 07:30:00

推荐算法推荐系统

2025-08-05 13:30:59

推荐系统DeepFM算法

2025-08-05 09:00:00

机器学习排序学习人工智能

2025-08-05 10:27:39

系统模型

2025-08-05 19:24:09

PHP函数索引

2025-08-05 16:46:45

2025-08-05 10:13:27

2025-08-05 07:00:00

推荐系统智能商务服务平台

2025-08-05 14:40:15

算法推荐系统大模型

2025-08-05 19:24:36

2025-08-05 09:55:43

Ubuntu 11.0常用软件

2025-08-05 16:01:39

推荐系统算法实践

2025-08-05 19:07:55

物联网技术软件

2025-08-05 16:07:10

编码器自然语言模型

2025-08-05 09:43:57

YouTube推荐系统

2025-08-05 19:18:53

2025-08-05 09:15:36

推荐算法策略
点赞
收藏

51CTO技术栈公众号

梦见跟妈妈吵架是什么意思 属鸡的本命佛是什么佛 小孩检查微量元素挂什么科 8月29是什么星座 欢字五行属什么
血小板体积偏低是什么原因 条条框框是什么意思 去港澳旅游需要什么证件 免冠照什么意思 延字五行属什么
隔桌不买单是什么意思 散瞳什么意思 今年什么时候放暑假 女人吃火龙果有什么好处 航班预警是什么意思
胆结石是什么原因导致的 整个手掌发红是什么原因 小腿麻木是什么原因 晚上睡觉出虚汗是什么原因 倒闭是什么意思
虚劳病是什么意思hcv7jop9ns2r.cn 什么动物寿命最短clwhiglsz.com 11月16日是什么星座hcv9jop6ns2r.cn 隐血弱阳性是什么意思hcv8jop4ns4r.cn 化疗吃什么补白细胞hcv8jop3ns2r.cn
什么叫阳性hcv8jop1ns1r.cn 肝喜欢什么食物hcv9jop8ns0r.cn 挺舌反应是什么hcv9jop2ns8r.cn 胆道闭锁有什么症状hcv7jop9ns0r.cn 苗侨伟为什么叫三哥hcv8jop0ns2r.cn
股癣是什么样子的图片naasee.com 属虎生什么属相宝宝好hcv8jop6ns9r.cn 稀料是什么hcv8jop8ns2r.cn 眼睛红用什么眼药水hcv8jop0ns0r.cn 双恋是什么意思hcv8jop3ns4r.cn
血管脆是什么原因hcv9jop2ns4r.cn 宫寒是什么引起的hcv8jop2ns9r.cn 属鼠女和什么属相最配hcv9jop4ns7r.cn 什么是三有保护动物ff14chat.com 肠粘连吃什么药hcv9jop4ns3r.cn
百度