博客
关于我
推荐系统项目实战一(推荐业务架构介绍)
阅读量:215 次
发布时间:2019-02-28

本文共 550 字,大约阅读时间需要 1 分钟。

架构与业务流

基础数据层

该层主要处理业务数据和用户行为日志数据,数据来源于前端埋点和系统日志。其中,用户数据包括注册信息、个人资料等基础信息;文章数据则涵盖用户上传的内容、发布信息等基础属性。用户行为日志数据实时流向Kafka,用于实时计算和分析;而业务数据则以批量形式存储在HDFS上,为后续的离线分析提供数据支持。

数据处理层

这一层面对基础数据进行深度处理,主要包括用户画像和文章画像的构建。具体流程包括:基于离线数据和实时数据,通过多种算法进行数据分析和特征提取,构建用户兴趣模型和阅读习惯模型。

召回与排序

召回环节通过算法逻辑从海量文章中筛选出用户感兴趣的候选集合,集合规模通常在上千级别。排序环节则对候选文章进行用户画像模型结果的排序,生成最终的推荐列表。

推荐业务层

该层通过提供RESTful接口为推荐业务场景服务,主要包括以下功能:

  • Feed流推荐:支持用户在今日推荐场景中通过不断下拉刷新获取内容流。

转载地址:http://jvxp.baihongyu.com/

你可能感兴趣的文章
Ploly烛台的定制颜色
查看>>
Ploly:如何在Excel中嵌入完全交互的Ploly图形?
查看>>
plotloss记录
查看>>
Plotly (Python) 子图:填充构面和共享图例
查看>>
Plotly 中的行悬停文本
查看>>
Plotly 停用 x 轴排序
查看>>
Plotly 域变量解释(多图)
查看>>
Plotly 绘制表面 3D 未显示
查看>>
Plotly-Dash 存在未知问题并创建“加载依赖项时出错“;通过使用 Python-pandas.date_range
查看>>
Plotly-Dash:如何过滤具有多个数据框列的仪表板?
查看>>
Plotly:如何为 x 轴上的时间序列设置主要刻度线/网格线的值?
查看>>
Plotly:如何从 x 轴删除空日期?
查看>>
Plotly:如何从单条迹线制作堆积条形图?
查看>>
Plotly:如何以 Root 样式绘制直方图,仅显示直方图的轮廓?
查看>>
Plotly:如何使用 Plotly Express 组合散点图和线图?
查看>>
Plotly:如何使用 plotly.graph_objects 和 plotly.express 定义图形中的颜色?
查看>>
Plotly:如何使用 Python 对绘图对象条形图进行颜色编码?
查看>>
Plotly:如何使用 updatemenus 更新一个特定的跟踪?
查看>>
Plotly:如何使用长格式或宽格式的 pandas 数据框制作线图?
查看>>
Plotly:如何向烛台图添加交易量
查看>>