7、Graph Embedding

几种主流的 Embedding 方法，包括序列数据的 Embedding 方法，Word2vec 和 Item2vec，以及图数据的 Embedding 方法，Deep Walk 和 Node2vec

图结构数据

a社交网络我们可以发现意见领袖
b知识图谱发现主体之间的潜在关系
c行为关系类图数据发掘出物品和物品之间、用户和用户之间，以及用户和物品之间的关系

基于随机游走的 Graph Embedding 方法：Deep Walk

基于原始的用户行为序列（图 2a
来构建物品关系图（图 2b）
随机游走的方式随机选择起始点，重新产生物品序列（图 2c）
将这些随机游走生成的物品序列输入图 2d 的 Word2vec 模型，生成最终的物品 Embedding 向量

在同质性和结构性间权衡的方法，Node2vec

网络的"同质性"指的是距离相近节点的 Embedding 应该尽量近似，如图 3 所示，节点 u 与其相连的节点 s1、s2、s3、s4的 Embedding 表达应该是接近的，这就是网络"同质性"的体现。在电商网站中，同质性的物品很可能是同品类、同属性，或者经常被一同购买的物品。
而"结构性"指的是结构上相似的节点的 Embedding 应该尽量接近，比如图 3 中节点 u 和节点 s6都是各自局域网络的中心节点，它们在结构上相似，所以它们的 Embedding 表达也应该近似，这就是"结构性"的体现。在电商网站中，结构性相似的物品一般是各品类的爆款、最佳凑单商品等拥有类似趋势或者结构性属性的物品。

首先，为了使 Graph Embedding 的结果能够表达网络的"结构性"，在随机游走的过程中，我们需要让游走的过程更倾向于 BFS（Breadth First Search，宽度优先搜索）
而为了表达"同质性"，随机游走要更倾向于 DFS（Depth First Search，深度优先搜索）

Node2vec 更注重同质性的体现，从中我们可以看到，距离相近的节点颜色更为接近，图 5 下则是更注重结构性的体现，其中结构特点相近的节点的颜色更为接近。

Embedding 是如何应用在推荐系统的特征工程中的？

其中，"直接应用"最简单，就是在我们得到 Embedding 向量之后，直接利用 Embedding 向量的相似性实现某些推荐系统的功能。典型的功能有，利用物品 Embedding 间的相似性实现相似物品推荐，利用物品 Embedding 和用户 Embedding 的相似性实现"猜你喜欢"等经典推荐功能，还可以利用物品 Embedding 实现推荐系统中的召回层等。当然，如果你还不熟悉这些应用细节，也完全不用担心，我们在之后的课程中都会讲到。
"预训练应用"指的是在我们预先训练好物品和用户的 Embedding 之后，不直接应用，而是把这些 Embedding 向量作为特征向量的一部分，跟其余的特征向量拼接起来，作为推荐模型的输入参与训练。这样做能够更好地把其他特征引入进来，让推荐模型作出更为全面且准确的预测。
第三种应用叫做"End2End 应用"。看上去这是个新的名词，它的全称叫做"End to End Training"，也就是端到端训练。不过，它其实并不神秘，就是指我们不预先训练 Embedding，而是把 Embedding 的训练与深度学习推荐模型结合起来，采用统一的、端到端的方式一起训练，直接得到包含 Embedding 层的推荐模型。这种方式非常流行，比如图 6 就展示了三个包含 Embedding 层的经典模型，分别是微软的 Deep Crossing，UCL 提出的 FNN 和 Google 的 Wide&Deep。它们的实现细节我们也会在后续课程里面介绍，你这里只需要了解这个概念就可以了。

页面树结构

7、Graph Embedding

几种主流的 Embedding 方法，包括序列数据的 Embedding 方法，Word2vec 和 Item2vec，以及图数据的 Embedding 方法，Deep Walk 和 Node2vec

基于随机游走的 Graph Embedding 方法：Deep Walk

在同质性和结构性间权衡的方法，Node2vec

Embedding 是如何应用在推荐系统的特征工程中的？