[TOC]
- 图模型,支持 千万级别节点,亿级别边
- 深度排序模型,支持 亿级别特征,百亿级别样本
- 深度召回模型,支持 亿级别特征,百亿级别样本
包括 训练脚本、预测脚本 和 demo 数据,以下模型的 demo 都可以直接运行。
- 参考编译文档编译
-
要求 python3.6 或 python3.7 运行环境, 在 embedx/demo 目录下执行
pip install -r requirements.txt -
修改 embedx/demo/env.sh 文件中的变量 BUILD_DIR_ABS
-
将 BUILD_DIR_ABS 修改为 embedx 编译输出的 bin 文件路径 embedx/build_xxxx 为 用户的编译输出绝对路径, 如
-
BUILD_DIR_ABS=/Users/yuanhangzou/embedx/build_xxxx
-
以下以 无监督图模型、有监督的图模型、深度排序模型 和 深度召回模型 为例分别介绍如何单机训练。
-
模型概述
- 无监督图模型包括
deepwalk、node2vec、struc2vec、metapath2vec、eges和unsup_graphsage等模型
- 无监督图模型包括
-
以无监督 graphsage 模型为例,介绍无监督图模型的单机训练流程
- 进入到
embedx/demo/single目录,运行run_unsup_graphsage.sh脚本 - 依次生成训练数据
edge、邻居平均特征average_feature、模型model和 节点 embeddingembedding
- 进入到
-
模型概述
- 有监督图模型包括
sup_graphsage - 有监督图模型提供了
多标签和多分类功能
- 有监督图模型包括
-
以
有监督 graphsage 模型多分类为例,介绍有监督图模型的单机训练流程- 进入到
embedx/demo/single目录,运行run_sup_graphsage.sh脚本 - 依次生成邻居平均特征
average_feature、模型model和 节点 embeddingembedding
- 进入到
-
模型概述
- 深度排序模型包括
deepfm和din等模型
- 深度排序模型包括
-
以
deepfm 模型为例,介绍深度排序模型的单机训练流程- 进入到
embedx/demo/single目录,运行run_deepfm.sh脚本 - 依次生成模型
model和 样本打分结果probs
- 进入到
-
模型概述
- 深度召回模型包括
dssm和youtube_dnn模型
- 深度召回模型包括
-
以
dssm 模型为例,介绍深度召回模型的单机训练流程- 进入到
embedx/demo/single目录,运行run_dssm.sh脚本 - 依次生成模型
model、user_embeddinguser_embedding和 item_embeddingitem_embedding
- 进入到