基于文档的语义、字词等属性,采集终端(Web、App、软件等)的用户行为、后端服务器日志(Log)、业务数据和第三方等多方数据源,存储细粒度数据,利用深度学习和语义分析模型构建推荐引擎,根据用户输入的文本自动推荐的更多同类型文档和具有相关性的文本。
文档向量是基于词向量,将一个文档转换成向量的模型(词袋模型)。可以用于短文本的相似度计算,是一个较强的基线模型。word2vec 通过训练,通过内容表征语义,可以把对文本内容的处理简化为 K 维向量空间中的向量 运算,而向量空间上的相似度可以用来表示文本语义上的相似度。因此,word2vec 输出的词向量可以被用来做很多 NLP 相关的工作,比如聚类、找同义词、词性分 析等等




POST
| 参数名称 | 参数说明 | 请求类型 | 是否必须 | 数据类型 |
|---|---|---|---|---|
| sentenceArray | 能够进行推荐的列表 | Body:form-data | true | string |
| size | 需要提取的推荐个数 | Body:form-data | true | string |
| text | 已完成分词的文本 | Body:form-data | true | string |
| token | 使用API时系统需要验证的身份信息 | Headers | true | string |