发明公开
- 专利标题: 一种向量搜索方法、系统、电子设备和存储介质
-
申请号: CN202311060694.3申请日: 2023-08-22
-
公开(公告)号: CN117056465A公开(公告)日: 2023-11-14
- 发明人: 张磊 , 顾斌 , 刘涛 , 于中阳 , 陈平
- 申请人: 上海极目银河数字科技有限公司 , 上海芯赛云计算科技有限公司
- 申请人地址: 上海市宝山区呼兰西路100号1幢3层330室;
- 专利权人: 上海极目银河数字科技有限公司,上海芯赛云计算科技有限公司
- 当前专利权人: 上海极目银河数字科技有限公司,上海芯赛云计算科技有限公司
- 当前专利权人地址: 上海市宝山区呼兰西路100号1幢3层330室;
- 代理机构: 北京绘聚高科知识产权代理事务所
- 代理商 张春慧
- 主分类号: G06F16/33
- IPC分类号: G06F16/33 ; G06F16/31 ; G06F16/335 ; G06F18/22 ; G06F40/284
摘要:
本申请提供了一种基于Go语言的向量搜索方法和系统,其中,基于Go语言的向量搜索方法包括:采集原始文本数据,根据向量空间模型算法对原始文本数据进行数据清洗处理,构建得到原始文本数据对应的向量空间模型;根据Go语言的向量排序算法和相似度算法,建立向量空间模型对应的词向量索引;接收客户端的词向量搜索请求,计算词向量搜索请求与词向量索引中所有词向量的相似度,根据相似度搜索得到预定数量个最相似的词向量;将预定数量个最相似的词向量对应单词数据,反馈至客户端。本申请的技术方案能解决现有技术中基于向量的检索和推荐系统存在难以处理高维度的海量数据和低效检索的问题。