一种基于tf-idf和倒排索引的众测助理实现方法

    公开(公告)号:CN113360596A

    公开(公告)日:2021-09-07

    申请号:CN202110634912.4

    申请日:2021-06-08

    Applicant: 南京大学

    Abstract: 本发明提出了一种基于tf‑idf和倒排索引的众测助理实现方法。数据采集阶段,从百度问答中爬取问答数据集,在爬取过程中进行筛选;数据预处理阶段,对每一个问题进行分词,并计算每一个词的频率,获得每个句子的tf‑idf向量表示;输入预处理阶段,对用户的输入进行分词,若涉及到不合适的词,如敏感词,政治词,则不予返回,将用户的输入去除停用词后转化为tf‑idf向量表示;答案返回阶段,利用倒排索引获得与输入相关的候选问题,计算输入与候选问题的相似度,并将相似度最高的k个问题的答案返回给用户作为结果。本发明利用倒排索引的思想加快了查找相似问题的效率,能应对问答对增加带来的内存爆炸问题。

    一种用于众包软件测试的多路召回推荐方法

    公开(公告)号:CN113360632A

    公开(公告)日:2021-09-07

    申请号:CN202110641238.2

    申请日:2021-06-09

    Applicant: 南京大学

    Abstract: 一种用于众包软件测试的多路召回推荐方法,S1,进行数据采集,获取用于多路召回的数据集,该数据集包括用户信息、用户社交信息、项目信息、项目文本描述和用户历史完成项目情况;S2,对数据进行预处理,计算用于多路召回模型的输入数;S3,进行项目多路召回,通过计算用户相似度找到目标用户的相似用户,通过用户‑项目交互矩阵找到目标用户和相似用户的历史完成项目;S4,进行用户多路召回,通过计算项目相似度和项目文本嵌入相似度找到目标项目的相似项目,通过用户‑项目交互矩阵找到完成过目标项目和相似项目的用户,通过计算用户相似度和用户关系矩阵找到用户的相似用户,从而完成对于众包测试用户的多路召回。

    一种基于知识图谱的众测助理实现方法

    公开(公告)号:CN113297089A

    公开(公告)日:2021-08-24

    申请号:CN202110642819.8

    申请日:2021-06-09

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于知识图谱的众测助理实现方法。数据采集阶段,确定好与测试领域相关的关键词;数据预处理阶段,设计相应的规则提取内容中的三元组,同时将别名、外文名用于实体对齐,与通用知识图谱CN‑DBpedia合并;数据存储阶段,以图数据库Neo4j存储数据,利用Cypher查询语句将三元组嵌入图数据库中;问句解析阶段,从用户的输入中,利用模板匹配从中抽取出槽值对,槽对应实体,值对应关系或属性,用py2neo嵌入Cypher语句查询相应的结果,并以聊天格式返回给用户。本发明以图数据库作为存储结构,满足了智能助理所要求的最大延时,领域内的知识图谱能够使智能助理为测试人员提供更好的帮助。

    一种用于众测任务发布的文本摘要与图文检索生成方法

    公开(公告)号:CN113392245A

    公开(公告)日:2021-09-14

    申请号:CN202110664152.1

    申请日:2021-06-16

    Applicant: 南京大学

    Abstract: 本发明公开了一种用于众测任务发布的文本摘要与图文检索生成方法,采集真实众测场景任务发布中提取的相关数据,对相关数据进行筛选整理与清洗;对给定的相关单个或多个任务文档进行摘要生成,利用上阶段获得的任务相关文本摘要,收集相关图片数据库并检索出合适的图像;对检索出的两幅相关图像进行二次融合加工,以生成的方式整合为一张图片,提高图片与任务的匹配度和信息量。本发明通过在众测任务发布中对较为繁杂的任务文档提取较为简短的文本摘要,降低了众测平台方的工作量;同时使用图文检索与图像融合技术,生成具有特色的任务图片。

    一种用于众测任务发布的文本摘要与图文检索生成方法

    公开(公告)号:CN113392245B

    公开(公告)日:2023-12-26

    申请号:CN202110664152.1

    申请日:2021-06-16

    Applicant: 南京大学

    Abstract: 本发明公开了一种用于众测任务发布的文本摘要与图文检索生成方法,采集真实众测场景任务发布中提取的相关数据,对相关数据进行筛选整理与清洗;对给定的相关单个或多个任务文档进行摘要生成,利用上阶段获得的任务相关文本摘要,收集相关图片数据库并检索出合适的图像;对检索出的两幅相关图像进行二次融合加工,以生成的方式整合为一张图片,提高图片与任务的匹配度和信息量。本发明通过在众测任务发布中对较为繁杂的任务文档提取较为简短的文本摘要,降低了众测平台方的工作量;同时使用图文检索与图像融合技术,生成具有特色的任务图片。

    一种用于众包软件测试的多路召回推荐方法

    公开(公告)号:CN113360632B

    公开(公告)日:2023-08-25

    申请号:CN202110641238.2

    申请日:2021-06-09

    Applicant: 南京大学

    Abstract: 一种用于众包软件测试的多路召回推荐方法,S1,进行数据采集,获取用于多路召回的数据集,该数据集包括用户信息、用户社交信息、项目信息、项目文本描述和用户历史完成项目情况;S2,对数据进行预处理,计算用于多路召回模型的输入数;S3,进行项目多路召回,通过计算用户相似度找到目标用户的相似用户,通过用户‑项目交互矩阵找到目标用户和相似用户的历史完成项目;S4,进行用户多路召回,通过计算项目相似度和项目文本嵌入相似度找到目标项目的相似项目,通过用户‑项目交互矩阵找到完成过目标项目和相似项目的用户,通过计算用户相似度和用户关系矩阵找到用户的相似用户,从而完成对于众包测试用户的多路召回。

    一种基于知识图谱的众测助理实现方法

    公开(公告)号:CN113297089B

    公开(公告)日:2023-06-20

    申请号:CN202110642819.8

    申请日:2021-06-09

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于知识图谱的众测助理实现方法。数据采集阶段,确定好与测试领域相关的关键词;数据预处理阶段,设计相应的规则提取内容中的三元组,同时将别名、外文名用于实体对齐,与通用知识图谱CN‑DBpedia合并;数据存储阶段,以图数据库Neo4j存储数据,利用Cypher查询语句将三元组嵌入图数据库中;问句解析阶段,从用户的输入中,利用模板匹配从中抽取出槽值对,槽对应实体,值对应关系或属性,用py2neo嵌入Cypher语句查询相应的结果,并以聊天格式返回给用户。本发明以图数据库作为存储结构,满足了智能助理所要求的最大延时,领域内的知识图谱能够使智能助理为测试人员提供更好的帮助。

Patent Agency Ranking