-
公开(公告)号:CN112380857B
公开(公告)日:2022-07-29
申请号:CN202011206972.8
申请日:2020-11-03
Applicant: 上海交通大学
IPC: G06F40/289 , G06F40/247 , G06F16/332 , G06Q40/00
Abstract: 本发明公开了一种金融领域近义词的扩展方法、装置及存储介质,该方法包括:从多个金融门户和/或网站获取金融语料;对获取的金融语料进行分词处理;分别计算每个单词最相近的单词;构建单词网络结构;利用可重叠社区发现算法建立具有社区结构的语料库;将每个社区归类出的单词存储至存储单元,当接收到检索词时,将检索词所在的社区输出。该装置包括:金融语料单元、分词处理单元、最相近的单词计算单元、单词网络结构构建单元、语料库建立单元以及社区输出单元。通过本发明,可以识别语义相似关系,当输入一个或多个金融词语时,可以输出意思相近的若干词语,无需用户具备专业领域的知识,可以大大降低用户的检索难度和时间,提高检索准确度。
-
公开(公告)号:CN104182457B
公开(公告)日:2017-08-01
申请号:CN201410334425.6
申请日:2014-07-14
Applicant: 上海交通大学
Abstract: 本发明提供了一种在社交网络中基于泊松过程模型的事件流行度预测方法,步骤:第一步,选取样本事件,并获取样本事件的微博传播链;第二步,用户影响力计算并筛选影响力大的作为关键用户,而将剩下的用户标记为非关键用户;第三步,将关键用户带来的转发微博过程建模为泊松过程模型,而对非关键用户带来的转发微博过程简单处理;第四步,使用样本事件的信息来学习和估计关键用户的泊松过程模型的参数以及非关键用户的参数;第五步,给定一个已知一定时间长度的演化信息的新的事件,根据第三步中的模型来预测它在未来某时刻的流行度。本发明能在微博事件发生的初期给出比较好的流行度预测,将为合理引导事件的发展提供非常有效的帮助。
-
公开(公告)号:CN105608454A
公开(公告)日:2016-05-25
申请号:CN201510968301.8
申请日:2015-12-21
Applicant: 上海交通大学 , 中国太平洋保险(集团)股份有限公司
CPC classification number: G06K9/3258 , G06N3/02
Abstract: 本发明公开一种基于文字结构部件检测神经网络的文字检测方法及系统,所述方法在深度卷积神经网络中构建文字结构部件检测层,所述文字结构部件检测层对文字结构部件进行检测,从而实现文字区域定位和分割。在文字结构部件检测层中,构建是多个文字结构检测器,对某一类文字结构使用单独的文字结构检测器进行检测,提高了文字结构检测的准确性和独特性。本发明以文字结构部件检测的深度学习网络对文字结构特征的强提取能力为出发点,针对中文字结构特征做了专项检测,因此具有更高的主动性和精确性。
-
公开(公告)号:CN105550901A
公开(公告)日:2016-05-04
申请号:CN201510968255.1
申请日:2015-12-21
Applicant: 上海交通大学 , 中国太平洋保险(集团)股份有限公司
IPC: G06Q30/02
CPC classification number: G06Q30/0202
Abstract: 本发明公开一种基于少量用户评价的物品流行度与喜好度联合预测系统,包括:数据准备模块,将用户的原始评价数据预处理,生成用户-物品评分矩阵、物品流行度向量;特征建模模块,生成用户对不同物品的喜好特征矩阵、物品属性特征矩阵、物品属性矩阵与流行度的回归系数向量;预测模块,把少量关键用户的喜好特征矩阵、对新物品的评价,映射为该新物品的属性特征向量,使用新物品的属性特征向量与线性预测系数相乘得到未来流行度预测结果。本发明仅采用少量具有显著区分度的“关键”用户的评价来对新物品流行度和新物品在全体用户中喜好度进行联合预测,提高运行速度,减少时间代价,并保证预测的准确度。
-
公开(公告)号:CN103092956B
公开(公告)日:2016-02-10
申请号:CN201310018004.8
申请日:2013-01-17
Applicant: 上海交通大学
IPC: G06F17/30
Abstract: 本发明公开一种社交网络平台上话题关键词自适应扩充的方法及系统。本发明通过分析社交网络信息内容中词之间的相关性,提取隐含和相关话题的关键词建立关键词扩充词汇库。该方法通过标注少量的关键词建立种子关键词库,增量自反馈收集样本信息建立语料库,通过样本信息获取词频,利用词频和多层过滤算法得到与种子关键词相关性高的相关词语,最后选择合适的词汇加入到关键词扩充库中。本发明区别于传统的网页类关键词扩充机制,这种方法是建立在社交网络信息内容的特点上,对关键词的选择具有更高的灵活性和自适应性。
-
公开(公告)号:CN104182457A
公开(公告)日:2014-12-03
申请号:CN201410334425.6
申请日:2014-07-14
Applicant: 上海交通大学
CPC classification number: G06F16/951 , G06Q10/04 , G06Q50/01
Abstract: 本发明提供了一种在社交网络中基于泊松过程模型的事件流行度预测方法,步骤:第一步,选取样本事件,并获取样本事件的微博传播链;第二步,用户影响力计算并筛选影响力大的作为关键用户,而将剩下的用户标记为非关键用户;第三步,将关键用户带来的转发微博过程建模为泊松过程模型,而对非关键用户带来的转发微博过程简单处理;第四步,使用样本事件的信息来学习和估计关键用户的泊松过程模型的参数以及非关键用户的参数;第五步,给定一个已知一定时间长度的演化信息的新的事件,根据第三步中的模型来预测它在未来某时刻的流行度。本发明能在微博事件发生的初期给出比较好的流行度预测,将为合理引导事件的发展提供非常有效的帮助。
-
公开(公告)号:CN102571486A
公开(公告)日:2012-07-11
申请号:CN201110419267.0
申请日:2011-12-14
Applicant: 上海交通大学
Abstract: 本发明公开了一种基于BoW模型和统计特征的流量识别方法,该方法采用了BoW模型,配合提出的特征提取方法,训练采集到的网络流量特征,从而获得每一个网络类别所对应的特征向量。对于新来的网络流量,同样能够通过提取其流量特征,利用BoW建模得到其相应的特征向量,然后依次与先前建立好的每一个网络类别的特征向量进行比较,取匹配度最高的特征向量所对应的类别作为新来的网络流量的分类标签。本发明使用的BoW方法是结合了非监督的k-means聚类方法以及有监督的K-近邻方法,因而更适合于进行多分类。由于Bow模型对于空间位置不敏感,因而在提取特征时不需要按照特征的时序进行排列,方便进行处理。
-
公开(公告)号:CN102571484A
公开(公告)日:2012-07-11
申请号:CN201110418586.X
申请日:2011-12-14
Applicant: 上海交通大学
Abstract: 本发明公开了一种检测网络水军以及找到网络水军的方法,首先建立蜜罐帐号;通过帐号管理模块对所有蜜罐帐号进行统一筹划,确定蜜罐帐号的发帖和关注策略;从收集的帐号中检测机器人帐号;帐号特征模块对帐号特征向量进行描述,这个向量包括多维;帐号检测模块对收集的帐号,根据帐号特征向量符合机器人帐号特性的多少来检测网络水军;利用检测出来的机器人帐号找到更多的机器人帐号和水军。本发明能够从社交网络中找到更多的机器人帐号或者水军帐号,确定水军军团分布。
-
公开(公告)号:CN101901344A
公开(公告)日:2010-12-01
申请号:CN201010252373.X
申请日:2010-08-13
Applicant: 上海交通大学
Abstract: 一种图像处理技术领域的基于腐蚀方法和DoG算子检测文字图像局部特征的方法。包括以下步骤:对于给定的文字图像,用MSER方法得到文字的连通区域;对得到的每一个文字连通区域,用改进的迭代腐蚀方法检测文字的端点和角点,然后合并相似的点,得到腐蚀方法后的特征点;对于步骤一中的文字图像,用DoG算子检测文字图像中尺度空间中稳定的特征点;合并步骤二和步骤三中相似的特征点,合并后的特征点为丰富的文字局部特征信息,即得到最终文字图像总的特征点。本发明腐蚀方法能够精确的定位文字的端点和角点,DoG算子对尺度、仿射变化、旋转、噪声等因素有很好的鲁棒性,能够提供更丰富的文字局部特征信息。
-
公开(公告)号:CN111767732B
公开(公告)日:2024-01-26
申请号:CN202010519571.1
申请日:2020-06-09
Applicant: 上海交通大学
IPC: G06F40/295 , G06F40/279 , G06V30/413 , G06V10/82 , G06N3/045 , G06N3/042
Abstract: 本发明提供了一种基于图注意力模型的文档内容理解方法及系统,包括:文档建图模块:对文档中出现的文本单词按照关联性建立边,从而生成对应文档内容的图网络,建立文档的二维空间信息;文档文字特征提取模块:使用自然语言处理领域的模型提取得到文档中的文字的向量表示,记为文字特征信息;文档图片特征提取模块:使用计算机视觉领域的模型提取得到文档中文字的图像信息表示,记为图片特征信息;图注意力模型:对文档的文字特征和图片特征进行特征融合,并且根据建立的文档的二维空间信息对相邻的节点之间的信息进行交换和传递。本发明利用图神经网路对得到的图结构信息进行学习训练,从而可以显性并有效的利用文档的二维空(56)对比文件Tao Gui等.A lexicon-based graphneural network for Chinese NER.《Proceedings or the 2019 Conference onEmpirical Methods in Natural LanguageProcessing and the 9th InternationalJoint Conference on Natural LanguageProcessing》.2019,第3节.Petar Veličković等.Graph AttentionNetworks《.The 6th InternationalConference on Learning Representations》.2018,第1节.
-
-
-
-
-
-
-
-
-