发明公开
- 专利标题: 跨医疗数据源的网络表示学习算法
-
申请号: CN202180006088.6申请日: 2021-04-06
-
公开(公告)号: CN114730638A公开(公告)日: 2022-07-08
- 发明人: 王朝坤 , 严本成 , 楼昀恺 , 石耕源 , 陈俊 , 黄海峰 , 陆超
- 申请人: 清华大学 , 百度在线网络技术(北京)有限公司
- 申请人地址: 北京市海淀区清华园一号;
- 专利权人: 清华大学,百度在线网络技术(北京)有限公司
- 当前专利权人: 清华大学,百度在线网络技术(北京)有限公司
- 当前专利权人地址: 北京市海淀区清华园一号;
- 代理机构: 北京中强智尚知识产权代理有限公司
- 代理商 黄耀威
- 优先权: PCT/CN2020/083377 20200403 CN
- 国际申请: PCT/CN2021/085611 2021.04.06
- 国际公布: WO2021/197491 ZH 2021.10.07
- 进入国家日期: 2022-05-19
- 主分类号: G16H50/70
- IPC分类号: G16H50/70
摘要:
本公开提出一种跨医疗数据源的网络表示学习算法,包括:S1,生成包括源网络和目标网络的医疗网络数据;S2,从源网络和目标网络随机采样设定数量的节点;S3,得到一个L层的神经网络,并对每一层分别计算源网络和目标网络的结构特征和表达特征,计算源网络和目标网络的网络特征之间的距离损失;S4,得到源网络在L层神经网络的输出,并根据分类损失和距离损失计算损失值,根据反向传播算法更新算法的参数;S5,重复步骤S2‑S4,直至整个算法收敛,使得算法对于疾病分类的准确率在多个迭代内不再上升。本公开考虑了不同医院数据源之间的数据分布不一致问题,通过提取网络的结构信息及节点属性信息、最小化特征距离弥补信息损失,有着广阔的应用空间。