一种结合转录组和重测序数据获取直系同源基因的方法

    公开(公告)号:CN117637028A

    公开(公告)日:2024-03-01

    申请号:CN202311604097.2

    申请日:2023-11-28

    申请人: 之江实验室

    摘要: 本发明公开了一种结合转录组和重测序数据获取直系同源基因的方法,通过采用C语言编写的算法与数据处理流程,结合来自重测序数据的基因组的DNA序列信息和来自转录组数据的基因的表达信息,以更准确、高效地鉴定SOGs。包括:对转录组原始数据进行组装,查找SOGs并比对到参考基因组,由此得到SOGs在基因组上的具体位置;对重测序数据进行遗传变异位点检测,得到包含所有位点信息的VCF文件;利用本发明工具FindSOG,根据SOGs的位置信息和VCF文件提取出重测序数据中的SOGs序列,将来自转录组和重测序数据的SOGs进行比对,得到的序列矩阵可用于后续进化分析。本发明整合了两种不同类型的数据集,能够更全面的提供更多物种的遗传信息,可在生物信息学研究领域得到广泛应用。

    一种基因数据处理方法、装置、介质及电子设备

    公开(公告)号:CN117831642A

    公开(公告)日:2024-04-05

    申请号:CN202311713495.8

    申请日:2023-12-12

    申请人: 之江实验室

    IPC分类号: G16B50/30 G16B50/00 G16B30/00

    摘要: 本说明书公开的一种基因数据处理方法、装置、介质及电子设备中,从指定数据源处获取待处理的基因数据,并确定标准格式,然后针对每个待处理的基因数据,根据确定的该待处理基因数据的基因标签,并根据该待处理基因数据的各基因表达量,判断该待处理基因数据是否符合标准格式,根据判断结果对待处理基因数据进行调整,并将调整后基因数据存储至目标数据库。当待处理基因数据都被调整后,将目标数据库中各待处理基因数据按基因标签的顺序导出至处理结果文件。从上述方法可以看出,通过对指定数据源中各待处理基因数据的处理,使得各待处基因数据具有统一的数据格式,方便通过处理后各基因数据进行后续的数据分析等操作,提高了数据分析的效率。

    一种细胞检测数据预处理方法、装置及存储介质

    公开(公告)号:CN117743809B

    公开(公告)日:2024-05-24

    申请号:CN202410189827.5

    申请日:2024-02-20

    申请人: 之江实验室

    摘要: 本说明书公开了一种细胞检测数据预处理方法、装置及存储介质,获取待处理的各细胞检测数据和各细胞检测数据对应的配置信息,配置信息至少包含若干提取规则,针对各细胞检测数据包含的每个子数据,确定该子数据的数据标识,根据数据标识,确定数据标识对应的各提取规则,依次针对每个提取规则,通过该提取规则从该子数据中提取对应的目标值,按照提取各目标值的顺序,确定该子数据对应的目标数据,根据各子数据对应的目标数据,确定结果数据。通过提取规则,可以实现对细胞检测数据中的各数据值的提取,并将提取到的各数据值重新排列整合为结果数据输出,该结果数据可用于机器学习算法的数据分析,与手动进行预处理相比,提高了预处理效率。

    一种数据处理的方法、装置、存储介质及电子设备

    公开(公告)号:CN117746999A

    公开(公告)日:2024-03-22

    申请号:CN202410189826.0

    申请日:2024-02-20

    申请人: 之江实验室

    IPC分类号: G16B50/00 G16B25/00

    摘要: 本说明书公开了一种数据处理的方法、装置、存储介质及电子设备。其中,首先获取细胞荧光蛋白检测源数据信息,并根据该细胞荧光蛋白检测源数据信息,确定出对应的元信息,进而根据该元信息,确定细胞荧光蛋白检测源数据信息中包含的有效数据值,并将有效数据值写入数据库,最后将该元信息与接收到的由用户输入的数据处理规则封装成通信消息发送至后端服务器,以使得后端服务器根据通信消息,解析出该通信消息中包含的元信息以及数据处理规则信息,并根据元信息,从数据库中查询出有效数据值,进而根据数据处理规则信息,对有效数据值进行数据处理。

    一种数据处理的方法、装置、存储介质及电子设备

    公开(公告)号:CN117746999B

    公开(公告)日:2024-05-03

    申请号:CN202410189826.0

    申请日:2024-02-20

    申请人: 之江实验室

    IPC分类号: G16B50/00 G16B25/00

    摘要: 本说明书公开了一种数据处理的方法、装置、存储介质及电子设备。其中,首先获取细胞荧光蛋白检测源数据信息,并根据该细胞荧光蛋白检测源数据信息,确定出对应的元信息,进而根据该元信息,确定细胞荧光蛋白检测源数据信息中包含的有效数据值,并将有效数据值写入数据库,最后将该元信息与接收到的由用户输入的数据处理规则封装成通信消息发送至后端服务器,以使得后端服务器根据通信消息,解析出该通信消息中包含的元信息以及数据处理规则信息,并根据元信息,从数据库中查询出有效数据值,进而根据数据处理规则信息,对有效数据值进行数据处理。

    一种基因表达量的检测数据管理方法及装置

    公开(公告)号:CN117935915A

    公开(公告)日:2024-04-26

    申请号:CN202410072107.0

    申请日:2024-01-17

    申请人: 之江实验室

    IPC分类号: G16B25/00 G16B50/30 G16B40/00

    摘要: 在本说明书提供的一种基因表达量的检测数据管理方法及装置中,响应于用户的管理请求,通过提取该管理请求携带的存储基因表达量检测值的源文件中的各第一标签信息,以及针对每个第一标签信息,从第一数据仓库中检索该第一标签信息,确定有效性,当有效性为有效时,将该第一标签信息以及该第一标签信息的基因表达量检测值,作为检测数据,并按照预设规则,存入第二数据仓库,通过该第二数据仓库中的检测数据,确定管理信息返回给用户。将第一标签信息的有效性为有效作为筛选标准,确定符合该筛选标准的检测数据,并按照预设规则存入第二数据仓库,实现了对源文件中基因表达量检测值的筛选,以及实现了存储方式的统一,便于用户后续管理。

    一种细胞检测数据预处理方法、装置及存储介质

    公开(公告)号:CN117743809A

    公开(公告)日:2024-03-22

    申请号:CN202410189827.5

    申请日:2024-02-20

    申请人: 之江实验室

    摘要: 本说明书公开了一种细胞检测数据预处理方法、装置及存储介质,获取待处理的各细胞检测数据和各细胞检测数据对应的配置信息,配置信息至少包含若干提取规则,针对各细胞检测数据包含的每个子数据,确定该子数据的数据标识,根据数据标识,确定数据标识对应的各提取规则,依次针对每个提取规则,通过该提取规则从该子数据中提取对应的目标值,按照提取各目标值的顺序,确定该子数据对应的目标数据,根据各子数据对应的目标数据,确定结果数据。通过提取规则,可以实现对细胞检测数据中的各数据值的提取,并将提取到的各数据值重新排列整合为结果数据输出,该结果数据可用于机器学习算法的数据分析,与手动进行预处理相比,提高了预处理效率。