资源类型:
申请号:
申请日期:
授权年份:
公开号:
公开日:
法律状态:
主分类号:
分类号:
摘要:
本发明公开了一种基于住院病案首页的肿瘤登记随访数据处理方法及系统,该方法包括步骤:获得肿瘤患者的住院病案首页文本;从所述住院病案首页文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码;当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息。通过本发明,不仅可以完善记录肿瘤登记随访数据,而且可以从重复多余的信息中抽取出有效数据,避免重复冗余数据对后期例如发病率分析的影响,继而提高分析结果的准确性。
主权项:
1.一种基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,包括以下步骤: 获得肿瘤患者的住院病案首页文本; 从所述住院病案首页文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码、确诊时间; 当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留确诊时间最早的一条或两条肿瘤信息,包括: 判断多条肿瘤信息中的肿瘤诊断编码中是否包含C00-C75或者C81-C95中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否重复,如果重复,则仅保留确诊时间最早的一条肿瘤信息,包括:将同一肿瘤患者的多条肿瘤信息按照确诊时间进行排序;按照时间先后依次遍历,针对于肿瘤诊断编码为C00-C75或者C81-C95中的任一种的肿瘤信息,若当前肿瘤信息中的肿瘤诊断编码首次出现,则保留该条肿瘤信息;若当前肿瘤信息中的肿瘤诊断编码非首次出现,则剔除该条肿瘤信息; 判断多条肿瘤信息中的肿瘤诊断编码中是否仅包含C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否冗余,如果冗余则仅保留肿瘤诊断编码优先级最高的一条或两条肿瘤信息,其中,优先级由高到低的排序为:C76、C80、C96>Z51.0、Z51.1>C77-C79>D00-D09,D32-D33、D42-D43、D45-D47独立为一级。