一、前言
不同的商业流向平台导出的药品流向数据格式千差万别,其中医院名称(终端)
叫法不统一,使得数据处理起来变得非常麻烦。把千奇百怪的医院名称转换为标准的医疗机构名称,也就是所谓的数据清洗
。当然,数据清选还包括产品名称,规格等字段的处理,甚至还包括计量单位转换。如果采用纯人工处理,工作量将会非常巨大。在[琪乐药品流向数据查询管理系统]:https://www.qipanet.com/project/279.html中有提到系统支持数据清洗,那么系统的数据清洗具体是怎么实现的呢?本文将以医院名称
为例,做一个简单的处理过程介绍。