安徽大学
硕士学位论文
数据挖掘技术在医疗费用分析中的应用
姓名:徐明鹃
申请学位级别:硕士
专业:计算机技术
指导教师:郑诚
2009-10
摘要近年来,随着电子信息技术的飞速发展,经济社会都取得了极大的进步,医院信息系统在我国大中小型医院也得到了广泛应用,这对推动医院信息化建设、促进医院快速发展起到了积极作用。但是随着就诊人数的逐年增加,医院信息系统中积累了大量纷繁复杂的信息,如住院耪费用信息、药品信息、电子病历信息、医嘱、检查报告以及各种人事、设备的管理信息等。因此,如何从这些海量的医学数据中找出有价值的知识和规则,再通过这些隐藏的规律为医生疾病的诊断和治疗提供科学决策依据,并帮助管理者发现并创造新的管理决策已经成为医院管理者越来越关心的问题。本文对淮南市某医院信息系统中~年医疗费用信息进行了数据挖掘和联机分析处理,首先阐述了数据挖掘的定义和对象、分析方法、过程,其中重点介绍了两种数据挖掘算法狹算法和惴ǎ黄浯味阅壳俺S玫数据挖掘工具进行了阐述,详细介绍了服务提供的数据挖掘功能以及的概念和分析方法;接着对医疗费用数据进行预处理,将筛选出挖掘目标所需要的信息表进行整合,然后对整合后的表中出现的空值、噪声数据进行处理,并将数据进行离散化,转换成挖掘工具更好处理的数据格式;然后通过—姆绞蕉栽ご砗蟮氖萁蠴治觯用图像化的方法显示多维数据集中部分维度之间的关系;最后建立医疗费用分析的聚类模型和决策树模型,通过查看模型处理后的依赖关系网络、最强关联网络和对数据进行钻取等多种方式分析医疗费用中的关键性影响因素,并结合实际情况,对该医院提高医疗服务质量提出试验性的意见,从而使医院能在激烈的竞争中脱颖而出。关键词:数据挖掘;聚类;决策树;医疗费用中的
批工仃趀,锄。’洫畂面籺鯟颽簅—,起曲痑緈纓皀睁眘吼、Ⅳ蓎疬膌∞,籺琽印羍,仇鵨也琫仃、騦瞖,丘坞,,篋;,鈊ⅡⅡ,琣:籱廿甿琣╗瑃
雡洒鬙╟血蚭锕,,;痳;;蚰铆唱粀:.,瞖瓸’:】培,.騛
第一章绪论课题研究背景随着网络技术和数据库技术的迅速发展,各种管理信息系统中能够搜集和处理的数据量越来越多,大量信息在给人们带来方便的同时也产生了“数据爆炸”的问题。那么,当数据信息积累到一定程度,如何不被这些数据淹没,如何处理这些数据,进而从这些数据当中产生有用的信息和模式逐渐成为人们关心的问题,于是数据挖掘,际跛嬷恕J萃诰蚣际跏谴世纪年代开始兴起,在年以后有了突飞猛进发展的一门新兴的学科,它是从大量的数据中挖掘那些令人感兴趣的、有用的、隐含的、先前未知的和可能有用的模式和知识,它的产生与的发展是数据库技术发展自然演化的结果,同时数据挖掘技术也使得数据库技术进入了一个更高级的阶段。因此数据挖掘技术被专家预测可能是继网络技术之后的下一个技术热点。世纪年代末期,随着医疗卫生系统信息化建设的不断深入,医院信息系统,在我国的大中小型医院被广泛应用,对推动医院信息化建设、促进医院快速发展起到了积极作用。但是,随着就诊人数的逐年增加,医院信息系统中积累了大量纷繁复杂的信息,如住院耪费用、药品、病历、医嘱、检查报告以及各种人事、设备的管理信息,这些信息多存放在医院的历史数据库中。数据挖掘技术从一开始就是面向应用的,当数据挖掘技术成功的应用在银行、电信、保险、交通、零售绯妒谐等许多商业领域时,那么面对医院信息数据库中大量的历史数据,我们又能够做些什么昵我们可以通过数据挖掘技术在医院信息系统中挖掘出很多有用的信息,如可以用关联分析预测手术术后和药物治疗的效果,可以对某种疾病的相关发病因素进行分析以指导患者如何预防该疾病;可以利用聚类分析方法进行医学影像数据的自动分析和中医的诊断和方剂的研究、疾病危险因素的分析等;可以利用决策树方法对医疗的需求进行预测,对医疗资源的利用进行评价,对疾病类型进行分类,确定治疗方案和开药数量等;可以利用人工神经网络进行临床的决策分析和医学信号的分析处理;可以利用粗糙集理论根据以往病历归纳出诊断规则,用来预测新的疾病的发生;可以应用时间序列预测方法,对医院药品进、销、存产生第一章绪论一,
国内外研究状况分子信息和数据挖掘方法可以预测早期非小细胞肺癌昴谑欠袼劳觯庖辉げ的数据进行统计分析,得出药品使用比例偏高的因素,有针对性控制药品比例。随着医院信息管理的不断发展,数据挖掘技术的应用必将在医院的管理和决策中起着越来越重要的作用。,即从数据库中发现知识,年略诿拦滋芈烧倏A说牡旃嗜斯ぶ悄芰:匣嵋工,,会上专门组织了有关知识发现的专题讨论会,随后便引起了国际人工智能和数据库等领域专家的广泛关注。在国外,数据挖掘技术也已广泛应用于医疗卫生领域,美国的研究者对大量的电子病历进行分析,发现黑人妇女患乳腺癌后的死亡率
数据挖掘技术在医疗费用分析中的应用 来自淘豆网m.daumloan.com转载请标明出处.